当前位置:文档之家› SPSS课后作业答案

SPSS课后作业答案

SPSS课后作业答案
SPSS课后作业答案

一、描述性统计分析:

Frequencies

Statistics 2222220

Valid Missing

N

Package design

Price

Brand name

Frequency Table

Package design

940.940.940.9627.327.368.2731.831.8100.0

22

100.0

100.0

A*B*C*Total

Valid

Frequency

Percent

Valid Percent

Cum ulativ e Percent

Price

836.436.436.4627.327.363.6836.436.4100.0

22

100.0

100.0

$1.19 $1.39$1.59Total

Valid

Frequency

Percent

Valid Percent

Cum ulative Percent

Brand name

731.831.831.8731.831.863.6836.436.4100.0

22

100.0

100.0

K2R Glory Bissell Total

Valid

Frequency

Percent

Valid Percent

Cum ulative Percent

Frequencies

Statistics

2222001.3636 1.27271.0000 1.00001.00 1.00.49237.45584.242.2081.00 1.001.00 1.002.00

2.00

Valid Missing

N

Mean Median Mode

Std. Deviation Variance Range Minim um Maximum

Good Housek ee ping seal

Money-back guarantee

Means

Case P rocessing Summary

22100.0%

0.0%

22

100.0%

Preference * Brand nam e

N Percent

N Percent

N

Percent

Included

Excluded Total Cases

Report

Preference 9.00007 6.7577113.00007 5.0990212.250087.3436111.4545

22

6.44188

Brand name K2R Glory Bissell Total

Mean N

Std. Deviation

结果解释:

(1)statistics 表显示了变量package design,price 和 brand name 都有22个有效观测值。Missing 行的值为0表明任何一个变量都没有缺失值。

频数表—package design,表明package design 的每一类的频数,在表中A*有9个、B*有6个、C*有7个;所占的比例分别为:40.9%、27.3% 和31.8%。

频数表-price ,表明price 的每一类频数,在表中¥1.19有8个、¥1.39有6个、¥1.59有8个;所占的比例分别为:36.4%、27.3%和36.4%。 频数表—brand name,表明brand name 的每一类的频数,在表中K2R 有7个、Glory 有7个、Bissell 有8个;所占的比例分别为31.8%、31.8%和36.4%。

(2)statistics 表显示了连续变量goodhousekeeping seal 的均值和标准差分别为1.3636和0.49237,money-back guatantee 的均值和标准差分别为1.2727 和0.45584。 二、相关性分析: Correlations

Correlations

1-.126.5772222-.1261

.57722

22

Pearson Correlation Sig. (2-tailed)N

Pearson Correlation Sig. (2-tailed)N

Pack age design

Price

Pack age

design

Price

结果解释:表中数据显示以22个数据为基础的package design 和 price 的相关性是0.126,相应的p-值0.557明显大于0.05,不拒绝原假设,即package design 和price 变量总体上没有相关性。 三、方差分析(一维组间方差分析):

Descriptives

Preference

817.7500 3.53553 1.2500014.794220.705811.0022.06 6.0000 4.00000 1.63299 1.802310.1977 1.0013.078.2857 4.42396 1.67210 4.194212.3772 2.0014.02111.2381 6.51847 1.422458.270914.2053

1.002

2.0

A*

B*C*Total

N

Mean Std. Dev iation

Std. E rror Low er Bound Upper Bound

95% Confidence Interv al for

Mean

Minim um

Max imum

Test of Homogeneity of Variances

Preference .237

2

18

.791

Lev ene Statistic

df1

df2

Sig.

ANOVA

Preference

564.8812282.44017.843

.000

284.9291815.829

849.810

20

Between Groups Within Groups Total

Sum of Squares df

Mean Square

F Sig.

Post Hoc Tests

Multiple Comparisons

Dependent Variable: Preference Tukey HSD

11.75000* 2.14870.000 6.266217.23389.46429* 2.05913.001 4.209114.7195-11.75000* 2.14870.000-17.2338-6.2662-2.28571 2.21350.567-7.9349 3.3635-9.46429* 2.05913.001-14.7195-4.20912.28571

2.21350.567

-3.36357.9349

(J) Package design B*C*A*C*A*B*(I) Package design A*B*C*

Mean Difference (I-J)

Std. E rror Sig.Low er B ound Upper Bound

95% Confidence Interval The m ean difference is significant at the .05 lev el.

*.

Homogeneous Subsets

Preference

Tukey HSD

a,b

6 6.000078.2857

8

17.7500

.546 1.000

Package design B*C*A*Sig.

N

12Subset for alpha = .05Means for groups in hom ogeneous subsets are displayed.

Uses Harm onic Mean S am ple Size = 6.904.a. The group sizes are unequal. The harm onic m ean of the group sizes is used. Ty pe I error lev els are not guaranteed.

b.

结果解释:表格descriptives 列出了描述统计量,A*的均值最高17.75,其次是C*均值为8.2857,最低的是B*均值为6.00

ANOVA 中的一个假设—方差相等的建设。因为由第二个表得出P 值为0.791大于0.05,不能拒绝原假设,假定三个包装设计的方差相等。 由ANOVA 中,总体均值是否相等的检验中的P 值,因为P 值为0小于0.05,表示三个包装设计相等的原假设被拒绝。

最后一个表格中包装A*不与B*和C*在同一列,所以它的显著性不同于(高于)包装B*和包装C*;因为包装B*和包装C*在同一列,所以包装B*和包装C*无显著差异。 四、回归分析: Regression

Descriptive Statistics

2.0000.87287222.0455

.84387

22

Price

Brand name

Mean Std. Deviation

N

Correlations

1.000.065.065 1.000..388.388.222222

22

Price

Brand name Price

Brand name Price

Brand name

Pearson Correlation Sig. (1-tailed)N

Price Brand name

Variables Entered/Removed b

Brand nam e

a .

Enter

Model 1

Variables Entered Variables Rem ov ed

Method All requested variables entered. a. Dependent Variable: Price

b.

Model Summary

.065a

.004

-.046

.89256

Model 1

R R S quare

Adjusted R S quare

Std. Error of the Estimate

Predictors: (Constant), B rand nam e

a.

ANOVA b

.0671.067.084.775a

15.93320.797

16.000

21

Regression Residual Total

Model 1

Sum of Squares

df

Mean Square

F Sig.Predictors: (Constant), Brand nam e a. Dependent Variable: Price

b.

Coefficients a

1.863.509 3.660.00

2.067.231

.065

.290.775

(Constant)Brand name

Model 1

B Std. Error Unstandardized Coefficients Beta

Standardized

Coefficients t

Sig.Dependent Variable: Price

a.

表格correlations 显示了Brand name 和Price 的相关性,两变量间的相关性为0.065,单侧检验P 值为0.388,双侧检验的P 值为0.775;无论

使用单侧检验(0.338>0.05),还是双侧检验(0.775>0.05),那么不拒绝原假设,即变量间的相关性是不显著的。

数据分析spss作业

数据分析方法及软件应用 (作业) 题目:4、8、13、16题 指导教师: 学院:交通运输学院 姓名: 学号:

4、在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列。试在α=0.05显著性水平下分析 (1)给出SPSS数据集的格式(列举前3个样本即可); (2)分析浓度对收率有无显著影响; (3)分析浓度、温度以及它们间的交互作用对收率有无显著影响。 解答:(1)分别定义分组变量浓度、温度、收率,在变量视图与数据视图中输入表格数据,具体如下图。 (2)思路:本问是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。假设:浓度对收率无显著影响。 步骤:【分析-比较均值-单因素】,将收率选入到因变量列表中,将浓度选入到因子框中,确定。 输出: 變異數分析 收率 平方和df 平均值平方 F 顯著性 群組之間39.083 2 19.542 5.074 .016 在群組內80.875 21 3.851 總計119.958 23 显著性水平α为0.05,由于概率p值小于显著性水平α,则应拒绝原假设,认为浓度对收率有显著影响。

(3)思路:本问首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。假设,H01:浓度对收率无显著影响;H02:温度对收率无显著影响;H03:浓度与温度的交互作用对收率无显著影响。 步骤:【分析-一般线性模型-单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,确定。 输出: 主旨間效果檢定 因變數: 收率 來源第 III 類平方 和df 平均值平方 F 顯著性 修正的模型70.458a11 6.405 1.553 .230 截距2667.042 1 2667.042 646.556 .000 浓度39.083 2 19.542 4.737 .030 温度13.792 3 4.597 1.114 .382 浓度 * 温度17.583 6 2.931 .710 .648 錯誤49.500 12 4.125 總計2787.000 24 校正後總數119.958 23 a. R 平方 = .587(調整的 R 平方 = .209) 第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果;第三列是自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率p值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.500。浓度,温度和浓度*温度的概率p值分别为0.030,0.382和0.648。 浓度:显著性<0.05说明拒绝原假设(浓度对收率无显著影响),证明浓度对收率有显著影响;温度:显著性>0.05说明不拒绝原假设(温度对收率无显著影响),证明温度对收率无显著影响;浓度与温度: 显著性>0.05说明不拒绝原假设(浓度与温度的交互作用对收率无显著影响),证明温浓度与温度的交互作用对收率无显著影响。 8、以高校科研研究数据为例:以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、获奖数X8;建立多元线性回归模型,

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

《统计分析及SPSS的应用(第五版)》课后练习答案解析(第4章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在 地职业 , 年龄 N Valid282282282 Missing00~ 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市] 200 边远郊区82 Total282 职业 ( Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24 商业服务业54 文教卫生18】公交建筑业15 经营性公司】 18 学校15

一般农户 35 种粮棉专业 户 4(种果菜专业 户 10 工商运专业户 ~ 34 退役人员17 金融机构35 现役军人3: Total282 、 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4/ 20~35岁146 35~50岁: 91 50岁以上41 Total282

《 分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

SPSS统计基础 数据分析

《SPSS统计基础》课程数据分析报告 (2016— 2017学年度第二学期) 题目:关于381名大学生学习适应情况的分析报告 班级:14小教2班 学号: 姓名: 2017年6月

381名大学生学习适应性调查数据分析报告 姓名:学号:班级: 一、数据分析目的及内容 (一)数据分析的目的 通过对师范学院学生学习适应现状及其影响因素的调查研究,了解我院学生对自己所学专业在适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应环境因素、适应总分六个维度的基本情况。本文拟在以往研究的基础上对大学生学习适应状况进行调查,并探讨影响大学生学习适应的因素,从而让大学生能更快更好地适应大学生活。 (二)数据分析的内容 1. 381名大学生在适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应 环境因素五个维度的得分及适应总分. 2.对年级、专业、生源地变量的容量等数据分布指标的描述,了解数据分布的全貌。 3.对适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应环境因素五个 维度的极大值、极小值、均值和标准差的统计。 4.学习适应各因子之间的相关分析。 5.学习适应五因子及适应总分的相关性分析。 二、数据库介绍 (一)数据来源: 1被试分布:总容量为381、年级(大一156人、大二136人、大三89人)、专业(小学教育140人、学前教育本科113人、学前教育专科128人)、生源地(城镇145人、农村236人)等方面的人数分布; 2、调查工具:《大学生学习适应量表》由冯廷勇等人编制,共29 个题目,量表采 用Likert5 点计分法,即完全不符合计 1 分,比较不符合计 2 分,不确定计 3 分,较符合计4 分,完全符合计 5 分。各维度和总量表分数越高,表明适应状况越好。总分低于58分,表明学习适应状态较差需要做较大调整;总分在59到87分之间,表明学习适应状态中等,需要做适当的调整;总分在88到116分之间,表明学习适应状态良好;总分在117到145分之间,表明学习适应状态良好。量表的效度为0.85,信度为0.87。该量表由五个维度构成: (1)学习动机(8题):1、6、7、8、9、13、17、23 (2)教学模式(7题):2、3、10、14、18、22、24 (3)学习能力(6题):4、11、15、21、25、26 (4)学习态度(4题):5、12、20、27 (5)环境因素(4题):16、19、28、29 (二)变量介绍: 1、本次问卷调查有三个变量; 2、变量名称为:专业,年级,生源地; 3、变量名称的取值为:专业:1=“小学教育”,2=“学前教育本科”,3=“学前教育专 科”;年级:1=“大一”,2=“大二”,3=“大三”,4=“大四”;生源地:1=“城镇”,2=“农村”。 三、数据统计与分析

数据分析课后答案spss教学提纲

数据分析课后答案 s p s s

习题1.3 統計資料 全国居民 N 有效 22 遺漏 0 平均數 1117.00 中位數 727.50 標準偏差 1015.717 變異數 1031680.286 偏斜度 1.025 偏斜度標準誤 .491 峰度 -.457 峰度標準誤 .953 百分位數 25 304.25 50 727.50 75 1893.50 (1).由表可知,全国居民的均值、方差、标准差、偏度、峰度分别为1117.00、1031680.286、1015.717、1.025、-0.457。 变异系数有公式计算得90.9325。 (2)中位数为727.50,上四分位数304.35,下四分位数为1893.50。 四分位极差由公式 得到1579.15 三均值由公式 得到913.1857。 (3)直方图 (%) *100cv _x s =1 31Q Q R -=3 141 2141Q M Q M ++=∧

(4)茎叶图 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 9.00 0 . 122223344 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s)

(5) 由箱图可以看出并不异常点。 統計資料 农村居民 N 有效22 遺漏0 平均數747.86 中位數530.50 標準偏差632.198 變異數399673.838 偏斜度 1.013 偏斜度標準誤.491 峰度-.451 峰度標準誤.953 百分位數25 239.75 50 530.50 75 1197.00

spss期末作业

吉林财经大学 《SPSS统计软件分析》作业(2010——2011学年第一学期) 学院信息学院 专业班级电子商务0806班 学生姓名王瑞霞 学号1403080616

1、对未分组资料频数分析 从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况,以该数据为例为例,进行频数分析。 首先输入数据: 选择Analyze中Descriptive Statistics——Frequencies,打开Frequencies对话框;将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标,选中所需要计算的指标: 单击Charts …按钮,选择需绘制的统计图: 单击OK按钮开始运行,运行结果为:

从上图中可以看出数据中缺失值为0,花生油的平均价格104.84是最高的,而巴氏牛奶的平均价格1.81最低,全部食品平均价格的平均数为16.5327,标准差为22.4668,各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标,其实质是一样的,从图中可以看出平均价格在0—22元之间的食品是最多的,20—40元之间的食品数次之,接下来是40—60元之间的食品,不存在平均价格在60—100之间的食品。 2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析: Transform —Recode—Into same V ariables ,将要分组的变量放入Numeric 栏中,单击Old and new V alues分组:

分组结果如下图所示: 回到数据编辑窗,定义变量的V alue labels : 再对食品平均价格进行频数分析,分析结果如下截图所示

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级 姓名 学号 - 广 东 财 经 大 学 答 题 纸(格式二) 课程 数据处理技术与SPSS 20 15 -20 16 学年第 1 学期 成绩 评阅人 评语: ========================================== (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面,帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷,回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

《统计分析与SPSS的应用(第五版)》课后练习标准答案(第8章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第8章)

————————————————————————————————作者:————————————————————————————————日期:

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第8章SPSS的相关分析 1、对15家商业企业进行客户满意度调查,同时聘请相关专家对这15家企业的综合竞争力进行评分,结果如下表。 编号客户满意度得分综合竞争力得分编号客户满意度得分综合竞争力得分 1 90 70 9 10 60 2 100 80 10 20 30 3 150 150 11 80 100 4 130 140 12 70 110 5 120 90 13 30 10 6 110 120 14 50 40 7 40 20 15 60 50 8 140 130 请问,这些数据能否说明企业的客户满意度与其综合竞争力存在较强的正相关,为什么? 能。步骤:(1)图形→旧对话框→散点/点状→简单分布→进行相应设置→确定;(2)再双击图形→元素→总计拟合线→拟合线→线性→确定

(3)分析→相关→双变量→进行相关项设置→确定 相关性 客户满意度得分综合竞争力得分客户满意度得分Pearson 相关性 1 .864** 显著性(双尾).000 N 16 15 综合竞争力得分Pearson 相关性.864** 1 显著性(双尾).000 N 15 15 **. 在置信度(双测)为 0.01 时,相关性是显著的。 两者的简单相关系数为0.864,说明存在正的强相关性。

2、为研究香烟消耗量与肺癌死亡率的关系,收集下表数据。(说明:1930年左右几乎极少的妇女吸烟;采用1950年的肺癌死亡率是考虑到吸烟的效果需要一段时间才可显现)。 国家1930年人均香烟消耗量1950年每百万男子中死于肺癌的人数 澳大利亚480 180 加拿大500 150 丹麦380 170 芬兰1100 350 英国1100 460 荷兰490 240 冰岛230 60 挪威250 90 瑞典300 110 瑞士510 250 美国1300 200 绘制上述数据的散点图,并计算相关系数,说明香烟消耗量与肺癌死亡率之间是否存在显著的相关关系。 香烟消耗量与肺癌死亡率的散点图(操作方法与第1题相同) 相关性 人均香烟消耗死于肺癌人数 人均香烟消耗Pearson 相关性 1 .737** 显著性(双尾).010 N 11 11 死于肺癌人数Pearson 相关性.737** 1

SPSS期末大作业-完整版

第1题:基本统计分析1 分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。 1、基本思路: (1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。 (2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。 操作步骤: (1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。 存取款金额1 频率百分比有效百分比累积百分比 有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 (2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。

(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。 统计量 存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述: 频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。

《统计分析与SPSS的应用(第五版)》课后练习答案.doc (1)

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 ●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; ●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: ●SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 ●活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: ●完全窗口菜单方式、程序运行方式、混合运行方式。 ●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 ●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 ●混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 ●简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 ●分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 ●整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本 状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N 有效359 359 缺失0 0 首先,对该地区的男女性别分布进行频数分析,结果如下

性别 频率百分比有效百分 比 累积百分 比 有效女198 男161 合计359 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为%和%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差171 一般79 比较 好 79 好24 非常 好 6 合计359 其次对原有数据中的积极性进行频数分析,结果如下表: 其次对原有数据中的是否进通道进行频数分析,结果如下表:

《统计分析与SPSS的应用(第五版)》课后练习答案解析(第4章)

WORD 格式整理 《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第 4 章 SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在职业年龄 地 Valid282282282 N Missing 000 户口所在地 Frequency Percent Valid Cumulative Percent Percent 中心城市20070.970.970.9 Valid 边远郊区8229.129.1100.0 Total282100.0100.0 职业 Frequency Percent Valid Cumulative Percent Percent 国家机关248.58.58.5 商业服务业5419.119.127.7 文教卫生18 6.4 6.434.0 公交建筑业15 5.3 5.339.4 Valid 经营性公司18 6.4 6.445.7学校15 5.3 5.351.1 一般农户3512.412.463.5 种粮棉专业 4 1.4 1.464.9 户

WORD 格式整理 种果菜专业 10 3.5 3.568.4 户 工商运专业 3412.112.180.5户 退役人员17 6.0 6.086.5 金融机构3512.412.498.9 现役军人3 1.1 1.1100.0 Total282100.0100.0 年龄 Frequency Percent Valid Cumulative Percent Percent 20 岁以下4 1.4 1.4 1.4 20~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.5 50 岁以上4114.514.5100.0 Total282100.0100.0

spss练习作业具体步骤要点教程文件

一、调查问卷 二、用SPSS Statistics软件进行描述统计分析 1、某地区经济增长率的时间序列图形。 解:第一步:数据来源,如图1 图 1 某地区经济增长率xls截图 图2 Spss软件制作过程截图 第二步:将数据输入SPSS软件之中,如图2,制作某地区经济增长率的时间序列图形,如图3。 图3某地区1990—2012年经济增长率的时间序列图 第三步,从图中可以看出,某地区随时间的变化经济增长率变化趋势较大。 2、用SPSS Statistics进行描述统计分析 解:第一步,按照题目中的要求,随机选取了148个数据,如图4部分数据:

图4 Spss随机数据截图 第二步,根据要求,对上月工资进行描述统计分析,主要包括描述数据的集中趋势、离散程度(见表1),绘制直方图(见图5)。 表1 上月工资描述统计表(单位:元) 集中趋势离散趋势 均值2925 极小值1500 中值2900 极大值4800 众数2900 全距3300 和432900 标准差496.364 偏度0.165 峰度 1.238 数据总计148 图5 上月工资直方图

第三步,分析数据的统计分布状况。 首先,从集中趋势来,上个月平均工资2925元,其中众数和中数也都在2900元,这说明大部分工资水平在2900左右。 其次,从离散趋势来看,最高工资4800元,最低工资1500元,最高工资和最低工资相差3300元,标准差为496.364,相差较大。 最后,从直方图来看和评述统计表来看,工资在2900元以上的占多数。可以的该地区整体工资水平大于平均值的占多数,该地区工资水平相对较高。 峰度为1.238,偏度为0.165符合正态分布。 三、用SPSS Statistics 软件进行参数估计和假设检验及回归分析 1、计算总体中上月平均工资95%的置信区间(见表3)。 解:总体中上月平均工资分布未知,但是样本容量大于30,且已知标准误,所以通过SPSS 分析得出总体中上月平均工资95%的置信区间,见表3, 假设; H0:总体中上月平均工资95%的不在此在此区间 H1:总体中上月平均工资95%的在此区间 答,总体中上月平均工资095的置信区间为[2844.37,3005.63],p=0.000<0.01,作出这样的推论正确的概率为0.95,错误的概率为0.05。 2、检验能否认为总体中上月平均工资等于2000元。 解:在本案例中,要检验样本中上月平均工资与总体中上月平均工资(为已知值:2000元)是否存在差异,即某一样本数据与某一确定均值进行比较。虽然不知道总体分布是否正态,但样本较大(N>30),可以运用单样本T 检验.通过SPSS 检验结果见(表4 、表5) 设; H o:2000=μ H 1:2000≠μ 其中,μ表示总体中上月平均工资 表4 单个样本统计量 表5 单个样本检验 t df Sig.(双侧) 均值差值 检验值 上月工资 22.671 147 0.000 925.000 2000 答:作出结论,均值差值为925,t=22.671,p=0.000<0.01,所以拒绝原假设,接受备择假设,即否认总体中上月的平均工资等于2000元。

统计分析与SPSS课后习题课后习题答案汇总(第五版)

, 《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; 结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 — 3、SPSS的数据集: SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: 完全窗口菜单方式、程序运行方式、混合运行方式。 完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 混合运行方式:是前两者的综合。 】 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。

SPSS作业

统计软件应用第一次作业 金融102班1005010259 于闯一.现有1992年-2006年国家财政收入和国内生产总值的数据如下表所示,请研究国家财政收入和国内生产总值之间的线性关系。 1.根据数据并作出散点图可以得知1992年-2006年国家财政收入和国内生产总值两 个变量之间具有一元线性关系。我们利用SPSS软件作出散点图,步骤如下:依次选择菜单“图形→旧对话框→散点/点状→简单分布”,具体操作如图所示: 并将“国内生产总值”作为x轴,“财政收入”作为y轴,得到如下所示图形。

图一:散点图 可以看出两变量具有较强的线性关系,可以用一元线性回归来拟合两变量。 2.为了便于数据分析所以定义三个变量,分别为“year”(年份)、“x”(国内生产总值)、“y”(财政收入)。 3.选择菜单“分析→回归→线性”,打开“线性回归”对话框,将变量“财政收入”作为因变量,“国内生产总值”作为自变量。 4.打开“统计量”对话框,选上“估计”和“模型拟合度”。单击“绘制(T)…”按钮,打开“线性回归:图”对话框,选用DEPENDENT作为y轴,*ZPRED为x轴作图。并且选择“直方图”和“正态概率图”作相应的保存选项设置,如预测值、残差和距离等。

○1变量输入和移去表

表中显示回归模型编号、进入模型的变量、移出模型的变量和变量的筛选方法。可以看出,进入模型的自变量为“国内生产总值” ○2模型综述表 R=0.989,说明自变量与因变量之间的相关性很强。R方(R2) =0.979,说明自变量“国内生产总值”可以解释因变量“财政收入”的97.9%的差异性。 ○3方差分析表 表中显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。方差来源有回归、残差。从表中可以看出,F统计量的观测值为592.25,显著性概率为0.000,即检验假设“H0:回归系数B = 0”成立的概率为0.000,从而应拒绝原假设,说明因变量和自变量的线性关系是非常显著的,可建立线性模型。 ○4回归系数表 表中显示回归模型的常数项、非标准化的回归系数B值及其标准误差、标准化的回归系数值、统计量t值以及显著性水平(Sig.)。从表中可看出,回归模型的常数项为-4993.281,自变量“国内生产总值”的回归系数为0.197。因此,可以得出回归方程:财政收入=-4993.281 + 0.197 ×国内生产总值。 回归系数的显著性水平为0.000,明显小于0.05,故应拒绝T检验的原假设,这也说明了回

spss的数据分析案例

关于某公司474名职工综合状况的统计分析报告一、数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分 析能够了解变量的取值状况,对把握数据的分布特征非常有用。 此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女性别分布进行频数分析,结果如下:

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表:

Educational Level (years)

上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。且接受过高于20年的教育的人数只有1人,比例很低。 2、描述统计分析。再通过简单的频数统计分析了解了职工在性别 和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。 Descriptive Ststistics

SPSS期末大作业

数据分析方法及软件应用 课程作业 学号:13125689 姓名:柏喜红 班级:1306 北京交通大学 2013年10月

第5题:方差分析(2) 分析思路 根据所给的表定义变量,进而进行数据录入。在进行单因素和多因素对销售量的影响分析的时候,应先提出相应的零假设,进而选择检验统计量,对检验统计量进行计算,并计算出概率P值,将计算出的概率P值与给定的显著性水平进行比较,做出相应的决策。 目标一:给出SPSS数据集格式 定义变量,进行数据录入。从题意以及所给的表中可以得出,这里有四个变量,分别为销售地点、销售方式、月份和销售量。其中,销售地点和销售方式为控制变量,月份为随机变量,销售量为观测变量,结合所给的表,进行数据的录入,录入四十个观测变量值。 图1 变量视图 图2 数据视图

目标二:分析销售地点对销售量的影响 (1)操作步骤 第一步:提出零假设。零假设H0是“销售地区对销售量没有产生显著影响”。 第二步:选择检验统计量,并计算检验统计量的观测值和概率P值。 选择菜单【分析——比较均值——单因素】 将销售量指定到【因变量列表(E)】中,将销售地区指定到【因子(F)】中,点击确定按钮,出现图3所示的结果。 图3单因素方差分析 销售量 平方和df 均方 F 显著性 组间254.600 4 63.650 1.107 .369 组内2013.000 35 57.514 总数2267.600 39 第三步:给定显著性水平α=0.05,根据表1,做出决策。 (2)结果分析 从图3中可以看出,观测变量销售量的总变差(2267.600)中“销售地区”可解释的变差为254.600,抽样误差引起的变差为2013.000,他们的方差为63.650和57.514,相除所得的F统计量为1.107,对应的概率P值接近于0.369。 (3)结论 因为显著性水平α=0.05,概率P值大于α,因而应接受原假设,认为不同的销售地区度销售量不产生显著影响。 目标三:分析销售地点、销售方式和他们的交互作用对对销售量的影响 (1)操作步骤 第一步:提出零假设。零假设H0是“销售地区对销售量没有产生显著影响,销售方式对销售量没有产生显著影响,销售地区和销售方式对销售量没有产生显著的交互影响。” 第二步:选择检验统计量,并计算检验统计量的观测值和概率P值。 选择菜单【分析——一般线性模型——单变量】; 将销售量指定到【因变量(D)】中,将销售地区和销售方式指定到【固定因子(F)】

相关主题
文本预览
相关文档 最新文档