当前位置:文档之家› 第四章 统计数据的描述

第四章 统计数据的描述

第四章 统计数据的描述
第四章 统计数据的描述

第四章统计数据的描述

(一)判断题

1、以最低限度为任务提出的计划指标,计划完成程度以不超过100%为好。()

2、全国人均国民生产总值,属于强度相对数。()

3、标志总量是指总体单位某一数量标志值的总和。()

4、在计算相对指标时,分子、分母可以互换的相对指标唯一只有强度相对数。()

5、某企业工人劳动生产率,计划提高5%,实际提高10%,则劳动生产率的计划完成程度为%。()

6、权数的实质是各组单位数占总体单位数的比重。()

7、在算术平均数中,若每个变量值减去一个任意常数a,等于平均数减去该数a。()

8、各个变量值与其平均数离差之和可以大于0,可以小于0,当然也可以等于0。()

9、各个变量值与任意一个常数的离差之和可以大于0,可以小于0,当然也可以等于0。

()

10、各个变量值与其平均数离差的平方之和一定等于0。()

11、各个变量值与其平均数离差的平方之和可以等于0。()

12、各个变量值与其平均数离差的平方之和为最小。()

13、已知一组数列的方差为9,离散系数为30%,则其平均数等于30。()

14、交替标志的平均数等于P。()

15、对同一数列,同时计算平均差和标准差,两者数值必然相等。()

16、平均差和标准差都表示标志值对算术平均数的平均距离。()

17、某分布数列的偏态系数为,说明它的分布曲线为左偏。()

(二)单项选择题

1、某种商品的年末库存额是()。

A. 时期指标和实物指标

B. 时点指标和实物指标

C. 时期指标和价值指标

D. 时点指标和价值指标

2、绝对指标的基本特点是计量单位都是()

A. 无名数

B. 有名数

C. 复名数

D. 无名数和有名数

3、相对指标数值的表现形式有()

A. 无名数

B. 有名数

C. 复名数

D. 无名数和有名数

4、相对指标数值的大小()

A. 随总体范围扩大而增大

B. 随总体范围扩大而减小

C. 随总体范围缩小而减小

D. 与总体范围大小无关

5、人口自然增长率,属于()

A. 结构相对数

B. 比较相对数

C. 强度相对数

D. 比例相对数

6、平均数反映了总体分布的()。

A. 集中趋势

B. 离中趋势

C. 长期趋势

D. 基本趋势

7、下列指标中,不属于平均数的是()。

A. 某省人均粮食产量

B. 某省人均粮食消费量

C. 某企业职工的人均工资收入

D. 某企业工人劳动生产率

8、影响简单算术平均数大小的因素是()。

A. 变量的大小

B. 变量值的大小

C. 变量个数的多少

D. 权数的大小

9、一组变量数列在未分组时,直接用简单算术平均法计算与先分组为组距数列,然后再用加权算术平均法计算,两种计算结果()。

A. 一定相等

B. 一定不相等

C. 在某些情况下相等

D. 在大多数情况下相等

10、加权算术平均数的大小()。

A. 受各组标志值的影响最大

B. 受各组次数影响最大

C. 受各组权数比重影响最大

D. 受各组标志值与各组次数共同影响

11、权数本身对加权算术平均数的影响,取决于()。

A. 总体单位的多少<

B. 权数的绝对数大小

C. 权数所在组标志值的数值大小

D. 各组单位数占总体单位数的比重大小

12、在变量数列中,当标志值较大的组权数较小时,加权算术平均数()。

A. 偏向于标志值较小的一方

B. 偏向于标志值较大的一方

C. 不受权数影响

D. 上述说法都不对

13、平均差的主要缺点是()。

A. 与标准差相比计算复杂

B. 易受极端数值的影响

C. 不符合代数演算方法

D. 计算结果比标准差数值大

14、标准差的大小取决于()。

A. 平均水平的高低

B. 标志值水平的高低

C. 各标志值与平均水平离差的大小

D. 各标志值与平均水平离差的大小和平均水平的高低

15、计算离散系数是为了比较()。

A. 不同分布的数列的相对集中程度

B. 不同分布的数列的标志变动度大小

C. 相同分布的数列的标志变动度大小

D. 两个数列平均数的绝对差异

16、把全部产品分为一级品、二级品和三级品,其中一级品占全部产品比重为70%,则这个70%属于()。

A. 平均数

B. 结构相对数

C. 具有某一属性的单位数在总体中的成数p

D. 不具有某一属性的单位数在总体中的成数q

(三)多项选择题

1、下列指标中属于时点指标的有()

A. 年末职工人数

B. 年初职工人数

C. 月末设备台数

D. 年国民生产总值

E. 月销售额

2、下列指标中,属于强度相对数的是()

A. 人均国内生产总值

B. 人口密度

C. 人均粮食产量

D. 人均粮食消费量

E. 人口自然增长率

3、时点指标的数值()

A. 可以连续计量

B. 反映现象在某一时刻上状况的总量

C. 只能间断计数

D. 其大小与时间长短成正比

E. 直接相加没有独立的实际意义

4、时期指标的数值()

A. 可以连续计量

B. 反映现象在某一时期内状况的总量

C. 相邻两时期指标有可加性

D. 其数值大小与时间长短有关

E. 有时可以间断计量,一般是连续计量

5、计算相对数指标的可比性原则大致可以归纳为()

A. 时间、空间可比

B. 计量单位可比

C. 价格可比

D. 计划和统计的口径可比

E. 计算过程可比

6、在计算相对指标时,分子、分母可以互换的相对指标是()

A. 计划完成相对数

B. 动态相对数

C. 比例相对数

D. 强度相对数总体单位与标志

E. 结构相对数

7、相对数的表现形式可以是()

A. 小数

B. 百分数

C. 千分数

D. 倍数

E. 学名数

8、总量指标与相对指标的关系,表现为()

A. 相对指标是计算总量指标的基础

B. 总量指标是计算相对指标的基础

C. 相对指标与总量指标结合运用

D. 相对指标能补充总量指标的不足

E. 相对指标能表明总量间的对比关系

9、下列指标中,属于平均指标约有()。

A. 某省人均国民收入

B. 某省人均粮食产量

C. 某省人均粮食消费量

D. 某企业工人劳动生产率

E. 某企业职工的人均工资收入

10、平均数能反映()。

A. 总体各单位标志值大小的一般水平

B. 总体分布的集中趋势

C. 总体分布的离中趋势

D. 现象之间的依存关系

E. 总体各单位标志值的差异程度

11、算术平均数的基本公式中,()。

A. 分子分母属于同一总体

B. 分子分母计量单位相同

C. 分子的标志是数量标志

D. 分母是分子的直接承担者

E. 分子是分母的直接承担者

12、加权算术平均数的大小,受()。

A. 各组次数的影响

B. 组中值大小的影响

C. 各组标志值大小的影响

D. 各组单位数占总体单位数比重大小的影响

E. 各组次数和各组标志值的共同影响

13、下列情况中,应采用调和平均数的有()。

A. 已知各企业计划完成百分比及实际产值,求平均的计划完成程度

B. 已知各商品的单价和销售额,求平均价格

C. 已知分组的粮食单位产量及各组粮食总产量,求总的平均单位产量

D. 已知三种产品的单位成本及总生产费用,求平均单位产品成本

E. 某采购站某月购进三批同种农产品的单价及收购额,求平均采购价格

14、利用四分位差说明标志的变异程度()。

A. 没有考虑总体所有单位标志值的差异程度

B. 与总体单位的分配无关

C. 能反映四分位数中间两个分位数之差

D. 反映总体最大标志值与最小标志值之差

E. 取决于平均数的大小

15、标准差和平均差的共同点是()。

A. 两者都以平均数为中心来测定总体各单位标志值的离散程度

B. 两者在反映总体标志变异程度方面都比全距准确

C. 两者都考虑了总体的所有变量值的差异程度

D. 两者都受极端值较大影响

E. 两者都计算方便

16、利用标准差比较两个总体的平均数代表性大小,要求()。

A. 两总体的单位数相等

B. 两个总体的标准差相等

C. 两个总体的平均数相等

D. 两个平均数反映的现象相同

E. 两个平均数的计量单位相同

17、不同总体间的标准不能进行简单的对比,是因为()。

A. 标准差不一致

B. 平均数不一致

C. 计量单位不一致

D. 总体单位数不一致

E. 上述原因都对

18、下列各项中属于交替标志具体表现的是()。

A. 产品中的合格品、不合格品

B. 农作物中的受灾面积、非受灾面积

C. 稻种中的发芽种子、不发芽种子

D. 人口性别中的男、女

E. 产品中的一等品、二等品、三等品

19、下列各项中属于交替标志具体表现的是()。

A.

B.

C.

D.

E.

(四)填空题

1、按总量指标的总体内容不同,可以分为______________和___________。

2、按总量指标所反映时间不同,可以分为____________和______________。

3、总量指标的计量单位归纳起来可以分为三种,即实物单位、____________和__________________。

4、强度相对数是两个_______________指标对比的比率。

5、总量指标是计算_______________指标和_______________指标的基础。

6、检查中长期计划的完成情况,有_______________和_______________两种检查方法。

7、 _______________相对数通常用符合计量单位表示。

(五)计算题

1.某厂2000年计划产值1080万元,计划完成110%,2000年产值计划比1999年增长8%,试计算该厂实际产值2000年比1999年增长百分之几

2.某企业有关资料如下:

(1)若五年计划规定最末一年产量应达170万吨,求五年计划完成程度和提前完成计划时间。

(2)若五年计划规定五年产量应达640万吨,求五年计划完成程度和提前完成计划时间。

3、某市场有三种不同品种的苹果,每千克价格分别为4元、6元和8元,试计算:(1)各买1千克,平均每千克多少钱(2)各买1元钱,平均每千克多少钱

4、某商品有甲乙两种型号,单价分别为5元和6元。已知价格低的甲型商品的销售量是乙型商品的2倍,试求该商品的平均销售价格;如果价格低的甲型商品的销售量比乙型商品多2倍,则该商品的平均销售价格是多少

5、某工业公司所属三个工厂的统计资料如下:

试求:(1)该公司产量计划平均完成百分比;

(2)该公司平均一等品率。

4、某电子产品企业工人日产量资料如表5-6。

试根据表中资料计算工人日产量的平均数、中位数和众数,并判断该分布数列的分布状态。

5、某厂两组工人加工同种零件,某天每人加工零件分别如下表。

根据表中资料,试比较哪组工人加工零件数的变异程度大

6、某厂两组工人加工同种零件,已知某天第一组工人加工零件总数为365件,经检验,发现有14件次品;第二组工人加工零件总数为326件,经检验,发现有13件次品。试比较哪组工人加工零件的质量较稳定

7、甲、乙两个不同的稻种,其平均及标准差资料如下表。

试比较哪种稻种值得推广

8、试根据平均数和标准差的性质,回答下列问题。

(1)标准差为50,平均数为60,试求标志变量对100的方差。

(2)各标志值对某任意数的方差为200,而这个任意数与单位标志值的平均数之差为11,试确定标准差。

(3)总体平均数为100,标准差系数为20%,试确定对什么数的标准差为200

(4)若方差为1600,标准差系数为20%,则各标志值对150的方差为多少

9、某商场上月按商品销售额分组资料如下表。试用简捷法计算标准差反映该商场售货员业务水平的差异程度。

ANSWER 4 (一)判断题

1.(×)

2.(√)

3.(√)

4.(×)

5.(√)

6.(√)

7.(√)

8.(×)

9.(√)

10.(×)

11.(√)

12.(√)

13.(×)

14.(√)

15.(×)

16.(×)

17.(×)(二)单项选择题

1.④

2.②

3.④

4.④

5.③

6.①

7.①

8.②

9.③

10.④

11.④

12.④

13.③

14. ③

15. ②

16. ②

(三)多项选择题

1.①②③

2.①②③⑤

3.②③⑤

4.①②③④⑤

5.①②③④⑤

6.③④

7.①②③④

8.②③④⑤

v1.0 可编辑可修改

9.③④⑤

10.①②④

11.①③④

12.①②③④⑤

13.①②③④⑤

14.①③

15.①②③

16.③④⑤

17.②③

18.①②③④

19.②④⑤

(四)填空题

1.总体总量、标志总量

2.时期指标、时点指标

3.价值单位、劳动量单位

4.性质不同而又有联系

5.相对、平均

6.水平法、累计法

7.强度

(五)计算题

1.18.8%

2.(1)% 6个月 (2)100% 3个月

3. (1)6 (2)

4. 5.33 7

v1.0 可编辑可修改

5. (1)% (2)%

6. 65 正态分布

7. 第二组工人加工零件数的变异程度大。

甲组工人加工零件的质量比较稳定。

乙品种值得推广

8.(1)4100

(2)79

(3)

(4)4100

9.

第2章统计数据的描述

第2章统计数据的描述——练习题 ●1.为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 解:(1)由于表中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。 (2)频数分布表如下: 服务质量等级评价的频数分布 服务质量等级家庭数(频数)频率% A1414 B2121 C3232 D1818

E1515 合计100100 (3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel练习题。即得到如下的条形图: 700716728719685709691684705718 706715712722691708690692707701 708729694681695685706661735665 668710693697674658698666696698 706692691747699682698700710722 694690736689696651673749708727 688689683685702741698713676702 701671718707683717733712683692 693697664681721720677679695691 713699725726704729703696717688 (1)利用计算机对上面的数据进行排序;

第四章、统计数据分布特征的描述

第四章、统计数据分布特征的描述 一、单项选择题(在每小题的四个备选答案中,选出一个正确答案) 1. 调和平均数是()。 A. 总体标志总量指标与总体单位总量指标的比值 B. 总体各单位变量值倒数的算术平均数 C. 总体各单位变量值倒数算术平均数的倒数 D. 总体各单位变量值连乘积的平方根 2. 在分组的情况下,总体平均指标数值的大小()。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 3. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是()。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 4. 标志变异指标反映了总体各单位变量值分布的(). A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 5. 下列变异指标中,受极端数值影响最大的是()。 A. 全距 B. 平均差 C. 标准差 D. 变异系数 6. 算术平均数与总体单位数的乘积等于()。 A. 总体各单位变量值的总和 B. 总体各单位变量值的连乘积 C. 总体各单位变量值与平均数的离差 D. 总体各单位变量值与平均数离差的平方 7. 权数对算术平均数的影响作用,实质上取决于()。 A. 作为权数的各组单位数占总体单位数比重的大小 B. 各组变量值占总体标志总量比重的大小 C. 变量值本身的大小 D. 变量值数量的多少 8.平均指标反映了总体分布的()。

第四章统计数据的描述

第四章统计数据的描述 (一)判断题 1、以最低限度为任务提出的计划指标,计划完成程度以不超过100%为好。() 2、全国人均国民生产总值,属于强度相对数。() 3、标志总量是指总体单位某一数量标志值的总和。() 4、在计算相对指标时,分子、分母可以互换的相对指标唯一只有强度相对数。() 5、某企业工人劳动生产率,计划提高5%,实际提高10%,则劳动生产率的计划完成程度为%。() 6、权数的实质是各组单位数占总体单位数的比重。() 7、在算术平均数中,若每个变量值减去一个任意常数a,等于平均数减去该数a。() 8、各个变量值与其平均数离差之和可以大于0,可以小于0,当然也可以等于0。() 9、各个变量值与任意一个常数的离差之和可以大于0,可以小于0,当然也可以等于0。 () 10、各个变量值与其平均数离差的平方之和一定等于0。() 11、各个变量值与其平均数离差的平方之和可以等于0。() 12、各个变量值与其平均数离差的平方之和为最小。() 13、已知一组数列的方差为9,离散系数为30%,则其平均数等于30。() 14、交替标志的平均数等于P。() 15、对同一数列,同时计算平均差和标准差,两者数值必然相等。() 16、平均差和标准差都表示标志值对算术平均数的平均距离。() 17、某分布数列的偏态系数为,说明它的分布曲线为左偏。() (二)单项选择题 1、某种商品的年末库存额是()。 A. 时期指标和实物指标

B. 时点指标和实物指标 C. 时期指标和价值指标 D. 时点指标和价值指标 2、绝对指标的基本特点是计量单位都是() A. 无名数 B. 有名数 C. 复名数 D. 无名数和有名数 3、相对指标数值的表现形式有() A. 无名数 B. 有名数 C. 复名数 D. 无名数和有名数 4、相对指标数值的大小() A. 随总体范围扩大而增大 B. 随总体范围扩大而减小 C. 随总体范围缩小而减小 D. 与总体范围大小无关 5、人口自然增长率,属于() A. 结构相对数 B. 比较相对数 C. 强度相对数 D. 比例相对数 6、平均数反映了总体分布的()。 A. 集中趋势 B. 离中趋势 C. 长期趋势

第二章 定量变量的描述性统计

第二章定量变量的描述性统计(中大.公卫学院.医学统计与流行病学系.骆福添.020-********) 第一节频数分布 ·收集到的数据必须给读者介绍一下,例2-1数据 怎么讲,读出来? 介绍特征,有何特征? ·例:肿瘤什么年龄多发?对发病年龄分组整理 ·脉搏:不妨对脉搏进行分组整理 一、频数分布表 例2-1测得130健康成年男子脉搏资料(次/分)如下,试编制频数表和观察频数分布情况。 66 77 64 67 76 75 75 71 65 62 76 72 71 60 67 75 75 73 79 66 69 79 78 70 72 70 72 78 72 67 72 80 68 70 61 70 73 72 71 81 70 66 75 71 63 77 74 76 68 65 77 69 77 75 79 64 79 73 76 61 80 64 69 70 73 68 65 70 69 66 81 63 64 80 74 78 76 66 70 73 60 76 82 73 64 65 73 73 63 80 68 76 70 79 77 64 70 66 69 73 78 76 制作频数表的步骤为: 1.计算极差极差R=84 -57=27 (次/分)。 2.决定组数、组距和组段 (1)组数:10组左右 (2)组距:等组距(取方便数) (3)组段:下限(最小值)、上限(最大值.空穴)、组中值(代表值.正中)注意:组段应包含全部数据(上下封顶、取方便数) 3.列表划记特别简单、特难全对 表2-1 130名健康成年男子脉搏(次/分)的频数分布表 组段划记频数相对频数(%) 频数频数(%) (1) (2) (3) (4)=(3)/N(5)=(3) (6)=(5)/N 56~ 2 1.54 2 1.54 59~正 5 3.85 7 5.38 62~正正12 9.23 19 14.62 65~正正正15 11.54 34 26.15 68~正正正正正25 19.23 59 45.38 71~正正正正正一26 20.00 85 65.38 74~正正正19 14.62 104 80.00 77~正正正15 11.54 119 91.54 80~正正10 7.69 129 99.23 83~85 一 1 0.77 130 100.00 合计130 ·频数表有2个重要特征: (1)集中趋势划记的杠杠(数据)多数向中间集中 (2)离散趋势划记的杠杠(数据)少数向两头分散

04第四章 统计资料的初步描述习题

第四章统计资料的初步描述 一、单项选择题 1、数值随着总体范围大小发生增减变化的统计指标是()。 ①总量指标②相对指标③平均指标④标志变异指标 2、将总量指标按其反映总体总量的内容不同分为()。 ①总体标志总量指标和总体单位总量指标 ②时期指标和时点指标 ③实物总量指标和价值总量指标 ④动态指标和静态指标 3、若以我国工业企业为研究对象,则单位总量指标为()。 ①工业企业总数②工业职工总人数 ③工业设备台数④工业增加值 4、下列表述正确的是()。 ①单位总量与标志总量无关②单位总量和标志总量是相对的 ③某一总量指标在某一总体中是单位总量指标,则在另一总体中也一定是单位总量指标 ④某一总量指标在某一总体中是标志总量指标,则在另一总体中也一定是标志总量指标 5、某地区年末居民储蓄存款余额是()。 ①时期指标②时点指标③相对指标④平均指标 6、总量指标数值大小()。 ①随总体范围增大而增大②随总体范围增大而缩小 ③随总体范围缩小而增大④与总体范围大小无关 7、下列指标中,哪个不是时期指标()。 ①森林面积②新增林地面积 ③减少林地面积④净增林地面积 8、下列指标中属于时点指标的是()。 ①国内生产总值②劳动生产率 ③固定资产投资额④居民储蓄存款余额 9、下列指标中属于时期指标的是()。 ①人口出生数②人口总数 ③人口自然增长率④育龄妇女数 10、相对指标是不能直接相加的,但在特定条件下,个别指标可以相加,如()。 ①结构相对指标②动态相对指标 ③比例相对指标④强度相对指标 11、某产品单位成本计划规定比基期下降3%,实际比基期下降3.5%,单位成本计划完成程度为()。 ① 85.7% ② 99.5% ③ 100.5% ④ 116.7% 12、宏发公司2006年计划规定利润应比2005年增长10%,实际执行的结果比2005年增长了12%,则其计划完成程度为()。 ① 83% ② 120% ③ 101.8% ④ 98.2% 13、按照计划,宏发公司今年产量比上年增加30%,实际比计划少完成10%,同上年相比,今年产量实际增长程度为

统计学 第2章 统计数据的描述

第2章统计数据的描述 练习: 2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的 等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (1) 指出上面的数据属于什么类型; (2)用Excel制作一张频数分布表; (3) 绘制一张条形图,反映评价等级的分布。 2.2某行业管理局所属40个企业2002年的产品销售收入数据如下(单位:万元): 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业, 105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 2.3某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 2.4为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果 如下: 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701

第二章 统计数据的描述

第二章统计数据的描述 一、填空题: 1.统计分组有等距分组与异距分组两大类。 2. 频率是每组数据出现的次数与全部次数之和的比值。 3. 统计分组的关键在于确定组数和组距。 4. 统计表从形式上看,主要由表头(总标题)、横行标题、纵栏标题和数字资料(指标数值)四部分组成。 5. 均值是测度集中趋势最主要的测度指标,标准差是测度离散趋势最主要的测度指标。 6.当平均水平和计量单位不同时,需要用变异系数(离散系数)来测度数据之间的离散程度。 7.众数是一组数据中出现次数最多的变量值。 8.对于一组数据来说,四分位数有 3 个。 二、单项选择题: 1. 次数是分配数列组成的基本要素之一,它是指( B )。 A、各组单位占总体单位的比重 B、分布在各组的个体单位数 C、数量标志在各组的划分 D、以上都不对 2. 某连续变量数列,其末组为600以上。又如其邻近组的组中值为560,则末组的组中值为 ( D )。 A、620 B、610 C、630 D、640 3. 变量数列中各组频率的总和应该是( B )。 A、小于1 B、等于1 C、大于1 D、不等于1 4. 某连续变量数列,其首组为500以下。又如其邻近组的组中值为520,则首组的组中值为 ( C )。 A、460 B、470 C、480 D、490 5. 在下列两两组合的指标中,哪一组的两个指标完全不受极端数值的影响(D ) A、算术平均数和调和平均数 B、几何平均数和众数 C、调和平均数和众数 D、众数和中位数 6. 在编制等距数列时,如果全距等于56,组数为6,为统计运算方便,组距应取(D )

A、9.3 B、9 C、6 D、10 7. 一项关于大学生体重的调查显示,男生的平均体重是60公斤,标准差为5公斤;女生的平均体重是50公斤,标准差为5公斤.据此数据可以推断( B) 用变异系数算 A、男生体重的差异较大 B、女生体重的差异较大 C、男生和女生的体重差异相同 D、无法确定 8. 某生产小组有9名工人,日产零件数分别为10,11,14,12,13,12,9,15,12.据此数据计算的结果是( A ) 众数12 中位数12 平均数12 A、均值=中位数=众数 B、众数>中位数>均值 C、中位数>均值>众数 D、均值>中位数>众数 9. 按连续型变量分组,最后一组为开口组,下限值为2000。已知相邻组的组距为500,则最后一组组中值为(B ) A、2500 B、2250 C、2100 D、2200 10. 下列数据是某班所有学生的统计学考试成绩:72,90,91,84,85,57,90,84,77,84,69,77,66,87,85,95,86,78,86,45,87,92,73,82。这些成绩的极差是(B) A、78 B、50 C、45 D、40 11. 下列关于众数的叙述中,不正确的是( C ) A、一组数据可能存在多个众数 B、一组数据可能没有众数 C、一组数据的众数是唯一的 D、众数不受极端数值的影响 三、多项选择题: 1. 下列分组哪些是按品质标志分组?(BCDE ) A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按所有制分组 E、人口按地区分组 F、职工按收入水平分组 2. 下列分组哪些是按数量标志分组(AF )。 A、职工按工龄分组 B、科技人员按职称分组 C、人口按民族分组 D、企业按所有志分组 E、人口按地区分组 F、职工按收入水平分组 3. 下列哪些属于离散程度的测度指标(BDE )。 A、几何平均数 B、极差 C、中位数 D、方差 E、离散系数 4. 下列哪些属于集中趋势的测度指标(AC )。

第四章 数据特征与统计描述

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 第四章数据特征与统计描述 第四章数据特征与统计描述 1/ 105

本章结构? ???第一节第二节第三节第四节频数分布表与频数分布图计量资料的常用统计指标计数资料的常用统计指标统计图表

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 第一节频数分布表与频数分布图 3/ 105

一、频数分布表 (frequency table)用途:用于描述资料的分布特征频数:在一批样本中,相同情形出现的次数称为该情形的频数。 资料类型计数和等级计量组段观察结果的所有分类根据观察结果重新划分频数相同类别出现的次数分组统计P44 表4-1,4-2,4-3

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 表4-3 某地150名正常成年男子红细胞数(1012/L)编号红细胞数12 3 4 5 6 73.984.54 4.74 5.13 4.43 4.81 4.98编号… 143 144 145 146 147 148红细胞数… 4.67 5.40 5.29 4.77 5.38 5.158 …3.79 …1491504.645.19 5/ 105

统计学方积乾 第七版 第二章 定量资料的统计描述课后练习题答案

第2章 定量资料的统计描述 案例2-1(P27) 答:该资料为一正常人群发汞值的检测结果,已整理成频率分布表(P27)。统计描述时应首先考察资料的分布规律,通过频率(频数)分布表(表2-9 P27)和直方图(图2-3 P14)可以看出,此238人发汞值的频数分布呈正偏态分布,即观察值绝大多数集中在发汞值较小的组段。 对偏态分布,选用算术均数和标准差进行统计描述是不恰当的。应选用中位数描述该市居民发汞平均水平,选用四分位间距描述居民发汞值变异度,计算如下: 25507523.5(23825%20) 4.7(mol/kg) 6625.5(23850%86) 6.6(mol/kg) 602 7.5(23875%146)8.9(mol/kg) 48(%) x x L x i P L n x f f P u P u P u =+?==+?==+?==+?S

离散程度指标: 四分位间距=P75-P25=8.9-4.7=4.2umol/kg。 故该市居民发汞平均水平为6.6 umol/kg,离散度为4.2umol/kg,

思考与练习(P31) 1. 答: (1) 某年某地120例6-7岁正常男童胸围测量结果(cm)的频数分布 Group Frequency Percent Cumulative Percent 49.0- 1 .8 .8 50.0- 4 3.3 4.2 51.0- 8 6.7 10.8 52.0- 6 5.0 15.8 53.0- 19 15.8 31.7 54.0- 18 15.0 46.7 55.0- 14 11.7 58.3 56.0- 26 21.7 80.0 57.0- 10 8.3 88.3 58.0- 9 7.5 95.8 59.0- 4 3.3 99.2 61.0-62.0 1 .8 100.0 Total 120 100.0

第2章 统计描述思考与练习参考答案

第2章统计描述 思考与练习参考答案 一、最佳选择题 1. 编制频数表时错误的作法是( E )。 A. 用最大值减去最小值求全距 B. 组距常取等组距,一般分为10~15组 C. 第一个组段须包括最小值 D. 最后一个组段须包括最大值 E. 写组段,如“~3,3~5, 5~,…” 2. 描述一组负偏峰分布资料的平均水平时,适宜的统计量是(A)。 A. 中位数 B. 几何均数 C. 调和均数 D. 算术均数 E. 众数 3. 比较5年级小学生瞳距和他们坐高的变异程度,宜采用(A)。 A. 变异系数 B. 全距 C. 标准差 D. 四分位数间距 E. 百分位数与的间距 4. 均数X和标准差S的关系是(A)。 A. S越小,X对样本中其他个体的代表性越好 B. S越大,X对样本中其他个体的代表性越好 C. X越小,S越大 D. X越大,S越小 E. S必小于X 5. 计算乙肝疫苗接种后血清抗-HBs的阳转率,分母为(B)。 A. 阳转人数 B. 疫苗接种人数 C. 乙肝患者数 D. 乙肝病毒携带者数 E. 易感人数 6. 某医院的院内感染率为人/千人日,则这个相对数指标属于(C)。 A. 频率 B. 频率分布 C. 强度 D. 相对比 E. 算术均数 7. 纵坐标可以不从0开始的图形为(D)。

A. 直方图 B. 单式条图 C. 复式条图 D. 箱式图 E. 以上均不可 二、简答题 1. 对定量资料进行统计描述时,如何选择适宜的指标 答:详见教材表2-18。 教材表2-18 定量资料统计描述常用的统计指标及其适用场合 描述内容指标意义适用场合 平均水平均数个体的平均值对称分布 几何均数平均倍数取对数后对称分布 中位数位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众数频数最多的观察值不拘分布形式,概略分析 调和均数基于倒数变换的平均值正偏峰分布资料 变异度全距观察值取值范围不拘分布形式,概略分析 标准差(方差)观察值平均离开均数的 程度 对称分布,特别是正态分布资料 四分位数 间距居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比 ①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 2. 举例说明频率和频率分布的区别和联系。 答:2005年某医院为了调查肺癌患者接受姑息手术治疗1年后的情况,被调查者150人,分别有30人病情稳定,66人处于进展状态,54人死亡。 当研究兴趣只是了解死亡发生的情况,则只需计算死亡率54/150=36%,属于频率指标。当研究者关心患者所有可能的结局时,则可以算出反映3种结局的频率分别为20%、44%、36%,它们共同构成所有可能结局的频率分布,是若干阳性率的组合。

第二章 统计数据的描述

第二章统计数据的描述 一、单项选择题 1.当数据呈对称分布或接近对称分布时,应选择( )作为集中趋势的代表值。 A .众数 B .均值 C .中位数 D .几何平均数 2.( )是用来对两组数据的差异程度进行相对比较的。 A .标准差 B .离散系数 C .平均差 D .全距 3.由组距数列确定众数时,如果众数相邻两组的次数相等时,则( )。 A .众数为零 B .众数就是那个最大的变量值 C .众数组的组中值就是众数 D .众数就是当中那一组的变量值 4.某连续变量数列,其首组为50以下。又知其邻近组的组中值为75,则首组的组中值为( ) A 24 B 25 C 26 D 27 5.两组数据相比较( )。 A.标准差大的离散程度也就大 B.标准差大的离散程度就小 C .离散系数大的离散程度也就大 D.离散系数大的离散程度就小 6.某连续变量分为5组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,则( ) A.50在第一组,70在第四组 B.60在第三组,80在第五组 C.70在第三组,80在第五组 D.80在第四组,50在第二组 7.若某总体次数分布呈左偏分布,则成立的有()。 A.x >e M >o M B.x o M >e M D.以上都不对 8.统计分组的依据是() A.标志 B.指标 C.标志值 D.变量值 9.统计分组的关键在于() A.正确选择分组标志 B.正确划分各组界限 C.正确确定组数和组限 D.正确选择分布数列种类 10.在全距一定的情况下,组距的大小与组数的多少成() A.正比B.反比C.无比例关系D.有时成正比有时成反比 11.按某一标志分组的结果表现为() A.组内同质性,组间同质性 B.组内同质性,组间差异性 C.组间差异性,组间同质性 D.组间差异性,组间差异性 12.不能全面反映总体各单位标志值变异程度的标志变异指标是() A.全距B.平均差C.标准差 D.标准差系数 13.某单位职工最大年龄与最小年龄之差称为该单位职工年龄的 ( ) A.标 志 B.全距 C.平均差 D.众 数 14.某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( )。 A. 10% B. 7.1% C. 7% D. 11%

第二章 统计数据的描述习题及答案

第一章统计数据的描述习题及答案 1.简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。 2.为什么要计算离散系数? 答:在比较二组数据的差异程度时,由于方差和标准差受变量值水平和计量单位的影响不能直接比较,由此需计算离散系数作为比较的指标。 3.某百货公司6月份各天的销售额数据如下(单位:万元): 257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 (1)计算该百货公司日销售额的均值、中位数和四分位数;(2)计算日销售额的标准差。 解:(1)将全部30个数据输入Excel表中同列,点击列标,得到30个数据的总和为8223,于是得该百货公司日销售额的均值: 或点选单元格后,点击“自动求和”→“平均值”,在函数EVERAGE()的空格中输入“A1:A30”,回车,得到均值也为274.1。在Excel表中将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数: 由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的Excel表中第8位是261,第15位是272,从而: 同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后的Excel表中第23位是291,第16位是273,从而: (2)未分组数据的标准差计算公式为:

第四章 描述性统计分析_表格法

第4章表格法 在统计分析里,一般用来做统计表的命令有PROC FREQ和PROC TABULATE两种,一般用来做统计图的命令为PROC CHART。 1、PROC FREQ(次数分配表) FREQ是对类别变量进行归纳的程序。它的一般形式为: PROC FREQ OPTION1; 必需语句 TABLES 变量/OPTION2; BY 变量; WEIGHT 变量; □PROGRAM解释 -proc freq:次数分配表制作过程中的必需语句,如果仅有此语句,则生成输入数据集中每个变量的单向频数表。□OPTION1 -data=资料名 -order= :界定各类别出现的次序。

order=freq,次序先后依据各类别次数多少而定; order=data,次序就是它们在输入数据时出现的次序。 order=internal,类别先后由英文字母先后决定。 order=formatted,类别次序由外在格式确定。 省略此选项时,内设置为order=internal,另外,缺省值数据总是排在最前面。 -formchar(1 2 7)=‘画表格的符号’,1代表纵轴,2代表横轴,7代表中心点。若无此选项,各位置上的符号系统有内设置。 □TABLES 语句 -tables 变量:指定做频数表的变量。用tables指令时,后边可以是一个变量,也可以是多个变量。根据变量设计一元、二元或多元变量的频数表。 -tables a;做的是变量a为行变量的频数表。 -tables a*b;做的是变量a为行变量,变量b为列变量的频数表。 -tables a*b*c;做的是以变量a分类,变量b为行变量,变量c为列变量的频数表。如果是三元以上的频数表,则倒数第二

第二章 简单统计描述分析

第二章单变量和双变量统计描述分析 第一节单变量统计描述基本技术 一、变量的计量尺度/层次 1、定类变量——最低层次的变量类型。只有类别属性之分,无大小程度之分。根据变量值,只能知道研究对象的异同。从数学运算特性来看,定类变量只有等于或不等于的性质。 2、定序变量——层次高于定类变量。取值除类别属性外,还有等级、次序之分。数学运算特性除等于或不等于外,还有大于或小于。 3、定距变量——层次高于定序变量。取值除类别属性、次序之外,取值之间的距离可以用标准化的举例度量。数学运算特性除等于不等于,大于小于之外,还可以加减。如收入,以1元为标准化距离,则2000元比1500元多了500元。 4、定比变量——最高层次变量。除了上述三种属性外,可以进行乘除运算。 1、社会学研究中,能够满足定距而不能同时满足定比要求的变量不多。如智商,因为智商0分只有相对的意义,0分不等于没有智商,且0值不固定。当前社会统计方法很少要求达到定比层测,所以只介绍前三种层次变量。 2、在社会学研究当中,有些变量的层次是不统一可变的,可用定序层次也可用定距层次,根据研究需要。高层次变量可以降低层次来使用。一般来说,测量层次越高越好,数学特性就越多,统计分析就越方便,能了解资料的程度就越深入。 二、基本技术 1、次数分布(定类)——针对定类变量 最基本的统计分析方法。面对大量的数据资料,首先要组织整理,第一步就是要采用次数分布来简化资料,看某变量的每一个值出现的次数是多少。 定类变量的取值要求:变量取值必须完备,使得每个各观察值都有所归类;必须互斥,一个观察值只能归入一类,对于分组数据遵循上限不包括在内原则。 次数分布可简化资料,但不能比较样本,因为样本量不同。 2、比、比例和比率(通常保留一位或两位小数) 比:某两类的次数相除,如性别比=男性/女性 比例:某类次数除以总数,老年人口比例=老年人口数/总人口数×100% 比率:某一确定变量相对应的某些事件发生的频率。分子和分母不存在隶属关系,有时是不同的变量,如人均GDP,患病率。 3、累加次数和累加百分比(定序和定距)

STATA 第二章 描述性统计命令与输出结果说明

第二章描述性统计命令与输出结果说明 上述数据也可以用变量x表示血磷测定值,分组变量group=0表示患者组和group=1表示健康组(如:患者组中第一个数据为2.6,则x=2.6,group=0;又如:健康组中第三个数据为1.98,则x为1.98以及group为1),并假定这些数据已以STATA格式存入ex2a.dta文件中。 计算资料均数,标准差命令summarize,以述资料为例: . summarize Variable Obs Mean Std. Dev. Min Max x1 11 4.710909 1.302977 2.6 6.53 x2 13 3.354615 1.304368 1.67 5.78 Mean 均值;Std.Dev.标准差 即:本例中急性克山病患者组的样本数为11,血磷测定值均数为4.711(mg%),相应的标准差为1.303,最小值为2.6以及最大值为6.53;健康组的样本量为13,血磷测定值均数为3.3546,相应的标准差为1.3044,最小值为1.67以及最大值为5.78。 计算资料均数,标准差,中位数,低四分位数和高四分位数的命令summarize 以及子命令detail,仍以述资料为例:

. summarize x1 x2,detail x1 Percentiles Smallest 1% 2.6 2.6 5% 2.6 3.24 10% 3.24 3.73 Obs 11 25% 3.73 3.73 Sum of Wgt. 11 50% 4.73 Mean 4.710909 Largest Std. Dev. 1.302977 75% 5.78 5.58 90% 6.4 5.78 Variance 1.697749 95% 6.53 6.4 Skewness -.0813446 99% 6.53 6.53 Kurtosis 1.809951 x2 Percentiles Smallest 1% 1.67 1.67 5% 1.67 1.98 10% 1.98 1.98 Obs 13 25% 2.33 2.33 Sum of Wgt. 13 50% 3.6 Mean 3.354615 Largest Std. Dev. 1.304368 75% 4.17 4.17 90% 4.82 4.57 Variance 1.701377 95% 5.78 4.82 Skewness .2963943 99% 5.78 5.78 Kurtosis 1.875392 . 结果: Percentiles 显示了从1%到99%的分位数的取值。第二列是最小和最大的5个数。第三列从上到下:obs观测值数目、mean平均数、std.dev标准差、variance 方差。 skewness偏度:偏度的绝对值越小,表明该数据的正态对称性越好。 kurtosis峰度:峰度值越大表明该数据的正态峰越明显。 95%可信限计算: 正态数据:ci 变量名 0-1 数据:ci 变量名,binomial poisson分布数据:ci变量名,poisson 90%可信限计算(其它可信限类推) 正态数据:ci 变量名,level(90) 0-1数据:ci 变量名,level(90) binomial poisson分布数据:ci 变量名,level(90) poisson ci x1 x2 . ci x1 x2 Variable Obs Mean Std. Err. [95% Conf. Interval] x1 11 4.710909 .3928624 3.835557 5.586261 x2 13 3.354615 .3617667 2.566393 4.142837 [95%Conf.Interval]为95%的可信限,因此x1的95%可信限为[3.8356,5.5863],x2的95%可信限为[2.5664,4.1428]。 根据样本数,样本均数和标准差计算可信限。

第二章 统计图表

第二章统计图表 第一节统计图 一、统计表的结构与种类 统计表:是将要统计分析的事物或指标以表格的形式列出来,以代替烦琐文字描述的一种表现形式。 (一)统计表的结构 ?序号 ?名称(标题):表的题目,居表上端的中间位置,概括全表统计资料的主要内容。 ?标目(项目):统计表的横行标题和纵列标题。 ?数字:统计表的语言,又称统计指标。 ?表注 ?线条 (二)统计表的种类 统计表按分类标志的标准和数目的不同,分为: ?简单表 简单表:统计资料的标目未经任何分组,只按一个标志简单列出调查单位、时序或统计指标名称的统计表。 ?分组表 分组表:统计资料的标目按一个标志(品质或数量)进行分组列成都统计表。 ?复合表 由两个或两个以上标志分组列成的统计表 二、次数分布表 定义:表现总体单位在各组次数分配情况的统计表 (一)简单次数分布表 是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。

(二)分组次数分布表 分组次数分布表的编制步骤: ? 1.求全距——R ? 2.定组数——K ? 3.求组距——I ? 4.定组限 ?表述组限与精确组限 ? 5.求组中值 ? 6.归类划记 ?7.记录次数 ?8.核对 (三)、累积次数分布表 通过简单次数分布表中各组对应的次数,可以进一步求出累积次数,制成累积次数分布表。 第二节统计图 定义:利用几何图形或具体事物来表示统计事项数量关系的图形。 一、统计图的结构 图号及图题;图目;图尺;图形;图例;图注等。 二、几种常见统计图的应用举例 (一)条形图 用相同宽度的条形长短或高度来比较图示指标数值大小的图形。 (二)圆形图 用圆形内扇形面积的大小来说明总体中各组成部分构成比例的图形。 练习题:某大学美术系有教职工58人,其中教师48人,行政和教辅人员10人。48位教师中,教授18人,副教授15人,讲师15人。请绘制一个圆形统计图表示该系教职工的比例。 (三)曲线图:用曲线的升降来表现统计资料数值变动的图形。 1.动态曲线图:表现统计事项随时间的变化其整体指标数值发展变化趋势的

第二章课本习题答案

第2章统计数据的描述 练习题部分: 2.1为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。服务质量的 等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。调查结果如下: B E C C A D C B A E D A C B C D E C E E A D B C C A E D C B B A C D E A B D D C C B C E D B C C B C D A C B C D E C E B B E C C A D C B A E B A C D E A B D D C A D B C C A E D C B C B C E D B C C B C (2)用Excel制作一张频数分布表; (3)绘制一张条形图,反映评价等级的分布。 2.2某行业管理局所属40个企业2008年的产品销售收入数据如下(单位:万元): 152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 108 97 88 123 115 119 138 112 146 113 126 (1)根据上面的数据进行适当的分组,编制频数分布表,并计算出累积频数和累积频率; (2)如果按规定:销售收入在125万元以上为先进企业,115万~125万元为良好企业, 105万~115万元为一般企业,105万元以下为落后企业,按先进企业、良好企业、一般企业、落后企业进行分组。 2.3某百货公司连续40天的商品销售额如下(单位:万元): 41 25 29 47 38 34 30 38 43 40 46 36 45 37 37 36 45 43 33 44 35 28 46 34 30 37 44 26 38 44 42 36 37 37 49 39 42 32 36 35 根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。 2.4为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果 如下: 700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727

第2章描述性统计分析实例

第2章 描述性统计分析实例 当进行数据分析时,如果研究者得到的数据量很小,那么就可以通过直接观察原始数据来获得所有的信息;如果得到的数据量很大,那么就必须借助各种描述指标来完成对数据的描述工作。用少量的描述指标来概括大量的原始数据,对数据展开描述的统计分析方法被称为描述性统计分析。常用的描述性统计分析有频数分析、描述性分析、探索分析、列联表分析。下面我们将一一介绍这几种方法在实例中的应用。 2.1 实例1——频数分析 2.1.1 频数分析的功能与意义 SPSS的频数分析(Frequencies)是描述性统计分析中比较常用的方法之一。通过频数分析,我们可以得到详细的频数表以及平均值、最大值、最小值、方差、标准差、极差、平均数标准误、偏度系数和峰度系数等重要的描述统计量,还可以通过分析得到合适的统计图。所以进行频数分析不仅可以方便地对数据按组进行归类整理,还可以对数据的分布特征形成初步的认识。 2.1.2 相关数据来源 下载资源\video\chap02\... 下载资源\sample\2\正文\原始数据文件\案例2.1.sav 【例2.1】表2.1给出了山东省某学校50名高二学生的身高。试分析这50名学生的身高分布特征,计算平均值、最大值、最小值、标准差等统计量,并绘制频数表、直方图。 表2.1 山东省某学校50名高二学生的身高 编号身高(cm) 001 175 002 163 003 156 004 174 005 167 … … 048 158 049 164 050 163

15 第2章 描述性统计分析实例 2.1.3 SPSS分析过程 在用SPSS 进行分析之前,我们要把数据录入到SPSS 中。本例中有两个变量,分别是编 号和身高。我们把编号定义为字符型变量,把身高定义为数值型变量,然后录入相关数据。录入完 成后,数据如图2.1所示。 图2.1 案例2.1数据 先做一下数据保存,然后开始 展开分析,步骤如下: 进入SPSS 24.0,打开相关数据文件,选 择“分析”|“描述统计”| “频率”命令,弹出如图2.2所示的对话框。 选择进行频数分析的变量。在“频率”对 话框的左侧列表框中选择“身高”选项,单击中间 的按钮使之进入“变量”列表框。 选择是否输出频数表格。选中“频率”对 话框左下角的“显示频率表”复选框,要求输出频数表格。 选择输出相关描述统计量。单击“频率”对话框右上角的“统计”按钮,弹出如图 2.3所示的对话框,在该对话框中可以设置相关描述统计量。我们在“百分位值”选项组中选中“四分位数”“分割点”复选框;在“集中趋势”选项组中选中“平均值”“中位数”“众数”“总和”复选框;在“离散”选项组中选中“标准差”“方差”“范围”“最小值”“最大值”“标 准误差平均值”复选框;在“分布”选项组中选中“偏度”“峰度”复选框。设置完毕后,单击“继续”按钮返回“频率”对话框。 设置图表的输出。单击“频率”对话框中的“图表”按钮,弹出如图 2.4所示的对话 框,选择有关的图形输出。在此我们选择直方图,并且带正态曲线。 图2.2 “频率”对话框

相关主题
文本预览
相关文档 最新文档