《统计学》第6版练习题含答案 (2章)
- 格式:docx
- 大小:17.22 KB
- 文档页数:8
第一章绪论第二章(一)A1型:1.下面的变量中,属于分类变量的是_____。
A.脉搏B.血型C.肺活量D.红细胞计数E.血压2.下面的变量中,属于定量变量的是_____。
A.性别 B.体重 C.血型 D.职业 E.民族3.某人记录了50名病人体重的测定结果:小于50kg的13人,介于50kg和70kg间的20人,大于70kg的17人,此种资料属于_____。
A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料4.上述资料可以进一步转换为_____。
A.定量资料B.分类资料C.有序资料D.二分类资料E.名义变量资料5.若要通过样本作统计推断,样本应是_____。
A.总体中典型的一部分B.总体中任一部分C.总体中随机抽取的一部分D.总体中选取的有意义的一部分E.总体中信息明确的一部分6.统计量_____。
A.是统计总体数据得到的量 B.反映总体统计特征的量C.是根据总体中的全部数据计算出的统计指标D.是用参数估计出来的E.是由样本数据计算出的统计指标7.因果关系_____。
A.就是变量间数量上的联系 B.可以用统计方法证明 C.必定表现为数量间的联系D.可以通过单独考察两个变量间关系得出E.可以通过变量间数量上的联系来证明(二)A2型:1.教材中提及美国人1954年实施了旨在评价索尔克(Salk)疫苗预防小儿麻痹或死于脊髓灰质炎效果的临床试验。
有180万儿童参与,约有1/4参与者得到了随机化。
这180万儿童是_____。
A.目标总体B.研究总体C.1份样本D.1份随机样本E.180万份样本2.上述试验最终肯定了索尔克疫苗的效果。
请问此结论是针对_____而言。
A.180万儿童B.每个儿童C.所有使用索尔克疫苗的儿童D.所有儿童E.180万儿童中随机化的1/4二、是非题 1.定量变量、分类变量和有序变量可以相互转换。
2.假变量可以参与计算,所以假变量是定量变量。
3.离散变量在数值很大时,单位为“千”或“万”时可以取小数值,此时可近似地视为连续型变量。
统计学一、单选1、从某高校随机抽出100名学生,调查他们每月的生活费支出,这研究的统计量是A 该校学生的总人数B 该校学生的月月平均生活费支出C 该校学生的生活费总支出D 100名学生的月平均生活费支出2、下列变量中,顺序变量是A职工人数 B产量 C产品等级 D利润总额3、将总体中所有单位按某种变量划分为若干层,再从各层中随机抽出一些单位组成一个样本。
这种抽样方式是A 简单随机抽样B 分层抽样C 整群抽样D 系统抽样4、指出下面陈述中错误的是A 抽样误差只存在于概率抽样中B 非抽样误差只存在于非概率抽样中。
C概率抽样和非概率抽样都存在非抽样误差。
D在普查中存在非抽样误差。
5、展示广告费支出与商品销售量之间是否有某种数量关系,最适合的图形是 A柱形图 B饼图 C线图 D散点图6、当样本量一定时,置信区间的宽度A 随置信水平的增大而减小B随置信水平的增大而增大C与置信水平的大小无关D与置信水平的平方根成反比7、在检验一个正态总体方差时,使用的分布是A z分布B t分布C X 分布D F分布8、指出下面陈述中的错误的是A 抽样误差可以避免B 抽样误差不可避免C 非抽样误差可以避免D 抽样误差可以控制9、假设检验中,如果计算出的P值越小,说明检验的结果越A 真实B 不真实C 显著D 不真实10、双因素方差分析涉及 自变量A 一个分类型B 一个数值型C 两个分类型D 两个数值型二、填空题1、当一组数据对称分布时,经验法则表明,大约有68%的数据分析在( 平均数±一个标准差 )的范围之内2、对于一组具有单峰分布的数据而言,当数据的m m >时,可判断数据是(左偏)分布3、连续变量在编制组距式变量数列时,其相邻两组的上下限必须重叠。
为解决不重的问题,应按照( 上组限不在内 )的规定确定数据所在的组4、单因素方差分析中,组间平方和SSA 对应的自由度为( k-1 ),组内平方和SSE 对应的自由度( n-k )5、数值型变量根据其取值的不同,可分为( 连续 )型变量和(离散 )型变量。
第一章总论一、填空题1.威廉·配弟、约翰·格朗特2.统计工作、统计资料、统计学、统计工作、统计资料、统计学3.数量对比分析4.大量社会经济现象总体的数量方面5.大量观察法、统计分组法、综合指标法、统计推断法6.统计设计、统计调查、统计整理、统计分析7.信息、咨询、监督8.同质性9.大量性、同质性、差异性10.研究目的、总体单位11.这些单位必须是同质的12.属性、特征13.变量、变量值14.总体单位、总体15.是否连续、离散、性质二、是非题1.非2.非3.是4.非5.是6.非7.是8.是9.是10.非11.非12.非13.非14.是15.非三、单项选择题1.C 2.B 3.C 4.A 5.C 6.C 7.A 8.A 9.C 10.B11.A 12.B 13.C 14.A 15.A四、多项选择题1.BC 2.ABC 3.ABE 4.ABCD 5.BCDE 6.AC 7.ABCDE 8.BD9.AB 10.ABCD 11.BD 12.ABCD 13.BD 14.ABD 15.ABC五、简答题略第二章统计调查一、填空题1.统计报表普查重点调查抽样调查典型调查2.直接观察法报告法采访法3. 统计报表专门调查4. 经常性一次性5. 调查任务和目的调查项目组织实施计划6. 单一表一览表7. 基层填报单位综合填报单位8. 原始记录统计台帐9. 单一一览二、是非题1.是2.是3.非4.是5.非6.是7.是8.非9.是 10.是三、单项选择题1. D2. A3. C4. A5. B6. C7. B8. D9. C 10. B四、多项选择题1. BCE2. ABCDE3. ADE4. ADE5.ACDE6. ABD7. BCDE8. ABE9.ACD五、简答题略第三章统计整理一、填空题1.统计汇总选择分组标志2.资料审核统计分组统计汇总编制统计表3.不同相同4.频率比率(或频率)5.全距组距6.上限以下7.组中值均匀8.离散连续重叠分组9.手工汇总电子计算机汇总10.平行分组体系复合分组体系11.主词宾词12.简单表简单分组表复合分组表二、是非题1.非2.非3.非4.非5.是6.是7.是8.非9.是10.是三、单项选择题1.A2.B3.A4.B5.B6.D7.B 8 .B 9.B 10.C11.A四、多项选择题1.BCDE2.ACD 3 .AE 4.ACE 5. ABD 6.ABD 7.ACDE 8.ABD 9.ADE 10.AC五、简答题略六、综合题1、(1)、( 2 )2.3.按工资(元)分组工人数(人)4000以下 24000--4500 44500--5000 45000--5500 35500--6000 106000--6500 76500--7000 87000--7500 27500--8000 48000--8500 28500--9000 29000--9500 19500以上 1合计50组距为1000元较合适4.(2)、变量数列为:第四章 综合指标一、填空题1.总体单位总量、标志总量、时点指标、时期指标、实物指标、价值指标、劳动量指标2.时点指标、没有意义、时期指标、可以 3.劳动时间-工时或工日4.无名数、有名数、强度、有名数、无名数 5.分组、总体单位总量、各组标志总量 6.104.55% 7.比例8.比较相对指标 9.强度相对指标 10.复名数、无名数 11.同质总体中12.总体各单位标志值之和、总体单位数、未分组资料、已分组资料 13.各组的标志值或各组的组中值、各组的次数或比重 14.某组的权数或比重越大 15. 离差和16.标志值的倒数、倒数 17.几何平均数18.奇数、偶数、简单平均 19.2∑f20.众数21.集中趋势、离中趋势 22.代表性、反比 23.绝对值 24.离散系数 25.P 、)1(P P -二、是非题1.是 2.非 3.非 4.非 5.非 6.是 7.是 8.非9.非 10.是 11.非 12.是 13.是 14.非 15.非 16.是 17.是三、单项选择题1.A 2.D 3.D 4.B 5.C 6.C 7.A 8.C 9.A 10.B 11.C 12.C 13.D 14.A 15.A四、多项选择题1.ABCDE 2.ABCD 3.ABCDE 4.ABCD 5.ABDE 6.AD 7.BC 8.CD 9.ABC 10.ABCDE 11.ABD 12.BCD 13.AC五、简答题略六、综合题1.解(1)直接材料占全部成本的比重=40002500×100% = 62.5%直接人工占全部成本的比重=40001000×100% = 25%制造费用占全部成本的比重=4000500×100%= 12.5% (2)直接材料:直接人工:制造费用=2500:1000:500=5:2:12.解:列表计算3.解:2016年该地区财政收入计划完成程度=120160×100%≈133.33%4.解: 变量数列编制如下表平均日产量x =∑∑fxf =371049≈28.35(件) 众数M=29(件)中位数位次=2∑f =237=18.5 根据向下累积或向上累积中位数组在第三组 中位数Me=28(件)5.解:算术平均数计算列表如下户平均月收入=∑∑fxf =27004930000=1825.93 (十元)众数组为1700-2100 众数M=1700+)500800()600800()600800(-+--×400=1860(十元) 或=2100-)500800()600800()500800(-+--×400=1860(十元) 中位数位次=2∑f=22700=1350 中位数组为1700-2100中位数M e =1700+800110022700-×400 =1825(十元)或=2100-80080022700-×400=1825(十元) 6.算术平均数∑∑=f xf x =1724(十元)7.平均计划完成程度∑∑=f xf x =10780001133560≈105.15%8.平均日产量H=∑∑x m m =105091808240784636590++++≈8.08(件)9. 平均价格H=∑∑x m m =21295400208104000210115500314900++≈209.93(元/千克)10.平均完成程度H=∑∑x m m =05.1131250098.0127400006.114840004070500++≈103.05% 11. A 商店 平均等级=3000100031000210001⨯+⨯+⨯=2平均价格=153.33(元/千克) B 商店 平均等级=3300110031000212001⨯+⨯+⨯≈1.97平均价格≈151.21(元/千克) 12.平均合格率≈96.99% 13.平均合格率≈99.35% 14.平均年利率≈6.428%15.甲班组平均工资=3820( 元 )全距=600( 元 )平均差=200( 元 )乙班组平均工资=3820( 元 )全距=800( 元 )平均差=240( 元 )甲班组平均数代表性大16. 乙班平均身高=170.25 ( cm )平均差7.9625( cm )乙班平均数代表性大17.甲班标准差系数≈49.64%乙班平均身高=170.25( 厘米 )乙班标准差≈9.22( 厘米 )乙班标准差系数≈5.42%乙班平均数代表性大18.平均胸径=26 ( 厘米 )全距=32( 厘米 )平均差≈5.32( 厘米 )标准差≈6.44( 厘米 )平均差系数≈20.46%标准差系数≈24.76%19.中位数=12众数=15对中位数的平均差=2.24对众数的平均差=2.620.X =98%平均数P标准差)1(P P -=14%21.甲组 平均日产量≈15.33( 件 ) 标准差≈2.87( 件 )标准差系数≈18.72%乙组 平均日产量≈15.58( 件 ) 标准差≈5.91( 件 )标准差系数≈37.93% 甲组平均数代表性大 22.(1)标准差σ=256 (2) 222x x -=σ=25xV σσ=≈41.67%(3)222x x -=σ9=25-2x 4=x(4)3000)(2=∑-nx x (0x 为任意数)300)2(2002=+-∑nx x x x∴30022002=+-x x xx ①又知10)(0=-x x∴1000)(2=-x x∴10022020=+-x x x x ②①-②得:20022=-x x222x x -=σ=200第五章抽样推断一、填空题1.同等可能性原则、同等被抽中的机会、人的主观意识的作用2.样本、计算出来、控制3.母体、总体4.抽样总体或子样、样本容量5.定值6.变量总体、属性总体7.X 、σ、P 、)1(P P -8.随机原则9.抽样平均数或抽样成数、总体平均数或总体成数 10.正比、反比、增加 11.N n12.Cn N13.n 次相互独立的试验14.点估计量、误差范围、置信度 15.25 16.校正因子、1--N n N 、1-Nn17. 1.96、2、318.总体标准差、允许误差、概率度、抽样方法、抽样的组织方式二、是非题1.非2.是3.是4.是5.非6.非7.是8.是9.非 10.是11.非12.是 13.是 14. 是 15.非 16.是三、单项选择题1.C2.A3.D4.D5.D6.A7.C8.A9.C 10.C四、多项选择题1.ABCDE2.ABCDE3.BCD4.ABCDE5.ACD6.ABE7.ABC8.ACE9.BCE 10.ABCDE五、简答题略六、综合题、1.(1)全及总体平均工资X =3840(元) 全及总体标准差σ=202(元)(3)x =3840(元)=X (4)x μ=nσ=20(元) 2. (1)全及总体平均工资X =3840(元) 全及总体标准差σ=202(元)(3)x =3840(元)=X (4) x μ=)1(2--N nN n σ=103(元)3.重置抽样p μ≈2.83% 不重置抽样p μ≈2.81%4. 58.04≤X ≤61.965.(1)合格品率p=95% 抽样平均误差p μ≈1.54%(2)合格品率估计区间91.92%≤P ≤98.08% 合格品量估计区间1838.4≤NP ≤1961.6 6.抽选户数n=1600(户) 7.抽查零件数n ≈384(件) 8.(1)n ’=4n x μ=n2σ(2)n ’=4nx μ=2nσ (3) x μ’=80%x μ 抽样单位数n 增加56.25%(4)N n 1=4% Nn2=20%12x x μμ=)1%4(%4)1%20(%2022----N NN N N NN N σσ=622≈40.82%9.(1) 3494.12 kg ≤X ≤3505.88 kg (2) 1397648kg ≤400X ≤1402352 kg 10.(1)t=2.236 F(t) ≈97.49% (2)n=45(人) (3)n=178(人) (4) n=400(人)第六章相关和回归分析一、填空题1. 关系数值不确定 2.函数关系、函数关系3.-1、+1、负相关、正相关 4.正相关、负相关5.r =σσyx n y y x x ))((--∑6.r s=1-)1(622-∑n dn7.rk=1-)1(4-∑n n i8.两个变量、三个或三个以上变量 9.一元线性回归分析 10.相关系数、相关指数11.不是对等、自变量、因变量 12.自变量13.给定的数值、随机变量 14.最小二乘法 15.∑∑∑∑∑--=)(22x x n y x x n b 、nx b ny a ∑∑-=16.2)(2-=∑-n c y y syx17.多元线性回归方程、回归系数二、 判断题1.非2.非3.非4.是5.是6.是7.是8.是9.是10.是11.非12.是13.是14.是15.是16.是三、 单项选择题1.D2.B3.C4.C5.D6.C7.B8.C9.A 10.D 11.C 12.C 13.B 14.C 15.C 16.A四、 多项选择题1. AE2.CDE3.ABCDE4.CD5.DE6.ABCE7.ABC8.ABD9.ABCD10.BDE五、简答题略六、综合题1.相关系数r=0.998777032.相关系数r=0.994826017093.斯皮尔曼相关系数s r =0.806060604.肯德尔相关系数k r =0.466666665.a ≈440.70 b ≈0.80x y c 80.070.440+=当生产性固定资产平均价值为1226万元时,年增加值为1421.50万元 6.(1) a =79.10067111≈79.10b =-2.32214764≈-2.322(保留三位)x y c 322.210.79-=322.2-=∆∆xy644.42322.2322.2-=⨯-=∆-=∆x y (元)产量每增加2000件时,单位成本平均下降4.644元 (2)产量为8000件时,单位成本为60.524元/件 (3)yx s ≈0.59797.75.01292-=-==σσσy xxy r ,显著相关 19922-=-==σσxxu b ∴x yc-=12第七章统计指数习题答案一、 填空题1.个体指数 总指数2.综合指数 平均数指数3.数量指标指数 质量指标指数4.同度量 权数5.数量指标 质量指标6.数量指标指数 质量指标指数7.固定权数加权算术平均数指数 K=∑KW ∕∑W 8.乘积 和 9.∑∑00qz q z K q∑∑zKq z q z 111110. 20.75% 11. 17.65%12.其他因素不变;其中某一因素的影响方向和程度二、是非题1.非2.是3.非4.是5.是6.是7.非8.非9.非10.是三、单项选择题1.B2.C3.B4.B5.B6.B7.D8.B9.D 10.A 11.B 12.C四、多项选择题1.BC2.AD3.ABD4.ADE5.BC6.AB7.BC8.AD9.ACE10.BD五、简答题略六、综合题1、 销量指数=130.333670373%,销量影响绝对额=2608.70万元价格指数=115%,价格影响绝对额=1681.30万元 2、(1)、单位成本指数=96.92%,下降3.08% (2)、全员劳动生产率指数=117.65%,提高17.65% (3)、价格指数=86.96%,3、(1)、个体产量指数分别为125%、111.11%、120%(2)、个体成本指数分别为184.62% 、45% 、133.33%(3)、成本综合指数=120%、对总成本的影响绝对额=230000元(4)、产量综合指数=118.3128%、对总成本的影响绝对额=178000万元4、农作物收购价格指数=103.44%5、(1)、粮食类的类指数=114.6%、副食品类的类指数=103.29%(2)、食品类物价指数=106.93%6、(1)、产量指数=114.17% (2)、物价指数=97.32%(3)、由于物价变动所引起总产值减少22万元7、(1)、物价指数=98.9%,由于物价变动使销售额减少1.1万元(2)、销量指数=105.26%,由于销量变动使销售额增加5万元8、价格总指数=104.17%9、净产值指数=165%,净产值增加31.2万元职工人数指数=110%,由于职工人数的变动使净产值增加4.8万元人均总产值指数=125%,由于人均总产值的变动使净产值增加13.2万元净产值率指数=120%,由于净产值率的变动使净产值增加13.2万元第八章时间数列一、填空题1.发展水平时间2.同一指标不同时间时间先后3.相对指标对比关系4.平均指标平均水平5.时期数列时点数列6.基期水平7.累积增长量固定基期水平8.前期水平9.间隔权数10.几何法方程法11.越明显二、是非题1.是2.是3.非4.非5.是6.是7.非8.是9.非10.非三、单项选择题1. C2. B3. B4. A5. A6. D7.D8. D9. D 10. A 11. D 12. A四、多项选择题1. CDE2. ABCD3. BCE4.AB5. ABD6. ABC7. ABCD8.ABC9.BCE五、简答题略六、综合题1.209人2.118人3. 892头4. 76%5.1-6月份的计划完成程度(%)分别为:125 112.7 98.3 98.8 117.7 130.76. 120人7.略8.89.52%9.12(元/件)10. 2.5次11.略12.①略②74.49%第九章动态趋势分析一、填空题1.长期趋势季节变动循环变动不规则变动2.时距扩大法移动平均法半数平均法最小平方法3.时期数列4.Y=T+S+C+I Y=T•S•C•I5.实际观察值与计算的趋势之间的离差之和等于零6.1200%7.400%8.二级增长量二、是非题1.是2.非3.非4.是5. 非6.是7.是三、单项选择题1.B2.C3.A4.A5.A6.D7.A四、多项选择题1. A B C D2.B C3.C D4.B E5.A C6.A B C E五、简答题略六、综合题1. y=7959.3+980.7x(原点:2013年)2. y =40+8x 96吨3. 略4. 略 5 .略6.A=1.935383834 a=86.1755 B=0.04196101 b=1.1014t y =86.1755t 1014.17. t y =80.3+5.3t (2011年t =1);117.4万吨;122.7万吨 8. t y =80.24+5.32t (2011年t =1);117.5万吨;122.8万吨 9.略10. t y =250.1+6.6t (原点:2007年);276.71万元;283.36万元第十章统计预测一、填空题1.连贯的原则、类推的原则、关联原则2.预测者是否充分掌握预测对象过去和现在的资料、预测者的经验、理论及业务水平、预测者的分析判断能力3.德尔菲法、因素列举法、主观概率法、指标分析法4.背靠背5.领先指标、同步指标、落后指标6.将近期数据与远期数据同等对待7.加权平均8.近期值9.平滑系数、0≤ ≤1二、是非题1.是2.是3.是4.非5.是6.非7. 非三、单项选择题1.A2.B3.D4. D5. C6.A7. C四、多项选择题1.AC2.BC3.ABCDE4. BCD5.ACD6.ABC7.BD8.AB五、简答题略五、综合题1.2)3()2(2--+=n S T R c =2*(2+5.5-2*3)/36=0.0833 c n n R T b 3533+---==(5.5-2)/6-(27+5)/3*0.0833 =-0.3385c b R a 637--==2.290020833.03385.029.2t t y +-=∧预测2017年销售量时将t=10代入上式得:210*0833.010*3385.029.2+-=∧y =7.2352.综合测试试题(一)答案一、填空题1.数量对比分析2.原始记录 统计台账3.全距 组距4.分组 总体单位总量 各组标志总量5.定值6. r =σσyx n y y x x ))((--∑7.数量指标 质量指标8.时期数列 时点数列9.实际观察值与计算的趋势值之间的离差之和等于零 10. 平滑系数、0≤α≤1二、是非题1.非2.是3.非4.非5.非6.是7.是8.是9.非10.非三、单项选择题1.A2.A3.A4.C5.D6.D7.B8.A9.A 10.C四、多项选择题1.ABCD2.ABE3.ACE4.ABDE5.ACD6.DE7.BC8.ABD9.AD 10.AB五、简答题略六、综合题1.中位数12 众数15 对中位数的平均差2.24 对众数的平均差2.6 2. (1)n ’=4n x μ=n2σ(2)n ’=4nx μ=2nσ (3) x μ’=80%x μ 抽样单位数n 增加56.25%(4)N n 1=4% Nn2=20%12x x μμ=)1%4(%4)1%20(%2022----N NN N N NN N σσ=622≈40.82%3. (1)物价指数=98.9%,由于物价变动使销售额减少1.1万元(2)销量指数=105.26%,由于销量变动使销售额增加5万元 4.y=40+8t 96吨5.(1) a =79.10067111≈79.10b =-2.32214764≈-2.322(保留三位)x y c 322.210.79-=322.2-=∆∆xy644.42322.2322.2-=⨯-=∆-=∆x y (元)产量每增加2000件时,单位成本平均下降4.644元 (2)产量为8000件时,单位成本为60.524元/件 (3)yx s ≈0.5979 6.2)3()2(2--+=n S T R c =2*(2+5.5-2*3)/36=0.0833c n n R T b 3533+---==(5.5-2)/6-(27+5)/3*0.0833 =-0.3385c b R a 637--==2.290020833.03385.029.2t t y +-=∧预测2017年销售量时将t=10代入上式得:210*0833.010*3385.029.2+-=∧y =7.235综合测试试题(二)答案一、填空题1.大量性同质性差异性2.表头表体表脚3.手工汇总电子计算机汇总4.强度相对指标f5.26.一元线性回归分析7.前期水平8.二级增长量9. 近期值二、是非题1.是2.是3.非4.非5.是6.是7.非8.非9.是三、单项选择题1.C2.C3.B4.A5.C6.A7.D8.D四、多项选择题1.AB2.ADE3.ACDE4.ABC5.BCE6.ABCD7.ACE8.BCE9.CD 10.BD五、简答题略六、综合题1.略户平均月收入=∑∑fxf =27004930000=1825.93 (十元)众数组为1700-2100 众数M=1700+)500800()600800()600800(-+--×400=1860(十元) 或=2100-)500800()600800()500800(-+--×400=1860(十元) 中位数位次=2∑f=22700=1350 中位数组为1700-2100中位数M e =1700+800110022700-×400=1825(十元)或=2100-80080022700-×400 =1825(十元)3.(1)t=2.236 F(t) ≈97.49% (2)n=45(人) (3)n=178(人) (4) n=400(人)4.(1)个体产量指数分别为125%、111.11%、120% (2)个体成本指数分别为184.62% 、45% 、133.33%(3)成本综合指数=120%、对总成本的影响绝对额=230000元 (4)产量综合指数=118.3128%、对总成本的影响绝对额=178000万元5.。
目录第一章P10 (1)第二章P34 (2)第三章P66 (3)第四章P94 (8)第七章P176 (11)第八章P212 (15)第10 章P258 (17)第11 章P291 (21)第13 章P348 (26)第14 章P376 (30)第一章P10一、思考题1.1什么是统计学?1.2解释描述统计和推断统计。
1.3统计数据可分为哪几种类型?不同类型的数据各有什么特点?1.4解释分类数据、顺序数据和数值型数据的含义。
1.5举例说明总体、样本、参数、统计量、变量这几个概念。
1.6变量可分为哪几类?1.7举例说明离散型变量和连续型变量。
1.8请举出统计应用的几个例子。
1.9请举出应用统计的几个领域。
1.1 指出下面变量的类型:(1)年龄(2)性别(3)汽车产量(4)员工对企业某项改革措施的态度(赞成、中立、反对)(5)购买商品时的支付方式(现金、信用卡、支票)(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
1.2 某研究部门准备抽取 2000 个职工家庭推断该城市所有职工家庭的年人均收入。
要求:(1)描述总体和样本。
(2)指出参数和统计量。
(1)总体是该市所有职工家庭的集合;样本是抽中的 2000 个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的 2000 个职工家庭的年人均收入。
1.3 一家研究机构从 IT 从业者中随机抽取 1000 人作为样本进行调查,其中 60%的人回答他们的月收入在5000 元以上,50%的人回答他们的消费支付方式是用信用卡。
回答下列问题:(1)这一研究的总体是什么?(2)月收入是分类变量、顺序变量还是数值型变量?(3)消费支付方式是分类变量、顺序变量还是数值型变量?(4)这一研究涉及截面数据还是时间序列数据?(1)总体是所有 IT 从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
1.4 一项调查表明,消费者每月在网上购物的平均花费是 200 元,他们选择在网上购物的主要原因是“价格便宜”。
第一章导论1。
1.1(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量.1。
2(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入.1。
3(1)总体是所有IT从业者的集合.(2)数值型变量.(3)分类变量。
(4)截面数据。
1。
4(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法.第二章数据的搜集1.什么是二手资料?使用二手资料需要注意些什么?与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源.2。
比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样.概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试.3。
调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法?实验式、观察式等。
第一章统计量是用来描述样本特征的概括性数字度量,它是根据样术数据计算出来的一个量,由于抽样是随机的,因此统计量是样本的函数。
研究者所关心的统计量主要有样本平均数、样本标准总、样本比例等。
3,变量(D变量,变量值①变量:说明现象某种特征的概念,其特点是从一-次观察到下一-次观察结果会呈现出差别成变化。
②变量值:变量的几体取值。
(2)变量的类型①分类变量是说明事物类别的一个名称,其取值是分类数据。
②顺序变量是说明事物有序类别的一一个名称,其取值足顺序数据。
③数值型变量是说明事物数字特征的一一个名称,其取值是数值型数据。
根据其取值的不同,又可以分为:..离散型变量:只能取可数值的变量,它只能取有限个值,而且其取值都以整位数断开,可以一一列举:b.连续型变量:可以在一个或多个区间中取任何值的变量,它的取值是连续不断的,不能-列举。
(3)变量的其他分类①随机变量、非随机变量②经验变量,理论变量经验变量所措述的是周围环境中可以观察到的事物:理论变量是由统计学家用数学方法所构造出来的一些变什么是统计学?答: 统计学是关于数据的科学,它所提供的是一套有关数据收集、处理,分析。
解释并从数据中得出结论的方法,统计研究的是来自各领域的数据。
数据收集也就是取得统计数据:数据处理是将数据用图表等形式展示出来:数据分析则是选择适当的统计方法研究数据,井从数据中提取有用信息进而得出结论。
.解释描述统计和推断统计。
答:数据分析所用的方法可分为描述统计方法和推断统计方法。
(1)描述统计研究的是数据收集、处理、汇总、图表措述,概括与分析等统计方法。
(2)推断统计是研究如何利用样本数据来推断总体特征的统计方法。
比如,对产品的质量进行检验,往往是破坏性的,不可能对每个产品进行测量。
这就需要抽取部分个体即样本进行测量。
然后根据获得的样本数据对来:数据分析则是选择适当的统计方法研究数据,井从数据中提取有用信息进而得出结论。
3.统计数据可分为哪几种类型?不同类型的数据各有什么特点?答:统计数据是对现象进行测量的结果,可以从不同角度对统计数据进行分类:(1) 按照所采用的计量尺度不同,可以将统计数据分为分类数据、顺序数据和数值型数据。
第二章、练习题及解答2.为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718 706 715 712 722 691 708 690 692 707 701 708 729 694 681 695 685 706 661 735 665 668 710 693 697 674 658 698 666 696 698 706 692 691 747 699 682 698 700 710 722 694 690 736 689 696 651 673 749 708 727 688 689 683 685 702 741 698 713 676 702 701 671 718 707 683 717 733 712 683 692 693 697 664 681 721 720 677 679 695 691 713 699 725 726 704 729 703 696 717 688要求:(2)以组距为10进行等距分组,生成频数分布表,并绘制直方图。
3.某公司下属40个销售点2012年的商品销售收入数据如下:单位:万元152 124 129 116 100 103 92 95 127 104 105 119 114 115 87 103 118 142 135 125 117 108 105 110 107 137 120 136 117 10897 88 123 115 119 138 112 146 113 126要求:(1)根据上面的数据进行适当分组,编制频数分布表,绘制直方图。
(2)制作茎叶图,并与直方图进行比较。
1.已知下表资料:25 20 10 500 2.5 30 50 25 1500 7.5 35 80 40 2800 14 40 36 18 1440 7.2 4514 7 630 3. 15 合 计200100687034. 35_y xf 6870根据频数计算工人平均日产量:〒=金^ =北* = 34.35 (件)£f 200结论:对同一资料,采用频数和频率资料计算的变量值的平均数是一致的。
第二章误差及分析数据的统计处理思考题1.正确理解准确度和精密度,误差和偏差的概念。
答:准确度是测定平均值与真值接近的程度,常用误差大小来表示,误差越小,准确度越高。
精密度是指在确定条件下,将测试方法实施多次,所得结果之间的一致程度。
精密度的大小常用偏差来表示。
误差是指测定值与真值之差,其大小可用绝对误差和相对误差来表示。
偏差是指个别测定结果与几次测定结果的平均值之间的差别,其大小可用绝对偏差和相对偏差表示,也可以用标准偏差表示。
2.下列情况分别引起什么误差?如果是系统误差,应如何消除?(1)砝码被腐蚀;(2)天平两臂不等长;(3)容量瓶和吸管不配套;(4)重量分析中杂质被共沉淀;(5)天平称量时最后一位读数估计不准;(6)以含量为99%的邻苯二甲酸氢钾作基准物标定碱溶液。
答:(1)引起系统误差,校正砝码;(2)引起系统误差,校正仪器;(3)引起系统误差,校正仪器;(4)引起系统误差,做对照试验;(5)引起偶然误差;(6)引起系统误差,做对照试验或提纯试剂。
3.用标准偏差和算术平均偏差表示结果,哪一种更合理?答:用标准偏差表示更合理。
因为将单次测定值的偏差平方后,能将较大的偏差显著地表现出来。
4.如何减少偶然误差?如何减少系统误差?答:在一定测定次数范围内,适当增加测定次数,可以减少偶然误差。
针对系统误差产生的原因不同,可采用选择标准方法、进行试剂的提纯和使用校正值等办法加以消除。
如选择一种标准方法与所采用的方法作对照试验或选择与试样组成接近的标准试样做对照试验,找出校正值加以校正。
对试剂或实验用水是否带入被测成分,或所含杂质是否有干扰,可通过空白试验扣除空白值加以校正。
5.某铁矿石中含铁39.16%,若甲分析得结果为39.12%,39.15%和39.18%,乙分析得39.19%,39.24%和39.28%。
试比较甲、乙两人分析结果的准确度和精密度。
解:计算结果如下表所示由绝对误差E 可以看出,甲的准确度高,由平均偏差d 和标准偏差s 可以看出,甲的精密度比乙高。
《统计学第6版》练习题含答案
第二章(数据的搜集)
1、二手数据的特点是( )
A.采集数据的成本低,但搜集比较困难
B.采集数据的成本低,搜集比较容易
C.数据缺乏可靠性
D.不适合自己研究的需要
2、从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为( )。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
3、从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为( )。
A.重复抽样
B.不重复抽样
C.分层抽样
D.整群抽样
4、一个元素被抽中后不再放回总体,然后再从剩下的元素中抽取第二个元素,直到抽取π个元素为止,这样的抽样方法称为( )。
A.重复抽样
B.不重复抽样
C.分层抽样
D.整群抽样
5、在抽样之前先将总体的元素划分为若干类,然后从各个类中抽取一定数量的元素组成一个样本,这样的抽样方式称为( )。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
6、先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本。
这样的抽样方式称为( )。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
7、先将总体划分成若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方式称为( )。
A.简单随机抽样
B.分层抽样
C.系统抽样
D.整群抽样
8、为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是( )
A.简单随机抽样
B.整群抽样
C.系统抽样
D.分层抽样
9、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是( )。
A.简单随机抽样
B.系统抽样
C.分层抽样
D.整群抽样
10、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是( )。
A.简单随机抽样
B.整群抽样
C.系统抽样
D.分层抽样
11、为了解女性对某种品牌化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查。
这种调查方式是( )。
A.简单随机抽样
B.分层抽样
C.方便抽样
D.自愿抽样
12、研究人员根据对研究对象的了解有目的选择一些单位作为样本,这种调查方式是( )。
A.判断抽样
B.分层抽样
C.方便抽样
D.自愿抽样
13、下面的哪种调查方式样本不是随机选取的( ).
A.分层抽样
B.系统抽样
C.整群抽样
D.判断抽样
14、下面的哪种抽样调查的结果不能用于对总体有关参数进行估计( )。
A.分层抽样
B.系统抽样
C.整群抽样
D.判断抽样
15、调查时首先选择一组调查单位。
对其实施调查之后,再请他们提供另外一些属于研究总体的调查对象,调查人员根据所提供的线索,进行此后的调查。
这样的调查方式称为( )。
A.系统抽样
B.整群抽样
C.滚雪球抽样
D.判断抽样
16、如果要搜集某一特定群体的有关资料,适宜采用的调查方式是( )。
A.系统抽样
B.整群抽样
C.滚雪球抽样
D.判断抽样
17、下面的哪种抽样方式不属于概率抽样( )。
A.系统抽样
B.整群抽样
C.分层抽样
D.滚雪球抽样
18、下面的哪种抽样方式属于非概率抽样( )。
A.系统抽样
B.整群抽样
C.分层抽样
D.滚雪球抽样
19、先将总体中的所有单位按一定的标志(变量)分为若干类,然后在每个类中采用方便抽样或判断抽样的方式选取样本单位。
这种抽样方式称为( )。
A.分类抽样
B配额抽样
C.系统抽样
D.整群抽样
20、与概率抽样相比,非概率抽样的缺点是( )。
A.样本统计量的分布是确定的
B.无法使用样本的结果对总体相应的参数进行推断
C.调查的成本比较高
D.不适合探索性的研究
21、一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
他将问卷发给就餐者,填写后再收上来。
他的搜集数据的方法属于( )。
A.自填式问卷调查
B面访式问卷调查
C.实验调查
D.观察式调查
22、为了估计某城市愿意乘坐公交车上下班的人数的比例,在搜集数据时,最有
可能采用的数据搜集方法是( )。
A.普查
B.公开发表的资料
C.随机抽样
D.实验
23、某机构十分关心小学生每周看电视的时间。
该机构随机抽取300名小学生家长对他们的孩子每周看电视的时间进行了估计。
结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。
该机构搜集数据的方式是( )。
A.概半抽样调查
B.观察调查
C.实验调查
D.公开发表的资料
24、如果一个样本因人故意操纵而出现偏差,这种误差属于( )。
A.抽样误差
B.非抽样误差
C.设计误差
D.实验误差
25、为了解居民对小区物业服务的意见和看法,管理人员随机抽取了50户居民,上门通过问卷进行调查。
这种数据的搜集方法称为( )。
A.面访式问卷调查
B.实验调查
C.观察式调查
D.自填式问卷调查
26、指出下面的陈述中哪一个是错误的( )。
A.抽样误差只存在于概率抽样中
B.非抽样误差只存在于非概率抽样中
C.无论是概率抽样还是非概率抽样都存在非抽样误差
D.在全面调查中也存在非抽样误差
27、指出下面的误差哪一个属于抽样误差( )。
A.随机误差
B.抽样框误差
C.回答误差
D.无回答误差
28、某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。
物业管理部门利用最初的居民户登记名单进行抽样。
但现在的小区中,原有的一些居民户已经搬走,同时有些是新人住的居民户。
这种调查产生的误差属于( )
A.随机误差
B.抽样框误差
C.回答误差
D.无回答误差
29、某居民小区为了解住户对物业服务的看法,准备采取抽样调查方式搜集数据。
物业管理部门利用居民户登记名单进行抽样。
但现在的小区中,原有的一些居民户已经搬走而没有回答问题。
这种调查产生的误差属于( )。
A.随机误差
B.抽样框误差
C.回答误差
D.无回答误差
30、某居民小区的物业管理者怀疑有些居民户有偷电行为。
为了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。
发现有些居民户有虚报或瞒报情况。
这种调查产生的误差属于( )。
A.有意识误差
B.抽样框误差
C.回答误差
D.无回答误差
31、某居民小区的物业管理者怀疑有些居民户有偷电行为。
为了解住户的每月用电情况,采取抽样调查方式对部分居民户进行调查。
发现调查员在登记电表数时有抄错的数据。
这种调查产生的误差属于( )。
A.有意识误差
B.抽样框误差
C.调查员误差
D.无回答误差
32、指出下面的陈述哪-一个是错误的( )。
A.抽样误差是可以避免的
B.非抽样误差是可以避免的
B.抽样误差是不可避免的
C.抽样误差是可以控制的
答案
(1~5) BAABB
(6~10) CDDDC
(11~15) CADDA
(16~20) CDDBB
(21~25) ACABA
(26~30) BABDA
(31~32) CA。