统计学答案
- 格式:docx
- 大小:507.61 KB
- 文档页数:25
1描述统计学和推断统计学区分的依据是( )1统计数据是一个( )1在抽样推断中,总体参数是一个( )1对某地区工业企业职工进行调查,调查对象是( )1平均数是对( )1以下哪一条不属于方差分析中的假设条件( )1当样本单位数充分大时,样本估计量充分地靠近总体指标1要对某企业的生产设备的实际生产能力进行调查,则该企1将某地区1996—2002年的新增加人口数量按年排列的动态1当变量值中有一项为零时,不能计算( )1某大学商学院的一位老师依据本院职工2009年6月份收入资1对于连续变量的取值通常是采用( )1构成统计总体的那些个体(单位)必须至少在某一方面具1要想了解上海市居民家庭的收支情况,最适合的调查方式1权数的最根本的作用体现在( )的变动上1统计调查对象是( )1相关系数的取值范围是( )1下列属于时点数列的是( )1下面属于品质标志的是( )1某工厂有100名职工,把他们的工资加总除以100,这是对1随着统计学科的不断发展,越来越成为现代统计学主流的1总体的作用在于界定( )1当一项科学实验的结果尚未得出时,这种实验将一直进行1以下调查方法中属于概率抽样的是( )1某单位职工的平均年龄为35岁,这是对( )的平均1在下列两两组合的平均指标中,两个平均数完全不受极端1随机试验所有可能出现的结果,称为( )1下列现象中,相关密切程度最高的是( )11999年全国从业人员比上年增加629万人,这一指标是(1已知三化中学课外兴趣小组8个学生的身高分别为:172.1下面那个图形不适合描述分类数据()1对于对称分布的数据,众数、中位数和平均数的关系是:1可以计算平均数的数据类型有:()1顺序数据的集中趋势测度指标有:()1数据型数据的离散程度测度方法中,受极端变量值影响最1当偏态系数为正数时,说明数据的分布是()1下列指标中,不属于平均数的是()1一组变量数列在未分组时,直接用简单算术平均法计算与1加权算术平均数的大小()1在变量数列中,当标志值较大的组权数较小时,加权算术1平均差的主要缺点是()1把全部产品分为一级品、二级品和三级品,其中一级品占1计算离散系数是为了比较()1主要用于测度分类数据的集中趋势,同时也适用于数值型1某寝室11名同学的英语成绩分别为70、71、76、78、83、1某人持有一种股票,连续三年皆获益,但三年的收益率皆不同,要计算这三年的平均收益率应采用的方法为()1某专家小组成员的年龄分别为29,45,35,43,45,58,他们年龄的中位数为 ()1当分布数列中各变量值的频率相等时 ()1某班有40名学生,其中男女学生各占一半,则该班学生的成数方差为 ()1已知一组变量值为38, 24, 69, 109, 15, 43, 56,则这组变量值的中位数为()1若已知某地120家企业按年产值()分成以下5组:500-1000;1000-1500;1500-2000;2000-2500;2500以上,则最后一组的组中值为()1下列变异指标中,最容易受极端值影响的是()1对比分析不同性质的变量数列之间的变异程度时,应使用()1在下列成数数值中,哪一个成数数值的方差最小()1如果偏态系数a小于零,峰态系数β小于3,可判断次数分布曲线为()1现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用()1若两数列的标准差相等而平均数不等,则()1假定一个样本由5个数据组成:3、7、8、9、13,该样本的方差为()1对于右偏分布,均值、中位数和众数之间的关系是 ()1在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状()1某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户。
《统计学》课后题答案第一章导论一、选择题1.C2.A3.C4.C5.C6.B7.A8.D9.C 10.D 11.A 12.C 13.C 14.A 15.B 16.A 17.C 18.B 19.D 20.A 21.D 22. D23.B 24.C 25.A 26.A 27.A 28.B 29.A 30.D 31.C 32.A 33.B第二章数据的收集一、选择题1.A2.B3.A4.D5.B6.C7.D8.D9.D 10.C 11.C 12.A 13.D 14.D 15.C 16.A 17.D 18.C 19.B 20.B 21.A 22.B 23.C 24.A 25.B 26.B 27.A 28.B 29.C 30.C (A)二、判断题1.∨2.∨3.×4. ∨5. ×6. ×7. ∨8. ×9. ×10. ×第三章数据整理与显示一、选择题CABCD CBBAB BACBD DDBC第四章数据分布特征的测度一、选择题1.A2.C3.B4.C5.D6.D7.A8.B9.A 10.B 11.A 12.D 13.C 14.C 15.D 16.A 17.A 18.B 19.A 20.B 21.A 22.A 23.B 24.C 25.C 26.D 27.D 28.A 29.D 30.C 31.C 32.D二、判断题1. ×2. ∨3. ×4. ×5. ×6. ×7. ∨8. ×9. × 10. ∨ 11. ∨ 12. ×四、计算题1. 11399073.8954ki ii kii x fx f=====∑∑甲11.96σ===甲73.89100%100% 6.18%11.96x σν=⨯=⨯=甲73.8100%100%7.43%9.93x σν=⨯=⨯=乙甲的代表性强2. 10.2510.966ki ii kii x fx f====∑∑0.250.056σ==0.250.056100%100% 5.834%0.966xσν=⨯=⨯= 1114.534ki ii kii x fx f====∑∑10.1295σ==10.1295100%100% 2.857%4.534xσν=⨯=⨯=该教练的说法不成立。
第一章一、单项选择题1.指出下面的数据哪一个属于分类数据()A.年龄B.工资C.汽车产量D.购买商品的支付方式(现金、信用卡、支票)2.指出下面的数据哪一个属于顺序数据()A.年龄B.工资C.汽车产量D.员工对企业某项制度改革措施的态度(赞成、中立、反对)3.某研究部门准备在全市200万个家庭中抽取2000个家庭,据此推断该城市所有职工家庭的年人均收入,这项研究的统计量是()A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4.了解居民的消费支出情况,则()A.居民的消费支出情况是总体B.所有居民是总体C.居民的消费支出情况是总体单位D.所有居民是总体单位5.统计学研究的基本特点是()A.从数量上认识总体单位的特征和规律B.从数量上认识总体的特征和规律C.从性质上认识总体单位的特征和规律D.从性质上认识总体的特征和规律6.一家研究机构从IT从业者中随机抽取500人作为样本进行调查,其中60%的人回答他们的月收入在5000元以上,50%的回答他们的消费支付方式是使用信用卡。
这里的“月收入”是()A.分类变量B.顺序变量C.数值型变量D.离散变量7.要反映我国工业企业的整体业绩水平,总体单位是()A.我国每一家工业企业B.我国所有工业企业C.我国工业企业总数D.我国工业企业的利润总额8.一项调查表明,在所抽取的1000个消费者中,他们每月在网上购物的平均消费是200元,他们选择在网上购物的主要原因是“价格便宜”。
这里的参数是()A.1000个消费者B.所有在网上购物的消费者C.所有在网上购物的消费者的平均消费额D.1000个消费者的平均消费额9.一名统计学专业的学生为了完成其统计作业,在《统计年鉴》中找到的2006年城镇家庭的人均收入数据属于()A.分类数据B.顺序数据C.截面数据D.时间序列数据10.一家公司的人力资源部主管需要研究公司雇员的饮食习惯,改善公司餐厅的现状。
》第一章参考答案一、填空1、统计一词的含义是统计工作、统计数据(统计资料)、统计学。
2、标志是说明总体单位的特征的,分为品质标志和数量标志。
3、要研究工业企业生产经营状况时,全部工业企业构成总体,每一个工业企业是总体单位。
4、工人的年龄、工资、工龄属于数量标志,工人的性别、民族、工种属于品质标志。
5、设备台数、工人人数属于离散变量,身高、体重、年龄属于连续变量。
6、研究某市居民生活状况,该市全部居民构成了总体,居民家庭的收入是数量标志。
`7、某市职工人数普查中,该市全部职工人数是指标,每一个职工是总体单位。
8、从个人奖金最高额、最低额,企业奖金总额和人均奖金总额等方面研究某企业奖金的分配情况,该项研究中统计指标是企业奖金总额、人均奖金总额,变量值是奖金最高额、最低额。
二、单选1、构成统计总体的个别事物称为( D )。
A 调查单位B 标志值C 品质标志D 总体单位2、对某城市工业企业未安装设备进行普查,总体单位是(B )。
A 工业企业全部未安装的设备B 工业企业每一台未安装设备C 每个工业企业的未安装设备D 每一个工业企业;3、下面属于统计总体的是( B )。
A 某地区的粮食总产量B 某地区的全部企业C 某商场全年商品销售额D 某地区全部职工人数4、在全国人口普查中( B )。
A 男性是品质标志B 人的年龄是变量C 人口的平均寿命是数量标志D 全国人口是统计指标5、下列指标中属于质量指标的是( B )。
A 社会总产值B 产品合格率C 产品总成本D 人口总数~6、指标是说明总体特征的,标志是说明总体单位特征的( B )。
A 标志和指标之间的关系是固定不变的B 标志和指标之间的关系是可以变化的C 标志和指标都是可以用数值表示的D 只有指标才可以用数值表示7、某工人月工资1500元,工资是( A )。
A 数量标志B 品质标志C 质量指标D 数量指标8、下列属于数量标志的是(A)。
A 职工的年龄B 职工的性别C 政治面貌D 籍贯9、研究某市工业企业生产设备使用状况,统计总体为( D )。
综合指标1、某企业2006年产值超计划完成8%,比上年增长12%,试问产值计划规定比上期增长多少?又该企业甲产品单位成本计划在上年230元的水平上降低15元,实际上比上年降低了8%,试计算甲产品单位成本的计划完成程度。
%108%1%121=++x%7.31%108%121%=-+=x2要求计算表中空格数字,并直接填入表中。
3要求:1.计算该工业局的平均劳动生产率; 2.计算该工业局平均每个企业的产值。
该工业局的平均劳动生产率=10600000÷1400=7571.4(元/人)该工业局平均每个企业的产值=1060÷20=53(万元/人)5试分别计算男、女职业人员的总录用率,并比较两组说明各组和总录用率高低不同的原因。
男的总录用率=123÷600=20.5%女的总录用率=89÷500=17.8%6、某厂三个分厂同时生产甲产品,第一季度生产情况如下:一分厂实际产量为500件,刚好完成计划;二分厂实际产量为900件,仅完成计划的90%;三分厂实际产量为1160件,超额完成计划16%。
另外,一分厂单位成本为18元/件,二分厂单位成本为16元/件,三分厂单位成本为17元/件。
所以全厂超额2%完成甲产品产量计划,即(0+16%-10%)/3=2%;全厂甲产品平均单位成本为17元/件,即(18+16+17)/3=17元/件。
以上平均指标的计算是否正确?为什么?应该如何计算?全厂计划完成率=%4.10225002560%116/1160%90/9005001160900500==++++全厂平均单位成本=8.1625604312011609005001711601690018500==++⨯+⨯+⨯(元)7、2006年某月份A 农贸市场某农产品价格和成交量、成交额资料如下:试问哪一个市场农产品的平均价格较高?并说明原因。
甲市场平均价格=5.5÷4=1.375(元/斤)乙市场平均价格=5.3÷4=1.325(元/斤)8、已知某企业资料如下:试计算该企业平均计划完成百分比;平均计划完成百分比=435÷420=103.6%9、某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件,标准差为9.6件;要求:(1)计算乙组平均每个工人的日产量和标准差;(2)比较甲、乙两生产小组哪个组的日产量更有代表性?乙组平均每个工人的日产量=2950÷100=29.5(件)8075 =9乙组每个工人日产量的标准差=100甲村的平均亩产=675000÷2500=270(公斤)乙村的平均亩产=625000÷2500=250(公斤)时间数列分析要求:(1)编制第一季度各月劳动生产率的动态数列;(2)计算第一季度的月平均劳动生产率(3)计算第一季度的劳动生产率(2)计算第一季度的月平均劳动生产率=14524÷3=4841(元/人)(3)计算第一季度的劳动生产率=1220÷840=14524(元/人)2、某零售商店2006年上半年的零售额与库存额资料如下:单位:万元试计算第一季度和第二季度商品流转次数,上半年的周转次数。
第一部分 计量资料的统计描述、最佳选择题1、描述一组偏态分布资料的变异度,以( )指标较好。
A 、全距B 、标准差C 、变异系数D 、四分位数间距E 、方差2.用均数和标准差可以全面描述( )资料的特征。
A .正偏态分布B .负偏态分布C .正态分布D .对称分布E .对数正态分布3.各观察值均加(或减)同一数后( )。
A .均数不变,标准差改变B .均数改变,标准差不变9.最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势。
A .均数B .标准差C .中位数D .四分位数间距E .几何均数10.血清学滴度资料最常用来表示其平均水平的指标是()。
A .算术平均数B .中位数C .几何均数D .变异系数E .标准差二、简答题1、对于一组近似正态分布的资料,除样本含量 n 外,还可计算 ,S 和 ,问各说明什么?2、试述正态分布、标准正态分布及对数正态分布的 联系和区别。
3、说明频数分布表的用途。
4、变异系数的用途是什么?5、试述正态分布的面积分布规律。
三、计算分析题1、根据 1999 年某地某单位的体检资料, 116 名正常 成年女子的血清甘油三酯( mmol/L )测量结果如右表, 请据此资料: (1)描述集中趋势应选择何指标?并计算之。
(2)描述离散趋势应选择何指标?并计算之。
( 3)求该地正常成年女子血清甘油三酯的 95%参考值范围。
( 4)试估计该地正常成年女子血清甘油三酯在 0.8mmol/L 以下者及 1.5mmol/L 以下者各占正常女子总人数的百分比。
2、某些微丝蚴血症者 42 例治疗后 7 年用间接荧火抗体试验得抗体滴度如下。
求平均抗体滴度。
C .两者均不变D .两者均改变4.比较身高和体重两组数据变异度大小宜采用(A .变异系数B 5.偏态分布宜用( A .算术均数 B.方差 C .极差 D )描述其分布的集中趋势。
.标准差 C .中位数0 的常数后,(B .标准差C .几何均数 )分布的资料,均数等于中位数。
统计学题库+答案一、单选题(共50题,每题1分,共50分)1、已知4个水果商店苹果的单价和销售额,要求计算4个商店苹果的平均单价,应该采用()。
A、简单算术平均数B、加权算术平均数C、加权调和平均数D、几何平均数正确答案:C2、当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于()。
A、函数关系B、回归关系C、随机关系D、相关关系正确答案:A3、如果分配数列把频数换成频率,那么方差()。
A、不变B、增大C、减小D、无法预期其变化正确答案:A4、按地理区域划片进行的区域抽样,其抽样方法属于()。
A、整群抽样B、等距抽样C、类型抽样D、简单随机抽样正确答案:A5、次数分配数列是()。
A、按数量标志分组形成的数列B、按品质标志分组形成的数列C、按统计指标分组所形成的数列D、按数量标志和品质标志分组所形成的数列正确答案:D6、按组距式分组()。
A、会使资料的真实性受到一定的影响B、会增强资料的真实性C、不会使资料的真实性受到损害D、所得资料是虚假的正确答案:A7、调查时间的含义是()。
A、调查资料报送的时间B、调查工作期限C、进行调查的时间D、调查资料所属的时间正确答案:D8、相关分析中,要求相关的两变量()。
A、都是随机的B、都不是随机变量C、其中因变量是随机变量D、其中自变量是随机变量正确答案:A9、某农贸市场土豆价格2月份比1月份上升5%,3月份比2月份下降2%,则3月份土豆价格与1月份相比()。
A、下降3%B、下降2%C、提高2.9%D、提高3%正确答案:C10、现象之间线性依存关系的程度越低,则相关系数()。
A、越接近于0B、越接近于1C、越接近于1D、在0.5和0.8之间正确答案:A11、计算平均指标最常用的方法和最基本的形式是()。
A、中位数B、众数C、调和平均数D、算术平均数正确答案:D12、全国的粮食产量与人口数之比是()。
A、总量指标B、平均指标C、相对指标D、数量指标正确答案:C13、相关系数的取值范围是()。
统计基础练习题一、单项选择题1.下列属于品质标志的有(B )。
A.工龄B.健康状况C.工资级别D.劳动生产率2.标志是说明(A )。
A.总体单位的特征的名称B.总体单位量的特征的名称C.总体质的特征的名称D.总体量的特征的名称3.调查某乡镇工业企业职工工资情况,则调查对象是(B )。
A.该乡镇全部工业企业B.该乡镇全部工业企业的职工C.该乡镇全部工业企业的职工的工资D.该乡镇工业企业每一名职工的工资4.某班每个学生的平均年龄为22岁,这里的22岁为( D )。
A.指标B.品质标志C.变量D.数量标志5.要了解某市工业企业生产设备情况,则统计总体是( D )。
A.该市全部工业企业B.该市每一个工业企业C.该市工业企业的某一台设备D.该市所有工业企业的全部生产设备6.下列情况属于离散变量的是(C )。
A.营业额 B.工龄 C.工厂数D.职工年收入7.在全国人口普查中(B )。
A、男性是品质标志B、人的年龄是变量C、人口的平均寿命是数量标志D、全国人口是统计指标8.研究农民生活状况。
“农民的纯收入”是(A)。
A.连续变量B.离散变量C.随机变量D.不确定变量9.某人的技术职称为讲师,“讲师”属于哪一统计学范畴( C )。
A.标志B.品质标志C.标志表现D.质量指标10.对某地区三家不同企业开展某项改革的情况进行调查,以了解其改革过程中的生产情况和存在的问题,以便为今后的普遍推广积累经验,这种调查是( B )A.普查B.重点调查C.典型调查D.抽样调查11.下列调查中,调查单位与填报单位一致的是(D )A、企业设备调查B、人口普查C、农村耕地调查D、工业企业现状调查12.抽样调查与重点调查的主要区别是( D )。
A、作用不同B、组织方式不同C、灵活程度不同D、选取调查单位的方法不同13.一次性调查是( C )。
A.只调查一次,以后不再进行调查B.只进行过一次的调查C.间隔一定时间进行一次的调查D.只隔一年就进行一次的调查14.重点调查中的重点单位是( C )。
统计学答案Document number【980KGB-6898YT-769T8CB-246UT-18GG08】第一章导论(1)数值型变量。
(2)分类变量。
(3)离散型变量。
(4)顺序变量。
(5)分类变量。
(1)总体是该市所有职工家庭的集合;样本是抽中的2000个职工家庭的集合。
(2)参数是该市所有职工家庭的年人均收入;统计量是抽中的2000个职工家庭的年人均收入。
(1)总体是所有IT从业者的集合。
(2)数值型变量。
(3)分类变量。
(4)截面数据。
(1)总体是所有在网上购物的消费者的集合。
(2)分类变量。
(3)参数是所有在网上购物者的月平均花费。
(4)参数(5)推断统计方法。
第二章数据的搜集1.什么是二手资料使用二手资料需要注意些什么与研究内容有关的原始信息已经存在,是由别人调查和实验得来的,并会被我们利用的资料称为“二手资料”。
使用二手资料时需要注意:资料的原始搜集人、搜集资料的目的、搜集资料的途径、搜集资料的时间,要注意数据的定义、含义、计算口径和计算方法,避免错用、误用、滥用。
在引用二手资料时,要注明数据来源。
2.比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用非概率抽样。
概率抽样是指抽样时按一定概率以随机原则抽取样本。
每个单位被抽中的概率已知或可以计算,当用样本对总体目标量进行估计时,要考虑到每个单位样本被抽中的概率,概率抽样的技术含量和成本都比较高。
如果调查的目的在于掌握和研究总体的数量特征,得到总体参数的置信区间,就使用概率抽样。
非概率抽样是指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
非概率抽样操作简单、实效快、成本低,而且对于抽样中的专业技术要求不是很高。
它适合探索性的研究,调查结果用于发现问题,为更深入的数量分析提供准备。
非概率抽样也适合市场调查中的概念测试。
3.调查中搜集数据的方法主要有自填式、面方式、电话式,除此之外,还有那些搜集数据的方法实验式、观察式等。
4. 自填式、面方式、电话式调查个有什么利弊自填式优点:调查组织者管理容易,成本低,可以进行较大规模调查,对被调查者可以刻选择方便时间答卷,减少回答敏感问题的压力。
缺点:返回率低,调查时间长,在数据搜集过程中遇到问题不能及时调整。
面谈式优点:回答率高,数据质量高,在数据搜集过程中遇到问题可以及时调整可以充分发挥调查员的作用。
缺点:成本比较高,对调查过程的质量控制有一定难度。
对于敏感问题,被访者会有压力。
电话式优点:速度快,对调查员比较安全,对访问过程的控制比较容易,缺点:实施地区有限,调查时间不宜过长,问卷要简单,被访者不愿回答时,不宜劝服。
5.请举出(或设计)几个实验数据的例子。
不同饲料对牲畜增重有无影响,新旧技术的机器对组装同一产品所需时间的影响。
6.你认为应当如何控制调查中的回答误差对于理解误差,要注意表述中的措辞,学习一定的心里学知识。
对于记忆误差,尽量缩短所涉及问题的时间范围。
对于有意识误差,调查人员要想法打消被调查者得思想顾虑,调查人员要遵守职业道德,为被调查者保密,尽量避免敏感问题。
7.怎样减少无回答请通过一个例子,说明你所考虑到的减少无回答的具体措施。
对于随机误差,可以通过增加样本容量来控制。
对于系统误差,做好预防,在调查前做好各方面的准备工作,尽量把无回答率降到最低程度。
无回答出现后,分析武回答产生的原因,采取补救措施。
比如要收回一百份,就要做好一百二十份或一百三十份问卷的准备,当被调查者不愿意回答时,可以通过一定的方法劝服被访者,还可以通过馈赠小礼品等的方式提高回收率。
第三章数据的图表搜集一、思考题数据的预处理包括哪些内容答:审核、筛选、排序等。
分类数据和顺序数据的整理和显示方法各有哪些答:分类数据在整理时候先列出所分的类别,计算各组的频数、频率,得到频数分布表,如果是两个或两个以上变量可以制作交叉表。
对于分类数据可以绘制条形图、帕累托图、饼图、环形图等。
根据不同的资料或者目的选择不同的图。
对于顺序数据,可以计算各种的频数、频率,以及累计频数、累计频率。
可根据需要绘制条形图、饼图、环形图等。
数值型数据的分组方法有哪些简述组距分组的步骤。
答:单变量值分组和组距分组。
其中组距分组:第一步,确定组数,组数多少由数据的多少和特点等决定,一般5~15组;第二步,确定各组组距,宜取5或10的倍数;第三步,根据分组整理出频数分布表,注意遵循“不重不漏”和“上限不在内”的原则。
直方图和条形图有何区别答:1,条形图使用图形的长度表示各类别频数的多少,其宽度固定,直方图用面积表示各组频数,矩形的高度表示每一组的频数或频率,宽度表示组距,高度与宽度都有意义;2直方图各矩形连续排列,条形图分开排列;3条形图主要展示分类数据,直方图主要展示数值型数据。
绘制线图应注意问题答:时间在横轴,观测值绘在纵轴。
一般是长宽比例10:7的长方形,纵轴下端一般从0开始,数据与0距离过大的话用折断符号折断。
饼图和环形图的不同答:饼图只能显示一个样本或总体各部分所占比例,环形图可以同时绘制多个样本或总体的数据系列,其图形中间有个“空洞”,每个样本或总体的数据系类为一个环。
茎叶图比直方图的优势,他们各自的应用场合答:茎叶图既能给出数据的分布情况,又能给出每一个原始数据,即保留了原始数据的信息。
在应用方面,直方图通常适用于大批量数据,茎叶图适用于小批量数据。
鉴别图标优劣的准则答:P65明确有答案,我就不写了。
制作统计表应注意的问题答:1,合理安排统计表结构;2表头一般包括表号,总标题和表中数据的单位等内容;3表中的上下两条横线一般用粗线,中间的其他用细线,两端开口,数字右对齐,不要有空白格;4在使用统计表时,必要时可在下方加注释,注明数据来源。
第4章 数据的概括性度量 (1)众数:100=M 。
中位数:5.5211021=+=+=n 中位数位置,1021010=+=e M 。
平均数:6.91096101514421==++++==∑= nxx ni i。
(2)5.24104===n Q L 位置 ,5.5274=+=LQ 。
5.7410343=⨯==n Q U 位置,1221212=+=U Q 。
(3)2.494.156110)6.915()6.914()6.94()6.92(1)(222212==--+-++-+-=--=∑= n x xs ni i(4)由于平均数小于中位数和众数,所以汽车销售量为左偏分布。
(1)从表中数据可以看出,年龄出现频数最多的是19和23,所以有两个众数,即190=M 和230=M 。
将原始数据排序后,计算的中位数的位置为:13212521=+=+=n 中位数位置,第13个位置上的数值为23,所以中位数23=e M 。
(2)25.64254===n Q L 位置,19)1919(25.019=-⨯+=L Q 。
75.184253=⨯=位置U Q ,56.252-7257.052=⨯+=)(U Q 。
(3)平均数242560025231715191==++++==∑= nxx ni i。
65.61251062125)2423()2417()2415()2419(1)(222212=-=--+-++-+-=--=∑= n x x s ni i (4)偏态系数:()08.165.6)225)(125(242533=⨯---=∑i x SK 。
峰态系数:[]77.065.6)325)(225)(125()125()24(3)24()125(254224=⨯-------+=∑∑i i x x K 。
(5)分析:从众数、中位数和平均数来看,网民年龄在23~24岁的人数占多数。
由于标准差较大,说明网民年龄之间有较大差异。
从偏态系数来看,年龄分布为右偏,由于偏态系数大于1,所以偏斜程度很大。
由于峰态系数为正值,所以为尖峰分布。
(1)茎叶图如下: 茎 叶 数据个数 5 5 1 6 6 7 8 3 7 1 3 4 8 8 5(2)796398.78.76.65.5==++++= x 。
714.0808.419)78.7()78.7()76.6()75.5(2222==--+-++-+-= s 。
(3)由于两种排队方式的平均数不同,所以用离散系数进行比较。
第一种排队方式:274.02.797.11==v ;102.07714.02==v 。
由于21v v >,表明第一种排队方式的离散程度大于第二种排队方式。
(4)选方法二,因为第二种排队方式的平均等待时间较短,且离散程度小于第一种排队方式。
(1)1.2743082231===∑=nxx ni i。
5.152130=+=中位数位置,5.2722273272=+=e M 。
(2)5.7430==位置L Q ,5.2592261258=+=L Q 。
5.224303=⨯=位置U Q ,5.2872291284=+=U Q 。
(3)17.211307.130021)(12=-=--=∑=n x xs ni i。
(1)41.193406600301500203000152100150030002100==++++==总产量总成本甲企业的平均成本。
92.183425562301500200051152553150000515523==++++==总产量总成本乙企业的平均成本.原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
(1)平均数计算过程见下表:按利润额分组组中值 i M 企业数i fi i f M 200~300250 19 4750 300~400 350 30 10500 400~500 450 42 18900 500~600 550 18 9900 600以上 650 11 7150 合计 — 120 5120067.426120512001===∑=nf Mx ki ii。
48.11611207.16146661)(12=-=--=∑=n f x Ms ki ii。
偏态系数:203.048.1161204.38534964)(3313=⨯=-=∑=ns f x MSK ki ii。
峰态系数:688.0348.1161204.851087441643)(4414-=-⨯=--=∑=ns f x MK ki ii。
(1)两位调查人员所得到的平均身高应该差不多相同,因为均值的大小基本上不受样本大小的影响。
(2)两位调查人员所得到的身高的标准差应该差不多相同,因为标准差的大小基本上不受样本大小的影响。
(3)具有较大样本的调查人员有更大的机会取到最高或最低者,因为样本越大,变化的范围就可能越大。