统计学3(含答案)
- 格式:doc
- 大小:75.50 KB
- 文档页数:3
统计学第三章练习题(附答案)一.单项选择题1.比较两组数据的离散程度最合适的统计量是( D )。
A.极差B.平均差C.标准差D.离散系数2.如果峰度系数k>3,表明该组数据是( A )。
A.尖峰分布B.扁平分布C.左偏分布D.右偏分布3.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。
上面的描述中,众数是( B )。
A.1200B.经济管理学院C.200D.理学院4.某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75 ,64,56,该班考试分数下四分位数和上四分位数分别是( A)。
A.64.5和78.5B.67.5和71.5C.64.5和71.5D.64.5和67.55.对于右偏分布,平均数、中位数和众数之间的关系是( A )。
A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的指标是( B )。
A.方差B.极差C.标准差D.变异系数7.在离散程度的测度中,最容易受极端值影响的是( A )。
A.极差B.方差C.标准差D.平均差8.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( D )。
A.标准差不同B.方差不同C.数据个数不同D.计量单位不同9.总量指标按其反应的内容不同,可分为( C )。
A.总体指标和个体指标B.时期指标和时点指标C.总体单位总量指标和总体标识总量指标D.总体单位总量指标和标识单位指标10.反映同一总体在不同时间上的数量对比关系的是( C )。
A.计划完成成都相对指标B.比较相对指标C.动态相对指标D.比例相对指标11.2003年全国男性人口数为66556万人,2002年全国金融、保险业增加值为5948.9亿元,2003年全社会固定资产投资总额为55566.61亿元,2003年全国城乡居民人民币储蓄存款余额103617.7亿元。
统计学原理作业三答案一、判断题1、抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的会产生误差,这种误差的大小是不能进行控制的。
(×)2、从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。
(×)3、在总体方差一定的条件下,样本单位数越多,则抽样平均误差越大(×)4、抽样估计的置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。
√5、在其它条件不变的情况下,提高抽样估计的可*程度,可以提高抽样估计的精确度。
(×)6、抽样极限误差总是大于抽样平均误差。
(×)7、相关系数是测定变量之间相关关系的唯一方法(×)8、甲产品产量与单位成本的相关系数是-0.8,乙产品单位成本与利润率的相关系数是-0.95,则乙比甲的相关程度高(√ )9、利用一个回归方程,两个变量可以互相推算( ×)10、估计标准误指的就是实际值y与估计值yc 的平均误差程度(√)二、单项选择题1、在一定的抽样平均误差条件下( A )A、扩大极限误差范围,可以提高推断的可*程度B、扩大极限误差范围,会降低推断的可*程度C、缩小极限误差范围,可以提高推断的可*程度D、缩小极限误差范围,不改变推断的可*程度2、反映样本指标与总体指标之间的平均误差程度的指标是( C )A、抽样误差系数B、概率度c、抽样平均误差D、抽样极限误差3、抽样平均误差是(D )A、全及总体的标准差B、样本的标准差c、抽样指标的标准差 D、抽样误差的平均差4、当成数等于( C )时,成数的方差最大A、1B、0 c、0.5 D、-15、对某行业职工收入情况进行抽样调查,得知其中80%的职工收入在800元以下,抽样平均误差为2%,当概率为95.45%时,该行业职工收入在800元以下所占比重是(C )A、等于78%B、大于84% c、在此76%与84%之间 D、小于76%6、对甲乙两个工厂工人平均工资进行纯随机不重复抽样调查,调查的工人数一样,两工厂工资方差相同,但甲厂工人总数比乙厂工人总数多一倍,则抽样平均误差( B )A、甲厂比乙厂大B、乙厂比甲厂大c、两个工厂一样大 D、无法确定7、反映抽样指标与总体指标之间抽样误差可能范围的指标是(B)。
附录1:各章练习题答案2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
2.6 (1)直方图(略)。
(2)自学考试人员年龄的分布为右偏。
2.7 (1(2)A班考试成绩的分布比较集中,且平均分数较高;B班考试成绩的分布比A班分散,且平均成绩较A班低。
2.8 箱线图如下:(特征请读者自己分析)2.9 (1)x =274.1(万元);Me=272.5 ;Q L =260.25;Q U =291.25。
(2)17.21=s (万元)。
2.10 (1)甲企业平均成本=19.41(元),乙企业平均成本=18.29(元);原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。
3%1%2%5.1++453025453025++++统计学第三章出题优课后习题答案原多项选择第三题D 选项解释有误,现在已经重新更改。
一、单项选择题1. 某商场某月商品销售额为1200万元,月末商品库存额为400万元,这两个总量指标( )。
A. 是时期指标B. 前者是时期指标,后者是时点指标C. 是时点指标2. 国民总收入与国内生产总值之间相差一个( )。
A. 出口与进口的差额B. 固定资产折旧C. 来自国外的要素收入净额3. 有三批产品,废品率分别为1.5%、2%、1%,相应的废品数量为25件、30件、45件,则这三批产品平均废品率的计算式应为( )。
A. B.C. D.4. 下列各项中,超额完成计划的有( )。
A. 利润计划完成百分数103.5%B. 单位成本计划完成百分数103.5%C. 建筑预算成本计划完成百分数103.5%5. 某厂某种产品生产量1月刚好完成计划,2月超额完成2%,3月超额完成4%,则该厂该年一季度各月平均超额完成计划的计算方法是( )。
A. 2%+4%=6%B. (2%+4%)÷2=3%C. (2%+4%)÷3=2%453025%1%2%5.1++++3%1%2%5.1⨯⨯6. 甲、乙两组工人的平均日产量分别为18件和15件。
若甲乙两组工人的平均日产量不变,但是甲组工人数占两组工人总数的比重下降,则两组工人总平均日产量( )。
A. 上升B. 下降C. 不变D.可能上升,也可能下降7. 当各个变量值的频数相等时,该变量的()。
A. 众数不存在B. 众数等于均值C. 众数等于中位数8. 如果你的业务是提供足球运动鞋的号码,那么哪一种平均指标对你更有用?( )A. 算术平均数B. 几何平均数9. 某年年末某地区城市和乡村平均每人居住面积分别为30.3和33.5平方米,标准差分别12.8和13.1平方米,则居住面积的差异程度( )。
A. 城市大B. 乡村大10. 下列数列的平均数都是50,在平均数附近散布程度最小的数列是( )。
统计学试卷三及答案统计学原理试卷一、单选题1.下面属于连续变量的是()A、职工人数B、机器台数C、工业总产值D、车间数.变量是( )A、可变的质量指标B、可变的数量指标和标志C、可变的品质标志D、可变的数量标志.有意识地选择三个农村点调查农民收入情况,这种调查方式属于()A、典型调查B、重点调查C、抽样调查D、普查.调查大庆、胜利等几个主要油田来了解我国石油生产的基本情况,这种调查方式属于()A、普查B、典型调查C、重点调查D、抽样调查.代表性误差()。
A、只有非全面调查中才有B、只有全面调查中才有C、全面调查和非全面调查中都有D、全面调查和非全面调查都没有.某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。
第一组和第四组的组中值分别为()A、750和2500B、800和2250C、800和2500D、750和2250.统计分组的核心问题是()A、划分各组界限B、选择分组标志C、确定组数D、确定组距.1990年我国国民生产总值为17688亿元,这是()。
A、时期指标B、时点指标C、总体总量指标D、平均指标.若企业全员劳动生产率计划规定提高4.5%,实际执行结果提高了6%,则全员劳动生产率的计划完成程度相对指标为多少,超额完成多少()。
A、133.33%、33.33%B、101.44%、1.44%C、101.60%、1.60%D、98.43%、–1.57%0.某工业企业产品年生产量为10万件,期末库存量为3.8万件,它们()。
A、是时期指标B、是时点指标C、前者是时期指标,后者是时点指标D、前者是时点指标,后者是时期指标1.标准差指标数值越小,则反映变量值()A、越分散,平均数代表性越低B、越集中,平均数代表性越高C、越分散,平均数代表性越高D、越集中,平均数代表性越低2.间隔相等的不连续时点数列计算序时平均数的公式为( )A .n a a ∑=B .∑∑=faf a C .na a a aa n 2/2/210++++=ΛD .∑⨯+++⨯++⨯+=-ff a a f a a f a a a nn n 2221221110Λ3.时间数列中所排列的指标数值( )。
模拟题B一、单项选择题(在备选答案中,选择一个正确的答案。
每题2分,共50分)1、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。
该研究人员所感兴趣的总体是( C )。
A、该大学的所有学生B、所有的大学生C、该大学所有的一年级新生D、样本中的200名新生2、1990年发表的一份调查报告显示,为了估计佛罗里达州有多少居民愿意支付更多的税金以保护海滩环境不受破坏,共有2500户居民接受了调查。
该项调查中,最有可能采用的数据收集方法是( C )。
A、设计的试验B、公开发表的资料C、随机抽样D、实际观察3、1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54749美元,中位数是47543美元,标准差是10250美元。
根据这些数据可以判断,女性MBA起薪的分布形状是( B )。
A、尖峰、对称B、右偏C、左偏D、均匀4、要了解成都市居民家庭的收支情况,最适合的调查方式是( D )。
A、普查B、重点调查C、典型调查D、抽样调查5、某股票在2000年、2001年、2002年和2003年的年收益率分别为4.5%,2.1%,25.5%,1.9%,则该股票在这四年的平均收益率为( A )。
A、8.079%B、7.821%C、8.5%D、7.5%6、根据切比雪夫不等式,至少有( D )的数据落在平均数加减3个标准差的范围之内。
A、68%B、99%C、95%D、89%7、评价统计量标准之一是随着样本统计量的数学期望等于总体参数,该标准称为( A )。
A.、无偏性B、有效性C、一致性D、准确性8、如果峰态系数小于于0,则表明这组数据( A )。
A 、扁平分布B 、尖峰分布C 、左偏分布D 、右偏分布 9、在概率度(可靠程度)一定的条件下( B )。
A 、允许误差较大,应抽取的单位越多B 、允许误差较小,应抽取的单位越多C 、允许误差较小,应抽取的单位越少D 、无法确定允许误差和应抽取单位数的变化10、在其它条件相同时,抽样平均数的抽样标准差减少到原来数1/3,则抽样单位就须( A )A 、增大到原来的9倍B 、增大到原来的3倍C 、比原来增加9倍D 、比原来减少8倍11、在下列两两组合的平均指标中,那一组的两个平均数完全不受极端数值的影响( D )A 、算术平均数和调和平均数B 、几何平均数和众数C 、调和平均数和众数D 、众数和中位数12、若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大,则( B )A 、甲单位的平均数代表性比较大B 、甲单位的平均数代表性比较小C 、两单位的平均数代表性一样大D 、无法判断13、设样本1X ,2X ,……,n X 取自正态总体N (u ,2σ),其中u 、2σ为未知参数。
统计学第三版答案第一章1.什么是统计学?怎样理解统计学与统计数据的关系?答:统计学是一门收集、整理、显示和分析统计数据的科学。
统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。
2.简要说明统计数据的来源答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。
间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。
3.简要说明抽样误差和非抽样误差答:统计调查误差可分为非抽样误差和抽样误差。
非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。
抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。
4.答:(1)有两个总体:A品牌所有产品、B品牌所有产品(2)变量:口味(如可用10分制表示)(3)匹配样本:从两品牌产品中各抽取1000瓶,由1000名消费者分别打分,形成匹配样本。
(4)从匹配样本的观察值中推断两品牌口味的相对好坏。
第二章、统计数据的描述思考题1描述次数分配表的编制过程答:分二个步骤:(1)按照统计研究的目的,将数据按分组标志进行分组。
按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。
按数量标志进行分组,可分为单项式分组与组距式分组单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。
统计分组应遵循“不重不漏”原则(2)将数据分配到各个组,统计各组的次数,编制次数分配表。
2.解释洛伦兹曲线及其用途答:洛伦兹曲线是20世纪初美国经济学家、统计学家洛伦兹根据意大利经济学家帕累托提出的收入分配公式绘制成的描述收入和财富分配性质的曲线。
洛伦兹曲线可以观察、分析国家和地区收入分配的平均程度。
第1章1.什么是统计学?怎样理解统计学与统计数据的关系?2.试举出日常生活或工作中统计数据及其规律性的例子。
3..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。
因此,他们开始检查供货商的集装箱,有问题的将其退回。
最近的一个集装箱装的是2 440加仑的油漆罐。
这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。
装满的油漆罐应为4.536 kg。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)描述推断。
答:(1)总体:最近的一个集装箱内的全部油漆;(2)研究变量:装满的油漆罐的质量;(3)样本:最近的一个集装箱内的50罐油漆;(4)推断:50罐油漆的质量应为4.536×50=226.8 kg。
4.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。
这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。
假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。
要求:(1)描述总体;(2)描述研究变量;(3)描述样本;(4)一描述推断。
答:(1)总体:市场上的“可口可乐”与“百事可乐”(2)研究变量:更好口味的品牌名称;(3)样本:1000名消费者品尝的两个品牌(4)推断:两个品牌中哪个口味更好。
第2章统计数据的描述——练习题(1) 指出上面的数据属于什么类型;(2)用Excel制作一张频数分布表;(3) 绘制一张条形图,反映评价等级的分布。
解:(1)由于表2.21中的数据为服务质量的等级,可以进行优劣等级比较,但不能计算差异大小,属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频数)频率%A1414B2121C 32 32D 18 18E 15 15 合计100100(3)条形图的制作:将上表(包含总标题,去掉合计栏)复制到Excel 表中,点击:图表向导→条形图→选择子图表类型→完成(见Excel 练习题2.1)。
一.单项选择题1.比较两组数据的离散程度最合适的统计量是( D )。
A.极差B.平均差C.标准差D.离散系数2.如果峰度系数k>3,表明该组数据是(A )。
A.尖峰分布B.扁平分布C.左偏分布D.右偏分布3.某大学经济管理学院有1200名学生,法学院有800名学生,医学院有320名学生,理学院有200名学生。
上面的描述中,众数是( B )。
B.经济管理学院D.理学院4.某班共有25名学生,期末统计学课程的考试分数分别为:68,73,66,76,86,74,61,89,65,90,69,67,76,62,81,63,68,81,70,73,60,87,75,64,56,该班考试分数下四分位数和上四分位数分别是(A)。
和和和和5.对于右偏分布,平均数、中位数和众数之间的关系是(A )。
A.平均数>中位数>众数B.中位数>平均数>众数C.众数>中位数>平均数D.众数>平均数>中位数6.某班学生的统计学平均成绩是70分,最高分是96分,最低分是62分,根据这些信息,可以计算的测度离散程度的指标是( B )。
A.方差B.极差C.标准差D.变异系数7.在离散程度的测度中,最容易受极端值影响的是(A )。
A.极差B.方差C.标准差D.平均差8.在比较两组数据的离散程度时,不能直接比较它们的标准差,因为两组数据的( D )。
A.标准差不同B.方差不同C.数据个数不同D.计量单位不同9.总量指标按其反应的内容不同,可分为(C )。
A.总体指标和个体指标B.时期指标和时点指标C.总体单位总量指标和总体标识总量指标D.总体单位总量指标和标识单位指标10.反映同一总体在不同时间上的数量对比关系的是( C )。
A.计划完成成都相对指标B.比较相对指标C.动态相对指标D.比例相对指标年全国男性人口数为66556万人,2002年全国金融、保险业增加值为亿元,2003年全社会固定资产投资总额为亿元,2003年全国城乡居民人民币储蓄存款余额亿元。
第一章1、指出下列的变量中哪一个属于分类变量(D)A、年龄B、工资C、汽车产量D、购买商品时的支付方式(现金、信用卡、支票)23、指出下面的变量中哪一个属于数值型变量( A )A、生活费支出B、产品的等级C、企业类型D、员工对企业某项改革措施的态度4、某研究部门准备在全市200万个家庭中抽取2000个家庭,以推断该城市所有职工家庭的年人均收入。
这项研究的总体是(B )A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入5、某研究部门准备在全市200万个家庭中抽取2000个家庭,以推断该城市所有职工家庭的年人均收入。
这项研究的样本是(A)A、2000个家庭B、200万个家庭C、2000个家庭的人均收入D、200万个家庭的人均收入6、下列不属于描述统计问题的是(A)A、根据样本信息对总体进行的推断B、了解数据分布的特征C、分析感兴趣的总体特征D、利用图表等对数据进行汇总和分析7、在下列叙述中,采用推断统计方法的是( B)A、用图形描述某企业职工的学历构成B、从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计果园中橘子的平均重量C、一个城市在1月份的平均汽油价格D、随机抽取100名大学生,计算出他们的月平均生活费支出8、最近发表的一份报告称,“由150辆轿车组成的一个样本表明,进口轿车的价格明显高于本国生产的轿车”。
这一结论属于(D)A、对样本的描述B、对样本的推断C、对总体的描述D、对总体的推断9、为了估计全国高中学生的平均身高,从20个城市选取了100所中学进行调查。
在该项研究中,样本是( D )A、100所中学B、20个城市C、全国的高中生D、100所中学的高中生10、只能归于某一类有序类别的非数字型数据称为(B )A、分类数据B、顺序数据C、数值型数据D、数值型变量第二章1、从含有N个元素的总体中,抽取n个元素作为样本,使得总体中的每一个元素都有相同的机会(概率)被抽中,这样的抽样方式称为(A)A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样2、从总体中抽取一个元素后,把这个元素放回到总体中再抽取第二个元素,直至抽取n个元素为止,这样的抽样方法称为(A)A、重复抽样B、不重复抽样C、分层抽样D、整群抽样34、先将总体各元素按某种顺序排列,并按某种规则确定一个随机起点,然后每隔一定的间隔抽取一个元素,直至抽取n个元素形成一个样本,这样的抽样方式称为(C)A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样5、先将总体划分为若干群,然后以群作为抽样单位从中抽取部分群,再对抽中的各个群中所包含的所有元素进行观察,这样的抽样方式称为(D)A、简单随机抽样B、分层抽样C、系统抽样D、整群抽样6、为了调查某校学生的购书费用支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是(D)A、简单随机抽样B、整群抽样C、系统抽样D、分层抽样7、为了调查某校学生的购书费用支出,从全校抽取4个班级的学生进行调查,这种调查方法是(D)A、简单随机抽样B、系统抽样C、分层抽样D、整群抽样8、为了调查某校学生的购书费用支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是(C)A、简单随机抽样B、整群抽样C、系统抽样D、分层抽样第三章1、把数据的全部类别或组都列出来,落在某一特定类别或组中的数据个数称为(A)A、频数B、频率C、频数分布表D、累计频数2、样本中各不同类别数值之间的比值称为(D)A、频数B、频率C、比例D、比率3、下面的哪一个图形最适合于描述结构性问题(B)A、条形图B、饼图C、雷达图D、直方图4、下面的哪一个图形适合于比较研究两个或多个样本或总体的结构性问题(A)A、环形图B、饼图C、直方图D、茎叶图5、为比较多个样本间的相似性,适合采用的图形是(C)A、环形图B、茎叶图C、雷达图D、箱线图67、由一组数据的最大值、最小值、中位数和两个四分位数5个特征值绘制而成的、反映原始数据分布的图形,称为(D)A、条形图B、茎叶图C、直方图D、箱线图第四章1、如果一个数据的标准分数是-2,表明该数据(B)A、比平均数高出2个标准差B、比平均数低2个标准差C、等于2倍的平均数D、等于2倍的标准差2、经验法则表明,当一组数据对称分布时,在平均数加减2个标准差的范围之内大约有B 的数据。
一.单项选择填空
1.要了解全国居民家庭的收支情况,最适合的调查方式是(抽样调查)
A. 普查 B 重点调查 C 典型调查 D 抽样调查
2.如果数据分布很不均匀,则应编制(不等距数列)
A.等距数列
B. 不等距数列
C. 开口组
D. 闭口组
3.(众数和中位数)完全不受极端数值的影响。
A.算术平均数和调和平均数
B.几何平均数和众数
C.调和平均数和众数
D.众数和中位数
4.抽样平均误差反映样本指标与总体指标之间的(平均误差程度)
A.实际误差
B. 实际误差的绝对值
C. 平均误差程度
D. 可能误差范围
5.在线性回归模型中,随机误差项被假定服从(正态分布)
A. 正态分布
B. 二项分布
C. 指数分布
D. t分布
二.判断
1.定序尺度的计量结果可以进行加,减运算。
(×)
2.峰度系数大于1时为尖峰分布。
(×)
3.F分布总是正偏分布。
(√)
4.假设检验的显著性水平α,就是犯第一类错误的概率。
(√)
5.变量之间的相关关系和函数关系,在一定条件下可以互相转化。
(√)
三.填空
M( )
1.根据分组数据计算中位数的公式为:=
e
2.统计表的设计应符合科学,(实用),简练,(美观)的要求。
3.根据排队标志的性质不同,等距抽样分为(有关标志排队)和(无关标志排队)
4.相关关系按相关形式可分为(线性相关)和(非线性相关)
5.测定季节变动的方法主要有(原始资料平均法)和(趋势—循环剔除法)
四.名词解释
1.推断统计学:根据样本信息对总体进行估计、假设检验、预测或其他推断
的统计学方法。
2.众数:将数据按大小顺序排队形成次数分配后,在统计分布中具有明显集
中趋势点的数值,是数据一般水平代表性的一种。
3.显著性水平:当原假设实际上正确时,检验统计量落在拒绝域的概率。
4.回归分析:用适当的数学模型去近似的表达或估计变量之间的平均变化关
系,其目的是要根据已知的或固定的自变量的数值,去估计因变量的总体平均值。
5.长期趋势:现象在一段相当长的时期内所表现的沿着某一方向的持续变化
发展。
五.论述区间估计与假设检验的关系。
参考答案:
.要点:(1)区间估计通常求得的是以样本估计值为中心的双侧置信区间,而假设检验不仅
有双侧检验也常常采用单侧检验。
(2)区间估计立足于大概率,通常以较大的把握去估计总体参数的置信区间。
而假设检验立足于小概率,通常是给定很小的显著性水平去检验对总体参数的先验假设是否成立。
(3)二者都是根据样本信息对总体参数进行推断,都是以抽样分布为理论依据,都是建立在概率基础上的推断,推断结果都有一定的可信程度或风险。
(4)对同一实际问题的参数进行推断,使用同一样本,同一统计量,同一分布,二者可以相互转换,形成了区间估计与假设检验的对偶性。
六. 计算题
1. 某企业生产某种产品的工人有1000人,某日采用不重复抽样抽取100人
调查日产量,样本人均产量为35件,产量的样本标准差为4.5件,试以95.45%的置信度估计平均产量的抽样极限误差和置信区间。
2. 设销售收入X 为自变量,销售成本Y 为因变量,现已根据某公司12个
月的有关资料计算出以下数据(单位:万元)
88.64725
.262855)(73.425053)(22==-∑=-∑X Y Y X X t t
09.334229))((8
.549=--∑=Y Y X X Y t t
要求(1)拟合简单线性回归方程
(2)计算可决系数和回归估计的标准误差。
出口额的影响。
参考答案:
1. 解:S=4.5 n=100 属于大样本,故
43.0)1000
1001(1005.4)1()(22≈-=-=
N n n S x σ(件) 又已知 9545.01=-α,则22
=α
Z
86.043.02)(2=⨯==∆x Z x σα(件)
平均产量的置信区间为:86.03586.035+≤≤-μ,即在34.14至35.86件之间。
2.解:(1)786
3.073
.42505309
.334229)())((2
2==
-∑--∑=
∧
X X Y Y X X t t t β
37.4088.6477863.08.54921=⨯-=-=∧
∧
X Y ββ
t t X Y 7863.037.40+=∧
(2)73.38902158.5491225.262855)(22
22
=⨯+=+-∑=∑Y n Y Y Y t t
178
.46086828.54988.6471209.334229))((=⨯⨯+=+--∑=∑Y X n Y Y X X Y X t t t t
82
.63178.46086827863.08.5491237.4073.3890215212
2=⨯-⨯⨯-=∑-∑-∑=∑∧
∧t
t t t t
Y X Y Y e ββ
9775.72
1082
.63222
=-=-∑=n e S t S=9775.7=2.8244
99976.025
.26285582
.63112
=-=-
=SST SSE r 3.解:4.9312
2107
1038175285122
21=+
++++=-+++= n a a a a n (人) 4.解:
79200
96000
96000160100792001601000
00110110011⨯=∑∑⨯
∑∑=∑∑p q p q q p q p q p q p
202.15%=166.77%⨯121.21%
160100-79200=(160100-96000)+(96000-79200) 80900=64100+16800
分析:由于出口价格上升66.77%,影响出口总额增加64100美元,由于出口量增加
21.21%,影响出口总额增加16800美元,两者共同影响的结果使出口总额增长102.15%,即增加80900美元。