统计学1
- 格式:doc
- 大小:164.50 KB
- 文档页数:8
练习题1、指出下面的数据哪一个属于分类数据(D)A.年龄 B工资 C汽车产量 D购买商品时的支付方式(现金、信用卡、支票)2、指出下面的数据哪一个属于顺序数据(D)A.年龄B.工资C.汽车产量D.员工对企业某项改革措施的态度(赞成、中立、反对)3、指出下面的数据哪一个属于数值型数据(A)A.5个人的年龄分别使5,22,34,41,33B.性别C.企业类型D. 员工对企业某项改革措施的态度(赞成、中立、反对)4、某项研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的总体是(B)A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入5、某项研究部门准备在权势200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的样本是(A)A.2000个家庭B.200万个家庭C.2000个家庭的总收入D.200万个家庭的人均收入6、某项研究部门准备在权势200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的参数是(D)A.2000个家庭B.200万个家庭C.2000个家庭的年人均收入D.200万个家庭的年人均收入7、某项研究部门准备在权势200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入。
这项研究的统计量是(C)A.2000个家庭B.200万个家庭C.2000个家庭的年人均收入D.200万个家庭的年人均收入8、一家研究机构从IT从业者中随即抽取500人样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
这里的总体是(A)A.IT业的全部从业者 B.500个IT从业者 C.IT从业者的总收入 D.IT从业者的消费支付方式9、一家研究机构从IT从业者中随即抽取500人样本进行调查,其中60%回答他们的月收入在5000元以上,50%的人回答他们的消费支付方式是用信用卡。
1-4章共165题一、判断题题库答案(第一章)1.参数是用来描述总体特征的概括性数字度量,是研究者想要了解的总体的某种特征值。
() +2.身高和体重都属于离散变量。
() -3.学生人数、企业数和产品产量属于离散变量。
() +4.对有限总体可进行全面调查或非全面调查,对无限总体只能进行非全面调查。
() +5.总体分为有限总体和无线总体主要是为了判别在抽样中每次抽取是否独立。
() +6.样本是包含所研究的全部个体(数据)的集合,通常由所研究的一些个体组成。
() -7.总体根据其所包含的单位数目是否可数可以分为有限总体和无限总体。
() +8.截面数据是在不同时间上收集到的数据,这类数据是按时间顺序收集到的,用于所描述现象随时间变化的情况。
() -9.统计学是一门应用性很强的方法论性质的学科。
() +10在检查灯泡的使用寿命时采用普查方式。
() -11.在调查某班人数时,人数是离散变量。
() +12.变量是说明现象某种特征的概念,特点是从一次观察到下一次观察结果会呈现出差别或变化。
() +13.某公司每月的销售利润是变量。
() +14. 年龄是数量标志。
() +15. 性别是数量标志。
() -16. 人口普查和工业普查是典型的普查类型。
() +17.离散变量是任意两个变量之间取值是无限的。
() -18.连续变量任意两个变量之间取值是有限的。
() -19.指标体系是由一系列反映社会经济现象数量特征的相对独立又相互联系的统计指标构成的整体。
() +(第二章)1.所有统计数据追踪其初始开源,都是来自调查或实验。
() +3.相对来说,一手数据搜集比较容易、采集成本低、搜集速度快。
() -4.实验大多是对自然现象而言的。
() +5.调查通常是对社会现象而言的。
() +6.搜集二手资料是研究生首先考虑并采用的,分析也应该首先从对二手数据的分析开始。
()+7.概率抽样不是根据随机原则抽样的。
()-8.简单随机抽样是一种最基本的抽样方法,是其他抽样方法的基础。
统计学1⼀、名词解释1、定性数据是指只能⽤⽂字或数字代码来表现事物的品质特征或属性特征的数据,具体⼜分为定类数据与定序数据。
(定类数据是对事物进⾏分类的结果,表现为类别,由定类尺度计量⽽成。
定序数据是对事物按照⼀定的排序进⾏分类的结果,表现为有顺序的类别,由定序尺度计量⽽成。
)2、定量数据是指⽤数值来表现事物数量特征的数据,具体⼜分为定距数据与定⽐数据两种。
(定距数据是⼀种不仅能反映事物所属的类别和顺序,还能反映事物类别或顺序之间数量差距的数据,由定距尺度计量⽽成。
定⽐数据是⼀种不仅能体现事物之间数量差距,还能通过对⽐运算,即计算两个测度值之间的⽐值来体现相对程度的数据,由定⽐尺度计量⽽成。
)3、长期趋势是指时间数列中指标值在较长⼀段时间内,由于受普遍的、持续的、决定性的基本因素的作⽤,使发展⽔平沿着⼀个⽅向持续向上或向下发展或持续不变的基本态势。
4、季节变动是指数列中各期指标值随着季节交替⽽出现周期性的、有规则的重复变动,这⾥的时间通常指⼀年。
5、循环变动是指时间数列中各项指标值随着时间变动发⽣周期性的重复变化,但循环变动所需的时间更长,重复变动的规律性、变动周期和时间也不像季节变动来得稳定、可以预测。
6不规则变动是由未能得到解释的⼀些短期波动所组成的,常指时间数列由于受偶然因素或意外条件影响,在⼀段时间内(通常指短期内)呈现不规则的或⾃然不可预测的变动。
7、相关关系,也称统计相关,是指现象之间存在的⾮确定性的数量依存关系。
8、点估计也称定值估计,就是以样本观测数据为依据,对总体参数做出确定值的估计,也就是⽤⼀个样本的具体统计值去估计总体的未知参数。
9、区间估计,就是指⽤⼀个具有⼀定可靠程度的区间范围来估计总体参数,即对于未知的总体参数9,想办法找出两个数值Qi和他(B i v他),使B处于区间(0|, 9)内的概率为1- a,即n ( 9iv 9V 9)=1- a区间(9i, 9)为总体参数的估计区间或置信区间,91为估计下限或置信下限,9为估计上限或置信上限。
第一章绪论第一节统计学的产生与发展统计这个专有名词的产生产生在17世纪后期,此时才形成一个学科来进行专门研究。
从统计学的发展来看,大致可分为三个时期:古典统计学、近代统计学和现代统计学。
一、古典统计学17世纪中期和18世纪中期,统计学的理论刚刚萌芽,当时分为记述学派和政治算术学派。
1、国势学派国势学派又称记述学派,产生于17世纪的德国。
由于该学派主要以文字记述国家的显著事项,故称记述学派。
其主要代表人物是海尔曼·康令和阿亨华尔。
因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。
该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。
2、政治算术学派政治算术学派产生于17世纪中叶的英国,创始人是威廉·配第(1623-1687),其代表作是他于1676年完成的《政治算术》一书。
这里的“政治”是指政治经济学,“算术”是指统计方法。
在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。
是现代统计学的理论基础,因此又被称为统计学之父。
二、近代统计学1、数理统计学派19世纪中叶,把概率论引进统计学而形成数理学派。
其奠基人是比利时的阿道夫·凯特勒(1796-1874),他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,使统计学进入一个新的发展阶段。
由于历史的局限性,凯特勒在研究过程中混淆了自然现象和本质区别,对犯罪、道德等社会问题,用研究自然现象的观点和方法作出一些机械的、庸俗化的解释。
但是,他把概率论引入统计学,使统计学在“政治算术”所建立的“算术”方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。
(机械论:能量和速度)2、社会统计学派社会统计学派产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯(1821-1889),主要代表人物主要有恩格尔(1821- 1896)、梅尔(1841-1925)等人。
一、选择题1、总体有三个人,其工资分别为645元、655元和665元。
其平均工资655元是( )。
A 、指标值B 、标志值C 、变异度D 、变量2、在不重复抽样中,抽样单位数从5%增加到25%,抽样平均误差( )。
A 、增加39.7%B 、减少约20%C 、减少约60%D 、没有什么变化 3、计算向上累计次数及比率时,各累计数的意义是各组()A 、上限以下的累计次数或比率B 、上限以上的累计次数或比率C 、下限以上的累计次数或比率D 、下限以下的累计次数或比率4、统计整理主要是对( )的整理。
A 、历史资料B 、分析资料C 、原始资料D 、综合资料5、2004年某集团公司A 分公司工人的月平均工资为2000元,B 分公司工人的月平均工资为1800元,2005年各分公司的工资水平不变,但A 分公司的工人人数增加30%,B 分公司的工人人数增加15%,则2005年两分公司工人总平均工资比2004年( )A 、提高B 、降低C 、不变D 、不能做结论6.如果检验的假设为0010:,:H H μμμμ≥<,则拒绝域为( )A 、 z z α>B 、z z α<-C 、A 或BD 、/2z z α<-7.某外商投资企业按工资水平分为四组:1000元以下,1000~1500元;1500~2000元;2000元以上。
第一组和第四组的组中值分别为( )A 、 750和2500B 、 800和2250C 、 800和2500D 、 750和22508.统计分组的核心问题是( )A 、划分各组界限B 、选择分组标志C 、确定组数D 、确定组距9.在某公司进行的计算机水平测试中,新员工的平均得分为80分,标准差5分,中位数86分,则新员工得分的分布形状是( )。
A 、对称的B 、左偏的C 、右偏的D 、无法确定10.某地有2万亩稻田,根据上年资料得知其中平均亩产的标准差为50公斤,若以95.45%的概率保证平均亩产的误差不超过10公斤,应抽选( )亩地作为样本进行抽样调查。
A 、100B 、250C 、500D 、1000二、多选题1.下列属于负相关的现象是( ) 。
A 、商品流转的规模愈大,流通费用水平越低B 、流通费用率随商品销售额的增加而减少C 、国民收入随投资额的增加而增长D 、生产单位产品所耗工时随劳动生产率的提高而减少E 、某产品产量随工人劳动生产率的提高而增加 2.应用相关分析与回归分析需注意的问题是( )。
A 、在定性分析的基础上进行定量分析B 、要注意现象质的界限及相关关系作用的范围C 、要具体问题具体分析D 、要考虑社会经济现象的复杂性E 、对回归模型中计算出来的参数的有效性应进行检验 3.下列关于假设检验的陈述正确的是( )。
A 、假设检验实质上是对原假设进行检验B 、假设检验实质上是对备选假设进行检验C 、当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝 对错误D 、假设检验并不是根据样本结果简单地或直接地判断原假设和备选假设 哪一个更有可能正确E 、当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝 对正确4.设总体为正态总体,总体方差未知,在小样本条件下,对总体均值进行如下的假设检验:1000:;(:μμμμμ≠=H H 为一已知数),α=0.1,则下列说法正确的有 ( )。
A 、()1.0,Z -∞-和 ()∞+,1.0Z 为原假设的拒绝区域B 、()05.0,Z -∞-和 ()∞+,05.0Z 为原假设的拒绝区域C 、()1.0,t -∞-和 ()∞+,1.0t 为原假设的拒绝区域D 、()05.0,t -∞-和 ()+∞,05.0t 为原假设的拒绝区域E 、若检验统计量的绝对值越大,则原假设越容易被拒绝 5.下列哪些情况应采用调和平均数( )。
A 、已知生产同种产品的四个企业的计划完成程度和计划产量,求平均计划完成程度B 、已知生产同种产品的四个企业的计划完成程度和实际产量,求平均计划完成程度C 、已知某种产品在不同集贸市场上的销售单价和销售额,求平均价格D 、已知某种产品在不同集贸市场上的销售单价和销售量,求平均价格E 、已知总产值和职工人数,求劳动生产率 三、判断题1、 从理论上讲,任何一个综合指数形式均可变形为相应的加权算术平均数指数和加权调和平均数指数。
( ) 2、 在单位成本指数111p qp q ∑∑中,∑11p q —∑01p q 表示单位成本增减的绝对额。
( )3、 已知某市工业总产值2001年至2005年年增长速度分别为4%,5%,9%,11%和6%,则这五年的平均增长速度为6.97%。
( )4、 移动平均法既可用于测定长期趋势,又可用于进行预测。
( )5、 定基发展速度等于相应各个环比发展速度的连乘积,所以定基增长速度也等于相应各个环比增长速度积。
( )6、 最不受极端值影响的算术平均数是调和平均数。
()7、 如果总体平均数落在区间(960,1040)内的概率为0.9545,则抽样平均误差等于30。
( ) 8、 根据航班正点率(%)与旅客投诉率(次/万名)建立的回归方程为: y ˆ= 6.02-0.07 x ,其中回归系数为-0.07,表示旅客投诉率与航班正点率之间是低度相关。
( ) 9、 估计标准误指的就是实际值y 与估计值y c 的平均误差程度。
( )10、统计分组是根据研究的任务和对象的特点,按照人们的意识将总体分为若干部分。
( ) 四、简答题1. 简述分组和编制频数分布表的步骤。
答:2. 什么叫离中趋势,描述离中趋势常用指标有哪些? 答:3.拉氏指数的概念及拉氏数量指数公式。
答:五、计算题1. 某城市居民120户住房面积调查的资料如下:住房面积(平方米/户)户数(户)50以下50-60 60-70 70-80 80-90 90-100 100以上10 15 20 40 10 15 10合计120试对以下两种情况计算成数(比例)的平均数及其方差:(1)住房面积“50以下”和“50以上”;(2)住房面积“50-60”和“50-60以外的各种住房面积”。
2. 万里橡胶制品厂生产的汽车轮胎平均寿命为40,000公里,标准差为7500公里。
该厂经过技术革新试制了一种新轮胎比原轮胎平均寿命明显延长,则可大批量生产。
技术人员抽取了100只新轮胎,测得平均寿命为41,000公里,汽车轮胎的平均寿命服从正态分布。
试利用样本观察的结果,说明该厂是否应大批量生产这种新轮胎。
(α=0.05)3. X 和Y 分别表示下肢瘫痪和正常成年男子的血液容量,单位:ml ,假设X 服从),(21σμN ,Y 服从),(22σμN ,对X 做了7次观测,对Y 做了10次观测,具体数据如下表所示,求21μμ-的95%置信区间。
X 1612 1352 1456 1222 1560 1456 1924 Y 1082 1300 1092 1040 910 1248 1092 1040 1092 12884、某汽车生产商想了解广告费用(x )对销售量(y )的影响,收集了过去12年的有关数据。
通过计算得到下面的有关数据:方差分析表变差来源 df SS MS F Sig. F0.000 残差 40158--- --- 总计 111643866--------- 参数估计表Coefficients 标准误差 t Stat P-value 常数 360.06 62.46 5.82 0.000168 回归 1.450.07419.980.000问:(1) 完成上面的方差分析表。
(+3)(2) 汽车销售量的变差中有多少是由于广告费用的变动引起的?(+3) (3) 写出估计的回归方程并解释回归系数的实际意义。
(+2) (4) 检验回归系数的显著性(显著水平为0.05)。
5.对某型号的电子元件进行耐用性能检查,抽查的资料分组列表如下,要求耐用时数的允许误差范围10.5小时,试求该批电子元件的平均耐用时数的区间估计和该置信区间下的置信概率。
耐用时数元件数900以下 1900-950 2950-1000 61000-1050 351050-1100 431100-1150 91150-1200 31200以上 1合计100附表1:标准正态分布表x0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09 0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359 0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753 0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141 0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517 0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879 0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224 0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549 0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852 0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133 0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389 1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621 1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830 1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015 1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177 1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319 1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441 1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545 1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633 1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706 1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767 2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817 2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857 2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890 2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916 2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936 2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952 2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964 2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974 2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981 2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986 3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990 3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993 3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995 3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997 3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998 3.50.99980.99980.99980.99980.99980.99980.99980.99980.99980.9998()dtex z P t x2/221-∞-⎰=<π附表2:t分布临界值表(上α分位点)单侧α0.1 0.05 0.025 0.01 0.005 双侧α0.2 0.1 0.05 0.02 0.011 3.077684 6.313752 12.7062 31.82052 63.656742 1.885618 2.919986 4.302653 6.964557 9.9248433 1.637744 2.353363 3.182446 4.540703 5.8409094 1.533206 2.131847 2.776445 3.746947 4.6040955 1.475884 2.015048 2.570582 3.36493 4.0321436 1.439756 1.94318 2.446912 3.142668 3.7074287 1.414924 1.894579 2.364624 2.997952 3.4994838 1.396815 1.859548 2.306004 2.896459 3.3553879 1.383029 1.833113 2.262157 2.821438 3.24983610 1.372184 1.812461 2.228139 2.763769 3.16927311 1.36343 1.795885 2.200985 2.718079 3.10580712 1.356217 1.782288 2.178813 2.680998 3.0545413 1.350171 1.770933 2.160369 2.650309 3.01227614 1.34503 1.76131 2.144787 2.624494 2.97684315 1.340606 1.75305 2.13145 2.60248 2.94671316 1.336757 1.745884 2.119905 2.583487 2.92078217 1.333379 1.739607 2.109816 2.566934 2.89823118 1.330391 1.734064 2.100922 2.55238 2.8784419 1.327728 1.729133 2.093024 2.539483 2.86093520 1.325341 1.724718 2.085963 2.527977 2.84534。