统计学(复习)
- 格式:doc
- 大小:280.50 KB
- 文档页数:20
《统计学》复习题一、选择题(有且仅有一个答案是正确的)1、劳动生产率是个()指标①动态②质量③流量④强度2、社会经济统计是()的有力武器①解决问题②克服困难③认识社会④进行合作3、计划完成程度是个()指标①动态②流量③强度④质量4、统计有三种含义,其中()是基础①统计学②统计活动③统计资料④统计部门5、把一个工厂的工人组成总体,每一个工人是()①总体单位②数量标志③指标④品质标志6、人口普查中规定统一的标准时间是为了()①登记的方便②避免重复或遗漏③扩大宣传效果④确定调查单位7、人口普查中,居民按年龄分组,宜编制()数列①组距②单项③离散④均可8、变量数列的组成要素一般是()①一个②两个③三个④四个9、某电视机厂为了检验全厂产品质量,应采用()①普查②重点调查③典型调查④抽样调查10、统计分组的关键是()①搜集各种原始资料②注意资料的真实性③正确选择分组标志与划分各组界限④绘制次数分配图11、某种产品单位成本计划规定比基期下降3%,实际比基期下降3.5%,则其单位成本计划完成程度相对指标为()① 116.7% ② 100.5% ③ 85.7% ④ 99.5%12、我国1993年轻工业增加值为重工业增加值的89.8%,该指标为()①结构相对指标②比例相对指标③比较相对指标④动态相对指标13、总量指标数值的大小()①随总体范围扩大而增大②随总体范围扩大而减少③随总体范围缩小而增大④与总体范围大小无关14、标志变异指标中,由总体中两上极端数值大小决定的是()①全距②平均差③标准差④标准差系数15、计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和()①小于100% ②大于100% ③等于100% ④不等于100%16、某种商品的年末库存额是()①时期指标并实物指标②时点指标并实物指标③时期指标并价值指标④时点指标并价值指标17、统计表的分类中不含()①一览表②简单表③分组表④复合表18、时期指标的特点是()① 不具有可加性 ② 具有可加性 ③ 与时间间隔无关 ④ 只能间断计数19、对于不同变量数列之间标志值离散程度的比较,只能计算( )① 标准差 ② 平均差 ③ 全距 ④ 标准系数20、是非标志标准差数值的取值范围是()① 0-0.25 ② 0-0.5 ③ 0-1 ④ 0.5-121、以1949年为最初水平,1994年为最末水平,计算钢产量的年递增率时,需要开( )次方。
第一章绪论第一节统计的产生和发展一、统计的产生:源于人类的计数与统计实践活动。
二、统计的发展1、英国的政治算术学派(17世纪)【“有实无名”的统计学】创始人:英国的威廉·配第(政治经济学之父)代表作:《政治算术》——统计学诞生的标志;文中针对英、法、荷兰的国情,利用数字、重量、尺度的方法,并配以朴素的图表(现代统计学广为采用的方法和内容)进行三国国力的比较,但没有使用“统计学”一词。
2、德国的国势学派(又称记述学派)(18世纪)【“有名无实”的统计学】代表人物:康令、阿亨瓦尔康令在大学开设“国势学”课程,以文字技术和比较为主,反映各国的国情国力;阿亨瓦尔继承和发展了康令的思想,并于1749年首次使用“统计学”代替“国势学”,认为统计学是关于各国基本制度的学问,但缺乏数字和内容。
3、数理统计学派(19世纪)代表人物:凯特勒(比利时)(古典统计学的完成者,近代统计学的先驱者)代表作:《社会物理学》——他将概率论引进统计学,完成了统计学和概率论的结合。
第二节统计学的性质和特点一、统计的三个含义:统计工作(过程)、统计资料(成果)和统计学(理论)。
二、统计学的研究对象:大量社会现象(主要是经济现象)的总体数量方面的方法论科学。
三、统计学的特点:数量性、总体性、具体性、社会性、广泛性。
第四节统计学中的几个基本概念一、统计总体与总体单位1、统计总体:是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体。
统计总体可以分为有限总体和无限总体,总体所包含的单位数有限的比如人口数、企业数,反之比如大海里的鱼资源数。
2、总体单位:是指构成总体的个别单位。
注:总体和总体单位的划分是相对的,它们随着统计研究对象和研究目的变化而相互转化。
二、统计标志与统计指标1、统计标志:用来说明总体单位所具有的属性或特征的名称。
可分为品质标志和数量标志。
品质标志是说明总体单位质的特征,不能用数字来表示的,如性别、籍贯、工种等;数量标志是说明总体单位量的特征,是可用数字来表示的,如年龄、身高、收入等。
1.什么是标志和指标?两者有何区别与联系?区别:⑴标志是说明总体单位(个体)特征的;而指标是说明总体特征的。
⑵标志中的数量标志是可以用数值表示,品质标志不能用数值表示;而所有的指标都是用数值表示的,不存在不能用数值表示的指标。
⑶标志中的数量标志不一定经过汇总,可以直接取得;而指标是由数量标志汇总得来的。
⑷标志一般不具备时间、地点等条件;而作为一个完整的统计指标,一定要有时间、地点、范围。
联系:⑴一般来说,指标的数值是由标志值汇总而来的;⑵标志和指标存在着一定的变换关系。
2.统计研究的基本方法有哪些?统计研究的基本方法有大量观察法、统计分组法、综合指标法、统计模型法、归纳推断法等。
3.影响频数分布的主要要素有哪些?⑴组距与组数:组距越小、组数越多、次数分布越分散。
⑵组限与组中值:组限的划定越科学,组中值越具有组代表性,次数分布越能反映总体单位实际分布特征。
4.统计分组的作用是什么?如何选择分组标志?统计分组可将复杂的社会经济现象科学分类,分析总体的内部结构,从而认识各种类型的社会经济现象的本质特征及其发展规律,揭示各种社会经济现象间的依存关系,加深对事物认识。
选择分组标志要⑴根据统计研究的目的;⑵适应被研究对象特征;⑶考虑历史资料的可比性。
5.加权算术平均数和加权调和平均数在计算上有什么不同?加权算术平均数与加权调和平均数在计算上的不同点是二者的应用条件不一样。
如果资料中直接给了每个组的变量值x和次数f,而没有给标志总量(m=xf),就要应用加权算术平均数计算平均数;如果资料中直接给了每个组的变量值x和标志总量(m=xf),而没有给每个组的次数f,就要用调和平均数来计算平均数。
6.在比较两个数列的二个平均数代表性大小时,能否直接用标准差进行对比?标准差的大小,一方面取决变量值离散程度大小的影响,也取决于平均数大小的影响。
如果两个数列的平均数大小相等时,平均数对标准差没有影响,这时就可以直接用标准差比较两个数列平均数代表性大小;但如果两个数列的平均数不等时,平均数的大小对标准差有影响,这时就能直接用标准差比较两个数列平均数代表性的大小,就需要消除平均数大小对标准差的影响,而需要用标准差系数比较两个平均数代表性的大小。
《社会统计学》复习题考试题型:一、填空(1*20=20)二、单选(1*10=10)三、多选(2*5=10)四、判断(2*5=10)五、计算题(5*8=40)六、分析题(1*10=10)一、填空题1、大量观察法之所以称为统计上特有的方法,是与()的作用分不开的。
2、大数定律的一般意义是:在综合大量社会现象的数量特征时,个别单位偶然的数量差异会(),使大量社会现象的数量特征借助于()形式,接近用确定的数值显示出必然的规律性。
3、要了解有个班级学生的学习情况,则总体是(),总体单位是()。
4、凡是相邻的两个变量值之间可以连续不断分割的变量,称为()。
凡是各变量值之间是以整数断开的变量,称为()。
5、统计按其内容主要包括两个方面:描述统计和()。
6、推论统计有两个基本内容:参数估计和()。
7、通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为()。
样本中所含的单位数,在统计学上称为样本大小,也叫做()。
8、()是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。
()是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。
9、()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。
()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。
10、统计调查从调查范围上分,可分为()和()。
11.()误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。
12基尼系数为(),表示收入绝对不平均;基尼系数为(),表示收入绝对平均。
13、统计表通常有一定格式,统计表各部位的名称分别是()、横行标题、纵栏标题、()。
14、实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈大,收入分配(),反之,则收入分配()。
相关:洛仑兹曲线是一种用来反映社会收入分配平均程度的累计百分数曲线。
统计学复习题1.总体(概念):也称统计总体,是指客观存在的,在同一性质基础上结合起来的许多个别单位的整体。
2.总体单位(概念):构成总体的个别单位称为总体单位。
(如所有的工业企业是总体,每一个工业企业是总体单位)1.标志(概念):用来说明总体单位特征的名称。
2.指标(概念):也称统计指标,是说明总体的综合数量特征的。
3.品质标志和数量标志的区分:品质标志说明总体单位质的特征,不能用数值表示。
如性别,民族。
数量标志表示总体单位量的特征,可以用数值表示,如年龄,工资。
1.变异(概念):品质标志的不同具体体现。
(如不同性别为男和女,不同民族为回或汉)2.变量(概念):数量表示的不同具体体现。
3.离散变量:只能取整数的变量。
(如人数,工厂数)连续变量:可以取小数的变量。
(如身高,资金)1.调查对象和调查单位区别:调查对象是我们需要进行研究的总体范围,即调查总体。
由许多性质相同的调查单位组成。
调查单位是我们所要研究的的总体单位,即所要登记的标志的承担着。
(如调查对象是某地区所有工业企业,则调查单位是每一个工业企业。
)2.调查单位和填报单位的区别:调查单位是调查项目的承担者,填报单位是负责上报调查资料的单位。
两者有时一致,有时(如①搜集国有企业生产情况的资料时,每一个国有企业既是调查单位也是填报单位。
不同。
②搜集国有企业高精尖设备使用情况的资料时,每一台高精尖设备是调查单位,而填报单位是每一国有企业。
1.调查时间是指资料所属的时点或时期。
2.调查期限是指调查工作进行的起讫时间(从一开始搜集资料到报送资料结束)3.时点:某个时间点,如2000年十一月一日零时时期:某个时间段第一天到最后一天,如1995年一月一日到十二月三十一日。
1.统计调查组织形式:一.按调查对象包括的范围分类(全面和非全面):①普查:专门,一次性(即“一时”),全面的调查。
②统计报表制度③抽样调查:专门,经常或者一时,非全面的调查。
④重点调查:报表或者专门,经常或者一时,非全面。
社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数)1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标.2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。
3、在回归分析中,各实际观测值y 与估计值y ˆ的离差平方和称为 剩余 变差。
4、平均增长速度= 平均发展速度 -1(或100%)。
5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。
6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。
7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。
8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为100%7%A 100% 1.06%100%6%-=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为100%10%100% 4.76%100%5%+=-=+B 产品产量计划超额完成程度 。
9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。
10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值);四个部分组成。
11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。
《统计学》综合复习资料一、单选题1.统计一词的三种涵义是( A )A.统计活动、统计资料、统计学 B.统计调查、统计整理、统计分析C.统计设计、统计分组、统计预测 D.统计方法、统计分析、统计预测2.统计调查按其组织形式分类,可分为( C )A.普查和典型调查 B.重点调查和抽样调查C.统计报表和专门调查 D.经常性调查和一次性调查3.我国编制零售物价指数是采用( C )法来编制的。
A.综合指数 B.平均指标指数C.固定加权算术平均指数D.固定加权调和平均指数4.某商品价格比原先降低5%,销售量增长了5%,则销售额( B )。
A.上升B.下降C.不变D.无法确定5.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用( C )。
A.算术平均数 B.调和平均数 C.几何平均数 D.众数6.欲以图形显示两变量X与y的关系,最好创建( D )。
A.直方图 B.圆形图 C.柱形图 D.散点图7.直接反映总体规模大小的指标是( A )。
A.总量指标 B.相对指标 C.平均指标 D.变异指标8.统计调查表可以分为( C )两种形式。
A.单一表和复合表B.简单表和复合表C.单一表和一览表D.简单表和分组表9.大量观察法的数学依据是(C )。
A.贝努里定律B.贝叶斯定理C.大数定律D.中心极限定理10.两变量的线性相关系数为 -1,说明两变量(C )。
A.完全正相关B.不完全相关C.完全负相关D.不存在线性相关关系11.若无季节变动,则季节比率理论上应该(B )。
A.小于1B.等于1C.大于1D.等于012.抽样平均误差的实质是(D )。
A.总体标准差B.样本的标准差C.抽样误差的标准差D.样本平均数的标准差13.某商品价格比上期下降5%,销售额比上期降低了5%,则销售量(C )。
A.上升B.下降C.不变D.无法确定14.几位工人的年龄分别是32岁,35岁,42岁,这几个数字是(C )。
1某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的总体是( B )A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入2某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的样本是( A )A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的总收入3某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的参数是( D )A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入4某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职工家庭的年人均收入,这项研究的统计量是( C )A.2000个家庭B.200万个家庭C.2000个家庭的人均收入D.200万个家庭的人均收入5为了调查某学校的购书费支出,从男生中抽取60名学生调查,从女生中抽取40名学生调查,这种调查方法是(C )A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样6为了调查某学校的购书费支出,从全校抽取4个班级的学生进行调查,这种调查方法是()A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样7为了调查某学校的购书费支出,将全校学生的名单按拼音顺序排列后,每隔50名学生抽取一名学生进行调查,这种调查方法是(D )A.简单随机抽样B.整群抽样C.分层抽样D.系统抽样8为了解女性对某种化妆品的购买意愿,调查者在街头随意拦截部分女性进行调查,这种调查方式是(C )A.简单随机抽样B.分层抽样C.方便抽样D.自愿抽样9研究人员根据对研究对象的了解有目的选择一些单位作为样本,这种调查方式是(A )A.判断抽样B.分层抽样C.方便抽样D.自愿抽样10下面的哪种调查方法的结果不能用于对总体有关参数进行估计( D )A.分层抽样B.系统抽样C.整群抽样D.判断抽样1如果要收集某一特定群体的有关资料,适宜采用的调查方式是(C )A.系统抽样B.整群抽样C.滚雪球抽样D.判断抽样2下面哪种抽样方式属于非概率抽样(D)A.系统抽样B.整群抽样C.分层抽样D.滚雪球抽样3一家公司的人力资源部主管要研究公司雇员的饮食习惯,改善公司餐厅的现状,将问卷发给就餐者,填写后再收上来。
三、单项选择题1.有20个工人看管机器台数资料如下:25443434422434634524,如按以上资料编制分配数列应采用(A)A.单项式分组B.等距分组C.不等距分组D.以上几种分组均可以2.将某地区国有企业按利润计划完成程度分为以下四组,正确的是(C)A.第一种,80%—90% 90%—99% 100%—109% 110%以上B.第二种,80%以下 80.1%—90% 90.1%—100% 100.1%—110 110%以上C.第三种,80%以上 80%—90% 90%—100% 100%—110% 110%以上D.第四种,85%以下 85%—95% 95%—105% 105%—115% 115%以上3.我国人口中,男女人口的性别比为1.6:100,这是(A)A.比例相对指标B.比较相对指标C.强度相对指标D.平均指标4.用标准差比较,分析两个同类总体平均指标的代表性的前提条件是(B)A.两个总体的标准差应相等B.两个总体的平均数应相等C.两个总体的单位数应相等D.两个总体的离差之和应相等5.事先将总体各单位按某一标志排列,然后依排列顺序和按相同的间隔来抽选调查单位的抽样称为(C)A.简单随机抽样B.类型抽样C.等距抽样D.整群抽样6.当所有的观察值y都落在直线yc=a+bx上时,则x与y之间的相关系数为(B)A. r=0 B. |r|=1 C. -17.统计指数按指数化指标反映的对象范围可分为(C)A.定基指数和环比指数B.数量指标指数和质量指标指数C.个体指数和总指数D.综合指数和平均数指数8.编制总指数的两种形式是(B)A.数量指标指数和质量指标指数B.综合指数和平均数指数C.算术平均数指数和调和平均数指数D.定基指数和环比指数9.已知各期环比增长速度为2%、5%、8%和7%,则相应的定基增长速度的计算方法为(A)A.(102%×105%×108%×107%)-100%B. 102%×105%×108%×107%C. 2%×5%×8%×7%D.(2%×5%×8%×7%)-100%10.几位学生的某门课成绩分别是67分、78分、88分、89分、96分,学生成绩是(BA.品质标志 B.数量标志 C.标志值 D.数量指标11.重点调查中重点单位是指(A)A.标志总量在总体中占有很大比重的单位B.具有重要意义或代表性的单位C.那些具有反映事物属性差异的品质标志的单位D.能用以推算总体标志总量的单位12.下述各项调查中属于全面调查的是(B)A.对某种连续生产的产品质量进行检验B.对某地区工业企业设备进行普查C.对会面钢铁生产中的重点单位进行调查D.抽选部分地块进行产量调查13.复合分组是(C)A.用同一标志对两个或两个以上的总量层叠起来进行分组B.对某一总体选择一个复杂的标志进行分组C.对同一总体选择两个或两个以上的标志层叠起来进行分组D.对同一总体选择两个或两个以上的标志并列起来进行分组14.由反映总体各单位数量特征的标志值汇总得出的指标是(B)A.总体单位总量 B.总体标志总量C.质量指标D.相对指标15.在什么条件下,简单算术平均数和加权算术平均数计算结果相同(B)A.权数不等 B.权数相等C.变量值相同D.变量值不同16.以抽样指标估计总体指标要求抽样指标值的平均数等于被估计的总体指标本身,这一标准称为(A)A.无偏性B.一致性C.有效性D.准确性17.能够测定变量之间相关系密切程度的主要方法是(C)A.相关表 B.相关图 C.相关系数 D.定性分析18.当变量x值增加时,变量y值随之下降,那么x与y之间存在着(C)A.直线相关关系B.正相关关系C.负相关关系D.曲线相关关系19.估计标准误说明回归直线的代表性,因此(B)A.估计标准误数值越大,说明回归直线的代表性越大B.估计标准误数值越大,说明回归直线的代表性越小C.估计标准误数值越小,说明回归直线的代表性越小D.估计标准误数值越小,说明回归直线的实用价值小20.下列调查中,调查单位与填报单位一致的是(D)A.企业设备调查 B.人口普查 C.农村耕地调查D.工业企业现状调查21.统计整理的关键(B)A.对调查资料进行审核 B.对调查资料进行统计分组C.对调查资料进行汇总D.编制统计表22.某主管局将下属企业按轻、重工业分类,再按企业规模进行分组,这样的分组属于(B)A.简单分组 B.复合分组 C.分析分组 D.结构分组23.将某地区国有企业按制调计划完成程度分为以下四组,正确的是(C)A.第一种,80%—90% 90%—99% 100%—109% 110%以上B.第二种,80%以下 80.1%—90% 90.1%—100% 100.1%—110% 110.1以上C.第三种,80%以上 80%—90% 90%—100% 100%—110% 110%以上D.第四种,85%以下 85%—95% 95%—105% 105%—115% 115%以上24.由反映总体各单位数量特征的标志值汇总得出的指标是(B)A.总体单位总量B.总体标志总量C.质量指标D.相对指标25.权数对算术平均数的影响作用,实质上取决于(A)A.作为权数的各组单位数占总体单位数比重的大小B.各组标志值占总体标志总量比重的大小C.标志值本身的大小D.标志值数量的多少26.反映样本指标与总体指标之间的平均误差程度的指标是(C)A.平均数离差B.概率度C.抽样平均误差D.抽样极限误差27.若物价上涨,商品的需求量相应减少,则物价与商品需求量之间的关系为(B)A.不相关B.负相关C.正相关D.复相关28.间隔相等的时点数列计算序时平均数应采用(D)A.几何平均法B.加权算术平均法C.简单算术平均法D.首末折半法29.标志是说明总体单位特征的名称(C)A.它有品质标志值和数量标志值两大类B.品质标志具有标志值C.数量标志且有标志值D.品质标志和数量标志都具有标志值30.几位学生的某门课成绩分别为67分、78分、88分、89分、96分“学生成绩”是(B)A.品质标志B.数量标志C.标志值D.数量指标31.统计指标按所反映的数量特点不同可以分为数量指标和质量指标两种,其中数量指标的表现形式是(A)A.绝对数B.相对数C.平均数D.百分数32.某市工业企业1997年生产经营成果年报呈报时间规定在1998年1月31日,则调查期限为(B )A.一日B.一个月C.一年D.一年零一个月33.下述各项调查中属于全面调查的是( B )A.对某种连续生产的产品质量进行检验B.对某地区工业企业设备进行普查C.对全面钢铁生产中的重点单位进行调查D.抽选部分地块进行农产量调查34.统计分组的关键在于( A )A.正确选择分组标志 B.正确确定组距 C.正确确定组数D.正确确定组中值35.强度相对指标与平均指标相比( A )A.都具有平均意义B.都可用复名数表示C.都是两上有联系的总体对比D.都具有正逆指标36.在什么条件下,简单算术平均数和加权算术平均数计算结果相同( B )A.权数不等B.权数相等C.变量值相同D.变量值不同37.为了了解某工厂职工家庭收支情况,按该厂职工名册依次每50人抽取1人,对其家庭进行调查,这种调查属于( B )A.简单随机抽样B.等距抽样C.类型抽样D.整群抽样38.当有变量的数值确定后,因变量的数值也随之安全确定,这种关系属于(B)A.相关关系B.函数关系C.回归关系D.随机关系39.统计指标按所反映的数量特点不同可以分为数量指标和质量指数,其中数量指标的表现形式是(A)A.绝对数 B.相对数 C.平均数 D.百分数40.某主管局将下属企业先按轻、重工业分类,再按企业规模分组,这样的分组属于(B)A.简单分组 B.复合分组 C.分析分组 D.结构分组41.计算结构相对指标时,总体各部分数值与总体数值对比求得的比重之和(C)A.小于100% B.大于100% C.等于100% D.小于或大于100%42.现象之间的相互关系可以归纳为两种类型即(A)A.相关关系和函数关系B.相关关系和因果关系C.相关关系和随机关系D.函数关系和因果关系43.能够测定变量之间相关关系密切程度的主要方法是(C)A.相关表B.相关图C.相关系数D.定性分析44.广义的指数是指(C)A.价格变动的相对数 B.物价变动的相对数 C.社会经济现象数量变动的相对数 D.简单现象总体数量变动的相对数45.某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长(C)A. 3% B. 10% C. 7.1% D. 107.1%46.平均增长速度是(C)A.长环增长速度的算术平均数B.总增长速度的算术平均数C.平均发展速度减去百分之百D.环比发展速度的序时平均数47.相对指标的表现(计量)形式有(2)。
“统计学”复习资料一、单选题:1、在企事业单位中直接影响统计报表工作数字资料真实可靠的因素是:(A)A、高质量的原始记录工作B、建立统计台帐C、完善企业内部报表D、各种经济核算协调一致2、对占煤炭开采量75%的大矿井进行劳动生产率调查;调查几个铁路枢纽,就可以了解我国铁路货运量的基本情况和问题;统计机关在拥有全国人口一半以上的各大城市的超市进行的零售价格水平系统调查。
这些都是:(C)A、全面调查B、抽样调查C、重点调查D、典型调查3、2010年7月1日零点的全国人口普查是(C)A、一次性调查和非全面调查B、经常性调查和非全面调查C、一次性调查和全面调查D、经常性调查和全面调查4、在不重复抽样中,抽样单位数从5%增加25%,抽样平均误差(C)A、增加39.7%B、增加约3/5C、减少约3/5D、没有什么变化5、计算向上累计次数及比率时,各累计数的意义是各组(A)A、上限以下的累计次数或比率B、上限以上的累计次数或比率C、下限以上的累计次数或比率D、下限以下的累计次数或比率6、2012年某集团公司A分公司工人的月平均工资为2000元,B分公司工人的月平均工资为1800元,2013年各分公司的工资水平不变,但A分公司的工人人数增加30%,B分公司的工人人数增加15%,则2013年两分公司工人总平均工资比2012年()A、降低B、提高C、不变D、不能做结论7、(甲)某高校新生1000人,从理科中随机抽取60人,文科中随机抽取40人,进行英语水平测试;(乙)从麦地总垅长中每3000市尺测竿落点处前后5尺长垅的产量进行实割实测;(丙)为研究城市青年业余时间活动情况,某城市每第10个居委会被抽取,并询问住在那里所有从16岁到30岁的青年人。
上述哪项属于类型抽样?()A、甲B、乙C、乙、丙D、甲、乙、丙=50+70x,这意味着()8、工人工资(元)倚劳动生产率(千元)变化的回归方程为YcA、劳动生产率为1000元时,工资为150元B、劳动生产率每增加1000元时,工人工资提高70元。
第1章统计和统计数据1统计学的定义:是收集、处理、分析、解释数据并从数据中得出结论的科学描述统计与推断统计的含义、内容、目的.描述统计: 是研究数据收集,处理和描述的统计学方法。
其内容包括如何取得研究所需要的数据,如何用图表形式对数据进行处理和展示,如何通过对数据的综合,概括与分析,得出所关心的数据特征。
推断统计:是研究如何利用样本数据来推断总体特征的统计学方法,内容包括两大类:参数估计: 是利用样本信息推断所关心的总体特征.假设体验:是利用样本信息判断对总体的某个假设是否成立.2、变量与数据:不同数据类型的含义,会判断已有数据的类型.变量:它们的特点是从一次观察到下一次观察会出现不同结果。
Ex:企业销售额,上涨股票的家数, 生活费支出,投掷一枚骰子观察其出现的点数数据:把观察到的结果记录下来。
总体:包含所研究的全部个体(数据)的集合样本: 从总体中抽取的一部分元素的集合样本量: 构成样本的元素的数目定量变量或数值变量:定量变量的观察结果称为定量数据或数值型数据。
可以用阿拉伯数据来记录其观察结果 .如“企业销售额"、“上涨股票的家数”、“生活费支出”、“投掷一枚骰子出现的点数”定性变量:分类变量和顺序变量统称为定性变量分类变量:表现为不同的类别.如“性别”、“企业所属的行业”、“学生所在的学院”等.分类变量的观察结果就是分类数据顺序变量或有序分类变量:具有一定顺序的类别变量。
如考试成绩按等级,一个人对事物的态度。
顺序变量的观察结果就是顺序数据或有序分类数据离散型变量:只能取有限个值得随机变量连续型变量:可以取一个或多个区间中任何值得随机变量3、获得数据的概率抽样方法有哪些?根据一个已知的概率来抽取样本单位,也称随机抽样-简单随机抽样:从总体N个单位(元素)中随机地抽取n个单位作为样本,使得总体中每一个元素都有相同的机会(概率)被抽中。
抽取元素的具体方法有重复抽样是抽取一个个体记录下数据后,再把这个个体放回到原来的总体中参加下一次抽选。
不重复抽样抽中的个体不再放回,再从所剩下的个体中抽取第二个元素,直到抽取n 个个为止。
- 分层抽样或分类抽样:它是在抽样之前先将总体的元素划分为若干层(类),然后从各个层中抽取一定数量的元素组成一个样本。
-系统抽样或等距抽样:它是想将总体个元素按某个顺序排列,并按某种规则确定一个随机起点,然后,每隔一定的间隔抽取一个元素,直至抽取n 个元素组成一个样本。
-整群抽样:是先将总体划分成若干群,然后以群作为抽样单元从中抽取部分群组成一个样本,再对抽中的每个群中包含的所有元素进行观察.第二章.用图表展示数据频数: 落在各类别中的数据个数比例:某一类别数据个数占全部数据个数的比值百分比:将对比的基数作为100而计算的比值比率:不同类别数值个数的比值频数分布表:频数分布表中落在某一特定类别数据.频数分布包含了很多有用的信息,通过它可以观察不同类型数据的分布状况。
什么是条形图:是用宽度相同的条形来表示数据多少的图形用于观察不同类别数据的多少或分布状况。
帕累托图: 是按各类别数据出现的频数多少排序后绘制的条形图饼图:是用圆形及圆内扇形的角度来表示数值大小的图形,它主要用于表示一个样本(或总体)中各组成部分道德数据占全部数据的比例,对于研究结构性问题十分有用。
环形图: 只能显示一个样本各部分所占的比例数据分组:是根据统计研究的需要,将原始数据按照某种标准化分成不同的组别。
1。
下限(lower limit) :一个组的最小值2。
上限(upper limit) :一个组的最大值3。
组距(class width):上限与下限之差4。
组中值(class midpoint):下限与上限之间的中点值组中值=下限值+上限值/2直方图与条形图的区别。
1.条形图中的每一矩形表示一个类别,其宽度没有意义,而直方图的宽度则表示各组的组距2.由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列3.条形图主要用于展示定性数据,而直方图则主要用于展示定量数据茎叶图:是反映原始数据分布的图形。
它由茎和叶两部分构成,其图形是由数据组成的.通过茎叶图,可以看出数据的分布形状及数据的离散状况,比如:分布是否对称,数据是否集中,是否有离群点。
等等箱线图:是由一组数据的最大值,最小值,中位数,两个四分位数.这五个特征值绘制而成的,它主要用于反映原始数据分布的特征,还可以进行多组数据分布特征的比较.雷达图:是显示多个变量的常用图示方法.1.从一个点出发,用每一条射线代表一个变量,多个变量的数据点连接成线,即围成一个区域,多个样本围成多个区域,就是雷达图2.可用于研究多个样本在多个变量上的相似程度3.当多个变量的取值相差较大或量纲不同时,可进行变换处理后再做图.第三章. 用统计量描述数据1、水平的度量描述数据水平的统计两主要有:平均数,中位数,分位数以及众数等.平均数.平均数的计算:1.也称为均值,常用的统计量之一2.消除了观测值的随机波动3.易受极端值的影响4.根据总体数据计算的,称为平均数,记为μ;根据样本数据计算的,称为样本平均数,记为⎺x中位数:是一组数据排序后处于中间位置上数值,用M e 表示。
四分位数:也称四分位点,它是一组数据排序后处于25%和75%位置上的值众数、中位数和平均数的关系*2、差异的度量极差:1.一组数据的最大值与最小值之差2.离散程度的最简单测度值3.易受极端值影响4.未考虑数据的分布5.计算公式为:R = max(x i) - min(x i)四分位差1.也称为内距或四分间距2.上四分位数与下四分位数之差:Q d=Q U–Q L3.反映了中间50%数据的离散程度4.不受极端值的影响5.用于衡量中位数的代表性样本方差和标准差(会计算)1.数据离散程度的最常用测度值2.反映各变量值与均值的平均差异3.根据总体数据计算的,称为总体方差(标准差),记为σ2(σ);根据样本数据计算的,称为样本方差(标准差),记为s2(s)4.样本方差假设是一个样本,则样本方差的计算公式为:其中是样本均值。
例如,一样本取值为3,4,4,5,4,则样本均值=,样本方差=。
样本方差是常用的统计量之一,是描述一组数据变异程度或分散程度大小的指标。
样本标准差S称为样本标准差.如在上例中,S=0.7071。
称(S/ X) ×100%为样本变异系数。
由于S与X都是从同一个样本资料中求得,两者的单位相同,故变异系数为一纯数。
当两种样本资料所用的单位不同时,只要计算出变异系数,就可以比较它们的变异程度。
标准分数: 可以计算一组数据中每个数值的标准分数,以测度每个数值在该组数据中的相对位置,并可以用它来判断一组数据是否有离群点离散系数(变异系数)是一组数据的标准差与其相应的平均数据之比,它消除了数据绝对值大小和计量单位对标准差大小的影响.分布形状的度量偏态:是指数据分布的不对称性. 侧度数据分布不对称性的统计量称为(偏态系数)峰态:是指数据分布峰值的高低。
测度峰态的统计量是(峰态系数)弄清偏态系数的取值含义,会判断左偏、右偏和对称情形*弄清峰态系数的取值含义,会判断尖峰、扁平和正常情形*第四章.概率分布概率:概率是对事件发生的可能性大小的度量随机变量:是用数值来描述特定试验一切可能出现的结果,它的取值事先不能确定,具有随机性连续性随机变量:只能取一个或多个区间中任何值得随机变量离散型随机变量:只能取有限个值得随机变量随机变量的概括性度量:期望值和方差的计算:描述随机变量集中程度的统计量称为(期望值)离散型概率分布:是用表格的形式表现出来,就是离散型随机变量的概率分布二项分布: 二项分布是建立在伯努利试验基础上的。
N重伯努利1.贝努里试验满足下列条件⏹一次试验只有两个可能结果,即“成功”和“失败”●“成功”是指我们感兴趣的某种特征⏹一次试验“成功”的概率为p ,失败的概率为q =1—p,且概率p对每次试验都是相同的⏹试验是相互独立的,并可以重复进行n次⏹在n次试验中,“成功"的次数对应一个离散型随机变量X泊松分布:1.1837年法国数学家泊松(D。
Poisson,1781-1840)首次提出2.用于描述在一指定时间范围内或在一定的长度、面积、体积之内每一事件出现次数的分布3.泊松分布的例子⏹一定时间段内,某航空公司接到的订票电话数⏹一定时间内,到车站等候公共汽车的人数⏹一定路段内,路面出现大损坏的次数⏹一定时间段内,放射性物质放射的粒子数⏹一匹布上发现的疵点个数⏹一定页数的书刊上出现的错别字个数超几何分布的应用背景1.采用不重复抽样,各次试验并不独立,成功的概率也互不相等2.总体元素的数目N很小,或样本容量n相对于N来说较大时,样本中“成功”的次数则服从超几何概率分布3.概率分布函数为连续型概率分布:正态分布:1.由C.F.高斯(Carl Friedrich Gauss,1777—1855)作为描述误差相对频数分布的模型而提出2.描述连续型随机变量的最重要的分布3.许多现象都可以由正态分布来描述4.可用于近似离散型随机变量的分布⏹例如: 二项分布5.经典统计推断的基础标准正态分布1.随机变量具有均值为0,标准差为1的正态分布2.任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布3.标准正态分布的概率密度函数4.标准正态分布的分布函数数据的正态性评估:Q—Q图和P—P图的应用1.对数据画出频数分布的直方图或茎叶图⏹若数据近似服从正态分布,则图形的形状与上面给出的正态曲线应该相似3.绘制正态概率图。
有时也称为分位数—分位数图或称Q—Q图或称为P—P图⏹用于考察观测数据是否符合某一理论分布,如正态分布、指数分布、t分布等等⏹ P —P 图是根据观测数据的累积概率与理论分布(如正态分布)的累积概率的符合程度绘制的 ⏹ Q-Q 图则是根据观测值的实际分位数与理论分布(如正态分布)的分位数绘制的4. 使用非参数检验中的Kolmogorov —Smirnov 检验(K-S 检验)由正态分布导出的几个重要分布:χ2分布、t 分布、F 分布的特点 χ2分布:1. 由阿贝(Abbe) 于1863年首先给出,后来由海尔墨特(Hermert)和卡·皮尔逊(K·Pearson) 分别于1875年和1900年推导出来2. 设 ,则3. 令 ,则 y 服从自由度为1的χ2分布,即4. 对于n 个正态随机变量y 1 ,y 2 ,y n ,则随机变量5. 称为具有n 个自由度的χ2分布,记为 性质和特点1. 分布的变量值始终为正2. 分布的形状取决于其自由度n 的大小,通常为不对称的正偏分布,但随着自由度的增大逐渐趋于对称3. 期望为:E (χ2)=n ,方差为:D (χ2)=2n (n 为自由度)4. 可加性:若U 和V 为两个独立的χ2分布随机变量,U ~χ2(n 1),V ~χ2(n 2),则U +V 这一随机变量服从自由度为n 1+n 2的χ2分布t 分布:1. 提出者是William Gosset ,也被称为学生分布(student’s t)2. t 分布是类似正态分布的一种对称分布,通常要比正态分布平坦和分散。