南开应用统计学考试答案
- 格式:doc
- 大小:144.50 KB
- 文档页数:5
应用统计基础试题及答案一、单项选择题(每题2分,共20分)1. 以下哪个选项是描述数据集中趋势的统计量?A. 众数B. 方差C. 标准差D. 极差答案:A2. 在统计学中,标准正态分布的均值是:A. -1B. 0C. 1D. 2答案:B3. 以下哪个选项是描述数据离散程度的统计量?A. 平均数B. 中位数C. 众数D. 极差答案:D4. 假设检验中的“显著性水平”通常用哪个希腊字母表示?A. αB. βC. γD. δ5. 相关系数的取值范围是:A. -1到1B. 0到1C. -1到0D. 0到-1答案:A6. 以下哪个选项是描述数据分布形状的统计量?A. 均值B. 方差C. 偏度D. 众数答案:C7. 以下哪个选项是描述数据分布集中趋势的统计量?A. 极差B. 标准差C. 众数D. 偏度答案:C8. 在统计学中,完全正相关的情况下,相关系数的值是:A. 0B. 1C. -1D. 2答案:B9. 以下哪个选项是描述数据分布离散程度的统计量?B. 众数C. 方差D. 极差答案:C10. 以下哪个选项是描述数据分布偏斜方向的统计量?A. 均值B. 标准差C. 偏度D. 极差答案:C二、多项选择题(每题3分,共15分)1. 下列哪些统计量可以用来描述数据的集中趋势?A. 平均数B. 中位数C. 众数D. 方差答案:ABC2. 在统计学中,以下哪些是描述数据分布形状的统计量?A. 偏度B. 峰度C. 极差D. 标准差答案:AB3. 以下哪些统计量可以用来描述数据的离散程度?A. 极差B. 方差D. 平均数答案:ABC4. 在假设检验中,以下哪些是常见的检验类型?A. t检验B. 方差分析C. 卡方检验D. 回归分析答案:ABC5. 以下哪些统计量可以用来描述数据的分布?A. 均值B. 众数C. 偏度D. 峰度答案:ABCD三、判断题(每题1分,共10分)1. 标准差是衡量数据集中趋势的统计量。
(×)2. 相关系数的绝对值越接近1,表示变量之间的相关性越强。
应用统计分析⒈解释”统计”:指对某一现象有关的数据的搜集、整理、计算和分析等的活动。
社会经济统计是对社会经济现象的一种调查研究活动。
(社会经济统计学:是研究社会经济统计活动过程的一门方法论性质的科学。
)⒉解释“统计指标”:统计指标是指反映社会经济总体现象综合数量特征的概念和具体数值。
⒊解释“随机原则”:随机原则是指在抽样时排除主观上有意识地抽取调查单位,每个受试单位以概率均等的原则,随机地分配到实验组与对照组。
使每一个单位都有一定的机会被抽中。
⒋解释抽样框(或称抽样结构):样框又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。
设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。
若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。
5解释统计分析:统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。
它是继统计设计、统计调查、统计整理之后的一项十分重要的工作,是在前几个阶段工作的基础上通过分析从而达到对研究对象更为深刻的认识。
它又是在一定的选题下,集分析方案的设计、资料的搜集和整理而展开的研究活动。
系统、完善的资料是统计分析的必要条件。
6.解释分组法:根据研究任务的要求,对调查所得的原始资料,确定哪些分组或分类。
统计分组是统计整理的关键。
统计分组具有两方面的含义。
对总体而言是“分”,即将总体中的各个个体按照它们的差异性区分为若干部分;对个体而言是“合”,即将性质相同的个体归并在一起。
7.解释权数:用来衡量总体中各单位标志值在总体中作用大小的数值叫权数8.解释统计指数:广义,一切比较相对数均可称为指数。
狭义,它是用来说明复杂经济现象总体的变动的。
(①广义:所有相对指标都可称为统计指数。
简称指数②狭义:指数是用来反映不能直接加总的由多因素组成的复杂现象的综合变动的特殊相对数)二、问答题(本题共30 分,每小题6分)⒈阐述统计与数理统计的区别1 )研究对象不同,社会经济统计研究的是社会经济现象,而数理统计则研究所有现象。
应用统计硕士南开大学《432统计学》专硕考研真题一、南开大学432统计学[专业硕士]考研真题二、统计学第1章统计数据的搜集一、单项选择题1要进行一项调查,调查者在马路上随机拦截部分人进行调查,这种方式属于()。
[河海大学2020研]A.简单随机抽样B.分层抽样C.自愿抽样D.方便抽样【答案】D@@@@【解析】方便抽样是调查过程中由调查员依据方便的原则,自行确定入样的单位的非概率抽样方法。
例如,调查员在街头、公园、商店等公共场所进行拦截式的调查;厂家在出售产品的柜台前对路过的顾客进行调查,等等。
2将调查对象划分为若干类,然后从每一类中随机抽取若干单位进行观察,这称为()[浙江工商大学2019研]A.等距抽样B.整群抽样C.类型抽样D.纯随机抽样【答案】C@@@@【解析】类型抽样也称为分层抽样,是将总体单位按其属性特征分成若干类或层,然后在每一类或层中独立地随机抽取样本单位,各层中抽取的样本构成总体样本。
等距抽样也称为系统抽样;纯随机抽样也称为简单随机抽样。
3某机构十分关心小学生每周看电视的时间。
该机构随机抽取300名小学生家长对他们的孩子每周看电视的时间进行了估计。
结果表明,这些小学生每周看电视的平均时间为15小时,标准差为5小时。
该机构搜集数据的方式是()。
[山东大学2018研]A.概率抽样调查B.观察调查C.实验调查D.公开发表的资料【答案】A@@@@【解析】概率抽样是根据一个已知的概率来抽取样本单位,也就是说,哪个单位被抽中与否不取决于研究人员的主观意愿,而是取决于客观的机会,即概率。
因此,哪个单位被抽中与否完全是随机的。
题中该机构抽取的300名小学生家长是随机的,每个小学生的家长都有被抽到的概率,因此该机构搜集数据的方式是概率抽样。
4为了解大学生的消费状况,一学生社团通过微信朋友圈投放调查问卷,并邀请收到问卷的同学在自己的朋友圈内分享问卷。
关于这种调查方式,以下说法正确的是()。
[中央财经大学2018研]A.使用的抽样方式是简单随机抽样B.使用的抽样方式是配额抽样C.使用的抽样方式是非概率抽样D.这种调查不是抽样调查【答案】C@@@@【解析】非概率抽样是相对于概率抽样而言的,指抽取样本时不是依据随机原则,而是根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
应用统计学试题和答案 Company number:【WTUT-WT88Y-W8BBGB-BWYTT-19998】《统计学》模拟试卷(一)一、填空题(每空1分,共10分)1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。
2、收集的属于不同时间上的数据称为数据。
3、设总体X的方差为1,从总体中随机取容量为100的样本,得样本均值x=5,则总体均值的置信水平为99%的置信区间_________________。
=4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP年度化增长率为。
5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为,中位数为。
6、判定系数的取值范围是。
7、设总体X~),(2σμN,x为样本均值,S 为样本标准差。
当σ未知,且为小样本时,则nsxμ-服从自由度为n-1的___________________分布。
8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有个。
二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。
每小题1分,共14分)1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( )①、应用统计学②、描述统计学③、推断统计学2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数()①、扩大2倍②、减少到1/3 ③、不变3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值的无偏估计值为()①、②、33 ③、4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为,2001~2002年两年平均为,试确定1998~2002五年的年平均发展速度 ( )5、若两个变量的平均水平接近,平均差越大的变量,其( )①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( )①、越大 ②、越小 ③、不变7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )①、x > e M >o M ②、x <e M <o M ③、x >o M >e M 8、方差分析中的原假设是关于所研究因素 ( ) ①、各水平总体方差是否相等 ②、各水平的理论均值是否相等③、同一水平内部数量差异是否相等9、某年某地区甲乙两类职工的月平均收入分别为1060元和3350元,标准差分别为230元和680元,则职工月平均收入的离散程度 ( ) ①、甲类较大 ②、乙类较大 ③、两类相同10、某企业2004年与2003年相比,各种产品产量增长了8%,总生产费用增长了 15%,则该企业2004年单位成本指数为 ( ) ①、% ②、7% ③、%11、季节指数刻画了时间序列在一个年度内各月或季的典型季节特征。
大学课程《应用统计学》试题及答案一、单项选择题1、统计学具有()特点A. 数量性和总体性B.数量性和差异性C. 总体性和差异性D.数量性和答案:A2、“统计”作为社会经济生活中经常使用的名词,以下哪项不是其含义()A. 统计工作B.统计资料C. 统计数据D.统计科学答案:C3、专业、性别属于以下哪项统计数据的计量尺度()。
A. 定类尺度B.定序尺度C. 定距尺度D.定比尺度答案:A4、在对工业企业的生产设备进行普查时,调查对象是()。
A . 所有工业企业 B. 每一个工业企业D. 工业企业的每台生产设备C . 工业企业的所有生产设备答案:C5、统计有三种涵义,其中()是基础、是源。
A. 统计学B. 统计资料C. 统计工作D. 统计方法答案:C6、要了解100 个学生的学习情况,则总体单位()。
A. 100 个学生B. 100 个学生的学习情况D. 每一个学生的学习情况C. 每一个学答案:C7、下列变量中属于连续变量的是()。
A. 职工人数B. 设备台数C . 学生的年龄 D. 工业企业数答案:C8、其数量随总体范围的大小而增减的指标是()。
A. 数量指标B. 质量指标D.相对指标C. 品质指标答案:A二、多项选择题1、下列哪项可以归于无限总体内。
()A. 中国目前居民B. 电脑内所有零件C. 某快递公司所有订单D. 报警电话E.美国现在的农业科研所数答案:CD2、要了解100 个工业企业的生产情况,则统计指标有()。
A. 100 个工业企业的工业总产值B. 每一个工人的月工资C. 全部工业企业D. 一个工业企业的工资总额E. 全部工业企业的劳动生产率答案:AE3、下面哪些属于变量()。
A、可变品质标志B、质量指标C、数量指标D、可变的数量标志E、某一指标数值答案:BCD4、指标是说明总体特征的,标志是说明总体单位特征的,则()。
A. 数量指标可以用数值表示B. 质量指标不能用数值表示C. 数量标志可以用数值表示D. 品质标志不能用数值表示F.品质标志和质量指标都可以用数值表示答案:ACD三、判断题1、总体性是统计研究的前提。
《应用统计学》本科第一章导论一、单项选择题1.统计有三种涵义,其基础是( )。
(1)统计学 (2)统计话动 (3)统计方法 (4)统计资料2.一个统计总体( )。
(1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标3.若要了解某市工业生产设备情况,则总体单位是该市( )。
(1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备4.某班学生数学考试成绩分刷为65分、71分、80分和87分,这四个数字是( )。
(1)指标 (2)标志 (3)变量 (4)标志值5.下列属于品质标志的是( )。
(1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资6.现要了解某机床厂的生产经营情况,该厂的产量和利润是( )。
(1)连续变量 (2)离散变量 ()3前者是连续变量,后者是离散变量 (4)前者是离散变量,后者是连续变量7.劳动生产率是( )。
(1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标8.统计规律性主要是通过运用下述方法经整理、分析后得出的结论( )。
(1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法9.( )是统计的基础功能。
(1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能10.( )是统计的根本准则,是统计的生命线。
(1)真实性 (2)及时件 (3)总体性 (4)连续性11.构成统计总体的必要条件是( )。
(1)差异性 (2)综合性 (3)社会性 (4)同质性12.数理统计学的奠基人是( )。
(1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔13.统汁研究的数量必须是( )。
(1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量14.数量指标一般表现为( )。
(1)平均数 (2)相对数 (3)绝对数 (1)众数15.指标是说明总体特征的.标志则是说明总体单位特征的,所以( )。
应用统计学试题和答案统计学(Statistics)是研究收集、整理、描述、分析和解释数据的一门学科,广泛应用于各个领域。
本文将介绍一些应用统计学的试题以及相应的答案,旨在帮助读者加深对统计学概念和方法的理解。
一、选择题1. 下列哪个量不是描述数据分布的度量指标?A. 平均值B. 方差C. 中位数D. 相关系数答案:D2. 如果一组数据呈正态分布,那么其中约有多少比例的数据会落在1个标准差范围内?A. 34%B. 68%C. 95%D. 99.7%答案:B3. 在某班级的成绩中,小明的成绩排在全班第80%的位置,那么小明的排名在班级中大约是第几名?A. 第16名B. 第20名C. 第24名D. 第32名答案:C二、填空题1. 某产品的年销售量(单位:万件)如下:18、21、25、16、19、23、20。
请计算这组数据的平均值。
答案:平均值= (18 + 21 + 25 + 16 + 19 + 23 + 20) / 7 = 142 / 7 ≈ 20.292. 某网络游戏每天的在线人数(单位:千人)如下:12、10、9、14、15、11、13。
请计算这组数据的中位数。
答案:首先将数据排序:9、10、11、12、13、14、15。
中位数为中间值,即第4个数和第5个数的平均值,所以中位数为 (12 + 13) / 2 = 12.5三、计算题某班级学生的数学考试成绩如下:1. 请计算这组数据的标准差。
答案:首先计算平均值:(85 + 76 + 92 + 88 + 79 + 81 + 90 + 84 + 87 + 93) / 10 ≈ 85.5然后计算每个数据与平均值的差的平方,并求和:(85-85.5)^2 + (76-85.5)^2 + ... + (93-85.5)^2 ≈ 230.5标准差= √(230.5 / 10) ≈ 4.82. 请计算这组数据的相关系数。
答案:首先计算每个数据与平均值的差,并求平方:(85-85.5)^2,(76-85.5)^2,...,(93-85.5)^2然后计算每个数据与平均值的差的乘积,并求和:(85-85.5)(76-85.5),(85-85.5)(92-85.5),...,(93-85.5)(87-85.5)最后计算相关系数:相关系数 = (每个数据与平均值的差的乘积的和) / √[(每个数据与平均值的差的平方的和) × (每个数据与平均值的差的平方的和)]计算结果为相关系数≈ 0.757四、应用题某超市的顾客每天购买的商品件数如下:1. 请计算这组数据的众数。
应用统计学试题和答案一. 单项选择题(10%, 每小题1分)1.要了解某企业职工的文化水平情况,则总体单位是()。
A.该企业的全部职工B.该企业每一个职工的文化程度C.该企业的每一个职工D.该企业全部职工的平均文化程度2.对一批食品进行质量检验,最适宜采用的调查方法是()。
A.全面调查B.抽样调查C.典型调查D.重点调查3.将某地区40个工业企业按产值多少分组而编制的变量数列中,变量值是(D)。
A.产值B.工厂数C.各组的产值数D.各组的工厂数4.某企业某月产品销售额为20万元,月末库存商品为30万元,这两个总量指标是(C)。
A.时期指标B.时点指标C.前者为时期指标,后者为时点指标D.前者为时点指标,后者为时期指标5.离散程度大小与平均数代表性之间存在(B)。
A.正比关系B.反比关系C.恒等关系D.依存关系6.下面4个动态数列中,属于时点数列的是( C )。
A.历年招生人数动态数列B.历年增加在校生人数动态数列C.历年在校生人数动态数列D.历年毕业生人数动态数列7.在材料单耗综合指数中,每种产品的材料单耗指标是( D )。
A.质量指标B.数量指标C.相对指标D.总量指标A、提高B、下降C、不变D、条件不够,无法判断8.某企业产品为连续性生产,为检查产品质量,在24小时中每隔30分钟取下一分钟的产品进行全部检查,这是( A )。
A.整群抽样 B.简单随机抽样C.类型抽样 D.纯随机抽样9.年劳动生产率x(千元)和工人工资y(元)之间的回归方程为y =10 + 70x,这意味着年劳动生产率每提高1 000元时,工人工资平均( A )。
A.增加70元B.减少70元C.增加80元 D.减少80元10.对某市全部商业企业职工的生活状况进行调查,调查对象是(B)。
A.该市全部商业企业B.该市全部商业企业职工C.该市每一个商业企业D.该市商业企业每一名职工二. 多项选择题(40%, 每小题2分)1.下面说法正确的是( A B D)。
2021 ~2022学年春季学期应用统计课程考试一、判断题(打√ 或×,每题2分,共20分)1.统计方法是适用于所有学科领域的通用数据分析方法,只要有数据的地方就会用到统计方法。
(√)2.分类数据有时会被赋予数字,可以直接用来计算。
(×)3.众数和中位数都是平均指标的一种,计算时容易受极端数值的影响。
(×)4.在置信水平一定的条件下,增加样本容量,会缩小置信区间。
(√)5.无论是数量指标还是质量指标,都能用数值表示。
(√)6.在假设检验中,对一个总体方差的检验一般使用F检验。
(×)7.若X、Y之间的相关系数r=0,则表明X、Y两变量之间无相关关系。
(×)8.一般来说,冷饮的销量夏季大于冬季,这体现了冷饮销售的长期趋势。
(×)9.用回归方程预测y时,使用的x值离样本数据区间越远预测越准确。
(×)10.一般来说,计划完成程度相对数小于100%,表明没有完成计划。
(×)二、单项选择题(每题2分,共20分)1.要了解北京市城镇居民生活消费情况,最适合的调查方式是( D )。
A. 普查B. 重点调查C. 典型调查D. 抽样调查2.某研究机构在某城市100万个家庭中抽取1000个家庭进行调查,推断该城市家庭年人均收入。
该研究样本是( C )A. 100万个家庭B. 100万个家庭总收入C. 1000个家庭D. 1000个家庭总收入3.将某单位职工的年收入分组为10万元以下、10-12万元、12-14万元、14-16万元、16万元以上等五组,第一组的组中值为( B )。
A. 8万元B. 9万元C. 10万元D. 11万元4.两组数据的平均数不等,但标准差相等,则( A )。
A. 平均数小的,离散程度大B. 平均数大的,离散程度大C. 平均数小的,离散程度小D. 两组数据离散程度相同5.当正态总体的方差未知时,在小样本条件下,估计总体均值使用的分布是( A )A. t分布B. 正态分布C. F分布D. 卡方分布6.当一组数据中出现0或负数时,将无法计算下列哪种平均数?( C )A. 算术平均数B. 中位数C. 几何平均数D. 众数7.若抽取不同的样本,可以得到___的置信区间;所有的置信区间___都会包含总体参数的真值,以上两个空选择( A )。
2020 ~2021学年春季学期 应用统计 课程考试答案一、判断题(打√ 或 ×,每题2分,共20分)1.相关系数r =0说明变量之间没有任何关系。
(×)2.有关社会经济现象的数据大多数为实验数据。
(×)3.截面数据是在相同时间点同一空间获得的,时间序列数据是在不同时间点不同空间获得的。
(×)4.指数平滑法是利用过去观察值的算数平均值对未来进行预测的方法。
( ×)5.工资总额增长10%,平均工资下降5%,则职工人数应增长15%。
( ×)6.抽样误差只存在于概率抽样中。
(√)7.调查人员站在楼下,将最先走到楼外的10位居民选入样本,这种抽样方法属于随机抽样。
(×)8.众数可能不存在,也可能有两个或多个众数。
(√) 9.平稳序列是指包含重复出现的周期性波动的序列。
(× )10.回归平方和(SSR )与残差平方和(SSE )的比值为判定系数(R 2)。
(×)二、单项选择题(每题2分,共10分)1.通常所说的四分位数是指(B )A .处在25%位置上的数值B .处在25%位置上的数值和处在75%位置上的数值C .处在75%位置上的数值D .处在25%位置上的数值或处在75%位置上的数值 2.当样本量给定时,置信区间的宽度随着置信系数的增大而();当置信水平固定时,置信区间的宽度随样本量的增大而(B )A .增大;增大B .增大;减小C .减小;增大D .减小;减小 3.若抽取不同的样本,可以得到(A )的置信区间;所有的置信区间()都会包含总体参数的真值A .不同;不一定B .不同;一定C .相同;不一定D .相同;一定 4.如果总体服从正态分布,在总体方差2σ已知、小样本的情况下,总体均值的置信区间为();在总体方差2σ未知、大样本的情况下,总体均值的置信区间为(A )A ./2z a x ±;/2z a x ± B ./2z a x ±;/2a x t ±C ./2a x t ±;/2z a x ± D ./2a x t ±/2a x t ±5.原假设H 为真,拒绝原假设的概率是();原假设H 为假,拒绝原假设的概率是(C )A .αβ;B .1αβ-;1-C .αβ;1-D .1αβ-; 6.已知各期环比增长率为3%、4%、5%、6%,则定基增长率为(C )A.3.6%B.18.0%C.19.2%D.4.5% 7.以下不属于概率抽样的有:( C )A .整群抽样B .多阶段抽样C .配额抽样D .系统抽样 8.选取z 统计量作为检验统计量,并计算P 值,下面哪种情况需要拒绝原假设(C )A . 0/2:1,||||H z z αμ=<B . 0:1,||||H z z αμ><C . 0:1,H P μα≤<D . 0:1,||||H z z αμ=< 9.评价估计量的标准不包括( C )A .无偏性B .有效性C .稳定性D .一致性 10.变量之间的关系包括( D )A .函数关系和随机关系B .相关关系和无关关系C . 相关关系和随机关系D .函数关系和相关关系三、简答题(回答要点并简单解释,共15分)1.什么是假设检验中的两类错误?这两类错误有什么样的数量关系?(5分)答:在假设检验中,第一类错误是指当原假设正确时拒绝原假设,也称α错误(1分 );第二类错误是指当原假设错误时未拒绝原假设,也称β错误(1分)。
应用统计分析⒈解释”统计”:指对某一现象有关的数据的搜集、整理、计算和分析等的活动。
社会经济统计是对社会经济现象的一种调查研究活动。
(社会经济统计学:是研究社会经济统计活动过程的一门方法论性质的科学。
)⒉解释“统计指标”:统计指标是指反映社会经济总体现象综合数量特征的概念和具体数值。
⒊解释“随机原则”:随机原则是指在抽样时排除主观上有意识地抽取调查单位,每个受试单位以概率均等的原则,随机地分配到实验组与对照组。
使每一个单位都有一定的机会被抽中。
⒋解释抽样框(或称抽样结构):样框又称“抽样框架”、“抽样结构”,是指对可以选择作为样本的总体单位列出名册或排序编号,以确定总体的抽样范围和结构。
设计出了抽样框后,便可采用抽签的方式或按照随机数表来抽选必要的单位数。
若没有抽样框,则不能计算样本单位的概率,从而也就无法进行概率选样。
5解释统计分析:统计分析是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。
它是继统计设计、统计调查、统计整理之后的一项十分重要的工作,是在前几个阶段工作的基础上通过分析从而达到对研究对象更为深刻的认识。
它又是在一定的选题下,集分析方案的设计、资料的搜集和整理而展开的研究活动。
系统、完善的资料是统计分析的必要条件。
6.解释分组法:根据研究任务的要求,对调查所得的原始资料,确定哪些分组或分类。
统计分组是统计整理的关键。
统计分组具有两方面的含义。
对总体而言是“分”,即将总体中的各个个体按照它们的差异性区分为若干部分;对个体而言是“合”,即将性质相同的个体归并在一起。
7.解释权数:用来衡量总体中各单位标志值在总体中作用大小的数值叫权数8.解释统计指数:广义,一切比较相对数均可称为指数。
狭义,它是用来说明复杂经济现象总体的变动的。
(①广义:所有相对指标都可称为统计指数。
简称指数②狭义:指数是用来反映不能直接加总的由多因素组成的复杂现象的综合变动的特殊相对数)二、问答题(本题共30 分,每小题6分)⒈阐述统计与数理统计的区别1 )研究对象不同,社会经济统计研究的是社会经济现象,而数理统计则研究所有现象。
2 )研究方法不同,社会经济统计是研究在质与量的密切联系中研究其数量方面;而数理统计研究其量而不是质。
3 )学科地位不同,在中国及一些原社会主义国家中,社会经济统计占主导地位;而英美法则以数理统计为主导,在日本德国则两种学科并列4 )学科归类不同,社会经济统计是一门实质性科学,是以大量社会经济现象的数量方面为研究对象的社会科学,目的是找到社会经济发展规律的具体地点时间条件下的数量表现。
⒉阐述统计工作过程有哪些环节(或称阶段):一项完整的统计工作可分为四个阶段,即统计设计、统计调查、统计整理和统计分析。
统计设计:统计设计是统计工作的首要阶段,是根据统计研究的目的和研究对象的特点,明确统计指标和指标体系,以及对应的分组方法,并以分析方法指导实际的统计活动。
(其基本任务是制定出各种统计工作方案,是统计工作过程不可缺少的重要环节之一,是统计工作的指导依据。
统计设计所制定的方案包括:统计指标体系、统计分类目录、统计报表制度、统计调查方案、统计汇总或整理方案以及统计分析方案等诸多方面的内容。
)统计调查:统计调查是根据调查的目的与要求,运用科学的调查方法,有计划、有组织地搜集数据信息资料的统计工作过程。
统计整理:统计整理,就是根据统计研究任务的要求,对统计调查所搜集到的原始资料进行科学的加工整理,使之条理化、系统化,把反映总体单位的大量原始资料,转化为反映总体的基本统计指标,统计工作的这一过程,叫统计资料的整理。
统计分析:是指运用统计方法及与分析对象有关的知识,从定量与定性的结合上进行的研究活动。
⒊阐述分组法的核心问题答:分组标志的选择是统计分组的关键,一般应遵循以下原则:1、应根据研究问题的目的和任务选择分组标志。
每一总体都可以按照许多个标志来进行分组,具体按什么标志分组,主要取决于统计研究的目的和任务。
(例如:研究人口的年龄构成时,就应该按“年龄”分组;研究各类型的工业企业在工业生产中的地位和作用时,就应该按“经济类型”分组,等等。
)2、在若干个同类标志中,应选择能反映问题本质的标志进行分组。
有时可能有几个标志似乎都可以达到同一研究目的,这种情况下,应该进行深入分析,选择主要的、能反映问题本质的标志进行分组。
3、结合所研究现象所处的具体历史条件,采用具体问题具体分析的方法来选择分组标志。
(例如,有的标志在当时能反映问题的本质,但后来由于社会经济的发展变化,可能已经时过境迁,此时,进行统计分组就要选择新的分组标志来进行分组。
)⒋阐述统计指数的作用:统计指数在社会经济领域内广泛应用,这是由于统计指数具有独特的功能,能够发挥重要的作用。
具体表现在以下几个方面:(1)综合反映复杂社会经济总体在时间和空间方面的变动方向和变动程度。
这是统计指数的最重要的作用。
在社会经济现象中,大量存在着不能直接加总或不能直接对比的复杂总体,为了反映和研究它们的变动方向和变动程度,只能通过统计指数法,编制统计指数才能得到解决。
(2)分析和测定社会经济现象总体变动受各因素变动的影响。
社会经济现象总体中包含着数量因素和质量因素,通过编制数量因素指数和质量因素指数,可以分析和测定各因素变动对总体变动的影响。
(3)研究平均指标指数变动及其受水平因素和结构因素变动的影响。
平均指标中包含水平因素和结构因素,因此可以编制可变组成指数,不变组成指数和结构影响指数,研究平均指标的变动及其各因素变动对平均指标变动的影响。
5.写出最小平方法解多项式方程参数的步骤及公式。
(写出最小平方法进行一元线性回归分析的解题步骤)最小平方法又称最小二乘法,是一种数学优化技术。
它通过最小化误差的平方和寻找数据的最佳函数匹配。
利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
最小二乘法还可用于曲线拟合。
其他一些优化问题也可通过最小化能量或最大化熵用最小二乘法来表达。
1 列表 找出 年序号t 每年量 y t 2ty列出方程2y na b tty a t b t ∑=+∑∑=∑+∑ 代入得到新的二元一次方程 ,解方程得到 a 和b 的值,再代入方程 y=a+bt 6.阐述统计的四个基本特征1.数量性:研究社会经济现象的数量方面.2.总体性:研究由许多个别事物所组成的整体现象.3.具体性:研究具体的社会经济现象,统计上的数据都有其具体的质的规定.4.社会性:指人们主观意识的参与,影响调查的结果. 7.什么是中位数,什么情况下使用中位数描述平均水平。
答:是处于统计数列中间位置的数值。
由于其位置居中,不受极端数值大小的影响,因而有时利用它来代表现象的一般水平。
在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。
在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响;如果研究目的就是为了反映中间水平,当然也应该用中位数。
在统计数据的处理和分析时,可结合使用中位数。
8.广义的季节指数(比率)包括哪些内容答:(狭义)由于自然条件和社会条件的影响,使现象在一年之内出现规律,每年往复出现(以年为周期往复出现),则称为季节变动。
(广义)季节变动以外还包括:以季度、月度、天为周期往复出现的准季节变动。
9.阐述影响抽样平均误差的因素及其公式 1. n 与u 的大小成反比 2.与成正比关系3.抽样方法,不重复抽样误差小,重复抽样误差大.4.抽样的组织方式不同,误差不同公式为:/x μσ=10.阐述相对指标的应用原则1、可比性原则 指对比的指标在含义、内容、范围、时间、空间和计算方法等口径方面是否协调一致,相互适应。
2、定性分析与定量分析相结合原则因为事物之间的对比分析,必须是同类型的指标,只有通过统计分组,才能确定被研究现象的同质总体,便于同类现象之间的对比分析。
这说明要在确定事物性质的基础上,再进行数量上的比较或分析,而统计分组在一定意义上也是一种统计的定性分类或分析。
即使是同一种相对指标在不同地区或不同时间进行比较时,也必须先对现象的性质进行分析,判断是否具有可比性。
同时,通过定性分析,可以确定两个指标数值的对比是否合理。
3、相对指标和总量指标结合运用原则绝大多数的相对量指标都是两个有关的总量指标数值之比,用抽象化的比值来表明事物之间对比关系的程度,而不能反映事物在绝对量方面的差别。
因此在一般情况下,相对指标离开了据以形成对比关系的总量指标,就不能深入地说明问题。
4、各种相对指标综合应用原则各种相对指标的具体作用不同,都是从不同的侧面来说明所研究的问题。
为了全面而深入地说明现象及其发展过程的规律性,应该根据统计研究的目的,综合应用各种相对指标。
三 、计算分析题1.某银行年末按定期存款单帐号的顺序每10户抽取1户进行等距抽样,有样本资料如下。
要求以95%的概率推断(t=1.96):(1) 储户定期存款额(5分) (2) 定期存款总额(5分)该题为按无关标志排队的等距抽样()5001015005030001045002605500803980500xfx f⨯+⨯+⨯+⨯+⨯===∑∑元()221559600x xfsf-=∑∑ ()/50052.98x μ=元 ()252.98105.96∆=⨯=元 P=80/500=16%(1)全体储户平均定期存款额在3874.04----4085.96万元之间 (2)全部储户的定期存款总额在3874.04×5000—4.85.96×5000之间 即在1937.02-2.42.982万元之间。
(3)2 3.11%p ∆=存款额在5000元以上的储户比重在16%-3.11%---16%+3.11%间,即12.89%---19.11%间。
2. .两企业职工工资资料如下表所示。
要求:⑴计算甲乙两企业平均工资。
(5分)3.某地区1996-2001年产品的销售资料如下。
要求:⑴用最小平方法拟合销售量与期数的直线趋势方程(8分)26,,,,21,,,,,162,,,,,91,,,,,610n t y t ty =∑=∑=∑=∑=代入2y n a b tt y a t b t∑=+∑∑=∑+∑得162= a6+21b 610= 21a+91b 解方程得 a=18.4 b=2.46直线方程为 y=a+bt y= 18.4+2.46t 2008年销售量为 y 8=18.4+2.46×8=38.084.有10个同类企业的生产性固定原值和工业总产值资料如下表。
要求计算:(1)相关系数(5分) (2)建立回归方程(10)(3)估计生产性固定资产为1100万元时的工业总产值(5) 单位:万元(1)12667185/3756.303565.340.9482r ==⨯=(2)126671850.897914109790b ==9795/100.89786525/10393.6855a y bx =-=-⨯=393.68550.8978x y∧=+ (3)112.9135r S =(4)设生产性固定资产x=1100万元时,工业总产值的估计值()393.68550.897811001381.2655y∧=+⨯=万元5.某企业2006年工业增加值及职工人数如下表,另知2006年初职工人数2010人。