《统计与计量分析》答案-190616(2)-新版.docx
- 格式:docx
- 大小:177.35 KB
- 文档页数:8
《统计学》(教育部教材)习题参考答案第一章统计概述一、填空题1.数量方面定量认识2.统计总体同质性差异性大量性3.总体单位数量标志品质标志不变标志可变标志4.总体指标名称指标数值5.总量指标相对指标平均指标数量指标质量指标静态指标动态指标二、单项选择题1.B 2.C 3.A 4.B 5.B三、多项选择题1.ABDE 2.ABC 3.ABCD 4.ABD 5.ABD四、问答题1.什么是指标?指标和标志有何区别和联系?①统计指标简称指标,是指综合反映现象总体数量特征的概念(及其数值)。
②指标与标志有两点区别:一是说明的对象范围不同,即指标是说明总体特征的,标志是说明总体单位特征的;二是具体表现的表示方式不同,即指标的具体表现都用数值表示,标志的具体表现只有数量标志用数值表示,品质标志则用文字表示。
③指标与标志有密切联系:一是标志表现是计算指标数值的基础;二是两者随研究目的不同具有转化关系。
2.指标有哪些具体分类?指标按表现形式分为总量指标、相对指标和平均指标;按性质或内容分为数量指标和质量指标;按时间状况分为静态指标和动态指标。
3.什么是指标体系?设置指标体系有何意义?指标体系是指一系列相互联系的指标组成的整体。
单项指标的局限性和社会经济现象的复杂性,决定了在统计中必须科学地设置指标体系,以便从不同角度、不同侧面来反映现象的全貌和事物间的联系。
4. 统计工作过程分哪几个阶段?如何理解统计“质—量—质”的认识过程?统计工作过程大致分为统计设计、统计调查、统计整理和统计分析四个相对独立、相互衔接的阶段。
四个阶段基本体现了统计“质—量—质”的认识过程。
统计首先要对现象进行初步的定性(质的)认识,作出统计设计;然后根据设计要求去进行量的调查和整理;最后通过统计分析,揭示现象的本质特征及其变化规律性,达到高一级的质的认识,实现统计之目的。
第二章统计调查一、填空题1.准确及时全面(系统或经济)2.调查项目3.全部工业生产设备每台工业生产设备每个工业企业4.单一表一览表表头表体表脚5.调查得到的统计数字客观现象实际数量表现登记性代表性二、单项选择题1.A 2.C 3.C 4.C 5.B三、多项选择题1.BCDE 2.BCDE 3.ABD 4.ABCDE 5.ACE四、问答题1.什么是统计调查?统计调查有哪些种类?统计调查是根据统计设计的要求,采用科学的方式和方法,有计划、有组织地向总体单位登记其有关标志表现,以获取统计研究所需要的原始资料的工作过程。
统计工作题库及答案详解统计工作是一项涉及数据收集、分析和解释的专业活动,广泛应用于经济、社会、科学研究等多个领域。
为了帮助统计学的学生和专业人士更好地掌握统计知识,以下是一些统计工作题库及答案详解。
1. 题目一:描述统计数据的类型。
答案详解:统计数据主要分为定性数据和定量数据。
定性数据反映的是事物的属性,如性别、种族等,通常用于分类。
定量数据则反映事物的数量特征,如年龄、收入等,可以进行数值运算。
2. 题目二:解释什么是中心趋势度量。
答案详解:中心趋势度量是用来描述数据集中趋势的统计量,常见的中心趋势度量包括均值、中位数和众数。
均值是所有数据值的总和除以数据的个数;中位数是将数据从小到大排序后位于中间位置的数值;众数是数据中出现次数最多的数值。
3. 题目三:什么是标准差,它在数据分析中的作用是什么?答案详解:标准差是衡量数据分布离散程度的一个统计量,它表示数据值与均值的平均偏差。
标准差越大,数据的离散程度越高;标准差越小,数据越集中。
在数据分析中,标准差常用于评估数据的稳定性和一致性。
4. 题目四:描述相关系数的概念及其类型。
答案详解:相关系数是衡量两个变量之间线性关系强度和方向的统计量。
常见的相关系数包括皮尔逊相关系数、斯皮尔曼等级相关系数和肯德尔等级相关系数。
皮尔逊相关系数适用于测量两个连续变量之间的线性关系;斯皮尔曼和肯德尔等级相关系数则适用于测量两个有序变量之间的相关性。
5. 题目五:解释什么是假设检验,以及它的基本步骤。
答案详解:假设检验是一种统计方法,用于基于样本数据对总体参数进行推断。
基本步骤包括:(1) 提出原假设和备择假设;(2) 选择适当的检验统计量和显著性水平;(3) 计算检验统计量的值;(4)根据检验统计量的值和显著性水平做出决策,接受或拒绝原假设。
6. 题目六:什么是回归分析,它在实际应用中的作用是什么?答案详解:回归分析是一种统计方法,用于研究一个或多个自变量与因变量之间的关系。
<<统计学>>课后习题参考答案第四章1. 计划完成相对指标==⨯++%100%51%81102.9% 2. 计划完成相对指标=%9.97%100%41%61=⨯-- 3.4.5.解:(1)计划完成相对指标=%56.115%1004513131214=⨯+++(2)从第四年二季度开始连续四季的产量之和为:10+11+12+14=47天完成任务。
个月零该产品总共提前天完成的天数已提前完成任务,提前该产品到第五年第一季1510459010144514121110∴=--+++=6.解:计划完成相对指标=%75.126%100%1.0102005354703252795402301564=⨯⨯⨯++++++(2)156+230+540+279+325+470=2000(万吨) 所以正好提前半年完成计划。
7.8.略第五章 平均指标与标志变异指标1.甲X =.309343332313029282726=++++++++乙X =44.319403836343230282520=++++++++ AD 甲=}22.29303430333032303130303029302830273026=-+-+-+-+-+-+-+-+-AD 乙=}06.594044.313844.313644.313444.313244.313044.312844.312544.3120=-+-+-+-+-+-+-+-+-R 甲=34-26=8 R 乙=40-20=20σ甲 =9)3334()3033()3032()3031()3030()3029()3028()3027()3026(222222222-+-+-+-+-+-+-+-+-=2.58 σ乙=9)44.3140()44.3138()44.3136()44.3134()44.3132()44.3130()44.3128()44.3125()44.3120(222222222-+-+-+-+-+-+-+-+-=6.06V 甲=1003058.2⨯%=8.6% V 乙=%3.19%10044.3106.6=⨯ 所以甲组的平均产量代表性大一些. 2.解:计算过程如下表:甲X =.)(5.101780元= 乙X =(元)9708077600= 3.解:计算过程如下表:甲X =.4.11980=(件) 乙X =8.120809660=(件) σ甲=06.98075.6568=(件) σ乙=81.10809355=(件) V 甲=1004.11906.9⨯%=7.58% V 乙=%94.8%1008.12081.10=⨯ 所以甲厂工人的平均产量的代表性要高些.4. 解:()()94.761018102457047.7610121871871870775121873595128518757653550=⨯-+==⨯-+--+==++++⨯+⨯+⨯+⨯+⨯=e M M X 5.解:(1)上期的平均计划完成程度为:()()第六章元解解度为下期的平均计划完成程tH V P X P P P P /3.2884102950943.5062900255.3212800604.43210943.506255.321604.432:.7%1.32%1009067.0291.0291.0%67.901%67.90%67.90%67.90%10030028300:.6%37.103%1031400%1011200%107810%110961400120081096:)2(%67.99%1001500100070080%951500%1001000%108700%1108044=⨯⎪⎭⎫ ⎝⎛++⨯++==⨯==-⨯====⨯-==++++++=⨯+++⨯+⨯+⨯+⨯σ1.()())(7.788%67.41500:2000%67.41500600:.6)(6.62126907106557306806702650600269071061527106556552655730620273068060026806706402670650:2)(7.62327107006907206806202680610271070062527006906452690720640272068062026806206002620680:)1(:.5%63.79%10026206005802580257646245002435:.4%85.105%100%113385%102350%97463%120485%105412%112410%98368%106350%105310%110324%102306%101303385350463485412410368350310324306303::.3872232122221030980329809002290010201210208402284067022670600.2104万吨年该县粮食产量为平均增长速度解元工人的月平均工资为乙工区上半年建筑安装元工人的月平均工资为甲工区上半年建筑安装解解度为全年月平均计划完成程解=+⨯=-==++++++⨯++⨯++⨯++⨯++⨯++⨯+=++++++⨯++⨯++⨯++⨯++⨯++⨯+=⨯++++++==⨯++++++++++++++++++++++=+++++⨯++⨯++⨯++⨯++⨯++⨯+=C a 7解:计算过程如下表:)(94.6653.444.45:1994:3.46025844.4594092万元年的地方财政支出额为则直线趋势方程为=⨯++=======∑∑∑bta y t tyb ny a二次曲线方程为:y = 0.0108x 2 + 4.1918x + 24.143(过程略) 指数曲线方程为:y = 26.996e 0.0978x8.解:计算过程如下表:9.解:(1)同季平均法求季节比率的过程如下表:(2)趋势剔除法测定的季节变动如下表:第七章 统计指数()()()()01001011111175000124000081138.44%5000012350008750002540000182138.03%500002535000181075000940000390.98%127500084000022750002540000425qqzpk q z q zq p q p q z kq z p q k p q⨯+⨯===⨯+⨯⨯+⨯===⨯+⨯⨯+⨯===⨯+⨯⨯+⨯==∑∑∑∑∑∑∑∑111111110102.12%75000184000015602.108.8%1200360110%105%pp q p q k p q p q p p=⨯+⨯====+∑∑∑∑11111560.135.65%1150135.65%124.68%108.8%.120%1800115%90096%6003.114.27%330042003300111.38%114.27%.pqpq qpqpq p qp q k p qk k k q q p q p q k q p q pkk k======⨯+⨯+⨯=======∑∑∑∑∑∑ 110101001013200005.100%128%250000128%123.1%14%320000307692.3104%307692.325000057692.3320000307692.312307.pq pqq PpK K K p qp q K p q p qq p q =⨯====+===-=-=-=-=∑∑∑∑∑∑1解:K 零售量变动对零售额变动影响的绝对值为:(万元)零售物价变动对零售总额变动影响的绝对值为:p 1110010000107350000120%120%180000110%110%116%116%17.6%107.6%350000291666.67120%180000163636.36.110%1pq pq q q pq pq q q K q K q p q Kq p q K p q p q ==+===+==+==+========⨯=∑∑∑∑∑∑∑∑城1城农城农1农1城城城1农农农城城城(万元)6.解:已知p ,,p ,,K ,K p 则p K 0010111101001116%291666.67338333.33107.6%163636.36176072.72350000180000103.03%338333.33176072.723%q pp q p q p q q q k p q p q p q ⨯==⨯=⨯=++====++∴∑∑∑∑∑∑∑∑农农农11城农城农K p p 该地区城乡价格上涨了。
《统计学》试题库答案在最后面,答案仅供参考知识点一:统计基本理论和基本概念一、填空题1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和理论概括。
2、统计研究的具体方法主要有、、和。
3、统计工作可划分为、、和四个阶段。
4、随着的改变,总体和是可以相互转化的。
5、标志是说明,指标是说明。
6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。
7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可分为确定性变量和随机变量。
8、社会经济统计具有、、、等特点。
9、一个完整的统计指标应包括和两个基本部分。
10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为和。
11、说明特征的名称叫标志,说明特征的名称叫指标。
12、数量指标用表示,质量指标用或平均数表示。
13、在统计中,把可变的和统称为变量。
14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者变动方向相同。
二、是非题1、统计学和统计工作的研究对象是完全一致的。
2、运用大量观察法,必须对研究对象的所有单位进行观察调查。
3、统计学是对统计实践活动的经验总结和理论概括。
4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。
5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。
6、某同学计算机考试成绩80分,这是统计指标值。
7、统计资料就是统计调查中获得的各种数据。
8、指标都是用数值表示的,而标志则不能用数值表示。
9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。
10、总体和总体单位可能随着研究目的的变化而相互转化。
11、女性是品质标志。
12、以绝对数形式表示的指标都是数量指标,以相对数或平均数表示的指标都是质量指标。
13、构成统计总体的条件是各单位的差异性。
14、变异是指各种标志或各种指标之间的名称的差异。
三、单项选择题1、统计认识过程是()A、从质到量B、从量到质C、从质到量,再到质和量的结合D、从总体到个体2、某班5名同学的某门课的成绩分别为60、70、75、80、85,这5个数是()A、指标B、标志C、变量D、变量值3、调查某市职工家庭的生活状况时,统计总体是()A、该市全部职工家庭B、该市每个职工家庭C、该市全部职工D、该市职工家庭户数4、调查某班50名学生的学习情况,则总体单位是()A、该班50名学生B、该班每一名学生C、该班50名学生的学习情况D、该班每一名学生的学习情况5、构成统计总体的基础和前提是()A、综合性B、同质性C、大量性D、变异性6、统计学研究对象的最基本特征是()A、总体性B、数量性C、具体性D、社会性7、某企业职工张三的月工资额为500元,则“工资”是()A、品质标志B、数量标志C、数量指标D、质量指标8、象“性别”、“年龄”这样的概念,可能用来()A、表示总体特征B、表示个体特征C、作为标志使用D、作为指标使用9、调查某校学生的学习、生活情况,学生“一天中用于学习的时间”是()A、标志B、指标C、变异D、变量10、一个统计总体()A、只能有一个标志B、只能有一个指标C、可以有多个标志D、可以有多个指标11、统计对总体数量的认识是()A、从总体到单位B、从单位到总体C、从定量到定性D、以上都对A、品质标志B、数量标志C、数量标志和指标D、质量指标13、研究某企业职工文化程度时,职工总人数是()A、数量标志B、数量指标C、变量D、质量指标14、某银行的某年末的储蓄存款余额()A、一定是统计指标B、一定是数量标志C、可能是统计指标,也可能是数量标志D、既不是统计指标,也不是数量标志15、年龄是()A、变量值B、离散型变量C、连续型变量D、连续型变量,但在应用中常作为离散型变量处理四、多项选择题1、全国第四次人口普查中()A、全国人口数是统计总体B、总体单位是每一个人C、全部男性人口数是统计指标D、男女性别比是总体的品质标志E、人的年龄是变量2、统计总体的特征表现为()A、大量性B、数量性C、同质性D、差异性E、客观性3、下列指标中属于质量指标的有()A、劳动生产率B、产品合格率C、人口密度D、产品单位成本E、经济增长速度4、下列指标中属于数量指标的有()A、国民生产总值B、国内生产总值C、固定资产净值D、劳动生产率E、平均工资5、下列标志中属于数量标志的有()A、性别B、出勤人数C、产品等级D、产品产量E、文化程度6、下列标志中属于品质标志的有()A、人口性别B、工资级别C、考试分数D、商品使用寿命E、企业所有制性质7、下列变量中属于离散型变量的有()A、粮食产量B、人口年龄C、职工工资D、人体身高E、设备台数8、研究某企业职工的工资水平,“工资”对于各个职工而言是()A、标志B、数量标志C、指标D、数量指标E、变量A、是连续不断的B、是以整数断开的C、用测量或计算方法取得D、相邻两值之间可取无限数值E、相邻两值之间不可能有小数10、总体、总体单位、标志、指标间的相互关系表现为:()A、没有总体单位就没有总体,总体单位不能离开总体而存在B、总体单位是标志的承担者C、统计指标的数值来源于标志D、指标是说明总体特征的,标志是说明总体单位特征的E、指标和标志都能用数值表示。
各章思考与练习参考答案第一章导论(一)单项选择题1.D 2.C 3.B 4.D 5.D 6.D 7.B 8.A 9.B 10.A (二)多项选择题:1.ABCD 2.CD 3.AD 4.BCDE 5.ABDE(三)判断题:1.×2.×3.×4.√5.×(四)简答题:答案略(五)综合题答案略第二章统计调查(一)单项选择题:1.C 2.C 3.B 4.C 5.C 6.A 7.B 8.C 9.C 10.B (二)多项选择题:1.ACD 2.ABC 3.ABCD 4.ABC 5.ACD6.ABCD 7.ABDE 8.BCE 9.ABE 10.CD(三)判断题:1.×2.×3.×4.√5.×(四)名词解释:答案略㈤(五)简答题:答案略第三章统计整理(一)单项选择题:1.C 2.B 3.C 4.B 5.B 6.A 7.B 8.C 9.B 10.B (二)多项选择题:1.AB 2.BD 3.ACD 4.AD 5.BCD6.BD 7.ABC 8.AC 9.ABC 10.CD(三)判断题:1.×2.√3.×4.×5.×(四)名词解释:答案略(五)简答题:答案略(六)计算题:1.解:2可见,组距1000元的分布数列,更为合理。
(2)对选中的分布数列,计算频率、较小制累计次数、较大制累计次数、组中值:(3)略第四章总量指标与相对指标(一)单项选择题:1.C 2.B 3.A 4.B 5.C 6.B 7.B 8.C 9.B 10.D(二)多项选择题:1.ABCD 2.CE 3.ABCDE 4.BCE 5.ABCD(三)判断题:1.X 2.X 3.X 4.√5.X(四)名词解释:答案略(五)简答题:答案略(六)计算题:1.解:该企业集团实现利润比去年增长百分比 =110%/(1+7%)-1=2.80%2.解:(1)2011年的进出口贸易差额=12178-9559=2619(亿元)(顺差)2011年进出口总额的发展速度=21737/17607×100%=123.46%(2)2011年进出口额比例相对数=9559/12178×100%=78.49%2011年出口额结构相对数=12178/21737×100%=56.02%(3)该地区进出口贸易发展速度较快,出现贸易顺差。
统计学课后习题及答案统计学课后习题及答案统计学是一门研究数据收集、分析和解释的学科,它在各个领域都有广泛的应用。
作为学习统计学的学生,课后习题是巩固知识、提高技能的重要途径。
本文将提供一些统计学课后习题及其答案,希望对学习者有所帮助。
1. 描述性统计习题:给定以下一组数据:10, 15, 12, 18, 20, 22, 16, 10, 14, 19。
请计算该组数据的均值、中位数和众数,并解释它们的含义。
答案:均值:计算方法是将所有数据相加,然后除以数据的个数。
对于给定的数据,均值为(10+15+12+18+20+22+16+10+14+19)/10 = 16.6。
中位数:将数据按照从小到大的顺序排列,找出中间的数。
对于给定的数据,中位数为16。
众数:出现频率最高的数。
对于给定的数据,众数为10。
这些统计量可以帮助我们了解数据的集中趋势。
均值是所有数据的平均值,中位数是数据的中间值,众数是出现频率最高的值。
在这个例子中,均值告诉我们这组数据的平均水平是16.6,中位数告诉我们大约一半的数据小于16,一半的数据大于16,众数告诉我们10是这组数据中出现次数最多的数。
2. 概率习题:一个骰子有6个面,每个面上的数字分别是1、2、3、4、5、6。
如果投掷一次骰子,求得到奇数的概率。
答案:奇数的个数为3个,即1、3、5。
骰子的总个数为6个。
所以得到奇数的概率为3/6 = 1/2。
概率是事件发生的可能性。
在这个例子中,奇数的个数是3个,总个数是6个,所以得到奇数的概率是3/6,即1/2。
3. 抽样与估计习题:某市有1000名居民,你希望了解他们对某项政策的态度。
你打算进行一次调查,抽取100名居民进行问卷调查。
这个调查结果能否代表整个市民的态度?为什么?答案:这个调查结果不能代表整个市民的态度。
原因是抽样的方式可能引入抽样误差。
如果抽取的100名居民在某些特征上不具有代表性,比如年龄、性别、职业等,那么调查结果可能会偏离整个市民的态度。
统计学课后答案(总23页)--本页仅作为文档封面,使用时请直接删除即可----内页可以根据需求调整合适字体及大小--第一章1.举出你所知道的统计应用的例子。
答:期末考试后统计班里同学的成绩,从而进行排名等;人口普查统计,从而得知男女人口比例,年龄分布等;统计一个生态系统里某种物种的密度;统计股票市场上某一天的各种数据;统计某个城市的人均收入水平,人民幸福指数,对某一电视节目的看法等。
2. 解释定性数据和定量数据的区别,分别给出一个定性数据和一个定量数据的例子。
答:定性数据和定量数据的区别:定性数据是由于我们考虑的是取值为类别的变量,对这些类别用数字来分别代表就得到定性数据;定量数据是我们所考虑的变量的取值为数值,它将在某个区间上连续取值,或在某个区间上取离散的值。
定性数据的例子:例如考察某幼儿园10个人的性别,定义1=男,2=女,则所得到定性数据为:1,1,2,2,2,1,2,1,1,1.定量数据的例子:考察某幼儿园10个人的身高,则此变量取值区间为(0,200)(单位:cm)3. 解释样本和总体的区别。
答:总体是根据一定目的和要求所确定的研究事物的全体。
为了了解总体的分布,我们从总体中随机地抽取一些个体,称这些个体的全体为样本。
样本和总体的区别在于总体是要考虑对象的全体,而样本是从总体中抽取出的一部分具有代表性的个体,从而通过对样本的研究得出关于总体的一些结论。
4. 解释离散型变量和连续型变量的区别,并各举一例。
离散型变量是指其数值只能用自然数或整数单位计算。
例如:某企业里职工的人数连续型变量是如果所考虑变量可以在某个区间内取任一实数,即变量的取值可以是连续的。
例如:生产零件的规格尺寸。
5.阐述四种主要的收集数据方法的区别。
答:观测,访问,问卷,实验区别:观测数据的研究者尽量不干涉研究对象的行为模式;访问在一定程度上对被访问者心理造成干扰,则收集到的数据会有误差;问卷常会产生未响应误差;实验时需要其控制它变量的影响。
统计与大数据分析基础知识单选题100道及答案解析1. 以下哪种数据类型不属于数值型数据?()A. 整数B. 浮点数C. 字符串D. 双精度数答案:C解析:字符串属于字符型数据,不是数值型数据。
2. 数据的集中趋势测度中,不受极端值影响的是()A. 均值B. 中位数C. 众数D. 以上都不对答案:C解析:众数是出现频率最高的数据值,不受极端值影响。
3. 一组数据的方差越大,说明()A. 数据的波动越大B. 数据的波动越小C. 数据的均值越大D. 数据的均值越小答案:A解析:方差越大,数据的离散程度越大,波动越大。
4. 在抽样调查中,抽样误差()A. 不可避免但可控制B. 可以避免C. 不受样本量影响D. 与样本量无关答案:A解析:抽样误差是不可避免的,但可以通过合理的抽样设计和增大样本量来控制。
5. 以下哪个指标用于衡量两个变量之间的线性关系强度?()A. 方差B. 协方差C. 相关系数D. 标准差答案:C解析:相关系数用于衡量两个变量之间的线性关系强度。
6. 对于正态分布,均值和中位数的关系是()A. 均值大于中位数B. 均值小于中位数C. 均值等于中位数D. 不确定答案:C解析:正态分布是对称分布,均值等于中位数。
7. 在假设检验中,如果p 值小于显著性水平,则()A. 拒绝原假设B. 接受原假设C. 无法确定D. 以上都不对答案:A解析:p 值小于显著性水平时,拒绝原假设。
8. 大数据的特点不包括()A. 数据量大B. 数据类型多样C. 处理速度慢D. 价值密度低答案:C解析:大数据处理速度要求快,而不是慢。
9. 以下哪种数据挖掘算法用于分类问题?()A. 聚类分析B. 决策树C. 关联规则挖掘D. 以上都不是答案:B解析:决策树常用于分类问题。
10. 箱线图中,箱子的长度表示()A. 数据的四分位距B. 数据的极差C. 数据的标准差D. 数据的均值答案:A解析:箱线图中箱子的长度表示四分位距。
1.统计学历史上产生过哪些学术流派?它们的学术特点是什么?2.统计一词有哪几种涵义?3.统计学研究对象的特点是什么?4.统计学的基本方法是什么?5.什么是统计总体和总体单位,它们的关系如何?6.什么是统计标志和统计指标,它们的关系如何?7.什么是变量和变量值?什么是连续变量、离散变量?8.统计工作包括哪些阶段?9.我国统计工作的任务是什么?参考答案略,详见教材。
1.统计调查在统计工作中具有什么地位?2.统计调查方式有哪些分类?都是按什么标志区分的?都分为几种?3.什么是统计报表?有何特点和作用?4.什么是普查?与统计报表有何区别?5.在普查时应遵循什么原则?6.什么是重点单位?如何确定?7.什么是典型调查?典型单位如何确定?8.什么是抽样调查?有何特点?在什么情况下使用?有哪些调查方法?9.在问卷法中,“自记式”和"他记式”是根据什么区分的?10.什么是调查误差?其种类有哪些?11.为什么要设计调查方案?调查方案包括哪些内容?12.什么是统计调查?为什么要进行统计调查?13.统计调查有哪些种类和方法?各有什么特点和作用?14.一个周密的统计调查方案应包括哪几个方面的内容?15.怎样理解调查目的与调查对象、调查单位及调查项目之间的关系?16.调查单位与填报单位有何区别和联系?17.简述经常性调查与一次性调查有何区别?18.什么是统计报表?统计报表有哪几种?19.什么是企业原始记录?它有什么特点和作用?20.什么是统计台帐?统计台帐有什么作用?统计台帐有哪几种?21.在典型调查中如何选择典型单位?22.在重点调查中怎样选择重点单位?23.简述重点调查、典型调查、抽样调查的异同。
24.什么是统计资料整理?统计整理工作一般要经过哪些步骤?25.统计资料汇总的组织形式有哪几种?统计资料汇总有哪些方法?26.统计分组有何作用?如何正确选择分组标志?确定组距数列组距的依据是什么?27.什么是变量数列?它有哪几种?什么情况下可以编制单项式数列?什么情况下应编制组距式数列?28.在编制组距数列时,如何确定组数、组距、组限和组中值?29.统计表从内容和形式上由哪些部分组成?从对总体分组情况看,统计表有哪几种?各有什么作用?30.兹有某超市有40名职工,月工资表的原始资料如下(单位:元)1752 1775 1780 1792 1782 1788 1796 1770 1790 17691794 1783 1764 1767 1788 1761 1763 1778 1781 17831785 1775 1781 1773 1797 1770 1809 1785 1788 17951798 1778 1798 1805 1776 1758 1800 1789 1764 1808试根据上述资料编制组距数列(1750元~1760元为第一组)和次数分配表,计算出人数、累计次数及频率,并做简要分析。
思考题与练习题参考答案【友情提示】请各位同学完成思考题和练习题后再对照参考答案。
回答正确,值得肯定;回答错误,请找出原因更正,这样使用参考答案,能力会越来越高,智慧会越来越多。
学而不思则罔,如果直接抄答案,对学习无益,危害甚大。
想抄答案者,请三思而后行!第一章绪论思考题参考答案1.不能,英军所有战机=英军被击毁的战机+英军返航的战机+英军没有弹孔的战机,因为英军被击毁的战机有的掉入海里、敌军占领区,或因堕毁而无形等,不能找回;没有弹孔的战机也不可能自己拿来射击后进行弹孔位置的调查。
即便被击毁的战机找回或没有弹孔的战机自己拿来射击进行实验,也不能从多个弹孔中确认那个弹孔是危险的。
2.问题:飞机上什么区域应该加强钢板?瓦尔德解决问题的思想:在他的飞机模型上逐个不重不漏地标示返航军机受敌军创伤的弹孔位置,找出几乎布满弹孔的区域;发现:没有弹孔区域是军机的危险区域。
3.能,拯救和发展自己的参考路径为:①找出自己的优点,②明确自己大学阶段的最佳目标,③拟出一个发扬自己优点,实现自己大学阶段最佳目标的可行计划。
练习题参考答案一、填空题1.调查。
2.探索、调查、发现。
3. 目的。
二、简答题1.瓦尔德;把剩下少数几个没有弹孔的区域加强钢板。
2.统计学解决实际问题的基本思路,即基本步骤是:①提出与统计有关的实际问题;②建立有效的指标体系;③收集数据;④选用或创造有效的统计方法整理、显示所收集数据的特征;⑤根据所收集数据的特征、结合定性、定量的知识作出合理推断;⑥根据合理推断给出更好决策的建议。
不解决问题时,重复第②-⑥步。
3.在结合实质性学科的过程中,统计学是能发现客观世界规律,更好决策,改变世界和培养相应领域领袖的一门学科。
三、案例分析题1.总体:我班所有学生;单位:我班每个学生;样本:我班部分学生;品质标志:姓名;数量标志:每个学生课程的成绩;指标:全班学生课程的平均成绩;指标体系:上学期全班同学学习的科目;统计量:我班部分同学课程的平均成绩;定性数据:姓名;定量数据:课程成绩;离散型变量:学习课程数;连续性变量:学生的学习时间;确定性变量:全班学生课程的平均成绩;随机变量:我班部分同学课程的平均成绩,每个同学进入教室的时间;横截面数据:我班学生月门课程的出勤率;时间序列数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;面板数据:我班学生课程分别在第一个月、第二个月、第三个月、第四个月的出勤率;选用描述统计。
《统计与计量分析》试题库一、简答题1.获得数据的概率抽样方法有哪些?(1)简单随机抽样简单随机抽样又称纯随机抽样,是指在特定总体的所有单位中直接抽取n个组成样本。
它最直观地体现了抽样的基本原理,是最基本的概率抽样。
(2)系统抽样系统抽样也称等距抽样或机械抽样,是按一定的间隔距离抽取样本的方法。
(3)分层抽样分层抽样也叫分类抽样,就是先将总体的所有单位依照一种或几种特征分为若干个子总体,每一个子总体即为一类,然后从每一类中按简单随机抽样或系统随机抽样的办法抽取一个子样本,称为分类样本,它们的集合即为总体样本。
(4)整群抽样整群抽样又称聚类抽样或集体抽样,是将总体按照某种标准划分为一些群体,每一个群体为一个抽样单位,再用随机的方法从这些群体中抽取若干群体,并将所抽出群体中的所有个体集合为总体的样本。
(5)多阶段抽样多阶段抽样又称多级抽样或分段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。
2.请说明平均数、中位数和众数的特点及应用场合。
平均数是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值。
它易受极端值影响,数学性质优良。
主要适用于数值型数据,而不适用于分类数据和顺序数据。
数据对称分布或接近对称分布时应用。
中位数是一组数据排序后处于中间位置上的变量值,不受极端值影响。
它将全部数据等分成两部分,一部分数据比中位数大,一部分比中位数小。
主要用于测度顺序数据的集中趋势,当然也适用于数值型数据,但不适用于分类数据。
数据分布偏斜程度较大时应用。
众数是一组数据中出现次数最多的变量值。
它不受极端值影响,具有不唯一性。
众数主要用于分类数据的集中趋势,当然也适用顺序数据和数值型数据。
数据分布偏斜程度较大时应用。
3.请解释中心极限定理的含义。
中心极限定理是研究独立随机变量和的极限分布为正态分布的问题。
它是概率论中最重要的一类定理,有广泛的实际应用背景。
中心极限定理是概率论中讨论随机变量序列部分和分布渐近于正态分布的一类定理。
这组定理是数理统计学和误差分析的理论基础,指出了大量随机变量积累分布函数逐点收敛到正态分布的积累分布函数的条件。
4.请解释置信水平的含义。
置信水平是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。
一般用1-α表示。
概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。
置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。
置信区间越大,置信水平越高。
5.第I类错误和第II类错误分别是指什么?它们发生的概率的大小之间存在怎样的关系?当原假设为真时拒绝原假设,所犯的错误称为第Ⅰ类错误,又称为弃真错误,犯第Ⅰ类错误的概率通常记为a。
当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误,又称为取伪错误,犯第Ⅱ类错误的概率通常记为b。
两者发生的概率的关系:当a增大时,b减小;当b增大时,a减小。
6.什么是P值?利用P值进行检验与利用统计量进行检验有什么不同?P值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。
P值常常作为观察到的数据与原假设不一致程度的度量。
统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,P值可以有效地补充α提供的关于检验可靠性的有限信息。
P值检验的有点在于,它提供了更过的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。
7.请说明内生变量与外生变量的区别。
内生变量是具有某种概率分布的随机变量,其数值是在所研究的经济系统的模型内决定的,其参数是联立方程模型估计的元素。
内生变量是由模型系统决定的,同时也对模型系统产生影响。
内生变量一般为经济变量。
外生变量一般是确定性变量,或是具有临界概率分布的随机变量,其数值是在所研究的经济系统的模型之外决定的,其参数不是模型系统研究的元素。
外生变量影响系统但不受系统影响。
外生变量一般是经济变量,条件变量,政策变量,虚变量。
8.我国1998年至2016年的季度通货膨胀率数据属于什么数据(时间序列,面板数据,还是截面数据)?时间序列数据是指对一个或几个变量跨期观察得到的数据。
也就是按固定的时间间隔观察某个对象的属性或变量的取值。
面板数据也称纵列数据,是对若干固定对象的属性或变量值追踪观察而得到的数据,跟踪观察一般是按固定时间间隔的跨期观察。
截面数据是指一个变量或多个变量再某个时点的数据集。
也就是说在同一个时间点观察多个对象的某个属性或变量取值。
我国1998年至2016年的季度通货膨胀率数据属于时间序列数据。
9.在回归模型中,对变量取对数的好处是什么?好处有很多,其中包括:1.减弱模型中数据的异方差性,只能是减弱,并不能彻底消除。
2.模型形式的需要,利用线性回归模型的前提是解释变量和被解释变量之间的现行关系,但是在实际中这一点很难满足,很多的时候需要对多个变量或者是单一变量做对数变换,让模型的形式变为线性。
3.取对数,再配合差分变化,把绝对数变成相对数,这样,数据更能表示变动的相关性。
4.有时候变量不符合正态分布的假定,取了对数可以渐近正态分布。
10. 请说明回归模型做预测和因果关系分析时基本假设的异同。
(未找到确定答案)二计算题1.某大学的商学院为了了解毕业生的就业去向,分别从会计专业抽取50人、从市场营销专业抽取30人、从企业管理专业抽取20人进行调查。
(1)这种抽样方式是分层抽样、系统抽样还是整群抽样?(2)样本量是多少?(1)分层抽样(2)样本量=50+30+20=1002.一家公司在招收职员时,首先要通过两项能力测试。
在A项测试中,其平均分数是100分,标准差是15分;在B项测试中,其平均分数是400分,标准差是50分。
一位应试者在A项测试中得了115分,在B项测试中得了425分。
与平均分数相比,该位应试者哪一项测试更为理想?A:(115-100)/15=1,因此A项测试高于平均分1个标准差B:(425-400)/50=0.5,因此B项测试高于平均分半个标准差,A项测试更理想3.从均值为200、标准差为50的总体中,抽取n=100的简单随机样本,用样本均值x̅估计总体均值。
(1)x̅的期望值是多少?(2)x̅的标准差是多少?(3)x̅的概率分布是什么?(1) E(样本均值)=E(总体均值)=200,因此,x̅的期望值是200(2)σ=50,x̅的方差为σ2n =25,标准差为√σ2n=5(3)x̅的概率分布是正态分布4.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。
(a) 假定总体的标准差为15元,求样本均值的标准误差。
(b) 在95%的置信水平下,求估计误差。
(c) 如果样本均值为120元,求总体均值μ的置信区间。
(a)总体标准差σ=15,样本均值的标准差为σ√n =157=2.143(b)置信水平1−α=0.95,Zα2=1.96,估计误差∆x=1.96*2.143=4.2(c)置信区间为(x-∆x,x+∆x)=(115.8,124.2)5.某超市想要估计每个顾客平均每次购物花费的金额。
根据过去的经验,标准差大约为120元,现要求以95%的置信水平估计每个顾客平均购物金额的置信区间,并要求估计误差不超过20元,应抽取多少个顾客作为样本?已知总体标准差σ=120,由置信水平1−α=0.95,Zα2=1.96,允许误差E≤20,由允许误差公式E=Zα2∗σ√n,n=(σ∗Zα2E)2≥(1.96∗12020)2=138.2976,为保证使“≥”成立,至少应取139个顾客作为样本。
6.对消费者的一项调查表明,17%的人早餐饮料是牛奶。
某城市的牛奶生产商认为,该城市的人早餐饮用牛奶的比例更高。
为了验证这一说法,生产商随机抽取550人的一个随机样本,其中115人早餐饮用牛奶。
在α=0.05显著性水平下,检验该生产商的说法是否属实。
=1.961-α=0.95;Zα/2H:π≦17%,H1:π>17%,Z=2.25 ;P=0.0121,拒绝,该生产商的说法属实。
H07.在模型Y i=β0+β1X1+β2X2+β3(X1×X2)+u i中,X1对Y的边际效应为多少?8.如何解释模型Y i=β0+β1ln X1+u i中斜率系数β1?9. 以下哪个问题不能通过Probit 回归模型进行估计:(a) 哪些学生会选择出国留学(b) 蓝领工人的工资是否存在性别差异(c) 家庭收入是否会影响其生二胎的决定(d) 消费者是否选择使用移动支付可能受到哪些因素的影响b,d10.假如你想研究广州连续两年天气之间的关系。
你把2016年的任意100天的温度数据作为因变量,把与之相对应的2015年的温度数据作为解释变量(例如,如果因变量为2016年1月11日的广州温度,则解释变量为2015年1月11日的广州温度),进行最小二乘回归。
结果如下:2016年广州温度̂=5.00 + 0.80×2015年广州温度̂,R 2=0.65,SER =9.63(0.80) (0.10)(a) 根据以上回归方程,当2015年广州的温度分别为10,25,40摄氏度时,你预测的2016年相应日期的广州的温度各为多少摄氏度?(b)说明上述结果是否与你的预期相同。