社会统计学期末复习题与答案整理
- 格式:doc
- 大小:405.82 KB
- 文档页数:25
社会统计学试题及答案一、单项选择题(每题2分,共20分)1. 社会统计学中,用来描述一组数据集中趋势的指标是()。
A. 众数B. 中位数C. 均值D. 方差答案:C2. 以下哪个选项不属于描述统计学的内容?()A. 数据收集B. 数据整理C. 数据分析D. 数据预测答案:D3. 在统计学中,用来衡量数据离散程度的指标是()。
A. 标准差B. 均值C. 众数D. 中位数答案:A4. 以下哪个概念不是社会统计学的研究对象?()A. 人口数量B. 收入水平C. 股票价格D. 家庭结构答案:C5. 社会统计学中,用来衡量两个变量之间相关关系的强度的指标是()。
A. 相关系数B. 回归系数C. 标准差D. 方差答案:A6. 以下哪个选项不是社会统计学中常用的数据收集方法?()A. 问卷调查B. 观察法C. 实验法D. 文献分析答案:C7. 在统计学中,用来衡量数据集中程度的指标是()。
A. 标准差B. 均值C. 众数D. 中位数答案:B8. 以下哪个选项是社会统计学中常用的数据整理方法?()A. 频数分布表B. 回归分析C. 假设检验D. 相关分析答案:A9. 社会统计学中,用来描述一组数据分布形态的指标是()。
A. 偏度B. 峰度C. 均值D. 方差答案:A10. 以下哪个概念是社会统计学中用来描述数据的离散程度的?()A. 标准差B. 均值C. 众数D. 中位数答案:A二、多项选择题(每题3分,共15分)1. 社会统计学中,用来描述一组数据的指标包括()。
A. 均值B. 众数C. 方差D. 标准差E. 中位数答案:ABDE2. 以下哪些是社会统计学中常用的数据分析方法?()A. 描述性分析B. 推断性分析C. 回归分析D. 假设检验E. 相关分析答案:ABCDE3. 社会统计学中,用来衡量数据离散程度的指标包括()。
A. 标准差B. 方差C. 偏度D. 峰度E. 极差答案:ABE4. 以下哪些是社会统计学中常用的数据收集方法?()A. 问卷调查B. 观察法C. 实验法D. 文献分析E. 访谈法答案:ABDE5. 社会统计学中,用来描述一组数据分布形态的指标包括()。
统计学期末综合测试一、单项选择题 (每小题 1 分,共 20分) 1、社会经济统计的数量特点表现在它是( )。
A 一种纯数量的研究B 从事物量的研究开始来认识事物的质C 从定性认识开始以定量认识为最终目的D 在质与量的联系中,观察并研究社会经济现象的数量方面2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应 是( )。
A q 0p 0Bq 1p 1Cq 1p 0Dq 0p 13、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。
A 均值 B 中位数 C 众数 D 四分位数4、某年末某地区城市人均居住面积为 20 平方米,标准差为 8.4 平方米,乡村人均居住面积 为 30 平方米,标准差为 11.6 平方米,则该地区城市和乡村居民居住面积的离散程度( )A 乡村较大B 城市较大C 城市和乡村一样D 不能比较5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年 1 月超额完成计划3%,2 月刚好完成计划, 3 月超额完成 12%,则该厂该年一季度超额完成计划( )。
A 3% B 4% C 5% D 无法计算6、基期甲、乙两组工人的平均日产量分别为 70 件和 50 件,若报告期两组工人的平均日产量 不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。
A 上升B 下降C 不变D 可能上升也可能下降7、同一数量货币,报告期只能购买基期商品量的 90%,是因为物价( )。
A 上涨 10.0% B 上涨 11.1% C 下跌 11.1% D 下跌 10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )A 环比发展速度B 年距发展速度C 定基发展速度D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )A 简单随机抽样的误差公式BC 等距抽样的误差公式 D10、我国统计调查方法体系改革的目标模式是以( A 抽样调查 B 普查 C11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为 100的样本,则可采用( )。
12231 3.322log 4×6i i i i i i i i i i i i u l u l u l u ll Rh N h R N AA B =-+-==+=+=====+第三章、组距 h (上限 下限)2、组中值 m 或 m 、斯特奇斯公式 (:组距 :全距 :总体单位)频数频率、频数密度 频率密度组距组距标准组距5、折合系数实际组距标准组距频数实际频数折合系数、基尼系数 G 111111n n i i i ii i PI P I --++===-∑∑ 或 G(i i P 是横轴上的累积百分数;I 是纵轴上的累计百分数)洛仑兹曲线P iI iAB1(2))(1)1221222d d X X X N fXX fN NN NN F L ==++-=+∑∑∑第四章1、算术平均数()()未分组资料 分组资料 注:对于单项数列分组,X即为变量值,若为组距式分组,则X为组中值 f:各组频数2、中位数(M 未分组资料 若N为奇数,则取第位上的变量值为中位数,若为偶数,则取第 位和第位上的两个变量值的平均数作为中位数()分组资料 M 112h h L : 2m m d m m m m m N F U f f f F F N---⨯=-⨯或 M 中位数所在组的下限: 中位数所在组的频数: 小于中位数所在组的各组频数之和(向上累计) h : 中位数所在组的组距 U: 中位数所在组的上限: 包括中位数所在组的各组频数之和(向上累计) 注: 中位数所在组由确定11111111133333334h :h 34h :N F l f F l f NF l f F l -=+⨯-=+⨯3、四分位数(1)第一四分位数 Q :小于第一四分位数所在组的各组累计频数(向上累计) 第一四分位数所在组的下限 :第一四分位数所在组的组距 :第一四分位数所在组的组距(2)第三四分位数 Q :小于第三四分位数所在组的各组累计频数(向上累计) 第三四分位数所在组的3311212h 1h :h 5o o o oo o f L L ∆=+⨯∆+∆∆∆下限 :第三四分位数所在组的组距 :第三四分位数所在组的组距4、众数(M )()未分组资料 先将所有数据顺序排列,观察某些变量值出现的次数最多,这些变量值就 是众数(2)分组资料 M 众数所在组的下限:众数所在组频数与前一组频数之差 :众数所在组频数与后一组频数之差 :众数所在组的组距、几何平均数11lg lg anti(lg )(2)1lg lg anti(lg )g g g g g gg g g X Nf X NX ========∑∑(M )()简单几何平均数 M 或 M M M 加权几何平均数M 或 M M M 注:若为组距式分组,则为组中值3112316)(1)111111...(2):312=23h h N h d o g h N Q Q NX X X X XNNf XX f X X -==++++==-≥≥-⋅∑∑、调和平均数(M 简单调和平均数(未分组) M 加权调和平均数(分组)M 注:若为组距式分组,为组中值 各组频数7、各种平均数的关系2M M M M 第五章、全距 R=X X 、四分位差 Q D、平均差=2=::X X Nf X XfX f X f -⋅-⋅∑∑(1)未分组资料 A D ()分组资料 A D 注:若为组距式分组,为组中值 各组频数4、标准差(S)(1)未分组资料(2)分组资料 注:若为组距式分组,为组中值 各组X X S-频数5、标准分 Z=社会统计学复习整理一、变量的测量层次61(2)37=1:83(o o oR R M M M o d o R X X SXN f f NNf X M X M X M S Sαα⋅⋅=-⋅=----==A D 、变异系数()全距系数 V =A D平均差系数 V =()标准差系数 V 、异众比率(非众数的频数与总体单位数的比值) V R 众数的频数、偏态系数())偏态=二、判断变量层次的技巧1.首先所有的变量都是定类变量。
社会统计学试题及答案一、选择题1. 社会统计学是研究和分析社会现象和社会问题的科学方法。
下列哪项不是社会统计学的研究对象?A. 人口B. 社会经济C. 政治D. 音乐答案:D2. 下列哪项是进行社会统计学研究时常用的数据收集方法?A. 实地调研B. 实验研究C. 文献研究D. 理论推导答案:A3. 下列哪项不是社会统计学常用的数据分析方法?A. 描述统计B. 回归分析C. 实证研究D. 主观评价答案:D二、简答题1. 什么是抽样调查?请简要描述抽样调查的步骤。
抽样调查是根据一定的抽样原则和抽样方法,从总体中选出少部分元素进行调查的方法。
抽样调查的步骤包括:定义研究目标和调查问题、确定研究对象和总体范围、选择适当的抽样方法、制定抽样方案、实施调查、数据收集和分析、得出结论并进行推断。
2. 什么是社会统计指标?请举例说明一个社会统计指标。
社会统计指标是用于衡量和描述社会现象、问题或变量的量化指标。
例如,人口增长率是一个常用的社会统计指标,用于表示某一地区或国家人口数量在某一时期内的增长速度。
三、论述题社会统计学在社会科学研究中的应用社会统计学作为一门综合性的学科,广泛应用于社会科学研究中。
它通过收集、分析和解释社会数据,提供了量化的研究工具和方法,对社会现象和问题进行客观的测量和评估。
首先,社会统计学在人口学研究中发挥了重要作用。
通过对人口数量、结构、分布等进行统计分析,可以揭示出不同地区、不同群体的人口变化趋势和特点。
人口统计数据还为制定人口政策、规划资源分配等提供了科学的依据。
其次,社会统计学在社会经济学研究中具有重要意义。
通过对收入分布、贫富差距、就业率等指标的统计分析,可以帮助我们了解社会经济现象和问题,并为政府和决策者提供制定经济政策的依据。
此外,社会统计学在社会学、教育学、卫生学等学科中也得到了广泛的应用。
它帮助研究者揭示社会结构、社会关系、社会变迁等方面的规律,为社会科学研究提供了重要的数据支持。
《社会统计学》复习题考试题型:一、填空(1*20=20)二、单选(1*10=10)三、多选(2*5=10)四、判断(2*5=10)五、计算题(5*8=40)六、分析题(1*10=10)一、填空题1、大量观察法之所以称为统计上特有的方法,是与()的作用分不开的。
2、大数定律的一般意义是:在综合大量社会现象的数量特征时,个别单位偶然的数量差异会(),使大量社会现象的数量特征借助于()形式,接近用确定的数值显示出必然的规律性。
3、要了解有个班级学生的学习情况,则总体是(),总体单位是()。
4、凡是相邻的两个变量值之间可以连续不断分割的变量,称为()。
凡是各变量值之间是以整数断开的变量,称为()。
5、统计按其内容主要包括两个方面:描述统计和()。
6、推论统计有两个基本内容:参数估计和()。
7、通过抽样得到的用以推断总体特征的那个“部分”,在统计学上称为()。
样本中所含的单位数,在统计学上称为样本大小,也叫做()。
8、()是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。
()是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。
9、()误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。
()误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。
10、统计调查从调查范围上分,可分为()和()。
11.()误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。
12基尼系数为(),表示收入绝对不平均;基尼系数为(),表示收入绝对平均。
13、统计表通常有一定格式,统计表各部位的名称分别是()、横行标题、纵栏标题、()。
14、实际收入分配情况则由洛仑兹曲线表示,一般表现为一条下凹的弧线,下凹程度愈大,收入分配(),反之,则收入分配()。
相关:洛仑兹曲线是一种用来反映社会收入分配平均程度的累计百分数曲线。
社会统计学复习题答案社会统计学是一门应用广泛的学科,它涉及到数据的收集、处理、分析和解释,以帮助我们更好地理解社会现象。
以下是一些社会统计学的复习题及其答案,供参考:一、选择题1. 社会统计学的主要研究对象是什么?A. 个体行为B. 社会现象C. 经济活动D. 政治事件答案:B2. 以下哪个是描述性统计的主要内容?A. 推断总体参数B. 描述数据分布C. 预测未来趋势D. 建立因果关系答案:B3. 抽样调查与普查的主要区别是什么?A. 抽样调查成本高B. 普查不具有代表性C. 抽样调查结果不可靠D. 普查可以得到全面数据答案:D二、填空题4. 社会统计学中,________是用来衡量数据集中趋势的指标。
答案:均值5. 标准差是衡量数据________的指标。
答案:离散程度6. 相关系数的取值范围在________之间。
答案:-1到1三、简答题7. 简述抽样误差和非抽样误差的区别。
答案:抽样误差是指由于样本不能完美代表总体而产生的误差,它可以通过增大样本量来减少。
非抽样误差则包括测量误差、非响应误差等,这些误差与抽样方法无关,通常与数据收集和处理过程中的偏差有关。
8. 描述统计与推断统计的区别。
答案:描述统计主要关注对数据集的描述,如计算均值、中位数、方差等,它不涉及对总体的推断。
推断统计则是基于样本数据来推断总体特征,如估计总体均值、进行假设检验等。
四、计算题9. 给定一组数据:10, 12, 14, 16, 18, 20,计算其均值和标准差。
答案:均值 = (10+12+14+16+18+20)/6 = 15;标准差 =√[(Σ(xi - 均值)^2) / (n-1)] = √[(10+4+0+4+0+5)/5] ≈ 3.0310. 如果一个总体的均值为50,标准差为10,样本均值为55,样本量为100,进行单样本t检验,假设总体方差未知,计算t值。
答案:首先计算样本标准差,然后使用t检验公式:t = (样本均值 - 总体均值) / (样本标准差/ √样本量)。
社会统计学期末复习训练一、单项选择题(20=2×10)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。
此处800人是.样本2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。
这项研究的总体是 332.1户家庭的年均收入3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是 22000名学生的每月生活费用4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。
此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级6.下列变量属于数值型变量的是工资收入7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为.简单随机抽样8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。
这种调查方法属于分层抽样9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
这种调查方法属于系统抽样11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率13.在频数分布表中,频率是指各组频数与总频数之比14.在频数分布表中,比率是指不同小组的频数之比15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度27.两组数据的平均数不相等,但是标准差相等。
社会统计学复习题1.定类变量是指取值只有属性之分,没有大小程度之分。
定序变量是指除类别属性之外,还有等级次序的差别、大小之分。
定距变量是指区别它是连续型变量还是离散型变量。
定比变量是指其取值还可构成一个比率。
2.分布是指概率分布或频次分布。
在一个分布中,变量的取值应注意(1)变量取值必须完备;(2)变量取值必须互斥。
3.根据变量的不同层次,统计图的选择是不同的,定类变量选择圆瓣图和图;定序变量选择条形图;定距变量选择直方图和折线图。
4.圆瓣图是指将资料展示在一个圆平面上,通常用圆形代表现象的总体;条形图是指用长条的高度来表示资料类别的次数或百分数;直方图是指由紧挨着的长度所组成,以长条的面积来表示频次或相对频次;折线图是指用直线连接直方图中条形顶端的中点。
5.频次密度是指直方图的长条面积=频次/组距;相对频次密度是指条形的长度,即纵轴的高度。
6.累计图或累计表是指大于某个变量值的频次是多少或小于某个变量值的频次是多少。
7.左偏态是指偏态图形左边尾巴拖得较长的图形;右偏态是指。
8.反映分布集中值或集中趋势的指标有众值、中位值、均值。
众值适用于定类、定序、定距变量;中位值适用于定距、定序变量;均值适用于定距变量。
9.对于众值、中位值和均值三者的大小关系,对称图形表现为众值、中位值、均值三者位置重叠;右偏态表现为均值变化较快,中位值次之,众值不变;左偏态表现为。
10.反映分布离散趋势的指标有异众比率、极差、四分互差、方差或标准差。
适用于定类变量的有异众比率;适用于定序变量的有异众比率、极差、四分互差;适用于定距变量的有异众比率、极差、四分互差,方差或标准差。
11.当变量值较大而次数较多时,平均数接近于变量值较大的一方,当变量值较小而次数较多时,平均数靠近于变量值较小的一方。
12.某班70%的同学平均成绩为85分,另30%的同学平均成绩为70分,则全班总平均成绩为 80.5 分。
13.统计中的变量数列是以均值为中心而左右波动,所以这个指标反映了总体分布的集中趋势。
社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数)1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。
2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。
3、在回归分析中,各实际观测值y 与估计值y ˆ的离差平方和称为 剩余 变差。
4、平均增长速度= 平均发展速度 —1(或100%)。
5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。
6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。
7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。
8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为100%7%A 100%1.06%100%6%-=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为100%10%100%4.76%100%5%+=-=+B 产品产量计划超额完成程度 。
9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。
10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值);四个部分组成。
11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。
社会统计学试题及答案一、选择题(共20题,每题2分,共40分)1. 社会统计学是研究人口、劳动力、收入、社会流动等社会现象的科学方法与技术的学科,其特点是()A. 程序化B. 分析性C. 统计性D. 全面性2. 社会统计学的研究对象主要包括()A. 人口B. 社会流动C. 劳动力D. 政治制度3. 社会统计学的基本任务是()A. 描述B. 分析C. 测度D. 预测4. 以下哪个属于社会统计学的主要研究方法()A. 实地调查B. 记录观察C. 数量分析D. 实验研究5. 通过抽样调查得出的结论具有一般性和代表性,其原因是()A. 抽样调查的科学性B. 抽样调查的随机性C. 抽样调查的综合性D. 抽样调查的简便性6. 据统计数据显示,中国人口在过去30年中一直呈现()A. 增长趋势B. 下降趋势C. 波动趋势D. 停滞趋势7. 以下哪项是人口自然增长率的计算公式()A. 出生率-死亡率B. 出生率/死亡率C. 死亡率-出生率D. 死亡率/出生率8. 劳动力的组成可以分为()A. 就业人口和失业人口B. 城市居民和农村居民C. 男性和女性D. 青年和老年9. 以下哪个指标用于衡量人口流动的规模()A. 出生率B. 死亡率C. 迁入率D. 婚姻率10. 社会现象的分布状况可以通过以下哪种图表来展示()A. 折线图B. 柱状图C. 饼图D. 散点图11. 收入差距的变化趋势可以通过以下哪种图表来展示()A. 人口金字塔图B. 折线图C. 散点图D. 聚类图12. 确定样本的个数和方法属于统计调查的()A. 问题设计B. 抽样设计C. 数据处理D. 结果分析13. 使用频率分布表可以直观地了解数据的()A. 聚集趋势B. 分布形态C. 关联程度D. 变化趋势14. 社会统计学可以对社会现象进行的分析方法主要包括()A. 描述统计方法B. 推断统计方法C. 直观统计方法D. 数量统计方法15. 制约社会统计学研究的条件主要包括()A. 人力资源B. 数据资源C. 手段资源D. 空间资源16. 在社会统计学中,相关分析用来研究()A. 双变量间的关系B. 多变量间的关系C. 分组间的关系D. 数值间的关系17. 决定统计调查质量的最根本要素是()A. 问卷设计B. 抽样方法C. 数据处理D. 有效样本数18. 使用抽样调查方法可以有效地()A. 节约调查成本B. 提高调查效率C. 提高数据精度D. 具有总体可比性19. 社会统计学的研究对象经常具有()A. 多样性B. 随机性C. 普遍性D. 特殊性20. 社会统计学可以用来指导()A. 社会政策制定B. 学术研究C. 教学实践D. 创新创业二、简答题(共5题,每题10分,共50分)1. 什么是人口负增长?可能导致人口负增长的原因是什么?人口负增长指的是人口数量在一定时期内净减少的现象。
社会统计学期末复习题与答案整理普查是一种专门的调查,它是为了其中一种特定的目的而对总体中所有的个体进行的一次全面调查。
例如,我们历年进行的人口普查、工业普查、农业普查、第三产业普查、经济普查、统计基本单位普查等。
(2)抽样调查抽样调查是从总体中选取部分个体组成样本进行调查的一种方式,其目的在于根据样本的调查结果推断总体特征。
根据抽取样本的方法不同,抽样调查可以分为:概率抽样和非概率抽样。
5.普查P12普查是一种专门的调查,它是为了其中一种特定的目的而对总体中所有的个体进行的一次全面调查。
例如,我们历年进行的人口普查、工业普查、农业普查、第三产业普查、经济普查、统计基本单位普查等。
6.概率抽样P13概率抽样就是按照随机原则进行的抽样,总体中每个个体都有一定的、非零的概率入选样本,并且入选样本的概率都是已知的或可以计算的。
包括:简单随机抽样、系统抽样、分层抽样、整群抽样、多阶段抽样。
7.众数P681、众数众数是一组数据中出现频数最多的数值,用Mo表示。
例如,一个城市有多种产业,但如果以旅游业为最多,那么旅游业就是众数,这个城市也被称为旅游城市。
8.中位数P732、中位数中位数是中心趋势的一种测量,是将一组数据排序后,处于中间位置的变量值,用Me表示。
中位数处于中间位置,前后每部分均包括50%的数据,而且前面部分小于中位数、后面部分大于中位数。
例如,在职工收入水平差异比较大的单位要了解职工收入的一般水平,用职工收入分布的中位数作为收入水平的代表值要比用算术平均数更恰当,因为它排除了极端数据的影响。
9.均值P784、均值均值是集中趋势最主要的测量值,它是将全部数据进行加总然后除以数据总个数,也称为算数平均数。
均值包含一组数据中所有数值,它是先将所有数值进行加总,然后进行平均,在均值中所有数值都有所体现。
因而,我们说均值是集中趋势最主要的测量值。
10.方差与标准差P956、方差方差是各数值与均值离差平方的平均数,它是数值型数据离散趋势最主要的测量值。
2024年电大《社会统计学》期末考试试题及答案很抱歉,但我不能提供实际的考试试题和答案,尤其是在它们涉及到版权受保护的教育材料时。
不过,我可以帮您创建一份关于社会统计学概念的模拟试题和答案的文档示例。
请注意,以下内容仅用于教育和信息目的,并且不应被视为真实的考试内容或用于任何非法或未经授权的活动。
---2024年电大《社会统计学》期末考试试题及答案第一部分:选择题(每题2分,共计20分)1. 以下哪项是描述统计学的一个主要组成部分?A. 概率论B. 推断统计学C. 调查方法论D. 社会心理学答案:(A) 概率论2. 当研究者想要确定某个群体中某个特定特征的普遍性时,他们通常会使用哪种统计技术?A. 频数分布B. 标准差C. t检验D. 方差分析答案:(A) 频数分布3. 以下哪项不是解释方差分析(ANOVA)的基本假设之一?A. 数据应该满足正态性分布B. 各组之间的方差必须相等C. 观测值之间应该是独立的D. 数据应该满足同方差性答案:(D) 数据应该满足同方差性第二部分:简答题(每题10分,共计40分)4. 请解释什么是标准差,以及它在社会统计学中的应用。
答案:(标准差是衡量一组数据离散程度的统计量。
它是方差的平方根,用来描述数据点围绕平均值的分散程度。
在社会统计学中,标准差可以用来评估调查数据或实验数据的离散程度,帮助研究者理解变量变动的范围。
例如,在比较不同国家的平均收入时,标准差可以显示这些国家收入差异的大小。
)5. 请描述如何使用卡方检验来评估两个分类变量之间是否存在关联。
答案:(卡方检验是一种常用的统计方法,用来检验两个分类变量是否独立。
基本步骤包括:构建一个列联表来展示两个变量的交叉频数;计算卡方统计量,它基于观察频数和期望频数之间的差异;根据自由度和卡方分布表,确定卡方统计量的显著性水平。
如果卡方统计量的p值小于显著性水平(通常是0.05),则拒绝原假设,认为两个变量不独立。
)第三部分:案例分析(40分)6. 某研究者正在比较两个不同城市的犯罪率。
社会统计学期末复习题社会统计学课程期末复习题一、名词解释1、社会统计学:社会统计学就是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法与技术。
也就是对社会现象的资料进行收集、整理和分析,以便对社会学的假设、理论进行求证的一门方法论学科。
4、点估计:所谓点估计,就是根据样本数据算出一个单一的估计值,用它来估计总体的参数值。
5、区间估计:所谓区间估计,就是计算抽样平均误差,指出估计的可信程度,进而在点估计的基础上,确定总体参数的所在范围或区间。
6、置信区间:置信区间就是我们为了增加参数被估计到的信心而在点估计两边设置的估计区间。
7、消减误差比例:变量间的相关程度,可以用不知Y与X有关系时预测Y的误差E,减去知道Y与X有关系时预测Y的误差1E,再将其化为比例来度量。
将削减误差比例记为PRE。
8、因果关系:变量之间的关系满足三个条件,才能断定是因果关系。
1)连个变量有共变关系,即一个变量的变化会伴随着另一个变量的变化;2)两个变量之间的关系不是由其他因素形成的,即因变量的变化是由自变量的变化引起的;3)两个变量的产生和变化有明确的时间顺序,即一个在前,另一个在后,前者称为自变量,后者称为因变量。
9、正相关与负相关:正相关是指一个变量的值增加时,另一变量的值也增加;负相关是指一个变量的值增加时,另一变量的值却减少。
13、大数定理:当我们的观察次数n趋向无限时,随机事件可能转换为不可能事件或必然事件。
即,在大量观察的前提下,观察结果具有稳定性。
多次重复试验,随机变量的平均值接近数学期望(即总体均值)。
7.描述性统计就是讨论范围仅以搜索的资料本身为限,而不予以扩大。
早期的统计都是描述统计。
8.推论性统计,主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。
是在树立统计学派之后发展起来的,属于比较现代的统计分析方法。
9.样本或样本总体,是通过抽样得到的用以推断总体特征的那个“部分”。
社会统计学期末复习训练一、单项选择题(20=2×10)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。
此处800人是.样本2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。
这项研究的总体是 332.1户家庭的年均收入3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是 22000名学生的每月生活费用4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。
此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级6.下列变量属于数值型变量的是工资收入7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为.简单随机抽样8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。
这种调查方法属于分层抽样9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
这种调查方法属于系统抽样11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率13.在频数分布表中,频率是指各组频数与总频数之比14.在频数分布表中,比率是指不同小组的频数之比15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度27.两组数据的平均数不相等,但是标准差相等。
社会统计学试题及答案一、选择题(每题2分,共20分)1. 社会统计学是研究社会现象数量特征和数量关系的科学,其主要研究方法不包括以下哪一项?A. 描述性统计B. 推断性统计C. 定性分析D. 指数分析2. 以下哪一项不是社会统计学中常用的数据类型?A. 计数数据B. 顺序数据C. 比率数据D. 定性数据3. 在社会统计学中,中位数是衡量数据集中趋势的一种方法,以下关于中位数的描述不正确的是?A. 中位数是将数据从小到大排序后位于中间位置的数值B. 中位数不受极端值的影响C. 中位数是数据的平均值D. 中位数适用于任何类型的数据4. 标准差是衡量数据离散程度的指标,以下关于标准差的描述不正确的是?A. 标准差越大,数据越集中B. 标准差是方差的平方根C. 标准差可以为负数D. 标准差反映了数据的波动大小5. 以下哪个统计量可以用来衡量变量之间的线性相关程度?A. 相关系数B. 方差C. 标准差D. 均值...(此处省略剩余选择题)二、简答题(每题10分,共30分)1. 简述描述性统计和推断性统计的区别。
2. 解释什么是正态分布,并说明其在社会统计学中的应用。
3. 什么是抽样误差?它是如何影响统计推断的?三、计算题(每题15分,共30分)1. 给定一组数据:10, 12, 14, 16, 18, 20。
计算这组数据的均值、中位数和标准差。
2. 如果一个样本的均值为50,标准差为10,样本量为100,求95%置信区间。
四、案例分析题(每题20分,共20分)某社会调查机构对1000名居民进行了收入调查,调查结果显示,平均收入为5000元,标准差为1500元。
请根据这些信息,分析可能存在的收入分布情况,并讨论如果样本量减少到500,对统计推断的影响。
答案一、选择题1. C2. C3. C4. A, C, D5. A二、简答题1. 描述性统计主要关注数据的收集、组织、描述和呈现,目的是对数据进行总结和解释,而推断性统计则是基于样本数据对总体进行推断,目的是做出关于总体的结论。
社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数)1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。
2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。
3、在回归分析中,各实际观测值y 与估计值y ˆ的离差平方和称为 剩余 变差。
4、平均增长速度= 平均发展速度 —1(或100%)。
5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。
6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。
7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。
8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为100%7%A 100% 1.06%100%6%-=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为100%10%100% 4.76%100%5%+=-=+B 产品产量计划超额完成程度 。
9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。
10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值);四个部分组成。
11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。
华南农业大学期末考试试卷(A卷)学年第学期考试科目:社会统计学考试类型:(开卷)考试时间:120 分钟一、单项选择题(请将正确选项的序号填在答题纸相应的位置。
)1.社会统计中的变量一般分四个层次,其中最高层次的变量是。
A、定类变量B、定序变量C、定距变量D、定比变量2.标准正态分布的均值一定。
A、等于1B、等于-1C、等于0D、不等于03.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式确定中位值所在位置。
A、n/2B、(n-1)/2C、(n+2)/2D、(n+1)/24.下列统计指标中,对极端值的变化最不敏感的是。
A、众值B、中位值C、四分位差D、均值5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。
A、两端检验B、右端检验C、左端检验D、无法判断6.在一个右偏的分布中,大于均值的数据个数将。
A、不到一半B、等于一半C、超过一半D、视情况而定7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。
A、回归分析可用于估计和预测B、相关分析是研究变量之间的相互依存关系的密切程度C、相关分析不需区分自变量和因变量D、回归分析是相关分析的基础8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。
A、-1 < r< 0B、0 < r< 1C、r = 1D、r = -19.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。
A、众值B、中位值C、均值D、平均差10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。
某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。
A、数学B、语文C、两门课程一样D、无法判断二、多项选择题(多选、错选均不得分,漏选得部分分。
请将正确选项的序号填在答题纸相应的位置。
)1.下列变量中属于定类层次的是。
社会统计学期末复习训练一、单项选择题(20=2×10)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。
此处800人是.样本2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。
这项研究的总体是 332.1户家庭的年均收入3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是 22000名学生的每月生活费用4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。
此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级6.下列变量属于数值型变量的是工资收入7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为.简单随机抽样8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。
这种调查方法属于分层抽样9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
这种调查方法属于系统抽样11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率13.在频数分布表中,频率是指各组频数与总频数之比14.在频数分布表中,比率是指不同小组的频数之比15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-20XX年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度27.两组数据的平均数不相等,但是标准差相等。
社会统计学课程期末复习题一、填空题(计算结果一般保留两位小数)1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。
2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。
3、在回归分析中,各实际观测值y 与估计值y ˆ的离差平方和称为 剩余 变差。
4、平均增长速度= 平均发展速度 —1(或100%)。
5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。
6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。
7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。
8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为100%7%A 100%1.06%100%6%-=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为100%10%100%4.76%100%5%+=-=+B 产品产量计划超额完成程度 。
9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。
10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值);四个部分组成。
11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。
社会统计学期末复习训练一、单项选择题(20=2×10)1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。
此处800人是.样本2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查,以推断所有家庭的年均收入水平。
这项研究的总体是 332.1户家庭的年均收入3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查,以推断所有学生的每月生活费用水平。
这项研究的总体是 22000名学生的每月生活费用4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。
此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级6.下列变量属于数值型变量的是工资收入7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的机会入选样本,这样的抽样方式称为.简单随机抽样8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从女生中抽取8名学生进行调查。
这种调查方法属于分层抽样9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽样的方式抽取子样本,这样的抽样方式称为分层抽样10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。
这种调查方法属于系统抽样11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率13.在频数分布表中,频率是指各组频数与总频数之比14.在频数分布表中,比率是指不同小组的频数之比15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 8920.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.222.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考试成绩的中位数是8823.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值近似为5.5小时24.对于左偏分布,平均数、中位数和众数之间的关系是众数>中位数>平均数25.对于右偏分布,平均数、中位数和众数之间的关系是平均数>中位数>众数26.离散系数的主要目的是比较多组数据的离散程度27.两组数据的平均数不相等,但是标准差相等。
那么 平均数大的,离散程度小28.已知某单位平均月收入为3500元,离散系数为0.2,那么他们月收入的标准差为70029.一班学生的平均体重均为55千克,二班学生的平均体重为52千克,两个班级学生体重的标准差均为5千克。
那么 二班学生体重的离散程度大30.已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月收入的均值为350031. 正态分布中,σ值越小,则 离散趋势越小32.已知某单位职工平均每月工资为3000元,标准差为500元。
如果职工的月收入是正态分布,可以判断月收入在2500元—3500元之间的职工人数大约占总体的68%33.如果一组数据中某一个数值的标准分值为-1.5,这表明该数值比平均数低1.5个标准差34.某班级学生期末英语考试平均成绩为75分,标准差为10分。
如果已知这个班学生的考试分数服从正态分布,可以判断成绩在65-85之间的学生大约占全班学生的68%35.经验法则表明,当一组数据正太分布时,在平均数加减2个标准差的范围之内大约有 95%的数据36.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。
如果学生的成绩是正太分布,可以判断成绩在72分-88分之间的学生大约占总体的95%37.如果一组数据中某个数值的标准分值为1.8,这表明该数值比平均数高出1.8个标准差38.某班级学生期末统计学考试平均成绩为82分,标准差为5分。
如果已知这个班学生的考试分数服从正态分布,可以判断成绩在77-87之间的学生大约占全班学生的68%39.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 68%的数据40.用样本统计量的值直接作为总体参数的估计值,这种方法称为点估计41.用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为区间估计42.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。
如果要检验该说法是否正确,则假设形式应该是0H :π≥0.1;错误!未找到引用源。
:π<0.143.某单位对该厂第一加工车间残品率估计高达13%,而该车间主任认为该比例(π)偏高。
如果要检验该说法是否正确,则假设形式应该为0H :π≥0.13;错误!未找到引用源。
:π<0.1344.在假设检验中,不拒绝虚无假设意味着没有证据证明虚无假设是错误的45.在假设检验中,虚无假设和备择假设有且只有一个成立46.在假设检验中,如果所计算出的P 值越大,那么检验的结果 越不显著47.在假设检验中,如果所计算出的P 值越小,那么检验的结果 越显著48.根据一个具体的样本求出的总体均值90%的置信区间以90%的概率包含总体均值49.根据一个样本均值求出的90%的置信区间表明总体均值有90%的概率会落入该区间内50.根据一个具体的样本求出的总体均值95%的置信区间以95%的概率包含总体均值51.用于说明回归方程中拟合优度的统计量主要是判定系数52.两个定类变量之间的相关分析可以使用λ系数53.判断下列哪一个不可能是相关系数1.254.判断下列哪一个不可能是相关系数1.3255.如果收入与支出之间的线性相关系数为0.92,那么二者之间存在着高度相关56.如果物价与销售量之间的线性相关系数为-0.87,而且二者之间具有统计显著性,那么二者之间存在着高度相关57. 某项研究中欲分析受教育年限每增长一年,收入如何变化,下列哪种方法最合适回归58.在回归方程中,若回归系数等于0,这表明自变量x对因变量y的影响是不显著的59.对消费的回归分析中,学历、年龄、户口、性别、收入都是因变量,其中收入的回归系数为0.8,这表明消费每增加1元,收入增加0.8元60.在因变量的总离差平方和中,如果回归和所占的比例越大,则两变量之间相关程度越高61.回归平方和(SSR)反映y的总变差中由于x与y之间的线性关系引起的y的变化部分62.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两个变量之间相关程度越小63.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个变量之间相关程度越大64.在因变量的总离差平方和中,如果回归平方和所占的比例越小,则自变量和因变量之间相关程度越低65.方差分析的目的是研究各分类自变量对数值型因变量的影响是否显著66.下面哪一项不是方差分析中的假定各总体的方差等于067.下列哪种情况不适合用方差分析年龄对收入的影响68.从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组间方差和组内方差分别为234,48.469.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组间均方和组内均方分别为432,7170.在方差分析中,某一水平下样本数据之间的误差称为组内误差二、名词解释1.离散变量与连续变量P10(1)离散变量如果一个变量的变量值是间断的,可以一一列举的,这种变量称为离散变量。
例如,某人兄弟姐妹数、结婚次数、工厂生产产品的数量等,其变量值的取值是0,1,2,3…。
离散变量的取值是有限个值,而且其取值都是以整数位断开的,是有最小计量单位的。
例如,某人的兄弟姐妹数,只能是1个、2个、3个等,而不能是1.3个、2.5个等。
(2)连续变量如果一个变量的变量值是连续不断的,即可以取无数多个数值,这种变量称为连续变量。
例如,年龄、温度、灯泡的寿命等,它们的取值是连续不断的。
连续变量可以取无数多个值,其取值是连续不断,不可以一一列举的,而且,它们没有最小计量单位。
例如,年龄可以是1岁整,也可以是1.2岁、1.45岁、2.544岁等。
2.总体与样本 P11总体是构成它的所有个体的集合,个体则是构成总体的最基本的单位。
样本就是从总体中按照一定方式抽取的一部分个体的集合。
例如,要从某省所有育龄妇女中抽取1000人进行调查进行调查,那么,该省所有育龄妇女就是研究总体,其中每一位育龄妇女就是个体,而抽取出的1000名育龄妇女就构成为了该总体的一个样本。
3.抽样单位与抽样框 P11抽样单位就是一次直接的抽样所使用的基本单位。
抽样单位有时与构成总体的个体是相同的,有时是不同的。
例如对育龄妇女的调查,当直接抽取育龄妇女时,两者是相同的;当我们从总体中一次直接抽取户时,以抽中的户中的育龄妇女作为样本时,抽样单位(户)与个体(育龄妇女)就不相同了。
抽样框是指一次直接抽样时样本中所有抽样单位的名单。
例如,从某校中抽取200名学生进行就业观的调查,那么这所学校的所有学生的名单就是这次抽样的抽样框。
但是,当我们先抽取班级,以抽中班级中的所有学生作为样本时,这所学校所有班级的名单就是这次抽样的抽样框。