上海立信会计学院统计学官方整理资料
- 格式:doc
- 大小:74.84 KB
- 文档页数:8
统计学_上海立信会计金融学院2中国大学mooc课后章节答案期末考试题库2023年
1.某班5名同学的某门课的成绩分别为60、70、75、80、85,这5个数是
()
答案:
变量值
2.调查某市职工家庭的生活状况时,统计总体是()
答案:
该市全部职工家庭
3.某企业职工张三的月工资额为500元,则“工资”是()
答案:
数量标志
4.像“性别”、“年龄”这样的概念,可能用来()
答案:
作为标志使用
5.一组数据中出现次数最多的变量值称为()。
答案:
众数
6.下列指标中属于结构相对指标的是()。
答案:
净产值占总产值的比重
7.时间数列中所排列的指标数值()
答案:
可以是绝对数,也可以是相对数或平均数
8.一个95%的置信区间是指()
答案:
在用同样方法构造的总体参数的多个区间中,有95%的区间包含该总体参数。
9.对总体参数提出某种假设,然后利用样本信息判断假设是否成立的过程称为
()
答案:
假设检验
10.在假设检验中,原假设和备择假设()
答案:
只有一个成立而且必有一个成立
11.由某产品的年生产量和库存量所组成的两个时间序列,( )。
答案:
前者是时期序列,后者是时点序列
12.若已知某网站4月份平均员工人数为84人,5月份平均员工人数为72人,
6月份平均员工人数为84人,7月份平均员工人数为96人,则二季度该
网站的月平均员工人数为( )人。
答案:。
专业班级学号姓名第八章练习题(解答各题必须写出必要步骤)1.用传统工艺加工的某种水果罐头中,每瓶的平均维生素C的含量为19(单位:mg)。
现改变了加工工艺,抽查了16瓶罐头,测得维生素C的含量的平均值,样本标准差。
假定水果罐头中维生素C的含量是否服从正态分布,问在使用新工艺后,维生素C的含量是否有显著变化(显著水平)?(,)答案:有显著变化2.已知某炼铁厂在生产正常的情况下,铁水含碳量服从正态分布,其方差为0.03,在某段时间抽测了10炉铁水,算得铁水含碳量的样本方差为0.0375。
试问这段时间生产的铁水含碳量方差与正常情况下的方差有无显著差异?(显著性水平)(,)答案:无显著变化3.某公司产品的不合格率过去为0.02,今从五批产品中抽取500件作为样本送给订货者检验,检验出不合格率只有0.01。
在显著水平下检验,对。
(,)答案:接受4.某电子元件的耐用时数服从均值为1000h的正态分布,现随机抽取10件新工艺条件下生产的产品做耐用性能测试,测得其平均耐用时数为1077h,样本标准差为51.97h,能否认为新工艺条件下生产的电子元件之耐用性能(平均耐用时数)明显不同于老产品?(显著性水平)()答案:明显不同5.用热敏电阻测温仪间接测量地热,勘探井底温度,重复测量7次,测得温度(℃):112.0,113.4,111.2,112.0,114.5,112.9,113.6,而用某精确办法测得温度为112.6℃(可看作温度真值),试问用热敏电阻测温仪间接测温有无系统偏差?(显著性水平)(设热敏电阻测温仪测得温度总体服从正态分布)()答案:无系统偏差6.设购买某名牌车的人的年龄,最近随机抽查了该车购买者400人,得平均年龄为30岁,在下检验,对(,)答案:接受7.某校大二学生概率统计成绩服从正态分布,从中随机地抽取25位考生的成绩,算得平均成绩分,样本标准差分。
问:在显著性水平,可否认为这次考试全体考生平均成绩为75分?()答案:可以认为这次考试全体考生平均成绩为75分8.某日从饮料生产线随机抽取16瓶饮料,分别测得重量(单位:克)后算出样本均值及样本标准差。
上海立信会计学院2010 ~2011学年第2学期09级本科 《概率论与数理统计》期终考试(A 卷)(本场考试属闭卷考试,可使用计算器) 共 5 页说明:可能要用到的相关数据0.025(6) 2.4469t =,0.05(6) 1.9432t = ,0.025(7) 2.3469t =,0.05(7) 1.8946t =,(1.96)0.975Φ=,(1.65)0.95Φ=.一、选择题(本大题共10小题,每小题2分,共20分. 在每个小题给出的四个选项中,只有一项符合题目要求的,把所选项前的字母填写在括号内)1.已知事件A 、B 互不相容,()0P A >、()0P B >,则 ( ).A. ()1P A B =B. ()()()P A B P A P B =C. ()0P A B =D. ()0P A B >2.对任意事件A 、B ,下面结论正确的是( ).A. ()0P AB =,则AB =∅B. 若()1P A B = ,则A B =ΩC. ()()()P A B P A P B -=-D. ()()()P A B P A P AB =-3.则c =A.81 B. 41 C. 31 D. 21 4. 设随机变量X 的密度函数为4,01,()0,cx x f x ⎧<<=⎨⎩其它,则常数c =( ).A. 51B. 41 C. 4 D. 5 5. 设2~(1,)X N σ-且(31)0.4P X -<<-=,则(1)P X ≥= ( ). A. 0.1 B. 0.2 C. 0.3 D. 0.56. 设随机变量X 服从二项分布,即~(,)X B n p ,且()3E X =,17p =,则n =( ).A. 7B. 14C. 21D. 497.设1216,,,X X X 是来自正态总体2(2,)N σ的一个样本,161116i i X X ==∑,则48~X σ-( ).A. (15)tB. (16)tC. 2(15)χD. (0,1)N8.设12,,,n X X X 是取自正态总体2~(,)X N μσ的一个样本,11ni i X X n ==∑,2211()n ni i S X X n ==-∑,则n Y = ). A. (1)t n - B. ()t n C.2(1)n χ- D. (0,1)N 9.设ˆθ是未知参数θ的一个估计量,若ˆ()E θθ≠,则ˆθ是θ的( ). A. 极大似然估计 B. 矩估计C. 有效估计D. 有偏估计10.下列说法中正确的是( ).A. 如果备择假设是正确的,但作出的决策是拒绝备择假设,则犯了弃真错误B. 如果备择假设是错误的,但作出的决策是接受备择假设,则犯了取伪错误C. 如果原假设是正确的,但作出的决策是接受备择假设,则犯了弃真错误D. 如果原假设是错误的,但作出的决策是接受备择假设,则犯了取伪错误二、解答题(本大题共6小题,每小题9分,共54分,解答应写出推1.某产品共30件,其中有三件是次品,现从中任取2件,求至少有一件是次品的概率.2. 对某一目标进行射击,直至击中为止. 如果每次射击命中的概率为p ,试求射击次数X 的分布律.设X 的概率密度函数为,0,()0,.x e x f x -⎧>=⎨⎩其他 试求2Y X =的4. 设X 的概率密度函数为2,01,()0,.x x f x ≤≤⎧=⎨⎩其他,试求(),()E X D X .5. 某车间生产滚珠,滚珠的直径),(~2σμN X ,其中μ未知,20.05σ=. 从某天的产品中随机抽取6件,侧得直径(mm )为: 15.1 14.6 14.8 14.9 15.1 15.2试求滚珠直径X 的均值μ的置信度为0.95的置信区间.6. 有一种新安眠剂,据说在一定剂量下能比某种旧安眠剂平均增加睡眠时间3小时,为了检验针对新安眠剂的这种说法是否正确,收集到一组使用新安眠剂的睡眠时间(单位:h ): 26.7, 22.0, 24.1, 21.0, 27.2, 25.0, 23.4.经计算此样本平均值为24.2,样本标准差为2.296. 根据资料用某种旧安眠剂时平均睡眠时间为23.8h ,假设用安眠剂后睡眠时间服从正态分布,试问这组数据能否说明新安眠剂的疗效?(0.05α=)得分三、综合题(本大题共2小题,每小题13分,共26分.解答应写出推理,演算步骤)1. 甲、乙、丙三个人独立地去破译一份密码,已知甲、乙、丙各人能译出此密码的概率分别为15,13,14,问三人中至少有一人能将此密码译出的概率?2.设随机变量(,)X Y 的联合分布律为 4,01,01,(,)0,.xy x y f x y ≤≤≤≤⎧=⎨⎩其他 ()X f x ,()Y f y ;(2)判断X 和Y 的独立性.得分《概率论与数理统计》期终考试(A 卷)参考解答一、选择题(本大题共10小题,每小题2分,共20分)1. C 2. D 3. B 4. D 5. A6. C7. D8. A9. D 10. C二、解答题(本大题共6小题,每小题9分,共54分)1.设A ={从30件产品中任取2件产品,至少有一件是次品},则样本空间所包含的基本事件总数为435230=C ,A 的对立事件所包含的基本事件总数为351227=C ,从而所求概率28()145P A =。
第一章绪论思考题1.什么是统计学?请简要说明一下它的发展过程。
统计学是关于数据搜集、整理、归纳、分析的方法论科学。
统计学的发展主要经历了三个阶段:(1)17世纪中叶至18世纪,统计学的产生和形成阶段;(2)18世纪末至20世纪中叶,统计推断方法和理论体系确立的阶段;(3)20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的阶段。
2.统计学、统计数据,以及统计活动之间有什么关系?统计活动直接影响统计数据的数量和质量;统计学是统计实践活动的理论概括,同时,它又用理论和方法研究分析统计实践活动,统计学和统计活动是理论与实践的关系。
3.统计学的研究方法有哪些,它们有怎样的关系?并举例说明。
主要方法有两个:(1)描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2)推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。
由于现实问题中,要获得总体数据存在很大的难度,能够获得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它已成为统计学的核心内容。
当然,描述统计的重要性不可忽略,通过它得到可靠的统计数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得出符合实际情况的结论。
4.简要说明总体、样本、变量的概念。
总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素;样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素;变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。
5.简述SPSS统计软件的特点和应用领域。
(1) 特点:第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置、点击功能按钮来完成,不需要用户记忆大量的操作命令。
可编辑修改精选全文完整版《统计学》复习资料一、单项选择题1.对某城市工业企业未安装设备进行普查,则个体是( )。
A.工业企业全部未安装设备B.工业企业每一台未安装设备C.每个工业企业的未安装设备D.每一个工业企业2.工业企业的设备台数、产品产值是( )。
A.连续变量B.离散变量C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量3.调查几个重要铁路枢纽,就可以了解我国铁路货运量的基本情况和问题,这种调查属于( )。
A.普查B.重点调查C.典型调查D.抽样调查4.统计分组的结果表现为()A.组内的差异性和组间的同质性B.组内的同质性和组间的差异性C.组内的差异性和组间的差异性D.组内的同质性和组间的同质性5.对百货商店工作人员进行普查,调查对象是()A.所有的百货商店B.每一个百货商店C.各百货商店的全体工作人员D.每一位工作人员6.对一批商品进行质量检验,最适宜采用的方法是( )。
A.全面调查B.抽样调查C.典型调查D.重点调查7.在分组时,凡遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是( )。
A.将此值归入上限所在组B.将此值归入下限所在组C.此值归入两组均可D.另立一组8.在总量指标中,其数值受时期长短影响的指标是()A.实物指标B.价值指标C.时期指标D.时点指标9.计划规定单位产品成本应比上年降低5%,实际降低了3%,则单位产品成本计划完成程度为( ) A.97.94% B.8% C.2% D.102.11%10.反映社会经济现象发展总规模、总水平的综合指标是( )。
A.质量指标B.总量指标C.相对指标D.平均指标11.采用加权算术平均计算时,当各组的权数都增加1倍时,平均数( ) A.不变 B.增加1倍C.是原来的一半D.无法判断12.我国人口中,男女人口的性别比为 106:100,这是( )。
A.比例相对指标B.比较相对指标C.强度相对指标D.平均指标 13.在出生婴儿中,男婴比重53%,女婴比重47%,这两个指标是( ) A.比例相对数 B.强度相对数 C.结构相对数D.比较相对数14.序时平均数中的“首尾折半法”适用于计算( ) A.时期数列的资料B.间隔相等的间断的时点数列的资料C.间隔不等的时点数列的资料D.由两个时期数列构成的相对数动态数列资料15.动态数列中的发展水平( )A.只能是总量指标B.只能是相对指标C.只能是平均指标D.上述三种指标均可以16.已知各环比增长速度分别为5%、8%、6%和10%,则相应的定基增长速度计算方法() A. 105%×108%×106%×110%B.(105%×108%×106%×110%)-100%C.(5%×8%×6%×10%)-100%D.5%+8%+6%+10%17.编制数量指标综合指数时,其同度量因素最好固定在( ) A.报告期 B.计划期 C.基期D.任一时期18.按综合指数变形的要求,采用加权调和平均数指数形式编制质量指标总指数时,其权数应该是( )A.11pq B.01p q C.10p q D.00p q19.设p 为商品价格,q 为销售量,则指数∑∑010qp qp 的实际意义是综合反映( )A.商品销售额的变动程度B.商品价格变动对销售额的影响程度C.商品销售量变动对销售额的影响程度D.商品价格和销售量变动对销售额的影响程度20.某企业的产值,2013年比2012年增长21%,其原因是() A.产品价格上升9%,产量增长了12% B.产品价格上升10%,产量增长了11% C.产品价格上升10.5%,产量增长了10.5% D.产品价格上升了10%,产量增长了10%21.某省教育主管部门要了解所属高校教学设备的使用状况,则统计研究的总体单位是() A.该省每一所高校B.该省全部高校的全部设备C.该省每一所高校的每一台设备D.该省每一所高校的每一台教学设备22.次数分布中的频数愈大,该组的标志值对总体平均水平所起的作用() A.愈大B.愈小C.可能大,也可能小D.无法确定23.在同一变量数列中,组距的大小与组数的多少之间的关系是() A.成正比 B.成反比 C.不确定D.无关24.下列关于标志变异指标的说法正确的是() A.反映现象总体的一般水平 B.反映现象总体的集中程度C.反映现象总体的联系程度D.反映现象总体各单位标志值分布的差异程度25.是非标志的标准差为() A.1-p B.pq C.)p 1(p -D.p (1-p)26.定基发展速度等于() A.环比发展速度之和 B.环比发展速度之积 C.环比增长速度之和 D.环比增长速度之积 27.1011q p q p ∑-∑表明() A.由于销售量变化对销售额的影响 B.由于价格变化对销售量的影响 C.由于价格变化对销售额的影响D.由于销售量变化对价格的影响 28.编制数量指标综合指数的一般原则是() A.采用基期的数量指标作为同度量因素 B.采用基期的质量指标作为同度量因素C.采用报告期的数量指标作为同度量因素D.采用报告期的质量指标作为同度量因素29.若两数列平均水平不同,在比较两数列离散程度时,应采用()A.全距B.平均差C.标准差D.标准差系数30.累计增长量等于()A.报告期水平与基期水平之差B.报告期水平与前一期水平之差C.报告期水平与某一固定基期水平之差D.逐期增长量之差31.工业企业的设备台数和利润额( )A.均是连续型变量B.均是离散型变量C.前者是连续型变量,后者是离散型变量D.前者是离散型变量,后者是连续型变量32.下列属于全面调查的是( )A.对一批产品质量进行抽检B.对工业设备的普查C.对某市工业企业进行典型调查D.调查几大彩电厂商,借此了解全国彩电的生产情况33.统计分组是根据统计研究的目的和任务,将总体按照一个或几个分组标志分成( )A.性质相同的若干部分B.性质不同的若干部分C.数量相同的若干部分D.数量不同的若干部分34.在出生婴儿中,男婴比重53%,女婴比重47%,这两个指标是( )A.比例相对数B.强度相对数C.结构相对数D.比较相对数35.在下列平均数中,不.受.极端数值影响的是( )A.中位数B.调和平均数C.几何平均数D.算术平均数36.增长速度的计算公式是( )A.增长速度=增长量/报告期水平B.增长速度=增长量/基期水平C.增长速度=增长量/平均水平D.增长速度=增长量/最末水平37.根据个体价格指数和报告期销售额计算的价格总指数是( )A.固定构成指数B.可变构成指数C.加权调和平均指数D.加权算术平均指数38.抽样调查应遵循的基本原则是( ) A.随机原则B.准确性原则C.系统原则D.及时性原则39.统计指数按其所反映的指标性质不同可分为( ) A.个体指数和总指数 B.数量指标指数和质量指标指数 C.综合指数和平均数指数 D.算术平均数指数和调和平均数指数40.某企业2003年比2002年产量增长了10%,产值增长了20%,则产品的价格提高了( ) A.10% B.30% C.100% D.9.09% 二、多项选择题1. 我国统计调查的方法有( )A.统计报表B.普查C.抽样调查D.重点调查E.典型调查 2.时期指标的特点有( )A.只能间断计数B.数值大小与时期长短有关C.具有可加性D.不具有可加性E.数值大小与间隔长短无关 3.已知各时期的环比发展速度,便能计算出()A.平均发展速度B.平均增长速度C.平均增长量D.平均发展水平E.定基发展速度4.对某商店某时期商品销售额变动情况分析,其指数体系包括 ( ) A.销售量指数 B.销售价格指数 C.总平均价格指数 D.销售额指数 E.个体指数5.受两极端值影响的平均数有() A.算术平均数 B.调和平均数C.几何平均数D.众数E.中位数 6.加权算术平均数的数学性质是( ) A.0)X X (=-∑B.)X X (-∑f=0C.)X X (-∑为最小D.2)X X (-∑为最小E.2)X X (-∑f 为最小7.关于趋势直线方程,bt a yˆt +=下列表述正确的有( ) A.a 是t 等于零时的趋势值 B.b 是趋势线在y 轴上的截距 C.b 是趋势线的斜率D.b表示时间t变动一个单位时,趋势值t yˆ平均变动的数量E.当b前面是负号时,说明y t与t是负相关8.常用的统计调查方法有()A.普查B.抽样调查C.统计报表D.典型调查E.重点调查9.用综合指数形式计算的价格总指数,所能够反映的是()A.价格的总体变动情况B.销售额的总体变动情况C.销售量的总体变动情况D.价格水平固定时的销售额变动情况E.销售量水平固定时的销售额变动情况10.时期数列的特点是()A.指标数值具有可加性B.指标数值不能直接相加C.指标数值通过连续登记加总取得D.指标数值只能间断计量E.指标数值的大小与时间长短有直接关系三、简答题1.简述统计的三种含义。
第一章绪论思考题1.什么是统计学?请简要说明一下它的发展过程。
统计学是关于数据搜集、整理、归纳、分析的方法论科学。
统计学的发展主要经历了三个阶段:(1)17世纪中叶至18世纪,统计学的产生和形成阶段;(2)18世纪末至20世纪中叶,统计推断方法和理论体系确立的阶段;(3)20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的阶段。
2.统计学、统计数据,以及统计活动之间有什么关系?统计活动直接影响统计数据的数量和质量;统计学是统计实践活动的理论概括,同时,它又用理论和方法研究分析统计实践活动,统计学和统计活动是理论与实践的关系。
3.统计学的研究方法有哪些,它们有怎样的关系?并举例说明。
主要方法有两个:(1)描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2)推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。
由于现实问题中,要获得总体数据存在很大的难度,能够获得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它已成为统计学的核心内容。
当然,描述统计的重要性不可忽略,通过它得到可靠的统计数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得出符合实际情况的结论。
4.简要说明总体、样本、变量的概念。
总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素;样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素;变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。
5.简述SPSS统计软件的特点和应用领域。
(1) 特点:第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置、点击功能按钮来完成,不需要用户记忆大量的操作命令。
菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。
第二,具有完善的数据转换接口,可以方便地和Windows其他应用程序进行数据共享和交换。
可以读取Excel、FoxPro、Lotus等电子表格和数据库软件产生的数据文件,可以读取ASCII数据文件。
第三,提供强大的程序编辑能力和二次开发能力,方便高级用户完成更为复杂的统计分析任务的需要,具有丰富的内部函数和统计功能。
第四,附带丰富的数据资料实例和完善的使用指南,为用户学习掌握软件的使用方法提供更多的方便。
软件启动后,用户可直接上网访问SPSS公司主页获得更多的帮助和信息。
(2) 应用领域:社会科学、自然科学、经济管理、商业金融、医疗卫生、体育运动等。
6.SPSS软件的数据编辑器包括哪些内容?(1) 标题栏,显示当前工作文件名称。
(2) 主菜单栏,排列SPSS的所有菜单命令。
(3) 工具栏,排列系统默认的标准工具图标按钮,此栏图标按钮可以通过单击View菜单的Toolbars命令选择隐藏、显示或更改。
(4) 状态栏,状态栏位于SPSS窗口底部,它反映了工作状态。
当用户将光标置于不同的区域时或者进行不同的操作时将显示不同的内容。
(5) 数据编辑栏,用户通过键盘输入的数据首先显示在这里。
(6) 数据显示区域。
它是一个二维的表格,编辑确认的数据都将在这里显示,其中每一个矩形格为单元格(Cell),其中边框加黑的单元格称为选定单元格。
数据显示区域的左边缘排列观测量序号,上边缘排列要定义的各变量名。
7. 调查表明,顾客每周花在某超市蛋糕的平均费用是30元,他们选择经常购买蛋糕的主要原因是该蛋糕味道很好。
要求:(1) 总体是什么?(2) 该项研究所使用的方法是描述统计方法还是推断统计方法?(1) 总体是所有的购买蛋糕的顾客;(2) 推断统计方法。
第二章数据整理和描述思考题1.获取统计数据有哪两种途径?一种是直接向调查对象搜集反映调查单位的统计数据,一般称为原始数据或第一手数据;另一种是搜集已经加工、整理过的、说明总体现象的数据,一般称为次级数据或第二手数据。
2.统计数据的搜集有哪几种方法?直接观察法、访问法、报告法、问卷法。
3.对统计数据进行搜集时,有哪几种组织方式?普查、抽样调查、重点调查、典型调查。
4.什么是数据分组?数据分组的方式有哪几种?(1)统计数据分组是根据统计研究目的,按某一标志将数据分别列入不同的组,使组与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。
(2)统计数据分组可以按品质标志分组和按数量标志分组。
(一)按品质标志分组就是按照事物的性质和属性特征进行分组。
一般来言,按品质标志分组的操作比较容易,分组也相对稳定。
如人口按性别分组、职工按文化程度分组等;(二)按数量标志分组,就是按照事物的数量特征进行分组。
例如,企业按职工人数、产值、产量等标志分组,人口按年龄分组等。
5.简述组距、组限、组数与组中值的含义以及它们的计算方法。
(1) 组距是指各组中最大变量值与最小变量值之差,用i表示。
计算方法为:i=R/n, 其中,n表示组数,R表示变量最大值与最小值之差(即全距);(2) 组限是指限定各组组距的数值。
各组的较大值称上限,较小值称下限;(3) 组数是指数据被分成的组个数。
计算方法为:1+=.3322Nn lg式中:n表示组数;N表示变量值个数;(4) 组中值是上限到下限之间的中点数值,其计算公式为:组中值=(上限+下限)/26. 向上积累和向下积累的数据有什么区别?累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。
(1) 向上累计频数(或频率),通常是指由变量值小的组向变量值大的组依次累计;(2) 向下累计频数(或频率),通常是指由变量值大的组向变量值小的组依次累计。
7. 什么是频数分布?试描述频数分布表的编制过程。
(1) 分布数列是指在统计分组的基础上,将总体的所有单位按一定标志分组整理,并按一定顺序排列,形成总体单位在各组的分布;(2) 一、确定变量数列的形式。
根据变量的类型和变量值的多少及现象本身的特点确定是编制单项数列还是编制组距数列。
二、组距式变量数列编制方法:计算全距、确定组数、确定组距、确定组限、计算组中值、计算累计频数和累计频率。
8. 对统计数据进行描述时,有哪几种统计图表表达方式?有统计表和统计图,其中统计图包括:直方图、折线图、曲线图。
9. 直方图和折线图有什么区别和关系?折线图可以在直方图的基础上,将直方图的每个长方形的顶端中点用折线连点而成。
如果不绘直方图,也可以用组中值与频数求出坐标点,连接而成。
它们与横轴围成的区域面积相等。
10. 请举出自己实际生活中的一组数据,对它进行分组,然后绘制直方图、折线图以及箱线图,分析该组数据的结构特征。
略第三章数据特征的度量思考题1. 数据分布的特征可以从哪些方面进行度量和描述?(1) 数据集中程度度量的常用方法有均值(算术平均数)、调和平均数、几何平均数、众数、中位数。
(2) 数据离散程度的测度方法,常用的有极差、内距、标准差及离散系数。
2. 简述中位数、四分位数、十分位数的概念,并举例说明。
中位数是将顺序排列的统计数据从中间分成相等的两部分;四分位数就是将排序后的数据4等分的三个数值,每部分包含25%的数据,其中中间的四分位数就是中位数,其余两项分别为下四分位数(Q 1)和上四分位数(Q 3); 十分位数和百分位数分别是将排序后的数据10等分和100等分的数值。
3. 简述众数、中位数和均值的特点和关系。
(1) 关系: 当数据呈对称分布时,均值、中位数、众数必定相等,即有Mo Me x ==;当数据呈左偏分布时,均值小于中位数且小于众数,即有Mo Me x <<; 当数据呈右偏分布时,均值大于中位数且大于众数,即有Mo Me x >>;(2) 特点:均值是根据所有数据计算的一般水平代表值,数据信息的提取足够充分,特别是当用样本信息估计总体特征时,均值就更显示其良好的特征。
因而在统计数据分析中均值起着很重要的作用。
众数、中位数虽然数据信息利用不够充分,但当数据有极端值出现时,中位数的优势就显现了。
4. 简述内距、极差、标准差的概念,并举例说明。
(1) 内距:又称为四分位数差,是指上四分位数和下四分位数之差,通常用Q d 表示;(2) 极差:也称全距,它是一组数据的最大值与最小值之差;在组距式数列中,极差可以是最高组的上限与最低组下限之差;(3) 标准差:也称均方差,是各数据和均值离差平方平均数的平方根。
5. 什么是离散系数?为什么要计算离散系数?(1) 常用的离散系数主要有标准差系数,也称均方差系数,它是数据的标准差与其相应的均值之比;(2) 原因:总体和样本的离散程度除了受变量值之间的离散程度影响外,还受变量值本身水平高低的影响,因此,在比较不同总体和样本的离散程度时,应消除由于变量值水平不同或计量单位不同带来的影响。
在统计分析中,用离散系数来比较不同总体和不同样本的均值的代表性。
6.简述偏度和峰度的概念。
偏度:偏度是对分布偏斜方向及程度的度量;峰度:是对数据分布尖峭程度的度量,它可以衡量频数分布的集中程度。
第四章统计指数思考题1.什么是统计指数?统计指数与数学上的指数函数有何区别?(1)统计指数:是表明复杂现象综合变动的相对数;(2)统计指数与数学上的指数函数是两种完全不同的概念。
2.统计指数的种类有哪些?统计指数可以按不同的角度作不同的分类:(一)指数按其反映的对象范围的不同,可以分为个体指数和总指数;(二)指数按其所反映的社会经济现象特征的不同,分为数量指标指数和质量指标指数;(三)指数按其采用基期的不同,分为定基指数和环比指数;(四)指数按其对比内容的不同,分为动态指数和静态指数;(五)指数按照常用的计算总指数的方法或形式,可以分为综合指数和平均指数。
3.综合指数和平均数指数有何区别和联系?(1)综合指数是以“先综合,后对比”的方式来编制得到的,就是将对比指标加总之后进行对比的结果;(2)平均指数是以“先对比,后平均”的方式编制得到的,就是对个体指数进行平均的结果。
4.什么是拉式指数和帕氏指数?(1) 拉氏指数是将同度量因素固定在基期水平上,因此也称基期综合指数,公式具体形式如下:1000,p p qL p q =∑∑ 1000;q q p L q p =∑∑(2) 帕氏指数将同度量因素固定在报告期水平上,因此也称报告期综合指数。
公式具体形式如下: 1101,pp q P p q =∑∑ 1101.q q p P q p =∑∑5. 为何要建立指数体系?指数体系有哪两种不同的含义?(1) 在经济分析中,一个指数通常只能说明某一方面的问题,而实践中往往需要将多个指数结合起来加以运用,这就需要建立相应的指数体系。