当前位置:文档之家› 统计学答案解析最新版本

统计学答案解析最新版本

统计学答案解析最新版本
统计学答案解析最新版本

统计学课本课后作业题(全)

题目:

第1章:P11 6,7

第2章:P52 练习题3、9、10、11

第3章:P116思考题12、14 练习题16、25

第4章:P114 思考题6,练习题2、4、6、13

第5章:P179 思考题4、练习题3、4、6、11

第6章:P209 思考题4、练习题1、3、6

第7章:P246思考题1、练习题1、7

第8章:P287 思考题4、10 练习题2、3

第一章

6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求:

(1)描述总体;最近的一个集装箱内的全部油漆;

(2)描述研究变量;装满的油漆罐的质量;

(3)描述样本;最近的一个集装箱内的50罐油漆;

(4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。

7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐”

(2)研究变量:更好口味的品牌名称;

(3)样本:1000名消费者品尝的两个品牌

(4)推断:两个品牌中哪个口味更好。

第二章

3.某百货公司连续40天的商品销售额如下(单位:万元):

41 25 29 47 38 34 30 38 43 40

46 36 45 37 37 36 45 43 33 44

35 28 46 34 30 37 44 26 38 44

42 36 37 37 49 39 42 32 36 35

根据上面的数据进行适当的分组,编制频数分布表,并绘制直方图。解:采用等距分组

全距=49-25=24

n=40 取组距为5,则组数为24/5=4.8 取5组

F r e q u e n c y

9.某百货公司6月份各天的销售额数据如下(单位:万元):

257 276 297 252 238 310 240 236 265 278 271 292 261 281 301 274 267 280 291 258 272 284 268 303 273 263 322 249 269 295 (1)计算该百货公司日销售额的均值、中位数和四分位数;

(2)计算日销售额的标准差。 解:(1) x =

x n

∑=822330

=274.1(万元)

将30个数据重新排序,则中位数位于30个数据的中间位置,即靠中的第15、第16两个数272和273的平均数:M e =

272273

2

+=272.5(万元) 由于中位数位于第15个数靠上半位的位置上,所以前四分位数位于第1~第15个数据的中间位置(第8位)靠上四分之一的位置上,由重新排序后的第8位是261,第15位是272,从而:Q L =261+

273272

4

-=261.25(万元) 同理,后四分位数位于第16~第30个数据的中间位置(第23位)靠下四分之一的位置上,由重新排序后第23位是291,第16位是273,从而:Q U =291-

273272

4

-=290.75(万元)。

(2)未分组数据的标准差计算公式为:s

s=21.1742。

10.甲乙两个企业生产三种产品的单位成本和总成本资料如下:

解:设产品单位成本为x,产量为f,则总成本为xf,由于:平均成本x=

xf

f

∑=

总成本

总产量

而已知数据中缺产量f的数据,又因个别产品产量f =

该产品成本

该产品单位成本

=

xf

x

从而

x=

xf

xf

x

,于是得:甲企业平均成本=

xf

xf

x

210030001500

210030001500

152030

++

++

=19.41(元),

乙企业平均成本=

xf

xf

x

325515001500

325515001500

152030

++

++

=18.29(元),对比可见,甲企业的总平

均成本较高。原因:尽管两个企业的单位成本相同,但单位成本较低的产品在乙企业的产量中所占比重较大,因此拉低了总平均成本。

11.在某地区抽取的120家企业按利润额进行分组,结果如下:

按利润额分组(万元)企业数(个)

200~300 19

300~400 30

400~500 42

500~600 18

600以上11

合计120

计算120家企业利润额的均值和标准差。

解:设各组平均利润为x,企业数为f,则组总利润为xf,

由于数据按组距式分组,须计算组中值作为各组平均利润,列表计算得:按利润额分组(万元)

组中值企业数(个)总利润

x f xf 200~300 250 19 4750

300~400 350 30 10500

400~500 450 42 18900

500~600 550 18 9900

600以上650 11 7150

合计—120 51200

于是,120家企业平均利润为:x=

xf

f

∑=

51200

120

= 426.67(万元);

(万元)。

第3章

思考练习:12解析总体分布、样本分布和抽样分布的含义

总体分布:就是与总体相联系的随机变量的概率分布

样本分布:是与样本相联系的随机向量的联合概率分布

抽样分布:就是作为样本的函数的统计量的分布

14解析中心极限定理的含义:是阐述大量随机变量之和的分布趋近于正态分布

的一系列定理的总称。

16某企业生产的某种电池寿命近似服从正态分布,且均值为200小时,标准差为30小时若规定寿命低于150小时为不合格品。试求 (1) 该企业生产的电池的合格率是多少?

(2) 该企业生产的寿命在200小时左右的多大范围内的概率不小于0.9? 解(1))6667.1()30

200

150()150(-<-<

=

(2) 设所求值为K ,满足电池寿命在200±K 小时范围内的概率不小于0.9,即有:

|200|(|200|){||}0.93030

X K

P X K P Z --<=<≥=

即:{}0.9530

K

P Z <

≥,K /30≥1.64485,故K ≥49.3456。 25某制造商为击剑运动员生产安全夹克,这些夹克是以剑锋刺入其中时所需的最小力量(以

牛顿为单位)来定级的。如果生产工艺操作正确,则他生产的夹克级别应平均840牛顿,标准差15牛顿。国际击剑管理组织(FIE )希望这些夹克的最低级别不小于800牛顿。为了检查其生产过程是否正常,某检验人员从生产过程中抽取了50个夹克作为一个随机样本进行定级,并计算x ,即该样本中夹克级别的均值。她假设这个过程的标准差是固定的,但是担心级别均值可能已经发生变化。 ⑴ 如果该生产过程仍旧正常,则x 的样本分布为何?

⑵ 假设这个检验人员所抽取样本的级别均值为830牛顿,则如果生产过程正常的话,

样本均值x ≤830牛顿的概率是多少?

⑶ 在检验人员假定生产过程的标准差固定不变时,你对b 部分有关当前生产过程的现

状有何看法(即夹克级别均值是否仍为840牛顿)?

⑷ 现在假设该生产过程的均值没有变化,但是过程的标准差从15牛顿增加到了45牛

顿。在这种情况下x 的抽样分布是什么?当x 具有这种分布时,则x ≤830牛顿的概率是多少?

第四章参数估计

6简述样本量与置信水平、总体方差、允许误差的关系。

样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比

2.某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客组成了一个简单随机样本。

(1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求允许误差;

(3) 如果样本均值为120元,求总体均值95%的置信区间。

解:(1)已假定总体标准差为σ=15元则样本均值的抽样标准误差为

x σσ15=2.1429

(2)已知置信水平1-α=95%,得 α/2Z =1.96,于是,允许误差是

E =

α/2

σ

Z ×2.1429=4.2000。 (3)已知样本均值为x =120元,置信水平1-α=95%,得 α/2Z =1.96, 这时总体均值的置信区间为

±α/2

x Z ±4.2=124.2115.8

可知,如果样本均值为120元,总体均值95%的置信区间为(115.8,124.2)元。

4. 从一个正态总体中随机抽取容量为8 的样本,各样本值分别为:10,8,12,15,6,13,5,11。求总体均值95%的置信区间。 解:(7.1,12.9)。

6. 在一项家电市场调查中,随机抽取了200个居民户,调查他们是否拥有某一品牌的电视机。其中拥有该品牌电视机的家庭占23%。求总体比率的置信区间,置信水平分别为90%和95%。

解:已知样本容量n =200,为大样本,拥有该品牌电视机的家庭比率p =23%,

拥有该品牌电视机的家庭比率的抽样标准误差为

p σ ⑴双侧置信水平为90%时,通过2β-1=0.90换算为单侧正态分布的置信水平β=0.95,查单侧正态分布表得 α/2Z =1.64,

此时的置信区间为 p ±αZ ±1.64×2.98%=27.89%18.11%

可知,当置信水平为90%时,拥有该品牌电视机的家庭总体比率的置信区间为

(18.11%,27.89%)。

⑵双侧置信水平为95%时,得 α/2Z =1.96,

此时的置信区间为 p ±αZ ±1.96×2.98%=28.8408%17.1592%

可知,当置信水平为95%时,拥有该品牌电视机的家庭总体比率的置信区间为;(17.16%,

28.84%)。

13.根据以往的生产数据,某种产品的废品率为2%。如果要求95%的置信区间,若要求允许误差不超过4%,应抽取多大的样本?

解:已知总体比率π=2%=0.02,由置信水平1-α=95%,得置信度α/2Z =1.96,允许误差E ≤ 4%即由允许误差公式 E=

/2

Z ασ整理得到样本容量n 的计算公式:

n=2()E

α/2P Z σ=2=2E 2α/2Z π(1-π)≥2

0.020.98

0.04??21.96=47.0596 由于计算结果大于47,故为保证使“≥”成立,至少应取48个单位的样本。

第五章

4什么是P 值?P 值检验决策的意义是什么?

答:p 值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P 值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平α,来控制犯第一类错误的上限,p 值可以有效地补充α提供地关于检验可靠性的有限信息。p 值检验的优点在于,它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。

3一家大型超市连锁店上个月接到许多消费者投诉某种品牌炸土豆片中60g 一袋的那种土豆片的重量不符合。店方猜想引起这些投诉的原因是运输过程中沉积在食品袋底部的土豆片碎屑,但为了使顾客们对花钱买到的土豆片感到物有所值,店方仍然决定对来自于一家最大的供应商的下一批袋装炸土豆片的平均重量(g )u 进行检验, 假设陈述如下:Ho :u>=60H1:u<60

(1)与这一假设检验问题相关联的第I 类错误是什么? (2)与这一假设检验问题相关联的第II 类错误是什么?

(3)你认为连锁店的顾客们会将哪类错误看得较为严重?而供应商会将哪类错误看得较为严重?

(1)第一类错误是该供应商提供的这批炸土豆片的平均重量的确大于等于60克,但检验结果却提供证据支持店方倾向于认为其重量少于60克;

(2)第二类错误是该供应商提供的这批炸土豆片的平均重量其实少于60克,但检验结却没有提供足够的证据支持店方发现这一点,从而拒收这批产品;

(3)连锁店的顾客们自然看重第二类错误,而供应商更看重第一类错误。

4某种纤维原有平均强度不超过6g ,现希望通过改进工艺来提高其平均强度。研究人员测得了100个关于新纤维的强度数据,发现其均值为6.35。假定纤维强度的标准差仍保持为1.19不变,在5%的显著性水平下对该问题进行假设检验。 (1)选择检验统计量并说明其抽样分布是什么样的。 (2)检验的拒绝规则是什么?

(3)计算检验统计量的值,你的结论是什么? (1)检验统计量n

s x z /μ-=

,在大样本情形下近似服从标准正态分布;

(2)如果05.0z z >,就拒绝0H ;

(3)检验统计量z =2.94>1.645,所以应该拒绝0H 。。

6一个视频录像设备(VCR )的平均使用寿命为6年,标准差为0.75年,而抽选了由30台电视组成的一个随机样本表明,电视使用寿命的样本方差为2年。试构造一个假设检验,能够帮助判定电视的使用寿命的方差是否显著大于视频录像设备的使用寿命的标准差,并在a=0.05的显著性水平下作出结论。

解:提出假设 22222

01:0.75,:0.75TV VCR TV H H σσσ≤=>

已知:2

30,2,0.05n s α===

检验统计量()()22

2

0.052

2

129*21032942.5570.75

VCR

n s χχσ-==

=>= 拒绝0H ,可判定电视使用寿命的方差显著大于VCR

11为比较新旧两种肥料对产量的影响,一边决定是否采用新肥料。研究者选择了面积相等、土壤等条件相同的40块田地,分别施用新旧两种肥料,得到的产量数据如下表。

(1)检验结果如下:

t-检验: 双样本等方差假设

变量 1

变量 2

平均 100.7

109.9

方差 24.11578947

33.35789474

观测值 20

20

合并方差

28.73684211

假设平均差0

df 38

t Stat -5.427106029

P(T<=t) 单尾 1.73712E-06

t 单尾临界 1.685953066

P(T<=t) 双尾 3.47424E-06

t 双尾临界 2.024394234

t-检验: 双样本异方差假设

变量1 变量2

平均100.7 109.9 方差24.11578947 33.35789474 观测值20 20 假设平均差0

df 37

t Stat -5.427106029

P(T<=t) 单尾 1.87355E-06

t 单尾临界 1.687094482

P(T<=t) 双尾 3.74709E-06

t 双尾临界 2.026190487

(2)方差检验结果如下:

F-检验双样本方差分析

变量 1

变量 2

平均 100.7

109.9

方差 24.11578947

33.35789474

观测值 20 20 df 19

19

F

0.722940991 P(F<=f) 单尾 0.243109655 F 单尾临界

0.395811384

第六章

4简述方差分析的基本思想。

是对比不同影响水平下整体方差和组间方差的差异,即不同水平的数据间方差和随机方差的对比

1从三个总体中各抽取容量不同样本数据,得到的资料见表。检验3个总体的均值之间是否有显著差异。(a=0.01) 三个总体抽取的样本数据

0215.86574.401.0=<=F F (或01.00409.0=>=-αvalue P ),不能拒绝原假设。

3 某企业准备用三种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,

随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到的结果 (1)完成下面的方差分析表

554131.3478.105.0=<=F F (或05.0245946.0=>=-αvalue P ),不能拒绝原假设。

6为检验广告媒体和广告方案对产品销售的影响,一家营销公司做了一项试验,考察三种广告方案和两种广告媒体,获得的销售数据如表。

广告方案

广告媒体

(a=0.05)

1432.575.1005.0=>=F F 广告方案(或05.00104.0=<=-αvalue P ),拒绝原假设。 9874.5305.0=<=F F 广告媒体(或05.01340.0=>=-αvalue P ),不能拒绝原假设。 1432.575.105.0=<=F F 交互作用(或05.02519.0=>=-αvalue P ),不能拒绝原假设。

第七章

1相关分析与回归分析的区别和联系是什么? 答:相关与回归分析是研究变量之间不确定性统计关系的重要方法,相关分析主要是判断两

个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。但它们在研究目的和对变量的处理上有明显区别。它们均是统计方法,不能揭示现象之间的本质关系。

1. 设销售收入x 为自变量,销售成本y 为因变量。现已根据某百货公司某年12个月的有关

资料计算出以下数据(单位:万元):

(1) 拟合简单西线性回归方程,并对方程中回归系数的经济意义作出结解析 (2) 计算可决系数和回归估计的标准方差 (3) 对B2进行显著性水平为5%的显著性检验

(4) 假定下年一月销售收入为800万元,利用拟合的回归方程预测其销售成本,并给出

置信度为95%的预测区间。

解:设简单线性回归方程为:12y x ββε=++

(1) 采用OLS 估计:()()()

2

2

334229.09?0.786425053.73i

i i

x x y y x x β--===-∑∑

11

??549.80.786*647.8840.566y x ββ=-=-= 回归系数经济意义:销售收入每增加1万元,销售成本会增加0.786万元。

(2) 可决系数为:()()()()2

22

22

334229.090.9998425053.73*262855.25

i i i i x x y y R x x y y ??--??===--∑∑∑

回归标准误:

? 2.29σ

===

=

(3) 检验统计量为:

()

2

2??223.76?t Se ββ==

=

=

所以2β是显著不为零

(4) 预测:12???40.5660.786*800669.366f f

y x ββ=+=+= 95%

区间为

? 1.96*669.366f y σ±=±即( 664.579 ,674.153)

7.表中给出y 对2x 和3x 回归的结果: 多元性回归的结果

离差来源 平方和(SS ) 自由度(df ) 平方和的均值(MSS ) 来自回归(ESS ) 65965 来自残差(RSS ) 总离差(TSS ) 66042 14

(1) 该回归分析中样本容量是多少? (2) 计算RSS ;

(3) ESS 和RSS 的自由度是多少? (4) 计算可决系数和修正的可决系数;

(5) 怎样检验2x 和3x 对y 是否有显著影响?根据以上信息能否确定2x 和3x 各自对

y 的贡献为多少?

解:(1)该回归分析中样本容量是14+1=15

(2)计算RSS=66042-65965=77

ESS 的自由度为k-1=2,RSS 的自由度 n-k=15-3=12 (3)计算:可决系数2

65965/660420.9988R == 修正的可决系数 2

151

1(10.9988)0.9986153

R -=-

?-=- (4)检验X2和X3对Y 是否有显著影响

/(1)65965/232982

5140.11/()77/12 6.4166

ESS k F RSS n k -=

===-

(5) F 统计量远比F 临界值大,说明X2和X3联合起来对Y 有显著影响,但并不能确定X2和X3各自对Y 的贡献为多少。

第八章

4甲企业近四年产品销售产量分别增长了9%、7%、8%、6%,乙企业这四年产品的次品率

也正好是9%、7%、8%、6%。这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?

10循环变动和季节变动的区别是什么? 循环变动与季节变动的区别是,循环变动的周期长短很不一致,不像季节变动那样有明显的按月或按季的固定周期规律,循环变动的规律性不甚明显。

2. 某地区社会商品零售额1988—1992(1993—1997)年期间(1987(1992)年为基期)每年平均增长10%,1993—1997(1998—2002)年期间每年平均增长8.2%,1998—2003(2003—2008)

年期间每年平均增长6.8%。问2003年与1987年相比该地区社会商品零售额共增长多少?年平均增长速度是多少?若1997(2002)年社会商品零售额为30亿元,按此平均增长速度,2004(2009)年的社会商品零售额应为多少?(注意:上面的年份和书本是不一样的,但数据一样。把年份改过来就行了,括号里面的年份是书本的。)

解:设i 年的环比发展水平为x i ,则已知的三段年均增长率表示为:

1992110%-=+,即为519921987(110%)x x =+

199718.2%-=+,即为519971992(18.2%)x x =+

20031 6.8%-=+,即为620031997(1 6.8%)x x =+

于是得:

(1) 以1987年为基期,2003年与1987年相比,该地区社会商品零售额的发展速度

为:

20031987x x =199219972003

198719921997

x x x x x x g g

=5

5

6

(110%)(18.2%)(1 6.8%)+?+?+

3.544273635

4.43%==

从而得知,2003年与1987年相比,该地区社会商品零售额共增长254.43%。

(2)1987年至2003年之间,年平均发展速度为:

2003-

可知,1987年至2003年之间,年平均增长速度为8.23%。 (3) 若x 1997=30亿元,按平均增长速度8.23%计算x 2004, 即由

200418.23%-=+ 得 x 2004=7

30(10.0823)52.1867?+= (亿元)

可知,按照假定,2004年的社会商品零售额应为52.1867亿元

3某地区国内生产总值在1998—2000年平均每年递增12%,2001—2004年平均每年递增10%,2005——2007年平均每年递增8%。试计算

(1)该地区国内生产总值在这10年间的发展总速度和平均增长速度;

(2)若2007年的国内生产总值为500亿元,以后平均每年增长6%,到2009年可达多少? (3)若2009年的国内生产总值计划任务为570亿元,一季度的季节比率为15%.则2009年一季度的计划任务应为多少?

(1)发展总速度%12.259%)81(%)101(%)121(3

4

3

=+?+?+

平均增长速度=%9892.91%12.25910=-

(2)8.561%)61(5002

=+?(亿元)

(3)平均数∑====415.1424

570

41j j y y (亿元),

2002年一季度的计划任务:625.1495.142%105=?(亿元)。

(此文档部分内容来源于网络,如有侵权请告知删除,文档可自行编辑修改内容,

供参考,感谢您的配合和支持)

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

2021年自考《社会统计学》习题及答案(卷二)

2021年自考《社会统计学》习题及答案(卷二) 一、填空 1.( )是指由调查者直接搜集的、未经加工整理而保持其原本状态的资料。( )是指经他人加工整理,可以在一定程度上被引用来说明总体特征的资料。 2.如果考虑到资料的时间过程,凡某一特定时刻的资料称为( );凡某时期内变动累计的资料称为( )。 3.( )调查就是根据调查的目的和要求,在对所研究对象进行初步全面分析的基础上,从中选择有代表性的单位,做周密细致的调查。 4.( )误差,是指在调查和统计过程中由于各种主客观因素而引起的技术性、操作性误差以及由于责任心缘故而造成的误差等。( )误差,是指由调查方式本身所决定的统计指标和总体指标之间存在的差数。 5. 统计误差有( )和( )两类,其中( )在全面调查和非全面调查中都可能发生。 6.对在全国钢产量中占很大比重的十大钢铁企业进行钢产量生产调查,这种调查方式属于( )。 7.统计调查从调查范围上分,可分为( )和( )。 8.统计调查按调查登记时间是否连续,可分为( )和( )。 9.统计调查从调查目的上,可分为( )和专项调查。 10.( )误差是在遵守随机原则的条件下,用样本指标代表总体指标不可避免存在的误差,它表示抽样估计的精度。

二、单项选择 1.将总体按与研究有关的标志进行分组,然后再随机地从各组中抽选单位组成样本。这种抽样方式叫( )。 A 简单随机抽样 B 类型抽样 C 等距抽样 D 整群抽样。 2.搞好重点调查的关键是( ) 。 A 力求统一要求和统一行动 B 选择好重点单位 C 选择最有代表性的单位 D 遵循随机原则。 3.下列资料,属于静态资料的是( ) 。 A 某厂89年职工工资总额为76万元; B 某乡89年粮食总产量为1亿3千万公斤; C 某市89年末人口为36.3万人; D 某市89年征用土地125亩。 4.关于统计调查的组织形式,下面正确的描述有( )。 A 普查是一种专门组织的一次性调查; B 满足一定条件,重点调查的结果可以用来推断总体; C 抽样调查是一种全面调查; D 典型调查是在研究现象的总体中,选择其中的重点单位进行调查。 5.应用( )方式抽取样本时,必须避免抽样间隔和现象本身的节奏性或循环周期相重合。 A 随机抽样 B 系统抽样 C 整群抽样 D 分层抽样 6.下面能进行除法运算的测量尺度是( )。

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

医学统计学样题及答案解析

1、某市1974年为了解该地居民发汞的基础水平,调查了留住该第一年以上,无明显肝、 肾疾病,无汞作业接触史的居民238人的发汞含量如下: 发汞值 1.5~ 3.5~ 5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~21.5( mol/kg): 人数20 66 60 48 18 16 6 1 0 3 (1)说明此频数分布的特征。 (2)选用何种指标描述其集中趋势和离散趋势? (3)估计该地居民发汞值的95%参考值范围? 答:(1)偏态分布 (2)选用中位数描述集中趋势,四分位间距描述离散趋势 (3) 频数相对频数累积频数累积相对频数 1.5~20 0.0840336 1 20 0.08403 4 3.5~66 0.2773109 2 86 0.36134 5 5.5~60 0.2521008 4 146 0.61344 5 7.5~48 0.2016806194 0.81512

7 6 9.5~18 0.0756302 5 212 0.89075 6 11.5~16 0.0672268 9 228 0.95798 3 13.5~ 6 0.0252100 8 234 0.98319 3 15.5~ 1 0.0042016 8 235 0.98739 5 17.5~0 0 235 0.98739 5 19.5~21.5 3 0.0126050 4 238 1 合计238 P2.5=1.5+(238×2.5%-0)×2/20=2.095 P97.5=13.5+(238×97.5%-228)×2/6=14.85 所以估计该地居民发汞值的95%参考值范围(2.095,14.85)

《社会统计学》作业(共享含部份答案)

社会统计学作业 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是( A ) A.样本 B. 总体 C. 统计量 D. 变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为( C )A.频率 B. 累积频数 C. 累积频率 D. 比率 3.离散系数的主要目的是( D ) A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有 ( B ) A. 50%的数据 B. 68%的数据 C. 95%的数据 D. 99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为( A ) A. 39.19

B. 28.90 C .19.54 D .27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为( A ) A .点估计 B .区间估计 C .有效估计 D .无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例(π)偏高。如果要检验该说法是否正确,则假设形式应该为( B ) A .0H :π≥0.1;1H :π<0.1 B .0H :π≤0.1;1H :π>0.1 C .0H :π=0.1;1H :π≠0.1 D .0H :π>0.1;1H :π≤0.1 8.下面哪一项不是方差分析中的假定( D ) A .每个总体都服从正态分布 B .观察值是相互独立的 C .各总体的方差相等 D .各总体的方差等于0 9.判断下列哪一个不可能是相关系数( D ) A .-0.9 B .0 C .0.5 D .1.2 10.用于说明回归方程中拟合优度的统计量主要是( D ) A. 相关系数 B. 离散系数 C. 回归系数 D. 判定系数

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

医学统计学试题及答案

医学统计学试题及答案集团文件发布号:(9816-UATWW-MWUB-WUNN-INNUL-DQQTY-

医学统计学试题及答案 习??题 《医学统计学》第二版??(五年制临床医学等本科生用)(一)??单项选择题 1.观察单位为研究中的( d??)。 A.样本? ?? ??B. 全部对象 C.影响因素? ?? ?????D. 个体2.总体是由( c )。 A.个体组成? ?? ?B. 研究对象组成 C.同质个体组成? ?? ? D. 研究指标组成 3.抽样的目的是(b??)。 A.研究样本统计量? ?? ?? ???B. 由样本统计量推断总体参数 C.研究典型案例研究误差? ???D. 研究总体统计量 4.参数是指(b? ?)。 A.参与个体数? ???B. 总体的统计指标 C.样本的统计指标? ? ??D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变? ?? ? B.均数改变,标准差不变 C.两者均不变? ?? ?? ?? ?? ??? D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a??)。 A.变异系数? ?? B.差 C.极差? ?? ?? ? D.标准差 8.以下指标中(? ?d)可用来描述计量资料的离散程度。 A.算术均数? ? B.几何均数 C.中位数? ?? ? D.标准差 9.偏态分布宜用(? ?c)描述其分布的集中趋势。 A.算术均数? ?? B.标准差 C.中位数? ?? D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(? ?b)不变。 A.算术均数? ??? B.标准差 C.几何均数? ?? ???D.中位数 11.( a??)分布的资料,均数等于中位数。 A.对称? ? B.左偏态 C.右偏态? ?? ?? D.偏态 12.对数正态分布是一种( c )分布。

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

社会统计学习题 卢淑华

1、P58习题十五 人数户数 0 1 2 3 4 5 6 7 8 417 240 366 222 134 63 39 24 21 (1)试作频率统计表,直方图和折线图 (2)试求均值和标准差 2、P59习题十六 设以下是七十二名离婚者的婚龄的统计(见下表)。 (1)试作频率统计表、直方图和折线图 (2)试求众值、中位值和均值,并做简单讨论。 (3)试求四分互差和标准差。 婚龄人数 1-3 4-6 7-9 10-12 13-15 16-18 19-21 22-24 25-27 28-30 5 10 20 14 9 4 3 2 4 1 3、P59习题十七 设以下是1209名抽烟者年龄的统计(见下表) 年龄人数 21-24 25-34 35-44 45-54 55-64 65岁以上212 273 257 226 152 89 (1)试作频率统计表、直方图和折线图 (2)试求四分互差。 4、P72例10 某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?

5、P73例12 根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少? 6、P75例13 为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少? 7、P75例14 某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少? 8、P76例16 根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少? 9、P77例17 某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少? 10、P78例18 某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20 设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少? 12、P83例22 10人抓阄,其中共有2张球票,问第2个人抓到球票的概率? 13、P85例23 设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。设上海厂得正品率为90%;北京厂的正品率为95%,天津厂的正品率为97%。问(1)任抽一件为正品的概率是多少?(2)在抽得产品是正品的情况下,是上海厂的概率是多少? 14、P99例27 已知随机变量的概率分布为 ξ13.4 13.5 13.6 13.7 13.8 P(ξ=Xi)0.05 0.15 0.60 0.15 0.05 求σ2=? 15、P106习题三 某班对全班订报纸情况进行了统计,中订《人民日报》的有45%;订《北京晚报》的有80%;两种报纸都订的有30%,试求以下事件的概率。 (1)只定人民日报的 (2)至少订以上一种报纸的 (3)只订以上一种报纸的 (4)以上两种报纸都不订的 16、P107习题6 根据统计,由出生活到60岁的概率为0.8,活到70岁的概率为0.4,问现年60岁的人活到70岁的概率为多少?

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

《医学统计学》习题及答案

一、最佳选择题 1.卫生统计工作的步骤为 c A.统计研究调查、搜集资料、整理资料、分析资料 B.统计资料收集、整理资料、统计描述、统计推断 C.统计研究设计、搜集资料、整理资料、分析资料 D.统计研究调查、统计描述、统计推断、统计图表 E.统计研究设计、统计描述、统计推断、统计图表 2.统计分析的主要内容有 A.统计描述和统计学检验 B.区间估计与假设检验 C.统计图表和统计报告 D.统计描述和统计推断 E.统计描述和统计图表 3.统计资料的类型包括 A.频数分布资料和等级分类资料 B.多项分类资料和二项分类资料 C.正态分布资料和频数分布资料 D.数值变量资料和等级资料 E.数值变量资料和分类变量资料 4.抽样误差是指 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别 C.样本中每个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 5.统计学中所说的总体是指 A.任意想象的研究对象的全体 B.根据研究目的确定的研究对象的全体 C.根据地区划分的研究对象的全体 D.根据时间划分的研究对象的全体 E.根据人群划分的研究对象的全体 6.描述一组偏态分布资料的变异度,宜用 A.全距 B.标准差 C.变异系数 D.四分位数间距 E.方差7.用均数与标准差可全面描述其资料分布特点的是 A.正偏态分布 B.负偏态分布 C.正态分布和近似正态分布 D.对称分布 E.任何分布 8.比较身高和体重两组数据变异度大小宜采用 A.变异系数 B.方差 C.极差 D.标准差 E.四分位数间距 9.频数分布的两个重要特征是 A.统计量与参数 B.样本均数与总体均数 C.集中趋势与离散趋势 D.样本标准差与总体标准差 E.样本与总体 10.正态分布的特点有 A.算术均数=几何均数 B.算术均数=中位数 C.几何均数=中位数 D.算术均数=几何均数=中位数 E.以上都没有 11.正态分布曲线下右侧5%对应的分位点为

社会统计学期末复习题与答案整理

社会统计学期末复习训练 一、单项选择题(20=2×10) 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样 本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是.样本 2.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调查, 以推断所有家庭的年均收入水平。这项研究的总体是 332.1户家庭的年均收入 3.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调查, 以推断所有学生的每月生活费用水平。这项研究的总体是 22000名学生的每月生活费用 4.为了解地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是样本5.从变量分类看,下列变量属于定序变量的是产品等级 6.下列变量属于数值型变量的是工资收入 7.从含有N个元素的总体中,抽取n个元素作为样本,同时保证总体中每个元素都有相同的 机会入选样本,这样的抽样方式称为.简单随机抽样 8.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从 女生中抽取8名学生进行调查。这种调查方法属于分层抽样 9.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系统抽 样的方式抽取子样本,这样的抽样方式称为分层抽样 10.某班级有100名学生,为了了解学生消费水平,将所有学生按照学习成绩排序后,在前 十名学生中随机抽出成绩为第3名的学生,后面依次选出第13、23、33、43、53、63、73、83、93九名同学进行调查。这种调查方法属于系统抽样 11.在频数分布表中,某一小组中数据个数占总数据个数的比例称为频率 12.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为累积频率 13.在频数分布表中,频率是指各组频数与总频数之比 14.在频数分布表中,比率是指不同小组的频数之比 15.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用环形图16.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110,111,114,115,下列哪种图形最适合描述这些数据线图 17.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形环形图 18.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为 39.19 19.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么该班考试成绩的中位数是 89 20.某企业职工的月收入水平分为五组:1)1500元及以下;2)1500-2000元;3)2000-2500元;4)2500-3000元;5)3000元及以上,则3000元及以上这一组的组中值为 3250元21.为了解某行业12月份利润状况,随机抽取5家企业,12月份利润额(单位:万元)分 别为65、23、54、45、39,那么这5家企业12月份利润额均值为 45.2 22.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那 么该班考试成绩的中位数是88 23.某班级学生平均每天上网时间可以分为以下六组:1)1小时及以下;2)1-2小时;3)2-3小时;4)3-4小时;5)4-5小时;6)5小时及以上,则5小时及以上这一组的组中值 近似为5.5小时

相关主题
文本预览
相关文档 最新文档