当前位置:文档之家› 假设检验社会统计学

假设检验社会统计学

假设检验社会统计学
假设检验社会统计学

第七章假设检验

第一节二项分布

二项分布的数学形式·二项分布的性质

第二节统计检验的基本步骤

建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定第三节正态分布

正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态近似法

第四节中心极限定理

抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理

第五节总体均值和成数的单样本检验

σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总体成数的检验

一、填空

1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋于()分布。

2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( ),它决定了否定域的大小。

3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越(),原假设为真而被拒绝的概率越()。

4.二项分布的正态近似法,即以将B(x;n,p)视为()查表进行计算。

5.已知连续型随机变量X~N(0,1),若概率P{X

≥λ}=0.10,则常数λ=()。

6.已知连续型随机变量X~N(2,9),函数值

9772

.0

)2(

=

Φ

,则概率

}8

{<

X

P=

()。

二、单项选择

1.关于学生t分布,下面哪种说法不正确()。

A 要求随机样本

B 适用于任何形式的总体分布

C 可用于小样本

D 可用样本标准差S代替总体标准差σ

2.二项分布的数学期望为()。

A n(1-n)p

B np(1- p)

C np

D n(1- p)。

3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为()。

A 大于0.5

B -0.5

C 1

D 0.5。

4.假设检验的基本思想可用( )来解释。

A 中心极限定理

B 置信区间

C 小概率事件

D 正态分布的性质

5.成数与成数方差的关系是( )。

A 成数的数值越接近0,成数的方差越大

B 成数的数值越接近0.3,成数的方差越大

C 成数的数值越接近1,成数的方差越大

D 成数的数值越接近0.5,成数的方差越大

6.在统计检验中,那些不大可能的结果称为( )。如果这类结果真的发生了, 我们将否定假设。

A 检验统计量

B 显著性水平

C 零假设

D 否定域

7.对于大样本双侧检验,如果根据显著性水平查正态分布表得Z α/2=1.96,则当零假设被否定时,犯第一类错误的概率是( )。

A 20%

B 10%

C 5%

D .1%

8.关于二项分布,下面不正确的描述是( )。

A 它为连续型随机变量的分布;

B 它的图形当p =0.5时是对称的,当p ≠ 0.5时是非对称的,而当n 愈大

时非对称性愈不明显;

C 二项分布的数学期望)(X E =μ=np ,变异数)(X

D =2σ=npq ;

D 二项分布只受成功事件概率p 和试验次数n 两个参数变化的影响。

9.事件A 在一次试验中发生的概率为

4

1,则在3次独立重复试验中,事件A 恰好发生2次的概率为( )。 A

21 B 16

1 C 643 D 649 10.设离散型随机变量X ~),2(p B ,若数学期望4.2)(=X E ,方差44.1)(=X D ,则参数p n ,的值为( ).

A 4=n ,p =0.6

B 6=n ,p =0.4

C 8=n ,p =0.3

D 12=n ,p =0.2

三、多项选择

1.关于正态分布的性质,下面正确的说法是( )。

A 正态曲线以μ=x 呈钟形对称,其均值、中位数和众数三者必定相等。

B 对于固定的σ值,不同均值μ的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置。

μ值,不同均值σ的正态曲线的外形完全相同,差别只在于曲线在

C 对于固定的

横轴方向上整体平移了一个位置。

μ值,σ值越大,正态曲线越陡峭。

D 对于固定的

2.下列概率论定理中,两个最为重要,也是统计推断的数理基础的是()

A 加法定理

B 乘法定理

C 大数定律

D 中心极限定理

E 贝叶斯定理。

3.统计推断的具体内容很广泛,归纳起来,主要是()问题。

A 抽样分布

B 参数估计

C 方差分析

D 回归分析

E 假设检验

4.下列关于假设检验的陈述正确的是()。

A 假设检验实质上是对原假设进行检验;

B 假设检验实质上是对备择假设进行检验;

C 当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误;

D假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更有可能正确;

E 当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确

5.选择一个合适的检验统计量是假设检验中必不可少的一个步骤,其中“合适”实质上是指()

A 选择的检验统计量应与原假设有关;

B 选择的检验统计量应与备择假设有关;

C 在原假设为真时,所选的检验统计量的抽样分布已知;

D 在备择假设为真时,所选的检验统计量的抽样分布已知;

E 所选的检验统计量的抽样分布已知,不含未知参数。

6.关于t检验,下面正确的说法是()。

A t检验实际是解决大样本均值的检验问题;

B t检验实际是解决小样本均值的检验问题;

C t检验适用于任何总体分布;

D t检验对正态总体适用;

E t检验要求总体的σ已知。

四、名词解释

1.零假设2.第一类错误3.第二类错误4.显著性水平

5.总体参数6.检验统计量7.中心极限定理

五、判断题

1.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危险不变的情况下,减少犯第二类错误的危险。()2.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。()3.检验的显著性水平(用α表示)被定义为能允许犯第一类错误的概率,它决定了否定

域的大小。 ( )

4.第一类错误是,零假设H 0实际上是错的,却没有被否定。第二类错误则是,零假设H 0实际上是正确的,却被否定了。 ( )

5.每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合 适。 ( )

六、计算题

1.根据统计,北京市初婚年龄服从正态分布,其均值为25岁,标准差为5岁,问25岁到30岁之间结婚的人;其百分数为多少?

2.共有5000个同龄人参加人寿保险,设死亡率为0.1%。参加保险的人在年初应交纳保险费10元,死亡时家属可领2000元。求保险公司一年内从这些保险的人中,获利不少于30000元的概率。

3.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有:,871元=X 元,21=S 问能否证明统计报表中人均收入μ=880元是正确的(显著性水平α=0.05)。

4.某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表显示的人均收入的数字有误(取显著性水平α=0.05)。

5.已知初婚年龄服从正态分布,根据9个人的抽样调查有:5.23=X (岁),3=S (岁)。问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)?

6.某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(α=0.05)

7.据原有资料,某城市居民彩电的拥有率为60%,现根据最新100户的抽样调查,彩电的拥有率为62%。问能否认为彩电拥有率有所增长?(α=0.05)

8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。但有16个小组,将它们配对成一个实验组和控制组,实验组和控制组各有8个小组,问怎样用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平0.05,请指出否定域。

9.孟德尔遗传定律表明:在纯种红花豌豆与白花豌豆杂交后所生的,子二代豌豆中,红花对白花之比为3:1。某次种植试验的结果为:红花豌豆352株,白花豌豆96株。试在α=0.05的显著性水平上,检定孟德尔定律。

10.一个样本容量为50的样本,具有均值10.6和标准差2.2,要求:

(1) 请用单侧检验,显著性水平0.05检验总体均值为10.0的假设;

(2)请用双侧检验,显著性水平0.05检验总体均值为10.0的假设;

(3)请比较上述单、双侧检验犯第一类错误和犯第二类错误的情况。

11.设要评价某重点中学教学质量情况,原计划升学率为60%,在高校录取工作结束后,现在一个由81个学生组成的随机样本中,发现升学率55%,用显著性水平为0.02,你能否就此得出该校的工作没有达到预期要求的结论。为什么?

12.在重复抛掷一枚硬币49次的二项试验中,试求成功29次的概率?

13.某市2003年居民的户均收入是3500元,为了了解该市居民2004年的收入情况,有关调查部门作了一个共100户的收入情况的抽样调查,样本户均月收入为3525,标准差为100元。据此,你有多大把握说该市居民户均收入是增加了。

14.某单位共有5名孕妇,求以下概率(设婴儿性别男为22/43,21/43):

(1)全为男婴;(2)全为女婴;(3)3男2女。

15.某地区回族占全体居民人数的6%,今随机抽取10位居民,问其中恰有2名是回族的概率是多少?

16.工人中吸烟的比例为0.5%。某车间有工人300名,求以下概率:

(1)全部吸烟;(2)2人吸烟;(3)100人吸烟;(4)160人吸烟。

17.某工厂总体的10%是技术人员,求7人委员会中4人是技术员的概率,并指出检验所需的假设。

18.设某股民在股票交易中,每次判断正确的概率是60%。该股民最近作了100次交易。试求至少有50次判断正确的概率。

19.某市去年的数字显示:进城农民工参加社保的比例是30%。今年在进城农民工中

随机抽取400人进行调查,经计算得该样本总体的参保率为33%,试在 =0.05的显著性水平上,检定“今年该市农民工参保情况有了改进”的零假设。

20.根据调查,儿童的智商分布为N(100,102),某幼儿园共有儿童250名,问智商在110 ~ 120之间的儿童共有多少名?

21.根据调查,女大学生的身高分布为N(163,62),某大学共有女大学生1500名,问身高在164 ~ 168厘米之间的女大学生共有多少名?

22.已知连续型随机变量X~N(0,1),求

(1)概率P{X=1};

(2)概率P{0

(3)概率P{X<-1.5;

(4)概率P{X>1.2};

(5)概率P{X≤1};

(6)概率P{X≥3}.

23.某批袋装大米重量X kg 是一个连续型随机变量,它服从参数为kg kg 1.0,10==σμ的正态分布,任选1袋大米,求这袋大米重量9.9kg ~10.2kg 之间的概率.

24.某批螺栓直径X cm 是一个连续型随机变量,它服从均值为0.8cm 、方差为0.0004cm 2的正态分布,随机抽取1个螺栓,求这个螺栓直径小于0.81cm 概率.

25. 某省文凭考试高等数学成绩X 分是一个离散型随机变量,近似认为连续型随机变量,它服从正态分布N (58,102

),规定考试成绩达到或超过60分为合格,求:

(1)任取1份高等数学试卷成绩为合格的概率;

(2)任取3份高等数学试卷中恰好有2份试卷成绩为合格的概率.

26. 已知连续型随机变量X ~N (3,4),求:

(1)概率}53{≤<-X P ;

(2)概率P {3-X >3.92};

(3)数学期望E (-X +5);

(4)方差D (-X +5)。

七、问答题

1.简述中心极限定理。

2.试述正态分布的性质与特点。

参考答案

一、填空

1.正态2.显著性水平3.大小

4.N( np ,npq ) 5.1.65 6.0.033

二、单项选择

1.B 2.C 3.D 4.C 5.D

6.D 7.C 8. A 9.C 10.B

三、多项选择

1.AB 2.CD 3.BE

4.ACDE 5.ACE 6.BD

四、名词解释

1.零假设:

概率分布的具体形式是由假设决定的,假设肯定不止一个。在统计检验中,通常把被检验的那个假设称为零假设(或称原假设,用符号H0表示),并用它和其他备择假设(用符号H1表示)相对比。

2.第一类错误:

零假设Ho实际上是正确的,却被否定了。

3.第二类错误:

零假设Ho实际上是错误的,却没有被否定。

4.显著性水平:

能允许犯第一类错误的概率叫做检验的显著性水平,它决定了否定域的大小。

5.总体参数:

已知一总体分布,可求得它的特征值。根据总体分布计算的特征值,即根据总体各个单位标志值计算的统计指标,在推论统计中称为总体参数。总体均值和总体标准差(或方差)是反映总体分布特征最重要的两个总体参数,习惯上分别记作μ和σ(或σ2)。

6.检验统计量:

检验统计量是关于样本的一个综合指标,但与参数估计中讨论的统计量有所不同,它不用作估测,而只用作检验。

7.中心极限定理:

μ和方差2σ的总体(可以具有任何形式)中重复抽取容量如果从一个具有均值

为n 的随机样本,那么当n 变得很大时,样本均值的抽样分布接近正态,并具有均值μ和方差2σ/n 。

五、判断题

1. ( √ ) 2.( √ ) 3.( √ )

4. ( × ) 5.( × )

六、计算题

1.【84.13%】

【34.13%】

已知μ=25,σ=5,z 1=

σμ-1x =52525-=0 z 2=σμ

-2x =5

2530-=1 P (z 1≤Z ≤z 2)=P (0≤Z ≤1)=0.3413

2.【98.75%】

3.不能,因为Z=-3.03<-1.96,所以否定原假设μ=880

4. 可以,因为Z=3.75〉1.96,所以可以拒绝原假设μ=3030,即可以认为统计报表有误

5.可以,因为t=3.2998〉1.8595,所以可以拒绝原假设μ=20,可以认为平均初婚年龄已超过20岁。

6.

1H 0.75,H 0.75?=<。=0.05,Z 1.65αα=。Z ==-2.77<-1.65.所以拒绝原假设,接受备择假设。

7.不能,因为Z=0.408<1.65,所以接受原假设p=60%,不能认为彩电拥有率有所增长

8.在社会研究的实验法中,此为“双组实验设计”,其步骤是:1)用匹配或随机指派的方法将实验对象一半分到控制组一半分到实验组;2)对实验组实施实验刺激但不对控制组实施这种刺激;3)然后同时对控制组和实验组进行测量,即后测;4)在比较和分析两个组后测结果之间的差别,得出实验刺激的影响。由此,我们先将16个组两两匹配,得到8个配对组(要使每个配对组在除实验变量之外的其他方面尽量相似)。然后在每个配对组中任取一组安排于实验组,另一组安排于控制组。接着,在4-8年的时间内,让分到实验组的8组人接受某种手段,如共同游戏,而控制组的8组人则没有这样做。而后对每个配对组分别进行后度测量,并用“+”号表示实验组比控制组好的那些配对组,用“-”表示实验组比控制组差的那些配对组。除非度量方法很粗燥,每配对组应该都能判断出差异。这样便可以用二项分布做实验无效的检验了。

0H :p=0.5,1H :p>0.5,选用0.1的显著性水平。()()78P P 0.03910.1+=<,()()()678P P P 0.1836>0.1++=,所以否定域由7个“+”和8个“+”组成,即对每配对组进行后测度量,如出现7个“+”和或8个“+”时,在0.1的显著性水平上,我们将否定零假设,说明实验有效。否则就不能否定零假设,也就是说实验无效

9. 3:p 4H ?=,13:p 4H ≠。20.05,Z 1.96αα==,

3523Z -==1.75<1.96,所以保留原假设

10.1)1.65<1.928,所以否定原假设,接受备择假设均值为10.6

2)1.928<1.96,所以不能否定原假设,仍接受总体均值为10.0

3)在方向可知时,同样犯第一类错误概率的情况下,单侧检验比双侧检验能减少犯第二类错误的概率

11. -0.918>-1.65,(题目中条件显著性水平为0.02应改为0.2计算时用单侧检验)所以不能否认原假设p=60%

12. 29292049C 0.50.5

13. 在α=0.05进行双侧检验时,Z=2.5>1.96,有95%的把握

14.(1)【52243?? ???】;(2【52143?? ???】;(3)【2

33543214322??

? ????? ??C 】。 15.【0.099】

16.(1)【3000030095.005.0C 】;(2)【2982230095.005.0C 】;(3)【20010010030095.05.0C 】;

(4)【3000030095.005.0C 】

17.34479.01.0C =0.00255,p=0.26%,1H 0.1,H 0.1?=≠ 18. 0.9793

19. 单侧检验时,Z=1.31<1.65,所以不能否定原假设,即不能认为今年农民工参保情况有了改进

20. 34

21. 343

22.

(1) Z =

σμ-X =101-=1,连续变量秋点概率无意义? (2)

0.49865 (3)

0.5-0.4332=0.0668 (4)

0.5-0.3849=0.1151 (5)

0.3413*2=0.6826 (6) 2(0.5-0.49865)=0.0027

23. 0.136

已知μ=10,σ=0.1,z 1=σμ

-1x =1

z 2=σμ

-2x =2

P (9.9≤X ≤10.2)=P (z 1≤Z ≤z 2)=P (1≤Z ≤2)=0.4773-0.3413=0.136

24. 69.15%

已知μ=0.8,σ=0.02, z =σμ

-x =02

.08.081.0-=0.5 P (X<0.81)=P (Z ≤0.5)+0.5=0.1915+0.5=0.6915

25. (1)0.4207

已知μ=58,σ=10, z =σμ

-x =10

5860-=0.2 P (60≤X )=0.5-P (Z ≤0.2)=0.5-0.0793=0.4207

(2) 12235793.04207.0C

26.

(1) 0.83995

已知μ=3,σ=2, z 1=-3,z 2=1, P (-3Z ≤1)=0.49865+0.3413=0.83995

(2) 0.95

-0.923.92}=0.475*2=0.95

(3) 2

-E(X)+5=-3+5=2

(4) -4

-D(X)+D(5)=-4

七、问答题

1.简述中心极限定理。

中心极限定理的具体内容是:如果从任何一个具有均值μ和方差σ2的总体(可以具有任何分布形式)中重复抽取容量为n 的随机样本,那么当n 变得很大时,样本均值X 的抽样分

布接近正态,并具有均值μ和方差n

2

σ。 2.试述正态分布的性质与特点。

(1)正态曲线以X =μ呈钟形对称,其均值、中位数和众数三者必定相等。

(2) ?(X =x )在X =μ处取极大值。X 离μ越远,?(X =x )值越小。这表明对于同样长度的区间,当区间离μ越远,X 落在这个区间的概率越小。正态曲线以X 铀为渐近线,即?(X =x )在| X |无限增大时趋于零,即-∞→x lim ?(x )=0或+∞

→x lim ?( x )=0。 (3)对于固定的σ值,不同均值μ的正态曲线的外形完全相同,差别只在于曲线在横轴方向上整体平移了一个位置(参见图7.3)。

(4)对于固定的μ值,改变σ值,σ值越小,正态曲线越陡峭;σ值越大,正态曲线越低平(参见图7.4)。

(5)正态分布的数学期望E(X)=μ,变异数D(X)=σ2,

广东财经社会统计学期末考试试卷(A卷)

广东财经社会统计学期末考试试卷(A卷) 一、单项选择题(请将正确选项的序号填在答题纸相应的位置。) 1.社会统计中的变量一般分四个层次,其中最高层次的变量是 D 。 A、定类变量 B、定序变量 C、定距变量 D、定比变量 2.标准正态分布的均值一定 C 。 A、等于1 B、等于-1 C、等于0 D、不等于0 3.计算中位值时,对于未分组资料,先把原始资料按大小顺序排列成数列,然后用公式 D 确定中位值所在位置。 A、n/2 B、(n-1)/2 C、(n+2)/2 D、(n+1)/2 4.下列统计指标中,对极端值的变化最不敏感的是 A 。 A、众值 B、中位值 C、四分位差 D、均值 5.如果原假设是总体参数不小于某一数值,即大于和等于某一数值,应采用的检验是。 A、两端检验 B、右端检验 C、左端检验 D、无法判断 6.在一个右偏的分布中,大于均值的数据个数将。 A、不到一半 B、等于一半 C、超过一半 D、视情况而定 7.下列关于“回归分析和相关分析的关系”的说法中不正确的是。 A、回归分析可用于估计和预测 B、相关分析是研究变量之间的相互依存关系的密切程度 C、相关分析不需区分自变量和因变量 D、回归分析是相关分析的基础 8.假定男性总是与比自己年轻3岁的女性结婚,那么夫妻年龄之间的积距相关系数r为。 A、-1 < r< 0 B、0 < r< 1 C、r = 1 D、r = -1 9.“4、6、8、10、12、26”这组数据的集中趋势宜用测量。 A、众值 B、中位值 C、均值 D、平均差 10.某校期末考试,全校语文平均成绩为80分,标准差为4.5分,数学平均成绩为87分,标准差为9.5分。某学生语文得了83分,数学得了92分,从相对名次的角度看,该生的成绩考得更好。 A、数学 B、语文 C、两门课程一样 D、无法判断 三、判断题(请在答题纸相应位置打√或?。) 1.无论分布曲线是正偏还是负偏,中位值都居于均值和众值之间。 2.一组数据的均值代表了该组数据中大多数的数据。 3.对于连续型随机变量,讨论某一点取值的概率是没有意义的。 4.异众比率越大,各变量值相对于众值越离散,众值的代表性越好。 5.只要样本量足够大,则不论总体分布如何,样本均值的抽样分布都服从正态分布。 6.检验均值差异时,独立样本采用“差的均值”、关联样本采用“均值的差”进行检验。 7.在显著性水平既定的情况下,一端检验比两端检验更容易拒绝H0。 8.不管相关关系表现形式如何,当r=1时,变量X和变量Y都是完全相关;当r=0时,变量X 和变量Y都是完全不相关。 9.方差分析就其内容来说,是分析或检验总体间的均值是否存在差异。 10.纳伪的概率β可以根据原假设H0所设的分布计算出来。 1

社会统计学复习题(有答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=-=-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% +=-=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。 10、从内容上看,统计表由 主词 和 宾词 两个部分组成;从格式上看,统计表由 总标题 、 横行标题 、 纵栏标题 和 指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于 正 相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于 负 相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于 数量 指标;单位成本属于 质量 指标。 13、如果相关系数r=0,则表明两个变量之间 不存在线性相关关系 。 二、判断题

社会统计学讲义

《社会统计学》讲义 教学目的和要求: 通过本课程的学习,使学生熟悉常用的统计方法,并且学会如何将统计分析知识应用于社会调查研究之中,掌握统计方法的灵活运用。本课程偏重统计方法的实际应用,而非其数理基础。在教学过程中,注重对于不同统计分析方法适用条件的说明,统计公式的讲解,以及对于统计值意义的说明。 教学重点和难点: 本课程的教学重点是不同统计分析方法所适用的条件以及统计值意义的解释。难点是统计公式的讲解以及不同统计分析方法在实际社会调查研究中的应用。 教法特点说明: 课堂讲授为主,注重对实例的讲解。 教材和参考书目: 1、卢淑华著:《社会统计学(第三版)》,北京大学出版社,2007年。 2、李沛良著:《社会研究的统计应用》,社会科学文献出版社,2002年。 3、柯惠新等著:《调查研究中的统计分析法》,北京广播学院出版社,1992年。 4、风笑天著:《现代社会调查方法》,华中科技大学出版社,2001年。 5、袁方主编:《社会研究方法教程》,北京大学出版社,1997年。

第一章统计学简史 教学目的和要求: 通过本章的学习使学生了解统计学的产生、发展历程有初步的认识。 教学重点和难点: 重点是国势学派与政治算数学派的差异,难点是文字记述与数字记述各自的特点。 教学方法: 课堂讲授 教学内容: 一、统计学的起源 统计技术:古埃及、古中国(大禹治水) 统计学:17世纪中叶Status(拉丁词汇,国家、状态)——Statistics 研究国家的宏观状态①国势学②政治算术 二、国势学(17世纪的德国) 德国大学学派:H·Coring 用文字记录一个国家的状况和制度 G·Achenwall 第一个定义——把国家的显著事项全部记录 下来的学科 三、政治算术(17世纪的英国) 英国的经验主义者:用数量或数字的方法说明国家的特征 J·Graunt 《关于伦敦死亡表的观察》用数量分析社 会、政治问题 William Petty 《政治算术》 四、概率论(数理特征更加明显) 1.J Bernoulli(贝努里)瑞士大数法则借助大数法则可以从社会现象复杂 不定的偶然性中寻找规律,它说明了社会现象的稳定性 2.Gauss(高斯)德国正态分布(中心极限定理的基础) 五、数理统计学 Adolphe Quetelet(阿道夫·凯特勒)法籍比利时人 数理统计学派的创始人“经验社会学之父”《社会物理学》

2018年春社会统计学期末复习训练题

2018年春社会统计学期末复习题 、单项选择题 1. 以下关于因变量与自变量的表述不正确的是() A. 自变量是引起其他变量变化的变量 B. 因变量是由于其他变量的变化而导致自身发生变化的变量 C. 自变量的变化是以因变量的变化为前提 D. 因变量的变化是以自变量的变化为前提 2. 在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为 () A. 频率 B. 累积频数 C. 累积频率 D. 比率 3. 离散系数的主要目的是() A. 反映一组数据的平均水平 B. 比较多组数据的平均水平 C?反映一组数据的离散程度 D.比较多组数据的离散程度 4. 经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A. 50%勺数据

B. 68%勺数据 C. 95%勺数据 D. 99%勺数据 5?在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25. 0、26.9、29.0,那么这10家企业7月份利润额均值为() A. 39.19 B. 28.90 C. 19.54 D. 27.95 6. 用样本统计量的值直接作为总体参数的估计值,这种方法称为() A. 点估计 B?区间估计 C. 有效估计 D. 无偏估计 7. 在频数分布表中,比率是指() A. 各组频数与上一组频数之比 B. 各组频数与下一组频数之比 C?各组频数与总频数之比 D.不同小组的频数之比 8. 下面哪一项不是方差分析中的假定() A. 每个总体都服从正态分布

B. 观察值是相互独立的 C?各总体的方差相等 D.各总体的方差等于0 9. 判断下列哪一个不可能是相关系数( A. -0.9 B. 0 C. 0.5 D. 1.2 10. 用于说明回归方程中拟合优度的统计量主要是() A. 相关系数 B. 离散系数 C?回归系数 D.判定系数 11. 在假设检验中,不拒绝虚无假设意味着() A. 虚无假设是肯定正确的 B?虚无假设肯定是错误的 C?没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12. 下列变量属于数值型变量的是() A. 工资收入 B?产品等级 C?学生对考试改革的态度

社会统计学复习题(有答案)复习课程

社会统计学复习题(有 答案)

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产 品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。 9、按照标志表现划分,学生的民族、性别、籍贯属于 品质 标志;学生的体重、年龄、成绩属于 数量 标志。

社会统计学习题和答案--相关与回归分析报告

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE )·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对和同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔和谐系数 第四节 定距变量的相关分析 相关表和相关图·积差系数的导出和计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,依变量则一般是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 是服从( );(2)分布中围绕每个可能的c Y 值的( )是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。自变量是作为( 变化根据 )的变量,因变量是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计和预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 是( 协方差 )与X 和Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关

周飞舟《社会统计学》课程大纲

《社会统计学》课程大纲 讲授教师:周飞舟Email: sociologist@https://www.doczj.com/doc/dd12444280.html, 助教:廖勤樱Email:liaoqinying@https://www.doczj.com/doc/dd12444280.html, 课程介绍 统计是社会科学研究中广泛采用的定量分析方法。本课程系统地介绍了社会统计学的基本原理、基本概念和主要内容,按照变量的四个测量层次(定类、定序、定距和定比),课程详细阐述了统计描述和统计推论的操作程序和具体方法,并结合生动的实例说明了统计分析在社会研究中的作用和地位。作为一门初中级社会统计学课程,本课程内容限定在单变量和双变量统计范围之内。 教学大纲 指导思想: 社会现象的独特性和社会研究方法的特点决定了统计在社会研究中的重要地位,统计也因此而成为社会研究的重要工具和重要手段。近十几年来,统计理论、统计方法和统计手段迅速发展,其应用范围也越来越广泛。本课程的目的就是为深入这一领域建立一个基础和平台,即对统计的基本概念、原理、类型、方法、程序、作用等有基本的和概括了解与把握,并能应用这些知识对研究问题进行简单的统计分析。本课程的教与学强调:第一,社会研究是一项系统的和严谨的工作,从研究设计→资料收集→资料整理分析→撰写研究报告,各个步骤之间相互联系、相互影响,密不可分。统计分析作为研究的一个重要环节,只有放在社会研究过程的背景之下,注重其与研究问题及研究方法的联系,才能更准确地掌握每一种统计类型和统计方法的特征,才能针对具体的研究问题选择恰当的统计方法。 第二,作为一门应用性极强的课程,本课程特别强调理论联系实际的原则,在教与学的过程中,一方面教师要通过列举和分析大量研究和应用实例,深化学生对统计原理的和统计思想的理解;另一方面要求学生将学习到的知识不断运用到对实际社会问题的分析中去。为此,要求学生在学习课程讲授的知识的同时,认真完成每一讲后面所指定的“实践性”的练习。 第三,在实际的社会研究中,资料的统计分析都是通过计算机完成的。各种统计描述和统计分析方法被制作成用于计算机的专门的和通用的统计软件,如SPSS、SAS、STATE等。本课程将熟练掌握和灵活运用上述统计软件作为本课程教与学的不可分割的一部分,课程所指定的各种“实践性”练习(包括作业)要求尽量在计算机上完成。 第四,课程中介绍的各种具体的统计方法和统计技术,都有其优点和某些局限性,适用于一定的研究目的和分析要求。因此,在课程学习过程中,不仅需要对每一种方法和技术的特点、实施程序和适用范围有清楚的了解,而且也需要认识各种方法与技术之间的异同点,以便能够在面对不同的社会现象和不同的研究目的时,正确、灵活地选择和运用相应的方法与技术。 第五,统计分析是一种定量分析方法,对于统计结果的理解和解释需要联系其它调查资料,如研究对象所处社会的背景状况、所研究问题的特定意义、调查对象的特点等等来进行。对统计结果的解释和使用应当遵循实事求是的原则,杜绝弄虚作假,这是每一个从事社会研究的人员均应该严格遵循的规范。 目的要求: 通过本课程的学习,掌握统计的基本概念、原理、类型、方法、程序、作用以及应用等。能

社会统计学教学大纲

社会统计学教学大纲 课程名称:社会统计学 英文名称:social statistics 课程编号:12600722j 使用专业:社会工作专业 总学时数:48学时 总学分:3学分 大纲撰写人:文法学院社工系马永方 内容简介 社会统计学是社会学主干课之一,与社会学调查研究方法结合起来,完整地介绍了当代社会调查研究的科学方法和资料处理技术。社会统计学则侧重介绍资料的收集、整理、分析和推论的处理技术。从事社会工作研究理论和实践的人都有必要掌握社会统计学这门有用的工具。 本课程共7章。第一章导论,介绍社会统计学和相关概念,第二章统计资料的搜集,第三章统计资料的整理,第四章到第七章是统计分析。第四章和第五章是描述统计,第六到第七章是统计推断,第六章概率论是统计推断的基础,统计推断有两个基本内容:假设检验第七章。 一、讲授的主要内容 第一章社会学研究和统计分析(2学时) 第一节社会学研究的科学性 第二节社会调查资料的特点和统计学的运用 第二章单变量统计描述分析 第一节分布统计表统计图 第二节集中趋势测量法 第三节离散趋势测量法 第三章概率(3学时) 第一节基础概率 第二节概率分布、均值和方差 第四章二项分布及其他离散型随机变量的分布(3学时) 第一节二点分布 第二节排列与组合 第三节二项分布 第四节多项分布 第五节超几何分布 第六节泊松分布 第五章正态分布、常用统计分布和极限定理(3学时) 第一节什么是正态分布 第二节标准正态分布 第三节标准正态分布表的使用 第四节常用统计分布 第五节大数定理和中心极限定理 第六章参数估计(4学时) 第一节名词解释 第二节参数的点估计

第四节正态总体的区间估计 第五节大样本区间估计 第七章假设检验(4学时) 第一节统计假设 第二节统计检验的基本步骤 一、建立假设 二、求抽样分布 三、选择显著性水平和否定域 四、计算检验统计量 五、判定 第八章单总体假设检验(4学时) 第一节大样本假设检验 第二节小样本假设检验 第九章二总体假设检验 第一节引言 第二节大样本二总体假设检验 第三节小样本二总体假设检验 第十章列联表(4学时) 第一节什么是列联表 第二节列联表的检验 第三节列联强度 第十一章等级相关(定序变量之间)(4学时)第一节斯皮尔曼等级相关系数 第二节Gamma等级相关 第三节其他等级相关系数 第十二章回归与相关(6学时) 第一节回归研究的对象 第二节回归直线方程的建立与最小二乘法 第三节回归方程的假定与检验 第四节相关 第五节用回归方程进行预测 第十三章方差分析(3学时) 第一节引言 第二节一元方差分析 第三节二元方差分析 第四节多元方差分析 第十四章非参数检验(4学时) 第一节非参数检验 第二节符号检验 第三节符号秩检验 第四节累计频次检验 第十五章抽样(4学时) 第一节引言 第二节抽样调查方法

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

社会统计学期末复习提纲

《社会统计学》课程期末复习提纲 ·考试题型: 一、填空题(10×1分=10分)二、判断题(10×1分=10分) 三、单项选择题(20×1分=20分)四、简答题(2×6分=12分)五、计算题(4题共48分) ·各章复习要点 第一章总论 P.2 统计的含义:统计工作·统计资料·统计学。其中:统计工作和统计资料是活动过程和成果的关系;统计学和统计工作是理论和实践的关系。 “统计”一词包含三种涵义,并且具有密切的联系。其中:统计工作和统计资料之间是工作与成果的关系;统计学和统计工作之间是理论和实践的关系。(y ) P.11—P.13 定类尺度;定序尺度;定距尺度;定比尺度(结合课件相关内容) 量化尺度特征功能举例 1、定类尺度确定类别分类民族的测量 2、定序尺度确定类别排列顺序分类排序考试成绩等级的测量 3、定距尺度确定类别排列顺序测数量差别和间隔距离无绝对零点分类排序加减智商的测量 4、定比尺度确定类别有序排序测数量差别和间隔距离有绝对零点分类排序加减乘除体重的测量何谓定类尺度和定序尺度?两者有何区别?1定类尺度是确定事物类别的计量尺度---高一个层次 2定类只能区分不同性质的现象并予以归类---可将所区分的类别按高低,大小,好坏,强弱,优劣等顺序做有序排列。 3定类不能进行数的比较和数学运算--能进行大小比较。 何谓定距尺度和定比尺度?两者区别定距尺度是确定研究对象之间某些数值相差的距离的尺度---最高的数据计量尺度 缺乏绝对零点---有,0 2. 0只表示一个值,即0值---0是绝对零点,表示没有 3.只能加减,不能乘除---加减乘除,高层次的各种统计分析。 P.13—P.14 总体和总体单位 一、总体和总体单位 (一)总体 1、概念总体(也称为统计总体)是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体(同质个体的集团)。 2、特点·客观性·大量性同质性·差异性 1、总体单位除了必须具备同质性外,还必须具备1、差异性(或变异性)性,否则

社会统计学复习题有答案

社会统计学复习题有答 案 集团标准化工作小组 #Q8QGGQT-GX8G08Q8-GNQGJ8-MHHGN#

社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为 比较 相对指标;某企业男女职工人数之比为 比例 相对指标;某产品的废品率为 结构 相对指标;某地区福利机构网点密度为 强度 相对指标。 2、各变量值与其算术平均数离差之和为 零 ;各变量值与其算术平均数离差的平方和为 最小值 。 3、在回归分析中,各实际观测值y 与估计值y ?的离差平方和称为 剩余 变差。 4、平均增长速度= 平均发展速度 —1(或100%)。 5、 正J 形 反J 形 曲线的特征是变量值分布的次数随变量值的增大而逐步增多; 曲线的特征是变量值分布的次数随变量值的增大而逐步减少。 6、调查宝钢、鞍钢等几家主要钢铁企业来了解我国钢铁生产的基本情况,这种调查方式属于 重点 调查。 7、要了解某市大学多媒体教学设备情况,则总体是 该市大学中的全部多媒体教学设备 ;总体单位是 该市大学中的每一套多媒体教学设备; 。 8、若某厂计划规定A 产品单位成本较上年降低6%,实际降低了7%,则A 产品单位成本计划超额完成程度为 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度 ;若某厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程度为 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度 。

9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位产品成本与产品产量的相关关系属于负相关。 12、按指标所反映的数量性质不同划分,国民生产总值属于数量指标;单位成本属于质量指标。 13、如果相关系数r=0,则表明两个变量之间不存在线性相关关系。 二、判断题 1、在季节变动分析中,若季节比率大于100%,说明现象处在淡季;若季节比率小于100%,说明现象处在旺季。(×;答案提示:在季节变动分析中,若季节比率大于100%,说明现象处在旺季;若季节比率小于100%,说明现象处在淡季。 ) 2、工业产值属于离散变量;设备数量属于连续变量。(×;答案提示:工业产值属于连续变量;设备数量属于离散变量) 3、中位数与众数不容易受到原始数据中极值的影响。(√;) 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√)

《社会统计学》课程教学大纲

《社会统计学》课程教学大纲 二、课程简介(不超过300字) 社会统计学是“统计学”与“社会研究”的结合,它是从数量方面描述社会状况,旨在探讨如何将统计学的方法应用于社会研究当中,是一门宏观性方法论学科。社会统计学的研究是以社会生活与社会发展的综合研究为重心,以区别于专业统计。 通过本课程的学习,使学生能够运用已学过的传统的统计方法,从数量方面描述社会状况、社会发展和有关的社会问题,能够利用综合评价方法从宏观角度说明社会生活与社会发展的相关问题,能够从宏观口径出发研究社会发展某一具体方面对社会发展的影响程度。 社会统计学是行政管理与劳动与社会保障专业必修的一门专业基础课程。 三、知识点 (一)基本知识点 在社会研究当中,最常用的结构化的经验资料是问卷调查数据,本课程主要关注问卷调查数据的统计分析。本课程内容主要围绕如何描述变异、如何解释变异以及如何将这种描述和解释由样本推论至总体展开。分为描述性统计和推论性统计两个部分。 基本要求:掌握常用的统计方法,并尽量将统计分析与社会问题相结合,强调统计法的应用性而非数理基础,力求让学生在现实中会用这些统计方法,并初步了解这些统计方法在SPSS中的操作过程。 (二)重要知识点 主要包括:社会统计的方法、社会统计工作的程序、描述统计与推论统计;统计调查的组织形式、信度和效度、定类测量、定序测量、定距测量、定比测量、统计误差;穷举与互斥、频数分布数列、变量数列的编制;算术平均数、中位数、众数;全距与全距的性质、四分位差、平均差及其性质、标准差及其性质、方差、标准分、变异系数、异众比率;变量之间的相互关系、列联表、消减误差比例(PRE)、λ系数、τ系数、同序对、异序对、同分对、G系数、相关表与散点图、极差系数及其性质、线性回归、判定系数;随机现象和随机事件、概率的数学性质、概率分布、数学期望;点估计值的标准、区间估计、简单随机抽样;统计检验的基本步骤、总体均值和成数的单样本检验 四、基本要求 (一)知识要求(熟练掌握、掌握、理解、了解) 第一章导论(4学时) 知识要求:熟练掌握社会统计的方法、社会统计工作的程序、描述统计与推论统计,掌握总体与单位、标志与变量、指标与指标体系

2013春社会统计学期末复习训练

2013春社会统计学期末复习训练 一、单项选择题 1.为了解IT行业从业者收入水平,某研究机构从全市IT行业从业者随机抽取800人作为样本进行调查,其中44%回答他们的月收入在6000元以上,30%回答他们每月用于娱乐消费在1000元以上。此处800人是() A.样本B.总体C.统计量D.变量 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率B.累积频数C.累积频率D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平B.比较多组数据的平均水平 C.反映一组数据的离散程度D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减1个标准差的范围之内大约有() A.50%的数据B.68%的数据C.95%的数据D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计B.区间估计C.有效估计D.无偏估计 7.某单位对该厂第一加工车间残品率的估计高达10%,而该车间主任认为该比例 ()偏高。如果要检验该说法是否正确,则假设形式应该6为() A.:≥0.1; :<;0.1 B.:≤0.1; :>0.1 C.:=0.1; :≠0.1 D.:>0.1; :≤0.1 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布B.观察值是相互独立的 C.各总体的方差相等D.各总体的方差等于0 9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是()

2018年春社会统计学期末复习训练题 (4)

2018年春社会统计学期末复习题 一、单项选择题 1.以下关于因变量与自变量的表述不正确的是() A.自变量是引起其他变量变化的变量 B.因变量是由于其他变量的变化而导致自身发生变化的变量 C.自变量的变化是以因变量的变化为前提 D.因变量的变化是以自变量的变化为前提 2.在频数分布表中,将各个有序类别或组的百分比逐级累加起来称为() A.频率 B.累积频数 C.累积频率 D.比率 3.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 4.经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有() A.50%的数据 B.68%的数据 C.95%的数据

D.99%的数据 5.在某市随机抽取10家企业,7月份利润额(单位:万元)分别为 72.0、63.1、20.0、23.0、54.7、54.3、23.9、25.0、26.9、29.0,那么这10家企业7月份利润额均值为() A.39.19 B.28.90 C.19.54 D.27.95 6.用样本统计量的值直接作为总体参数的估计值,这种方法称为() A.点估计 B.区间估计 C.有效估计 D.无偏估计 7.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 8.下面哪一项不是方差分析中的假定() A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于0

9.判断下列哪一个不可能是相关系数() A.-0.9 B.0 C.0.5 D.1.2 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 11.在假设检验中,不拒绝虚无假设意味着() A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 12.下列变量属于数值型变量的是() A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 13.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形()

社会统计学习题和答案--相关与回归分析

第十二章 相关与回归分析 第一节 变量之间的相关关系 相关程度与方向·因果关系与对称关系 第二节 定类变量的相关 双变量交互分类(列联表)·削减误差比例(PRE)·λ系数与τ系数 第三节 定序变量的相关分析 同序对、异序对与同分对·Gamma 系数·肯德尔等级相关系数(τa 系数、τb 与τc 系数)·萨默斯系数(d 系数)·斯皮尔曼等级相关(ρ相关)·肯德尔与谐系数 第四节 定距变量的相关分析 相关表与相关图·积差系数的导出与计算·积差系数的性质 第五节 回归分析 线性回归·积差系数的PRE 性质·相关指数R 第六节 曲线相关与回归 可线性化的非线性函数·实例分析(二次曲线指数曲线) 一、填空 1.对于表现为因果关系的相关关系来说,自变量一般都就是确定性变量,依变量则一般就是( 随机性 )变量。 2.变量间的相关程度,可以用不知Y 与X 有关系时预测Y 的全部误差E 1,减去知道Y 与X 有关系时预测Y 的联系误差E 2,再将其化为比例来度量,这就就是( 削减误差比例 )。 3.依据数理统计原理,在样本容量较大的情况下,可以作出以下两个假定:(1)实际观察值Y 围绕每个估计值c Y 就是服从( );(2)分布中围绕每个可能的c Y 值的( )就是相同的。 4.在数量上表现为现象依存关系的两个变量,通常称为自变量与因变量。自变量就是作为( 变化根据 )的变量,因变量就是随( 自变量 )的变化而发生相应变化的变量。 5.根据资料,分析现象之间就是否存在相关关系,其表现形式或类型如何,并对具有相关关系的现象之间数量变化的议案关系进行测定,即建立一个相关的数学表达式,称为( 回归方程 ),并据以进行估计与预测。这种分析方法,通常又称为( 回归分析 )。 6.积差系数r 就是( 协方差 )与X 与Y 的标准差的乘积之比。 二、单项选择 1.当x 按一定数额增加时,y 也近似地按一定数额随之增加,那么可以说x 与y 之间 存在( A )关系。 A 直线正相关 B 直线负相关 C 曲线正相关 D 曲线负相关 2.评价直线相关关系的密切程度,当r 在0、5~0、8之间时,表示( C )。 A 无相关 B 低度相关 C 中等相关 D 高度相关 3.相关分析与回归分析相辅相成,又各有特点,下面正确的描述有( D )。 A 在相关分析中,相关的两变量都不就是随机的;

统计学期末复习

2、解释分类数据、顺序数据、数值型数据的含义 分类数据,是只能归于某一类别的非数字型数据,他是对数据分类的结果,数据表现为类别, 是用文字表述的。 顺序数据,是只能归于某一有序别的非数字型数据。 数字型数据,是按数字尺度测量的观察值,其结果表现为具体的数值。 2、按照统计数据的收集方法,可以将其分为观测数据和实验数据。(会区分) 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件 下得到的,有关社会经济现象的统计数据几乎都是观测数据。 实验数据:是在实验中控制实验对象而收集的数据 6、非抽样误差的类型有? (1)抽样框误差(2)回答误差(3)无回答误差(4)调查员误差(5)测量误差 8直方图与条形图有何区别 区别:1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。2)由于分组数据具有连续性,直方 图的各矩形通常是连续排练,而条形图则是分开排列。3)条形图主要用于展示分类数据, 而直方图则主要用于展示数值型数据。 9、饼图和环形图有什么不同 饼图是用圆形及圆内扇形的面积来表示数值大小的图形,它主要用于表示总体中各组成 部分所占的比例,对于研究结构性问题十分有用。 环形图与饼图类似,但它们之间也有区别。环形图中间有一个“空洞”,总体或样本中 的每一部分数据由环中的一段表示。饼图只能显示一个总体和样本各部分所占的比例,而环形图则可以同时绘制多个总体或样本的数据系列,每一个总体或样本的数据系列为一个环。因此环形图可显示多个总体或样本各部分所占的相应比例,从而有利于我们进行比较研究。 13、简述中心极限定理的内容 设从均值为卩、方差为d 2 (有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值一的抽样分布近似服从均值为□、方差为d 2/n的正态分布。 14、假设检验和参数估计有什么相同点和不同点?解:参数估计与假设检验是统计推断的两个组成部分。 相同点:它们都是利用样本对总体进行某种推断。 不同点:推断的角度不同。参数估计讨论的是用样本统计量估计总体参数的方法, 总体参数卩在估计前是未知的。而在假设检验中,则是先对卩的值提出一个假设,然后利用样本信息去检验这个假设是否成立。 15、置信区间的理解,有以下几点需要注意: (1 )如果用某种方法构造的所有区间中有95%的区间包含总体参数的真值,5%勺区间不包含总体参数的真值,那么,用该方法构造的区间称为置信水平的95%勺置信区间。 16、简述评价估计量好坏的标准 (1 )无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2 )有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。

(完整版)社会统计学简答题与计算题复习资料

社会统计学复习材料 简答题 1、统计数据的质量要求: 1、精度:最低的抽样误差或随机误差; 2、准确性:最小的非抽样误差或偏差; 3、关联性:满足用户决策、管理和研究的需要; 4、及时性:在最短的时间里取得并公布数据; 5、一致性:保持时间序列的可比性; 6、最低成本:以最经济的方式取得数据。 2、抽样误差及其影响因素: 1、由于抽样的随机性所带来的误差; 2、所有样本可能的结果与总体真值之间的平均性差异; 3、影响抽样误差的大小的因素:样本量的大小,总体的变异性。 3、判断计量优劣的评判标准: 用样本的估计量直接作为总体参数的估计值, 无偏性:估计量抽样分布的数学期望等于被估计的总体参数; 有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效;一致性:随着样本容量的增大,估计量的值越来越接近被估计的总体参数。4、假设检验的一般步骤: (1)陈述原假设和备择假设; (2)从所研究的总体中抽出一个随机样本; (3)确定一个适当的检验统计量,并利用样本数据算出其具体数值;

(4)确定一个适当的显著性水平,并计算出其临界值,指定拒绝域; (5)将统计量的值与临界值进行比较,作出决策; (6)统计量的值落在拒绝域,拒绝H0,否则不拒绝H0。 5、假设检验中的两类错误及其之间的关系 错误: 1、第Ⅰ类错误(弃真错误)原假设为真时拒绝原假设,第Ⅰ类错误的概率记为a ,即显著性 水平; 2、第Ⅱ类错误(取伪错误)原假设为假时未拒绝原假设,第Ⅱ类错误的概率记为b 。 a 和 b 的关系就像翘翘板,a 小b 就大,a 大b 就小。因此,在样本容量n 固定情况下, 不能同时减少两类错误!一般采用增加样本容量的办法来解决。 关系:当显著性水平a 减小时,由于拒绝域的减小,弃真的错误会减小,但由此而来的是 接受域增大了,因此纳伪的概率b 要增大。反之亦然(P235)。也就是说如果要减小b ,就 增大显著性水平a 。 6、置信区间与置信度的关系表达式: ()αεθθεθ -=+≤≤-1??P []εθεθ+-?,?称作置信区间。α-1称作置信度,可信度,或置信水平。α称置信水平。在样本容量一定的情况下,置信区间和置信度是相互制约的。置 信度愈大,则相应的置信区间也域宽。当把区间估计得小一些,估计的精确程度提高了,但换取的代价将是估错的可能性增加了,也就是可靠性或置信度 α-1下降了。(P201) 7、正态分布曲线的特征: (1)一个高峰:曲线是单峰,有一个最高点。 (2)一个对称轴。曲线的高峰处有一个对称轴,在轴的左右两边是对称的。

(完整版)社会统计学复习题(有答案),DOC

o o 海量资源,欢迎共阅 社会统计学课程期末复习题 一、填空题(计算结果一般保留两位小数) 1、第五次人口普查南京市和上海市的人口总数之比为比较相对指标;某企业男女职工人数之比为比例相对指标;某产品的废品率为结构相对指标;某地区福利机构网点密度为强度相 对指标。2最小 值。345、正J 6于 重点7;总 8计划超额完成程度为;若某 100%7% A 100% 1.06%100%6% -=- =-产品单位成本计划超额完成程度厂计划规定B 产品产量较上年增长5%,实际增长了10%,则B 产品产量计划超额完成程 度为。 100%10% 100% 4.76%100%5% += -=+B 产品产量计划超额完成程度9、按照标志表现划分,学生的民族、性别、籍贯属于品质标志;学生的体重、年龄、成绩属于数量标志。

海量资源,欢迎共阅 10、从内容上看,统计表由主词和宾词两个部分组成;从格式上看,统计表由 总标题、横行标题、纵栏标题和指标数值(或统计数值); 四个部分组成。 11、从变量间的变化方向来看,企业广告费支出与销售额的相关关系,单位产品成本与单位产品原材料消耗量的相关关系属于正相关;而市场价格与消费者需求数量的相关关系,单位 13 1 100%, ) 2 3 4、有意识地选择十个具有代表性的城市调查居民消费情况,这种调查方式属于典型调查。(√) 5、统计调查按调查范围划分可以分为全面调查和非全面调查。(√) 6、用移动平均法修匀时间数列时,如果移动项数为偶数项,只要进行一次移动平均;如果移动项数为奇数项,则要进行二次移动平均。(×;答案提示:用移动平均法修匀时间数列 时,如果移动项数为奇数项,只要进行一次移动平均;如果移动项数为偶数项,则要进行二

相关主题
文本预览
相关文档 最新文档