当前位置:文档之家› 统计学第三章知识题

统计学第三章知识题

统计学第三章知识题
统计学第三章知识题

第三章数据分布特征的描述

一、单选题

1. 如果所掌握到的只是各单位的标志值(变量值),这时计算算术平均数()。

A 应用简单算术平均数B应用加权算术平均数

C用哪一种方法无法判断D这种资料不能计算算术平均数

2. 加权算术平均数受什么因素的影响()。

A 只受各组变量值大小的影响B只受各组次数多少的影响

C同时受以上两种因素的影响D无法做出判断

3. 权数本身对加权算术平均数的影响决定于()。

A 权数所在组标志值的大小B权数绝对数值的大小

C各组单位数占总体单位数比重的大小D总体单位数的多少

4. 标志值的次数多少,对于算术平均数的影响有权衡轻重的作用。若把标志值的次数都缩小为原来的十分之一,则算术平均数的值为()。

A 也缩小为原来的十分之一B保持不变C扩大为原来的十倍D无法判断

5. 如果被平均的每一个标志值都增加5个单位,则算术平均数的数值()。

A 也增加5个单位B只有简单算术平均数是增加5个单位

C减少5个单位D保持不变

6. 设某企业在基期老职工占60%,而在报告期准备招收一批青年工人,估计新职工所占的比重将比原来增加20%。假定老职工和新职工的工资水平不变,则全厂职工的总平均工资将如何变化()。

A 提高B降低C不变D无法判断

7. 设有8个工人生产某种产品,他们的日产量(件)按顺序排列是:4、6、6、8、9、12、14、15,则日产量的中位数是()。

A 4.5B8和9 C8.5 D没有中位数

8. 在下列哪种情况下, 算术平均数、众数和中位数三者相等()。

A 只有钟形分布B只有U形分布

C钟形分布或U形分布D只有对称的钟形分布

9. 当变量右偏分布时,有()。

A Mo

B Mo>Me>X

C Mo≤Me≤X

D Mo≥Me≥X

10. 设有某企业职工人数和工资水平资料如下:

报告期的总平均工资低于基期的总平均工资,原因是:()。

A 各组工资水平的变动B各组人数的增加C各组人数结构的变动D职工收入的下降

11. 总体的离散程度越大,说明()。

A 平均数的数值越大B平均数的代表性越大C平均数的数值越小D平均数的代表性越小

12. 平均差的基本含义可表述为()。

A 各数量标志值离差的平均数B各数量标志值离差的平均数

C各数量标志对其算术平均数的离差的绝对值D各数量标志对其算术平均数的平均离差

13. 设篮球运动员的平均身高为198厘米,一年级小学生的平均身高为100厘米。篮球运动员组的身高平

均差为2.6厘米,小学生组的身高平均差为1.8厘米。根据该资料判断()。

A 篮球运动员组身高较均匀B小学生组的身高较均匀

C两组的身高不能比较D无法比较

14. 在计算方差时,如果所有的标志值均缩小到原来的十分之一,则方差()。

A 缩小到原来的十分之一B保持不变

C缩小到原来的百分之一D难以作出判断

15. 平均数为30,标准差为15,则各标志值对常数50的标准差为()。

A 625 B25 C675 D415

16. 根据平均指标的确定方法和依据资料不同主要有五种,其中()。

A 中位数和算术平均数是位置平均数B众数和调和平均数是位置平均数

C算术平均数和几何平均数是位置平均数D中位数和众数是位置平均数

17. 当只有总体标志总量和各标志值,而缺少总体单位资料时,计算平均数应采用()。

A 加权算术平均数公式B简单算术平均数公式

C调和平均数公式D几何平均数公式

18. 标准差指标数值越小,则反映变量值()。

A 越分散,平均数代表性越低B越集中,平均数代表性越高

C越分散,平均数代表性越高D越集中,平均数代表性越低

19. 用组中值代表组内变量值的一般水平有一定的假定性,即()。

A 各组的次数必须相等

B 变量值在本组内的分布是均匀的

C 组中值能取整数

D 各组必须是封闭组

20. 已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销售额基本相同的情况下,计算平均价格可采取的平均数形式是()。

A 简单算术平均数

B 加权算术平均数

C 简单调和平均数

D 加权调和平均数

21. 若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数()。

A 扩大2倍

B 减少到1/3

C 不变

D 不能预期平均值的变化

22. 假定各个标志值都减去20个单位,那么平均值就会()。

A 减少20

B 减少到1/20

C 不变

D 不能预期平均值的变化

23. 如果变量值中有一项为零,则不能计算()。

A 算术平均数

B 调和平均数和几何平均数

C 众数

D 中位数

24. 计算标准差时,如果从每个变量值中都减去任意数a,计算结果与原标准差相较()。

A 变大

B 变小

C 不变

D 可能变大也可能变小

25. 标准差与平均差的区别主要在于()。

A 意义不同

B 计算结果不同

C 计算条件不同

D 对离差的数学处理方式不同

26. 不同总体间的标准差不能进行简单对比,这是因为()。

A 平均数不一致

B 离散程度不一致

C 总体单位不一致

D 离差平方和不一致

27. 两个总体的平均数不等,但标准差相等,则()。

A 平均数小,代表性大

B 平均数大,代表性大

C 两个平均数代表性相同

D 无法加以判断

28. 如果两个数列是以不同的计量单位来表示的,则比较其离差的计量方法是()。

A 极差

B 标准差

C 平均差

D 标准差系数

29. 如果偏度值a小于零,峰度值β小于0,可判断次数分布曲线为()。

A 左偏分布,呈尖顶峰度

B 右偏分布,呈尖顶峰度

C 左偏分布,呈平顶峰度

D 右偏分布,呈平顶峰度

30. 由相对数或平均数计算平均数时()。

A 应该采用算术平均数

B应该采用调和平均数

C采用算术平均数和调和平均数都可以

D采用算术平均数还是采用调和平均数应根据实际所掌握的资料而定

31. 根据分组资料或分配数列计算标准差时,可采用下面的哪个公式较恰当()。

A

()

n

x

x2

-

B

()

f

f

x

x

-

∑2

C

f

f

x

x

-

D

()

f

f

x

x

-

∑2

32. 已知某企业职工工资的分组资料如下:

则该企业职工工资水平的全距近似地表示为()。

A 500元B400元C550元D无法计算其全距

33. 分配数列各组的标志值不变,若每组的次数均增加20%,则加权算术平均数的数值()。

A 相应地增加20% B数值不变化C反而减少20% D无法判断

34. 平均指标是指同类现象在一定时间、地点和条件下()。

A 复杂的总体数量的总和水平

B可比的总体数量的相对水平

C 总体内各单位数量差异抽象化的代表水平 D 总体内各单位数量差异程度的相对水平 35. 算术平均数的分子和分母是( )。 A 两个有联系的而性质不同的总体总量

B 分子是总体单位总量,分母是总体标志总量 C 分子是总体标志总量,分母是另一总体单位总量 D 是同一总体的标志总量和总体单位总量

36. 根据单项式分组数列计算加权算术平均数和直接利用该数列的未分组资料计算简单算术平均数是( )。

A 一致的 B 不一致的 C 某些情况下一致 D 多数情况下不一致 37. 已知某公司所属企业的资金利润率和占用资金额,计算该公式的平均资金利润率应采用( )。 A 简单算术平均数 B 加权算术平均数 C 加权调和平均数 D 几何平均数 38. 在计算平均差时,所以采用离差的绝对值(x x -),这是因为( )。 A

()∑≤-0x x B ()∑≥-0x x C ()∑≠-0x x D ()∑=-0x x

39. 平均差(A.D )的取值范围是( )。

A 0.=D A B 0.≤D A C 0.≥D A D 1.0≤≤D A 40. 标准差(σ)的取值范围是( )。

A 0=σ B 0≤σ C 0≥σ D 10≤≤σ

41. 1990年发表的一篇文章讨论了男性和女性MBA 毕业生起薪的差别。文章称,从前20名商学院毕业的女性MBA 的平均起薪是54749美元,中位数是47543美元,标准差是10250美元。根据这些数据可以判断,女性MBA 起薪的分布形状是( )。

A 尖峰,对称 B 右偏 C 左偏 D 均匀

42. 1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。文章称,从前20名商学院毕业的女性MBA的平均起薪是54749美元,中位数是47543美元,标准差是10250美元。对样本中位数可作如下解释()。

A 大多数女性MBA的起薪是47543美元B最常见到的起薪是47543美元

C样本起薪的平均值为47543美元D有一半女性的起薪高于47543美元

43. 1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。文章称,从前20名商学院毕业的女性MBA的平均起薪是54749美元,中位数是47543美元,标准差是10250美元。对样本标准差可作如下解释()。

A 最高起薪与最低起薪之差是10250美元B大多数的起薪在44499~64999美元之间

C大多数的起薪在37293~57793美元之间D大多数的起薪在23999~85499美元之间

44. 大学生每学期花在教科书上的费用平均为280元,标准差为40元。如果已知学生在教科书上的花费是尖峰对称分布,则在教科书上的花费在160~320元之间的学生占()。

A 大约95%B大约97.35%C大约81.5%D大约83.85%

45. 在某公司进行的计算机水平测试中,新员工的平均得分是80分,标准差是5分,中位数是86分,则新员工得分的分布形状是()。

A 对称的B左偏的C右偏的D无法确定

46. 对在某个高速路段行驶过的120辆汽车的车速进行测量后发现,平均车速是85公里/小时,标准差是4公里/小时,下列可以看作是异常值的车速是()。

A 78公里/小时B82公里/小时C91公里/小时D98公里/小时

47. 某组数据的四分之一分位数是45,中位数是85,四分之三分位数是105,则该组数据的分布是()。

A 右偏的B对称的C左偏的D上述全不对

48. 某组数据的四分之一分位数是45,中位数是65,四分之三分位数是85,则该组数据的分布是()。

A 右偏的B对称的C左偏的D上述全不对

49. 如果数据的分布是左偏的,下列叙述中正确的是()。

A 均值在中位数的右侧B均值等于中位数

C分布的“尾部”在图形的右边D均值在众位数的左侧

50. 除了()之外,下列都是中位数的特征。

A 中位数是一组数据中的大小数值的平均B中位数是数据集中趋势的一种度量

C中位数的位置由公式(n+1)/2确定,其中n是数据个数D中位数等于第二个四分位数

51. 权数对均值的影响实质上取决于()。

A 各组权数的绝对值大小B各组权数是否相等

C各组变量值的大小D各组权数的比重

52. 某城市对1000户居民的一项调查显示,人均收入在2000~3000元的家庭占24%,在3000~4000元的家庭占26%,在4000~5000元的家庭占29%,在5000~6000元的家庭占10%,在6000~7000元的家庭占7%,在7000元以上的家庭占4%。从此数据中可以判断,中位数()均值。

A 大于B小于C等于D无法判断

53. 某班25名学生的统计学平均成绩为70分,其中15名男生的平均成绩为68分,则该班女生的平均成绩为()分。

A 70 B73 C60 D68

54. 对数据对称性的测度是()。

A 偏度B峰度C变异系数D标准差

55. 某企业1999年的产量为100万吨,2000年与1999年相比增长率为9%,2001年与2000年相比增长率为16%,2002年与2001年相比增长率为20%,该企业各年的平均增长率为()。

A 15%B5% C14.91% D15.21%

56. 某股票在2000年、2001年、2002年和2003年的年收益率分别为4.5%、2.1%、25.5%、1.9%,则该股票在这四年的平均收益率为()。

A 8.079%B7.821%C8.5%D7.5%

57. 一家公司在招收员工时,要对应聘者进行两项能力测试。在A项测试中,平均分为100分,标准差为15分;在B项测试中,平均分400分,标准差为50分。一位应聘者在A项测试中得分为115分,在B项测试中得分为425分。与平均分相比,该应聘者()。

A A项成绩更好BB项成绩更好

CA项和B项的成绩相同DA项和B项的成绩无法比较

58. 对于分类数据,主要使用()测度其离散程度。

A 众数B异众比率C标准差D方差

二、多选题

1. 简单算术平均数的应用条件是()。

A 所掌握的资料未加分组,只是总体各单位的标志值

B 各标志值的次数都是1

C 各标志值的次数都相等

D 各变量值的次数不是都相同

E 应该用加权算术平均法,但没有掌握权数资料

2. 加权算术平均数的应用条件是()。

A 所掌握的资料已经分组

B 各标志值的次数都相同

C 各标志值的次数不是都相同

D 已掌握了被平均的变量值和基本公式的分子资料

E 已掌握了被平均的变量值和基本公式的分母资料

3. 下列各式计算的结果,属于平均指标的有()。

A 一个国家的粮食总产量与全国人口数之比

B 一个国家的国土面积与全国人口数之比

C 某工厂工资总额与该厂职工人数之比

D 生产某种产品的总成本与该产品产量之比

E n个变量值之积的n次方根

4. 中位数的数值是()。

A 由标志值在数列中所处的位置决定

B 根据标志值出现的次数决定

C 总体单位水平的平均值D总体一般水平的代表值

E不受总体中极端数值的影响

5. 常用的测度数值型数据离散程度的指标有()。

A 全距

B 平均差

C 平均差系数

D 标准差

E 标准差系数

6. 与标志值同计量单位的标志变异指标有()。

A 全距

B 平均差

C 标准差

D 方差

E 平均差系数和标准差系数

7. 根据全距说明标志变异程度()。

A 没有考虑中间标志值的变异程度

B 没有考虑总体各单位的分布状况

C 能反映所有标志值的变异程度

D 取决于平均数的大小

E 仅考虑最大标志值与最小标志值的影响

8. 不同总体间各标志值的差异程度可以通过标准差系数进行比较,因为()。

A 消除了不同总体各标志值测量单位的影响

B 消除了不同数列平均水平高低的影响

C 消除了不同数列各标志值差异的影响

D 数值的大小与数列的差异水平无关

E 数值的大小与数列的平均数大小无关

9. 对比两个计量单位不同的变量数列标志值的离散程度,应使用()。

A 平均差

B 全距

C 均方差系数

D 标准差

E 平均差系数

10. 平均指标的作用主要有()。

A 可以对比同类现象在不同单位、不同地区的一般水平

B 可以对比同类现象在不同的时间上的一般水平

C 可用以分析现象之间的依存关系

D 可以反映社会经济现象的总规模和总水平

E 可以反映总体现象的同质性

11. 加权算术平均数的大小受下列因素的影响( )。

A 变量值水平的高低

B 各变量次数的多少

C 各变量值次数绝对数值的大小

D 各变量值次数占总次数的比重

E 总体单位数的多少

12. 变异指标和平均指标既有联系又有区别,表现于( )。

A 二者都是反映总体单位标志值分布特征的

B 平均指标反映各单位某一数量标志的共性

C 平均指标说明分配数列中变量的集中趋势

D 变异指标反映各单位某一数量标志的差异性

E 变异指标说明分配数列中变量的离中趋势

13. 计算标准差时,根据掌握的资料不同,可分别选用下面的公式( )。 A

n x x 2

)(-∑ B f f x x ∑-∑2)( C f

f

x x ∑?-∑2)( D

22)(x x -

E 算术平均数×标准差系数

14. 在组距数列的条件下,计算中位数的公式为( )。

A i f S f L M m m e ?-∑+

=+12 B i f S f

U M m m e ?-∑-=-12 C i f S f L M m m e ?-∑+

=-12 D i f S f U M m m e ?-∑-=+12 E i f S f

U M m

m e ?-∑+=-1

2 15. 在组距数列的条件下,计算众数的公式为( )。 A i L M o ??+??+

=211 B i L M o ??+??-=2

11

* *

C i L M o ??+??+

=212 D i U M o ??+??+=212

E i U M o ??+??-

=2

12

16. 正确运用平均指标应遵循的原则是( )。 A 必须注意所研究社会经济现象的同质性 B 必须注意用组平均数补充说明总平均数 C 必须注意用分配数列补充说明平均数

D 必须注意一般与个别相结合,把平均数和典型事例结合起来 E 平均指标要与变异指标结合运用

三、判断题

1. 按人口平均计算的国民收入是个平均数。( )

2. 根据组距数列计算得到的平均数,只是个近似值。( )

3. 加权算术平均数和加权调和平均数都是用变量值所出现的次数作为权数。( )

4. 平均差和标准差都表示各标志值对算术平均数的平均离差。( )

5. 若两总体的平均数不同,而标准差相同,则标准差系数也相同。( )

6. “全国国内生产总值/全国平均人口”(即人均国内生产总值)是算术平均数。( )

7. 几何平均数适合于计算平均比率和平均速度。( )

8. 比较两总体平均数的代表性,若标准差系数越大,说明其平均数的代表性越好。( )

四、名词解释

1. 几何平均数

2. 调和平均数

3. 全距

4. 离散系数

5. 平均差

6. 标准分数

7. 偏态

8. 峰态

五、计算题

1. 某商场出售某种商品的价格及销售额资料如下表所示:

计算该商场商品的平均销售价格。

2. 为了扩大国内居民需求,银行为此多次降低存款利率,5年的年利率分别为7%、5%、4%、3%、2%,试计算在单利和复利情况下5年的平均利率。

3. 甲、乙两单位人数及月工资资料如下表所示:

根据上表资料:

⑴比较甲、乙两单位哪个单位工资水平高;

⑵说明哪个单位平均工资更具有代表性。

4. 对某车间甲、乙两工人当日产品抽取10件产品进行质量检查,得如下资料:

试比较哪个工人生产的零件质量较稳定(计算标准差和标准差系数)。

5. 某地科学试验站对A、B两个品种的水稻分别在4块地里进行试验,其产量如下:

试根据上表资料分别计算两个品种的平均单位面积产量,并确定哪一个品种具有较好的稳定性?

6. 某年12月份甲、乙两农贸市场某种农产品价格及成交额的资料如下表:

试计算哪个市场农产品的平均价格高,并说明原因。

7. 某时期某企业按工人劳动生产率分组的资料如下:

试计算该企业工人的平均劳动生产率。

8. 已知某公司所属生产同种产品的三家企业的有关资料:

试根据上述资料做如下的计算:⑴各企业及全公司的工人劳动生产率和单位产品成本;⑵如果各企业劳动生产率都达到三个企业中的先进水平,则全公司可增加多少产量?⑶如果各企业单位产品成本都达到三个企业中的先进水平,则全公司可节约多少资金?

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

卫生统计学选择题及答案

t分布与标准正态分布有一定的关系,下述错误的叙述是_____ A.参数数目不同 B.t分布中的自由度趋于无穷大时,曲线逼近标准正态分布 C.为单峰分布 D.对称轴位置在0 E.曲线下面积的分布规律相同 在抽样研究中,当样本例数逐渐增多时_____. A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 抽样误差是指。 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别) C.样本中每个个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 下面说法中不正确的是_____. A.没有个体差异就不会有抽样误差 B.抽样误差的大小一般用标准误来表示 C.好的抽样设计方法,可避免抽样误差的产生 D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 抽样研究中,适当增加观察单位数,可() A.减小Ⅰ型错误 B.减小Ⅱ型错误 C.减小抽样误差 D.提高检验效能 E.以上均正确

说明两个有关联的同类指标之比为。 A.率 B.构成比 C.频率 D.相对比 E.频数 构成比用来反映。 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对 以下属于分类变量的是___________. A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围 计算麻疹疫苗接种后血清检查的阳转率,分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数 关于构成比,不正确的是_____. A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小 C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同,可对率进行标准化 E.构成比之和必为100% 甲乙两地某病的死亡率进行标准化计算时,其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据 C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对 用均数与标准差可全面描述资料的分布特征() A.正态分布和近似正态分布 B.正偏态分布 C.负偏态分布 D.任意分布

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

统计学基础试题

2014-2015学年第一学期《统计学》期复习资料 一、单项选择题 1.下列属于品质标志的有(B )。 A.劳动时间 B.健康状况 C.工资级别 D.劳动生产率 2.标志是说明( A )。 A.总体单位的特征的名称 B.总体单位量的特征的名称 C.总体质的特征的名称 D.总体量的特征的名称 4.调查某乡镇工业企业职工工资情况,则调查对象是( B )。 A.该乡镇全部工业企业 B.该乡镇全部工业企业的职工 C.该乡镇全部工业企业的职工的工资 D.该乡镇工业企业每一名职工的工资 5.对某地区三家不同部门进行某项改革的企业进行调查,以了解某近阶段生产情况和存在问题,以便为今后的普遍推广积累经验,这种调查是( C ) A.普查 B.重点调查 C.典型调查 D.抽样调查 6.按连续型变量分组,第一组为75以下,第二组为75~85,第三组为85~95,第四组为95以上,则数据( A ) A.75在第一组 B.85在第二组 C.85在第三组 D.95在第四组 7.按连续型变量分组,其末组为开口组,下限为2000。已知相邻组的组中值为1750,则末组组中值为( C ) A.2100 B.2200 C.2250 D.2500 第一步: 一般情况下,组中值=(上限+下限)/2 已知相邻组组中值为975,相邻组的上限即为末组的下限1000,即975=(1000+下限)/2 由该公式得到下限=950 所以,相邻组组距=1000-950=50 第二步: 计算开口组的组中值时,只有下限而无上限,则 组中值=下限+相邻组组距/2=1000+50/2=1025 8.在全国医院总体中,医院数(a)、医院医生人数(b)和病床张数(c)三个指标() A.都是总体单位总量 B.a是总体安慰总量,b、c是总体标志总量 C.都是总体标志总量 D.b是总体安慰总量,a、c是总体标志总量 9.某商店计划规定本年费用水平比去年下降4%,实际下降了6%,则该商店费用水平计划完成程度是( A ) A.97.9% B.101.9% C.102.1% D.150% 10.不能全面反映总体各单位标志值变异程度的标志变异指标是() A.平均差 B.标准差系数 C.标准差 D.全距 11.要了解某市工业企业生产设备情况,则统计总体是( )。 A.该市全部工业企业 B.该市每一个工业企业 C.该市工业企业的某一台设备 D.该市所有工业企业的全部生产设备 12.下列情况属于离散变量的是( C )。 A.营业额 B.工龄 C.工厂数D.职工年收入 13.调查问卷中,开放式问题一般应该排在问题的( C )。 A.开头B.中间C.最后D.都可以

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

卫生统计学部分题库

对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______. A.有相关关系 B.无任何关系 C.无直线相关关系 D.无因果关系 E.有伴随关系 若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究 四格表资料的χ2检验应使用校正公式而未使用时,会导致。 A.χ2增大,P值减小 B.χ2减小,P值也减小 C.χ2增大,P值也增大 D.χ2减小,P值增大 E.视数据不同而异 配对设计四格表资料比较两个率有无差别的无效假设为。 A.μ1=μ2 B.π1=π2 C.μ1≠μ2 D.π1≠π2 E.b=c 四格表χ2检验的校正公式应用条件为。 A.n>40且T>5 B.n<40且T>5 C.n>40且1<T<5 D.n<40且1<T<5 E.n>40且T<1 两组设计两样本均数比效的t检验公式中,位于分母位置上的是。 A.两样本均数之差 B.两样本均数之差的方差 C.两样本均数之差的标准误 D.两样本均数方差之差

E.两样本均数标准误之差 两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断 在假设检验中,P值和α的关系为。 A.P值越大,α值就越大 B.P值越大,α值就越小 C.P值和α值均可由研究者事先设定 D.P值和α值都不可以由研究者事先设定 E.P值的大小与α值的大小无关 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 下面关于均数的正确的说法是______. A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值 从同一正态总体中随机抽取多个样本,用样本均数来估计总体均数的可信区间,下列哪一样本得到的估计精度高。 A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误小的样本 E.标准误大的样 以一定概率由样本均数估计总体均数,宜采用。 A.抽样误差估计 B.点估计 C.参考值范围估计 D.区间估计

第三版统计学基础练习题部分答案

第一章 1统计数据可分为哪几种类型不同类型的数据各有什么特点 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。 2变量分为那几类:分类变量、顺序变量和数值型变量。 3举例说明离散型变量和连续型变量: 离散变量是指其数值只能用自然数或整数单位计算的则为离散变量.例如,企业个数,职工人数,设备台数等,只能按计量单位数计数,这种变量的数值一般用计数方法取得. 在一定区间内可以任意取值的变量叫连续变量,其数值是连续不断的,相邻两个数值可作无限分割,即可取无限个数值.例如,生产零件的规格尺寸,人体测量的身高,体重,胸围等为连续变量,其数值只能用测量或计量的方法取得.

练习书上有答案:需注意:用数值表示的属于数值变量。分类选择的属于分类变量。投票选举的属于顺序变量。 第二章: 简述普查和抽样调查的特点: 抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。 特点:第一普查通常是一次性的或周期性的。第二普查一般需要规定统一的调查时间。第三普查的数据一般笔记哦啊准确,规范化程度也较高,因此它可以为抽样调查或其他调查提供基本的依据。第四普查使用范围比较狭窄,只能调查一些最基本的、特定的现象。 调查方案包括哪几方面的内容:调查目的、调查对象和调查单位、调查项目和调查表。 什么是调查问卷:它由哪几部分组成 调查问卷是用来收集调查数据的一种工具,是调查者根据调查目的和要求所涉及的,有一系列问题、备选答案、说明以及码表组成的一种调查形式。结构:开头部分、甄别部分、主体部分和背景部分组成。

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

统计学20个重点知识整理

一、统计的含义及其之间的关系 统计一词一般有三种含义,即统计工作、统计资料和统计学。 1、统计工作即统计实践活动,是指按照调查研究的任务,对社会经济现象的数量方面进行搜集资料、整理资料和分析运用资料等一系列调查研究的工作过程。 2、统计资料是指反映社会经济现象特征的各项数字资料以及与之有联系的其他资料,包括调查阶段搜集的原始资料,经过加工整理和分析后的图标和文字资料等系统资料。 3、统计学是研究怎样进行社会经济统计活动的方法论科学,它阐述了统计研究社会经济现象的数量和数量关系时应该遵循的原理、原则和采用的方法等,是系统化的知识体系。 4、关系:统计资料是统计工作的成果,是对社会经济现象进行统计研究的基础;统计学是统计活动经验的科学总结和理论概括,统计学来源于实践,又高于实践,对统计实践起着指导的作用;统计工作要以统计学的理论为指导,并检验和发展统计理论。 二、统计总体和统计单位及其之间的关系 1、统计总体:是由客观存在的、具有某种共同性质的许多个别单位所构成的整体,简称总体。 2、统计总体的特征:大量性、同质性、差异性 3、总体单位:构成统计总体的个别事物 4、例:要研究某一乡镇企业的职工素质情况,则该乡镇企业的全体人员构成一个总体,其中每一个职工就是总体单位。 5、关系:a.总体由总体单位组成; b.组成总体的个体是有差别的; C.根据统计研究目的的不同,总体与总体单位是可以相互转化的。 三、统计指标和统计标志之间的关系 两者之间既有明显的区别,又有密切的联系。主要区别在于: 1、指标说明总体特征;而标志则说明总体单位特征; 2、统计指标必须是可量的;统计标志未必都是可量的; 3、统计指标具有综合性;而统计标志一般不具有综合性; 两者之间的主要联系在于: 1、许多统计指标的指标数值是从总体单位的数量标志值汇总而来; 2、指标与标志之间存在着变换关系; 例如:要了解我国粮食生产状况,则我国的粮食总产量是指标,而某省的粮食总产量是标志。 四、一个完整的统计调查方案包括的内容 1、确定调查目的; 2、确定调查对象和调查单位; 3、确定调查项目,设计调查表; 4、确定调查时间和方法; 5、制定调查工作的组织实施计划 五、统计调查的分类 1、按统计调查方式的不同,可分为定期统计报表和专门调查; 2、按调查总体包括的范围不同,可分为全面调查和非全面调查; 3、按调查登记的时间是否具有连续性,可分为经常性调查和一次性调查; 4、按统计调查是否具有强制性,可分为政府统计调查、民间统计调查和涉外社会调查; 5、按收集资料的方法,可分为直接观察法、报告法、采访法和问卷法

统计学基础复习题

10级电商《应用统计学》期末复习 一、单选题 1.统计学的研究对象是( A ) A.客观事物的总体数量特征和数量关系 B.统计工作过程 C.总体与样本的关系 D.抽象数量的联系和空间形式 2.按某一标志分组的结果,表现出( A ) A.组内同质性和组间差异性 B.组内差异性和组间差异性 C.组内同质性和组间同质性 D.组内差异性和组间同质性 3.指出下面的数据哪一个属于顺序数据( D ) 个人的年龄分别是25,22,34,41,33 B.性别:男,女 C.上市公司所属行业:金融,房地产,医药,机械制造 D.员工对企业某项改革措施的态度:赞成,中立,反对 4.下列不属于描述统计问题的是( A ) A.根据样本信息对总体进行的推断 B.了解数据分布的特征 C.分析感兴趣的总体特征 D.利用图、表或其他数据汇总工具分析数据 5.我国六次人口普查规定的标准时间是2010年11月1日0时(截止时间),下列情况应计入人口数的是( D ) 年11月2日出生的婴儿 年10月29日21时出生,10月31日23时死亡的婴儿 年10月29日23时死亡的人 年11月1日3时死亡的人 6.某商场2010年空调销售量为10000台,库存年末比年初减少100台,这两个总量指标是( A ) A.时期指标 B.时点指标 C.前者是时期指标,后者是时点指标 D.前者是时点指标,后者是时期指标 7.某企业某年上半年月产量分别为410、420、380、410、420、420万件,则该企业上半年的平均月产量、中位数和众数分别为( A ) 、415、420 、420、420 、420、420 、420、410 8.下列数列中属于时间序列数据的是( B ) 年我国的国内生产总值 年我国的国内生产总值 年底我国的人口数 年10月我国的进口额 9.下列关于相关系数的陈述中哪一个是错误的( A ) A.数值越大说明两个变量之间的关系就越强 B.仅仅是两个变量之间线性关系的一个度量,不能用于描述非线性关系 C.只是两个变量之间线性关系的一个度量,并不意味两个变量之间存在因果关系 D.绝对值不会大于1 10.如果报告期商品价格计划降低5%,销售额计划增加10%,则销售量应增加( D ) % % 同时研究居民的消费支出与居民货币收入和消费品价格的数量关系,属于( B ) A.单相关 B.复相关 C.直线回归 D.曲线回归 12.在回归直线$μμ0 1 y x β β=+中,μ1 β表示( C )

统计学基础知识

一、数据的特征值 (一)数据的位置特征值 1)平均值 如果从总体中抽取一个样本,得到一批数据x 1,x 2,x 3….x n ,则样本的平均值x 为: n-数据个数; x i -第i 个数据数; ∑-求和。 2)中位数 有时,为减少计算,将数据x 1,x 2,x 3….x n 按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。 3)中值M 测定值中的最大值x max 与最小值x min 的平均值,用M 表示。 4)众数 在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,频数最多的区间代表值(一般取区间中值)也称众数。 (二)数据的离散特征值 1)极差R 测定值中的最大值x max 与最小值x min 之差称为极差。通常R 用于个数n 小于10的情况下,n 大于10时,一般采用标准偏差s 表示。 2)偏差平方和S 各测定值x i 与平均值 之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称平方和,用S 表示。 无偏方差 各个测定值的偏差平方和除以(n-1)后所得的值称为无偏方差(简称方差),用s 2表示: ~ x _x _ x ∑ =--=-=n i i x x n n S s 1 2 _2)(1112 _ 2 _ 22 _ 1)(...) () (x x x x x x n -+-+-∑=-n i i x x 1 2 _ )(S = =

标准偏差s 2 (三)变异系数 以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上 上式中σ和μ为总体均值和总体标准差,当过程在受控状态下,且样本容差较大时,可用样本标准差s 和样本均值 估计。 _x

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

统计学知识点梳理

复习提纲:(计算部分全用红色标注了!其他红色的是我的推断,可能出什么题型;有下划线的重点记忆!当然整理的知识点都是重点!都要背和理解!Fighting!) 第一章绪论 一.统计的含义 即统计工作、统计资料和统计学 统计工作:统计实践活动,搜集,整理,分析和提供关于社会现象数字资料工作总称 统计资料:统计实践活动过程中所取得的各项资料,包括原始资料和加工整理资料 统计学:关于认识客观现象总体数量特征和数量关系的科学 二.统计工作过程 就一次统计活动来讲,一个完整的认识过程一般可以分为统计调查、统计整理和统计分析三个阶段。

统计调查:第一阶段,是认识客观经济现象的起点,是统计整理和统计分析的基础。 统计整理:第二阶段,处于统计工作的中间环节,起着承前启后的作用。 统计分析:第三阶段,通过第三阶段,事物由感性认识上升到理性认识。 三.总体与总体单位(会辨析总体与总体单位即可) 总体,亦称统计总体,是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体;构成总体的这些个别单位称为总体单位。 总体由总体单位构成,要认识总体必须从总体单位开始,总体是统计认识的对象。 例如:所有的工业企业就是一个总体,其中的每一个工业企业就是一个总体单位。 四.标志和指标 标志是用来说明总体单位特征的名称。 指标,亦称统计指标,是说明总体的综合数量特征的。一个完整的统计指标包括数量指标名称和指标数值两部分。(以上内容理解即可) 1.指标和标志的区别和联系(简答) 指标与标志的区别:(1)指标是说明总体特征的,而标志是说明总体单位特征的;(2)指标都能用数值表示,而标志中的品质标志不能用数值表示,是用属性表示的;(3)指标数值是经过一定的汇总取得的,而标志中的数量标志不一定经过汇总,可直接取得;(4)一个完整的统计指标,一定要讲时间、地点、范围,而标志一般不具备时间、地点等条件。 指标与标志的联系:(1)有许多统计指标的数值是从总体单位的数量标志值汇总而来的;(2)两者存在着一定的变换关系,即由于研究目的不同,原来的统计总体如果变成总体单位了,则相应的统计指标也就变成数量标志了。 2.标志与标志值(会区分) 标志分为品质标志和数量标志,数量标志用来说明总体单位量的特征,可以用数值表示,即为标志值(如:年龄、工资额、身高) 3.变异与变量(会什么是变异,什么是变量) 变异:品质标志在总体单位之间的不同具体表现。如:性别表现为男、女,民族表现为汉、满、蒙等。 变量:数量标志抽象化即为变量,而数量标志的不同具体表现则称为变量值(或标志值)。如:某职工的年龄是42岁,月工资2200元。 4.统计指标的划分 (1)统计指标按其所反映的总体内容的不同,可分为数量指标和质量指标。数量指标指说明总体规模和水平的各种总量指标。质量指标指反应现象总体的社会经济效益和工作质量的各种相对指标和平均指标。 (2)统计指标按其作用和表现形式的不同,有总量指标(绝对数)、相对指标(绝对数)、平均指标(平均数)三种。 第二章统计调查与整理 一.统计调查的含义 统计调查是统计工作过程的第一阶段。它是按照统计任务的要求,运用科学的调查方法,有组织的向社会实际搜索各项原始资料的过程。统计调查是整个统计认识活动的基础,决定着统计认识过程及其结果的成败。 二.统计调查方案设计的内容+调查对象、调查单位的含义 ⒈确定调查目的;(为什么调查) 根据实际需要和可能确定

统计学基础

一、单项选择题(共10道小题,共100.0分) 1.在下列调查中.调查单位与填报单位一致的是( )。 A. 公司设备调查 B. 农村耕地调查 C. 学生学习情况调查 D. 汽车养护情况调查 2. 3.在统计调查中,调查标志的承担者是( )。 A. 调查对象 B. 调查单位 C. 填报单位 D. 调查表 4. 5.填报单位( )。 A. 是调查标志的承担者 B. 是负责向上报告调查内容的单位 C. 是构成调查对象的每一单位 D. 即是总体单位 6. 7.变量数列中各组频率之和是( )。 A. 不等于l B. 大于1 C. 小于1 D. 等于l

8. 9. 统计表的结构,从其外形看,是由( )。 A. 标题和数字资料两部分构成 B. 标题、横行、纵栏标目三部分构成 C. 横行和纵栏数字资料构成 D. 标题、横纵、纵栏、数字资料等部分构成 10. 11.有20个工人看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、 4、3、4、6、3、4、 5、2、4,按以上资料编制分配数列,应采用( )。 A. 单项式分组 B. 等距分组 C. 不等距分组 D. 以上几种分组均可 12. 13.某厂劳动生产率计划在去年的基础上提高8%,执行结果仅比去年提高4%, 则劳动生产率的计划完成相对数算式为( )。 A. 4%÷8% B. 8%÷4% C. (100%+4%)÷(100%+8%) D. (1+8%÷1+4%) 14. 15. (错误) 下面属于结构相对指标的是( )。

A. 招生录取率 B. 人均钢产量 C. 轻重工业比例 D. 人均国民收入 16.对全市科技人员进行调查,每位科技人员是总体单位,科技人员的职称是 ( )。 A. 品质标志 B. 变量 C. 变量值 D. 标志值 17. 18.某学生某门课成绩为80分,则该成绩是( )。 A. 品质标志 B. 数量标志 C. 变量 D. 指标 1.设2000~2004年各年的环比增长速度为6%、7%、8%、9%和10%,则平均增长速度为 ( )。 A. B. C.

统计学重点知识点

基本统计方法 第一章 概论 1. 总体(Population ):根据研究目的确定的同质对象的全体(集合);样本(Sample ):从总体中随机抽取的部分具有代表性的研究对象。 2. 参数(Parameter ):反映总体特征的统计指标,如总体均数、标准差等,用希腊字母表示,是固定的常数;统计量(Statistic ):反映样本特征的统计指标,如样本均数、标准差等,采用拉丁字字母表示,是在参数附近波动的随机变量。 3. 统计资料分类:定量(计量)资料、定性(计数)资料、等级资料。 第二章 计量资料统计描述 1. 集中趋势:均数(算术、几何)、中位数、众数 2. 离散趋势:极差、四分位间距(QR =P 75-P 25)、标准差(或方差)、变异系数(CV ) 3. 正态分布特征:①X 轴上方关于X =μ对称的钟形曲线;②X =μ时,f(X)取得最大值;③有两个参数,位置参数μ和形态参数σ;④曲线下面积为1,区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 4. 医学参考值范围的制定方法:正态近似法:/2X u S α±;百分位数法: P 2.5-P 97.5。

第三章 总体均数估计和假设检验 1. 抽样误差(Sampling Error ):由个体变异产生、随机抽样造成的样本统计量与总体参数的差异。抽样误差不可避免,产生的根本原因是生物个体的变异性。 2. 均数的标准误(Standard error of Mean, SEM ):样本均数的标准差,计算公式: X σσ=误差的大小。 3. 降低抽样误差的途径有:①通过增加样本含量n ;②通过设计减少S 。 4. t 分布特征: ①单峰分布,以0为中心,左右对称; ②形态取决于自由度ν,ν越小,t 值越分散,t 分布的峰部越矮而尾部翘得越高; ③当ν逼近∞,X S 逼近X σ, t 分布逼近u 分布,故标准正态分布是t 分布的特例。 5. 置信区间(Confidence Interval , CI ):按预先给定的概率(1-α)确定的包含总体参数的一个范围,计算公式:/2,X X t S αν±或/2,X X u S αν±。95%CI 含义:从固定样本含量的已知总体中进行重复抽样试验,根据每个样本可得到一个置信区间,则平均有95%的置信区间包含了总体参数。 6. 假设检验的基本原理:小概率反证法的思想。 ①反证法:从问题的对立面(H 0)出发间接判断要解决的问题(H 1)

相关主题
文本预览
相关文档 最新文档