当前位置:文档之家› 第四章 数据分布特征的测度讲解

第四章 数据分布特征的测度讲解

第四章  数据分布特征的测度讲解
第四章  数据分布特征的测度讲解

第四章数据分布特征的测度

学习目的和要求:

通过本章的学习,掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。

难点释疑:

(一)算术平均数通常用来反映总体分布的集中趋势,调和平均数往往只作为算术平均数的变形来使用,即在已知标志总量而未知总体单位总量的情况下计算调和平均数;而几何平均数较适用于计算平均比率和平均速度。

(二)调和平均数虽然是根据标志值的倒数计算的,但其结果不等于算术平均数的倒数。在计算和应用平均指标时,除了考虑数理方面的要求外,更重要的是要考虑其现实的经济意义。

(三)平均数的性质是简捷计算法的基础,也是计算标志变异指标的基础。掌握中位数和众数与算术平均数的关系的目的是能够根据其中的两个平均数大体计算出第三个平均数,并判断总体的分布状态。

(四)全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。全距是描述数据离散程度的最简单测度值,它计算简单,易于理解,但不能全面反映总体各单位标志值的差异程度。标准差与平均差的意义基本相同,但在数学性质上比平均差要优越,所以,在反映标志变动度大小时,一般都采用标准差。标准差是实际中应用最广泛的离散程度测度值。

(五)标准差系数的应用。为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。它是标志变异的相对指标。它既消除了变量数列变量值差异程度的影响,也消除了变量数列水平高低的影响。

练习题:

(一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内)

1.平均指标反映了()。

①总体变量值分布的集中趋势②总体分布的离散特征

③总体单位的集中趋势④总体变动趋势

2.加权算术平均数的大小( )。

①受各组标志值的影响最大 ②受各组次数的影响最大

③受各组权数系数的影响最大 ④受各组标志值和各组次数的共同影响

3.在变量数列中,如果变量值较小的一组权数较大,则计算出来的算术平均数( )。 ①接近于变量值大的一方 ②接近于变量值小的一方 ③不受权数的影响 ④无法判断

4.权数对于平均数的影响作用取决于( )。

①总体单位总量 ②各组的次数多少

③各组标志值的大小 ④各组次数在总体单位总量中的比重

5.由组距变量数列计算算术平均数时,用组中值代表组内标志值的一般水平,有一个假定条件,即( )。

①各组的次数必须相等 ②各组标志值必须相等 ③各组标志值在本组内呈均匀分布 ④各组必须是封闭组

6.如果次数分布中,各个标志值扩大为原来的2倍,各组次数都减小为原来的1/2,则算术平均数( )。 ①增加到原来的

2

1

②稳定不变 ③减少到原来的

2

1

④扩大为原来的2倍 7.已知某市场某种蔬菜早市、午市、晚市的每公斤价格,在早市、午市、晚市的销 售额基本相同的情况下,计算平均价格可采取的平均数形式是( )。 ①简单算术平均数 ②加权算术平均数 ③简单调和平均数 ④加权调和平均数

8.凡是变量值的连乘积等于总比率或总速度的现象,要计算其平均比率或平均速度都可以采用( )。

①算术平均法 ②调和平均法 ③几何平均法 ④中位数法 9.四分位差排除了数列两端各( )单位标志值的影响。 ①10% ②15% ③25% ④ 35% 10.如果一组变量值中有一项为零,则不能计算( )。 ①算术平均数 ②调和平均数 ③众数 ④中位数

11.在掌握了各组单位成本和各组产量资料时,计算平均单位成本所使用的方法应是( )。

①算术平均数②调和平均数

③几何平均数④中位数

12.各变量值与算术平均数离差平方的和为()。

①0 ②1 ③最小④最大

13.出现次数最多的那个标志值是()。

①众数②中位数③算术平均数④几何平均数

14.各总体单位的标志值都不相同时()。

①众数不存在②众数就是最小的变量值

③众数是最大的变量值④众数是出现次数最多的变量值

15.由组距数列确定众数时,如果众数组的相邻两组的次数相等,则()。

①众数在众数组内靠近上限②众数在众数组内靠近下限

③众数组的组中值就是众数④众数为零

16.当各个变量值的频数相等时,该变量的()。

①众数不存在②众数等于均值

③众数等于中位数④众数等于最大的变量值

17.如果你的业务是提供足球运动鞋的号码,那么,哪一种平均指标对你更有用?()

①算术平均数②几何平均数③中位数④众数

18.一组数据排序后处于25%和75%位置上的值称为()。

①众数②中位数③四分位数④均值

19.四分位数实际上是一种()。

①算术平均数②几何平均数

③位置平均数④数值平均数

20.当数据组高度偏态时,哪一种平均数更具有代表性? ()

①算术平均数②中位数③众数④几何平均数

21.假定某人5个月的收入分别是1800元,1840元,1840元,1840元,1840元,8800元,反映其月收入一般水平应该采用()。

①算术平均数②几何平均数

③众数④调和平均数

22.某居民小区准备采取一项新的物业管理措施,为此,随机抽取了100户居民进行调查,其中表示赞成的有69户,表示中立的有22户,表示反对的有9户,描述该组数据的集中趋

势宜采用( )。

①众数 ②中位数 ③四分位数 ④算术平均数 23.在标准正态分布条件下,有( )。

①X =Me=M o ②Mo >Me >X ③Me >X >Mo ④X >Me >Mo 24.若某总体次数分布呈轻微左偏分布,则有( )成立。 ①X > e M >o M ②X o M >e M ④X

25.已知某企业职工消费支出,年支出6000元人数最多,平均年支出为 5500元,该企业职工消费支出分布属于( )。 ①左偏分布 ②右偏分布 ③对称分布 ④J 形分布 26.下列变异指标中,消除了量纲影响的是( )。

①全距 ②平均差 ③标准差 ④离散系数 27.标准差系数抽象了( )。

①总体指标数值大小的影响 ②总体次数多少的影响

③标志变异程度的影响 ④平均水平高低对离散分析的影响 28.下列标志变异指标中,最易受极端值影响的是( )。 ①全距 ②平均差 ③标准差 ④离散系数

29.可直接用标准差评价两数列差异程度大小的条件是:两数列的平均数( )。 ①相差较大 ②相差较小 ③不等 ④相等

30.若两组数列的计量单位不同,在比较两数列的离散程度大小时,应采用( )。 ①全距 ②平均差 ③标准差 ④标准差系数

31.甲班学生平均成绩80分,标准差8.8分,乙班学生平均成绩70分,标准差8.4分,因此( )。

①甲班学生平均成绩代表性好一些 ②乙班学生平均成绩代表性好一些

③无法比较哪个班学生平均成绩代表性好

④两个班学生平均成绩代表性一样

32.两个总体的平均数不等,但标准差相等,则()。

①平均数小,代表性大②平均数大,代表性大

③两个平均数代表性相同④不能判断哪个平均数代表性大

33.已知某班40名学生,其中男、女学生各占一半,则该班学生性别成数方差为( )。

①25%②30%③40%④50%

34.是非标志的成数方差最大值为()

①1 ②0.5 ③0.25 ④0

35.下列分布中,集中度最大的是()。

①②③④

36.下列分布中,离中度最大的是()。

①②③④

37.某企业有甲、乙两个生产车间,已知2009年甲、乙两车间工人的月平均工资分别为1820元和1900元,又知2010年甲车间工人数占全厂工人总数比重上升,乙车间的下降。若2010年两车间工人工资水平不变,则全厂工人平均工资将()。

①提高②下降③不变④升降不定

(二)多项选择题(在下列备选答案中,有二至五个正确答案,请将其全部选出并把顺序号填入括号内)

1.计算和应用平均数的原则是( )。

①现象的同质性②用组平均数补充说明总平均数

③用变量数列补充说明平均数④用时间变量数列补充说明平均数

⑤把平均数和典型事例结合起来

2.平均数的作用是( )。

①反映总体的一般水平

②对不同时间、不同地点、不同部门的同质总体平均数进行对比

③测定总体各单位的离散程度

④测定总体各单位分布的集中趋势⑤反映总体的规模

3.下面关于权数的描述,正确的是( )。

①权数衡量相应的变量对总平均数作用的强度

②权数起作用在于次数占总次数的比重大小

③权数起作用在于次数本身绝对值大小

④权数起作用的前提之一是各组的变量值必须互有差异

⑤权数起作用的前提之一是各组的频率必须有差别

4.加权算术平均数的大小受哪些因素的影响( )。

①受各组频数或频率的影响②受各组标志值大小的影响

③受各组标志值和权数的共同影响④只受各组标志值大小的影响

⑤只受权数大小的影响

5.在什么条件下,加权算术平均数等于简单算术平均数( )。

①各组变量值不相同的条件下②各组次数相等的条件下

③各组权数都为1的条件下④在分组组数较少的条件下

⑤各组次数不相等的条件下

6.几何平均数主要适用于( )。

①标志值的代数和等于标志值总量的情况

②标志值的连乘积等于总比率的情况

③标志值的连乘积等于总速度的情况

④具有等比关系的变量数列⑤求平均比率时

7.中位数是( )。

①由标志值在变量数列中所处的位置决定的

②根据标志值出现的次数决定的③总体单位水平的平均值

④总体一般水平的代表值⑤不受总体中极端数值的影响

8.众数是( )。

①位置平均数②总体中出现次数最多的标志值

③不受极端值的影响

④适用于总体单位数多,有明显集中趋势的情况

⑤处于变量数列中点位置的那个标志值

9.在各种平均数中,不受极端值影响的平均数是( )。

①算术平均数②调和平均数③中位数

④几何平均数⑤众数

10.若一组数据的众数大于其算术平均数,则可以认为()。

①该组数据呈左偏分布②该组数据呈右偏分布

③数据中存在极大值④数据中存在极小值

⑤该组数据分布的偏度系数大于0

11.下列指标中,反映数据组中所有数值变异大小的指标有( )。

①四分位差②平均差③标准差

④极差⑤离散系数

12.关于极差,下列说法正确的有( )。

①只能说明变量值变异的范围②不反映所有变量值差异的大小

③反映数据的分配状况④最大的缺点是受极端值的影响

⑤最大的优点是不受极端值的影响

13.有些离中趋势指标是用有名数表示的,它们是( )。

①极差②平均差③标准差

④平均差系数⑤四分位差

14.不同总体间的标准差不能简单进行对比,是因为( )。

①平均数不一致②标准差不一致

③计量单位不一致④总体单位数不一致

⑤与平均数的离差之和不一致

15.不同数据组间各标志值的差异程度可以通过标准差系数进行比较,因为标准差系数( )。

①消除了不同数据组各标志值的计量单位的影响

②消除了不同数列平均水平高低的影响

③消除了各标志值差异的影响

④数值的大小与数列的差异水平无关

⑤数值的大小与数列的平均数大小无关

16.若一组数据的偏度系数是-0.25,则下列说法正确的有( )。

①平均数、中位数与众数是分离的

②众数在左边、平均数在右边

③数据的极端值在右边,数据分配曲线向右延伸

④众数在右边、平均数在左边

⑤数据的极端值在左边、数据分配曲线向左延伸

17.某公司下属5个企业,共有2000名职工,已知每个企业某月的产值计划完成百分比及其实际产值,要计算公司平均产值计划完成程度,则()。

①应采用算术平均数②应采用调和平均数

③实际产值是权数④工人数是权数

⑤企业数是权数

(三)判断题(在下列命题中,认为正确的,在括号内打“√”,错误的打“×”)

1.权数对算术平均数的影响作用取决于权数本身绝对值的大小。 ( )

2.算术平均数的大小,只受总体各单位标志值大小的影响。 ( )

3.在特定条件下,加权算术平均数可以等于简单算术平均数。 ( )

4.在资料已分组形成变量数列的条件下,计算算术平均数或调和平均数时,应采用简单式;反之,采用加权式。 ( )

5.未知计算平均数的基本公式中的分子资料时,应采用加权算术平均数方法计算。

( )

6.根据组距式数列计算得到的算术平均数只能是一个近似值。 ( )

7.当各标志值的连乘积等于总比率或总速度时,宜采用几何平均法计算平均数。

( )

8.当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,应采用倒数平均数来计算平均比率。( )

9.中位数和众数都属于平均数,因此它们数值的大小受到总体内各单位标志值大小的影响。( )

10.分位数都属于数值平均数。 ( )

11.众数是总体中出现最多的次数。 ( )

12.如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在。

( )

13.投资者连续三年股票投资收益率为4%、2%和5%,则该投资者三年内平均收益率为3.66%。()

14.总体中各标志值之间的差异程度越大,标准差系数就越小。 ( )

15.在一个总体中,算术平均数、中位数和众数始终是相等的。()

16.若已知甲数列的标准差小于乙数列,则可断言:甲数列算术平均数的代表性好于乙数列。( )

17.变量数列的分布呈右偏分布时,算术平均数的值最小。 ( )

18.是非标志的标准差是总体中两个成数的几何平均数。 ( )

19.若A、B、C三个公司的利润计划完成程度分别为95%、100%和105%,则这三个公司平均的利润计划完成程度应为100%。( )

20.在对称分布的条件下,高于平均数的离差之和与低于平均数的离差之和,必然相等,全部的离差之和一定等于0。 ( ) (四)填空题

1.平均指标就是在内,将各单位,用以反映总体在一定时间、地点条件下的一般水平。

2.统计中的变量数列是以为中心而上下波动,所以平均数反映了总体分布的。

3.根据组距数列计算算术平均数时,假定各组内的标志值是分布的,并以

代表变量值计算平均数。

4.利用组中值计算算术平均数是假定各组内的标志值分布,计算结果只是一个

值。

5.加权术平均数受两个因素的影响,一个是,一个是。

6.权数对算术平均数的影响作用,不决定于权数的大小,而决定于

的比重大小。

7.权数在算术平均数的计算方法中有两种表现形式,即和,其中

是权数的实质。

8.在计算加权算术平均数时,必须慎重选择权数,务必使各组的

和的乘积等于各组的。

9.加权算术平均数的大小接近于的这一组的标志值。

10.几何平均数又称,当各项变量值的连乘积等于

或时,都可以适用几何平均数计算平均比率或平均速度。

11.算术平均数、调和平均数、几何平均数又称为平均数;众数、中位数又算称为__ 平均数。其中平均数不受极端数值的影响。

12.某日某农贸市场最普遍的成交价格,这在统计上称做。

13.由组距数列求众数时,如众数组相邻两组的次数相同,则

即为众数。

14.某总体呈轻微偏态分布,已知其算术平均数等于94,中位数等于96,则众数等于,该总体为分布。

15.平均指标说明变量数列中变量值的,而标志变异指标则说明变量的。

16.标志变异指标的大小与平均数代表性的大小成关系。

17.是非标志的平均数为,标准差为。

18.某种产品的合格率为95%,废品率为5%,则该种产品的平均合格率为,其标准差是。

19.某企业职工按工资额分组,最高组为140-150元,最低组为50-60元,其全距为。

20.变异指标是衡量的尺度,它与成

关系。

21.已知平均数X=120元,标准差系数V=30%,则标准差σ=。

22.全距是标志值的与之差。在组距分组资料中,可以用

和之差来近似地表示全距。

23.标准差系数是与之比,其计算公式。

24.现象的是计算或应用平均数的原则。

25.成数方差的最大值,是当P值趋近于。

(五)简答题

1.对统计数据的分布特征,主要从哪几个方面进行描述?

2.平均指标与强度相对指标的区别是什么?

3.平均指标的计算原则是什么?有何作用?

4.简述变异指标的概念和作用。

5.为什么要研究标志变异指标?

6.什么是标志变动度?测定它的方法有几种?

(六)计算应用题

1.某研究所职工月工资资料如下:

试用次数权数和比重权数分别计算该所职工的平均工资。

2.某企业工人按日产量分组如下:

单位:件

试计算7、8月份平均每人日产量,并简要说明8月份比7月份平均每人日产量变化的原因。

3.以下数据给出的是道森供应公司和J.C克拉克批发公司两家公司交付定货天数的数据。道森供应公司交货天数:

11 10 9 10 11 11 10 11 10 10

克拉克批发公司交货天数:

8 10 13 7 10 11 10 7 15 12

哪一家供应公司交货时间更稳定、更可靠。用数据支持你的结论。

4.某职员每天可以有两种方法去上班:公共交通和小汽车。每种方法所需要的样本时间记录如下(单位:分钟)

公共交通:28 29 32 37 33 25 29 32 41 34

小汽车:29 31 33 32 34 30 31 32 35 33

应该选用那一种方法更合适?请解释。

5.设甲、乙两单位职工的工资资料如下:

比较哪个单位的职工工资差异程度小。

6.2010年某月份甲、乙两农贸市场某农产品价格和成交量、成交额资料如下:

哪一个市场农产品的平均价格高?并说明原因。

7.某厂生产某种机床配件,要经过三道生产工序,现生产一批该产品在各道生产工序上的合格率分别为95.74%、93.48%、97.23%。根据资料计算三道生产工序的平均合格率。

8.已知某企业有如下资料:

计算该企业平均计划完成程度。

9.已知某公司职工的月工资收入为965元的人数最多,其中,位于全公司职工月工资收入中间位置职工的月工资收入为932元,试根据资料计算出全公司职工的月平均工资。并指出该公司职工月工资收入变量数列属于何种偏态?

10.某地区居民某年医疗费支出的众数为300元,算术平均数为250元。

要求:

(1)计算中位数近似值;

(2)说明该地居民医疗费支出额分布的态势;

(3)若该地区居民医疗费支出额小于400元的占人数的一半,众数仍为300元,试估计算术平均数,并说明其分布态势。

11.对成年组和幼儿组共500人身高资料分组,分组资料列表如下:

要求:

(1)分别计算成年组和幼儿组身高的平均数、标准差和标准差系数。

(2)说明成年组和幼儿组平均身高的代表性哪个大?为什么?

12.对某车间甲、乙两工人当日产品中各取10件产品进行质量检查,得如下资料:

已知经过计算乙工人生产零件的平均长度为9.96mm,标准差为0.254mm。试比较甲、乙两工人谁生产的零件质量较稳定。

13.两种水稻分别在五块田地上试种,其产量如表:

假定各地块两个品种的生产条件相同,试计算这两个品种的平均收获率,进而确定哪一

品种具有较大的稳定性和推广价值。

14.一批苹果自山东某地运往上海口岸,随机抽出200箱检验,其中有4箱不符合质量要求,试问是非标志的平均数和标准差各是多少?

15.某灯泡厂对10000个产品进行使用寿命检验,随机抽取2%样本进行测试,所得资料如下表。

按照质量规定,电灯泡使用寿命在1000小时以上者为合格品,试计算平均合格率、标准差及标准差系数。

16.某厂某月份生产了400件产品,其中合格品380件,不合格品20件。求产品质量分布的集中趋势与离中趋势。

17.某市场上某种蔬菜早市每斤0.25元,中午每斤0.2元,晚市每斤0.1元,现在早、中、晚各买一元,求平均价格。

18.某地区20个商店某年第四季度资料:

试计算该地区20个商店平均完成销售计划指标以及总的流通费用率(提示:流通费用率=流通费用额/实际销售额)。

19.(课堂作业)甲、乙两厂生产同种电子元件,经抽查,甲厂该种电子元件的平均耐用时间为116.8小时,标准差为15.3小时,乙厂该电子元件耐用时间的分组资料如下:

(1)计算并比较哪个厂电子元件平均耐用时间长?

(2)比较哪个厂电子元件耐用时间差异较大?

20.(课堂作业)某工厂生产一批零件共10万件,为了解这批产品的质量,采取抽样的方法抽取1000件进行检验,其结果如下:

标准差及标准差系数。

参考答案:

(一)单项选择题

1.①

2.④

3.②

4.④

5.③

6.④

7.④

8.③

9.③

10.②11.① 12.③ 13.① 14.④ 15.③ 16.①17.④ 18.③

19.③ 20.② 21.③ 22.①23.① 24.② 25.① 26.④ 27.④

28.①29.④ 30.④ 31.① 32.② 33.① 34.③35.④36.③

37.②

(二)多项选择题

1.①②③⑤

2.①②④

3.①②④⑤

4.①②

5.②③

6.②③⑤

7.①④⑤ 8.①②③④ 9.③⑤ 10.①④ 11.②③ 12.①②④

13.①②③⑤ 14.①③ 15.①②⑤ 16.①④⑤ 17.②③

(三)判断题

1.×

2.×

3.√

4.×

5.√

6.√

7.√

8.×

9.× 10.×

11.× 12.√ 13.× 14.× 15.× 16.× 17.× 18.√ 19.× 20.√

(四)填空题

1.同质总体、数量差异抽象化

2.算术平均数、集中趋势

3.均匀、组中值

4.均匀、近似

5.变量值、权数

6.本身数值、各权数占总体单位数

7.绝对数权数、相对数权数、相对数权数

8.变量值、次数、标志总量 9.权数大

10.对数平均数、总比率、总速度 11.数值、位置、位置 12.众数 13.众数组的组中值 14.100、左偏

15.集中趋势、离中趋势 16.反比 17. P 、)(P P -1 18. 95%、%5%95?=21.79% 19.100元 20.平均数、平均数代表性大小、反比 21.36元 22.最大值、最小值、最大组上限、最小组下限 23.标准差、平均数、%100?=

X

V σ

σ 24.同质性 25.0.5

(五)简答题

1.统计数据的分布特征,从集中趋势、离散程度、偏度和峰度三个方面进行描述。平均指标旨在反映总体的一般水平或分布的集中趋势;变异指标是用来刻画总体分布的变异状况或离散程度的指标;偏度和峰度描述数据分布的形状。

2.(1)概念不同。强度相对数是两个有联系而性质不同的总体对比而形成的相对数指标。算术平均数是反映同质总体单位标志值一般水平的指标。(2)主要作用不同。强度相对数反映两不同总体现象形成的密度、强度。算术平均数反映同一现象在同一总体中的一般水平。(3)计算公式及内容不同。算术平均数分子、分母分别是同一总体的标志总量和总体单位数,分子、分母的元素具有一 一对应的关系,而强度相对数是两个总体现象之比,分子分母没有一 一对应关系。

3.平均指标的计算原则是:(1)现象的同质性;(2)要用组平均数补充总平均数;(3)要用分配数列补充说明平均数;(4)注意一般和个别相结合,把平均数和典型事例结合起来。

平均指标的作用:(1)可以消除因总体范围不同而带来的总体数量变异,从而使不同的总体具有可比性;(2)同一总体在不同时间上的平均数可以说明该现象总体的发展变化趋势;(3)利用平均指标可以分析现象之间的依存关系;(4)平均数是统计推断的一个重要参数。

4.变异指标是反映现象总体中各单位标志值变异程度的指标。以平均指标为基础,结合运用变异指标是统计分析的一个重要方法。变异指标的作用有:反映现象总体各单位变量分布的离中趋势;说明平均指标的代表性程度;测定现象变动的均匀性或稳定性程度。

5.总体的分布特征主要有两方面,一是变量值的集中趋势,一是变量值的离中趋势。平均指标是将变量值的数量差异抽象化,以反映现象的一般水平,即变量值的集中趋势;但总体内部各单位之间的差异毕竟是客观存在的,它们构成了总体分布的另一方面的重要特征。标志变异指标能反映变量值的差异程度,即变量值的离中趋势。在统计分析中,变异指标与平均指标是相互补充的,二者结合起来反映总体分布的特征。

6.标志变动度是反映现象总体中各单位标志值变异程度的指标,是测定平均数代表性最重要的方法。常用的测定标志变动度的方法主要有三种:全距法、平均差法、标准差法。

(六)计算应用题

1.解:

次数权数: 该局平均工资7818110

860000

==

X =X ∑∑f

f (元) 比重权数:

该局平均工资∑∑?

X =X f

f

=6500×0.18+7500×0.41+8500×0.32+9500×0.09=7818(元) 2.解:

7月份平均每人日产量为:

37360

13320

==

X =

X ∑∑f

f (件) 8月份平均每人日产量为:

44360

15840

==

X =

X ∑∑f

f (件) 根据计算结果得知,8月份比7月份平均每人日产量多7件。其原因是不同组日产量水平的工人所占比重发生变化所致。7月份工人日产量在40件以上的工人只占全部工人数的40%,而8月份这部分工人所占比重则为66.67%。 3.解:

道森供应公司

从数据计算结果看,平均交货天数都为10.3天,但标准差不同,道森供应公司标准差为0.6749,克拉克批发公司标准差为2.584,由于平均数相同,因此可以认为道森供应公司交货时间更稳定、更可靠。从全距看,结论相同。 4.解:

公共交通上班平均时间=32 小汽车上班平均时间=32

公共交通上班时间标准差=4.64 小汽车上班时间标准差=1.93 应选小汽车。小汽车上班时间变异程度小。 5.解:

)(67.86630

26000

);(70.8193327050元 元乙

甲====

X =

X ∑∑X f

f

)(05.124);(14.138元= 元=乙甲σσ

%31.1467

.86605.124%;85.1670.81914.138=== =

乙甲V V 差异程度小,所以乙单位职工工资 乙甲V V > 。

6.解:成交额单位:万元,成交量单位:万斤

甲市场平均价格)

(375.145.5元==X

=∑∑X m m h

乙市场平均价格)(325.14

3

.5元==

X =

X ∑∑f

f 说明:两个市场销售单价是相同的,销售总量也是相同的,影响两个市场平均价格高

克拉克批发公司

低不同的原因就在于各种价格的农产品在两个市场的成交量不同。甲市场销售价格较高的乙产品量最多,而乙市场销售价格最低的甲产品最多,因而使得甲市场的平均价格高于乙市场。这就是权数在平均数形成中所起的权衡轻重的作用,如果将两个市场的各级成交量占总成交量的比重计算出来,则更能看出权数的作用。

7.解:由于各道工序合格率的连乘积等于总合格率,所以三道工序的平均合格率:

%

47.959547.08702.09723.09378.09574.03321_

===??=∏X =X ??X ?X =X n n n

8.解:列表计算如下:

平均计划完成程度为:

%77.10156495749==X

=

∑∑X

m H

9.解:月平均工资为:)(50.9152

965

9323230__

元=-?=-=

X M M e

该公司职工月工资收入变量数列属于左偏态。 10.解:(1)e M ≈266.67

(2)X <e M <o M ,负偏态(左偏)

(3)X ≈450,X >e M >o M ,正偏态(右偏) 11.解: (1)成人组:

第四章 随机变量的数字特征试题答案

第四章随机变量的数字特征试题答案 一、 选择(每小题2分) 1、设随机变量X 服从参数为2的泊松分布,则下列结论中正确的是(D ) A.E (X )=0.5,D (X )=0.5?B.E (X )=0.5,D (X )=0.25 C.E (X )=2,D (X )=4?D.E (X )=2,D (X )=2 2 Y X -=,则34) A C 5A 6、)1= (C ) A .3 4?B .3 7C . 323?D .3 26 7、设随机变量X 服从参数为3的泊松分布,)3 1 ,8(~B Y ,X 与Y 相互独立,则 )43(--Y X D =(C ) A .-13? B .15 C .19? D .23 8、已知1)(=X D ,25)(=Y D ,XY ρ=0.4,则)(Y X D -=(B )

A .6? B .22 C .30? D .46 9、设)3 1 ,10(~B X ,则)(X E =(C ) A .31? B .1 C .3 10?D .10 10、设)3,1(~2N X ,则下列选项中,不成立的是(B ) A.E (X )=1? B.D (X )=3? C.P (X=1)=0? D.P (X<1)=0.5 11 A .C .12、XY ρ= (D 13x =(B) A . 14、(C ) A.-15、为(A .C .21)(,41)(== X D X E ?D .4 1 )(,21)(==X D X E 16、设二维随机变量(X ,Y )的分布律为

则)(XY E =(B ) A .9 1-?B .0 C .9 1?D .3 1 17、已知随机变量X 服从参数为2的泊松分布,则随机变量X 的方差为(D ) A 18,0.5),则A 19,则X A 20, 则21(B A C 22、设n X X X ,,,21 是来自总体),(2σμN 的样本,对任意的ε>0,样本均值X 所满足的切比雪夫不等式为(B ) A .{}2 2 εσεμn n X P ≥ <-?B .{} 22 1ε σεμn X P -≥<- C .{}2 2 1ε σεμn X P - ≤≥-?D .{}2 2 εσεμn n X P ≤ ≥-

数据特征的测度

数据特征的测度 统计数据经过整理和显示后,我们对数据分布的类型和特点就有了一个大致的了解,但这种了解只是表面上的,还缺少代表性的数量特征值准确地描述出统计数据的分布。为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。对统计数据分布的特征,我们可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的偏态和峰度,反映数据分布的形状。这三个方面分别反映了数据分布特征的不同侧面,这里我们主要讨论集中趋势和离散程度的测度方法。 (一)集中趋势的测度 集中趋势是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。集中趋势的测度值主要有众数、中位数、均值、几何平均数等几种。 1.众数 众数是一组数据中出现次数最多的变量值,用0M 表示。例如,下面是抽样调查的10个家庭住房面积(单位:平方米)的数据: 55 75 75 90 90 90 90 105 120 150 这10个家庭住房面积的众数为90。即0M =90(平方米) 众数是一个位置代表值,它的特点是不受数据中极端值的影响。 2.中位数 中位数是一组数据按一定顺序排序后,处于中间位置上的数值,用e M 表示。显然,中位数将全部数据等分成两部分,每部分包含50%的数据,一部分数据比中位数大,另一部分则比中位数小。 根据未分组数据计算中位数时,要先对数据进行排序,然后确定中位数的位置,其公式为: 2 1 +n 中位数位置= 式中的n 为数据的个数,最后确定中位数的具体数值。 设一组数据为1x ,2x ,…,n x ,按从小到大排序后为)1(x ,)2(x ,…,)(n x ,则中位数可表示为: ??? ? ??????? ??+=++为偶数时 当为奇数时当n x x n x M n n n e 122)21 (21 例如,在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据如下(单位: 元): 750 780 850 960 1080 1250 1500 1650 2000

数据分布特征的测度

习题 一、填空题 1、统计数据分布的特征,可以从三个方面进行测度和描述:一是分布的__________,反映所有数据向其中心值靠拢或聚集的程度;二是分布的__________,反映各数据远离其中心值的趋势;三是分布的__________,反映数据分布的形状。 2、算术平均数有两个重要数学性质:各变量值与其算术平均数的__________等于零;各变量值与其算术平均数的__________等于最小值。 3、简单算术平均是加权算术平均数的__________,事实上简单算术平均数也有权数存在,只不过各变量值出现的权数均_________。 4、几何平均数主要用于计算__________的平均。它只适合于__________数据。 5、在一组数据分布中,当算术平均数大于中位数大于众数时属于________分布;当算术平均数小于中位数小于众数时属于________分布。 6、__________是各变量值与其均值离差平方的平均数,是测度数值型数据__________最主要的方法。 7、为了比较人数不等的两个班级学生的学习成绩的优劣,需要计算__________;而为了说明哪个班级学生的学习成绩比较整齐,则需要计算________。 8、偏态是对分布__________和__________的测度;而峰度则是指分布集中趋势__________的形状。 二、判断题 1、根据组距式数列计算得到的算术平均数只能是一个近似值。() 2、众数的大小只取决于众数组相邻组次数的多少。() 3、若已知甲数列的标准差小于乙数列,则可断言:甲数列算术平均数的代表性好于乙数列。() 4、如果数据的分布没有明显的集中趋势或最高峰点,众数也可能不存在。() 5、若A、B、C三个公司的利润计划完成程度分别为95%、100%和105%,则这三个公司平均的利润计划完成程度应为100%。() 6、当所掌握的变量值本身是比率的形式,而且各比率的乘积等于总的比率时,应采用倒数平均数来计算平均比率。() 7、投资者连续三年股票投资收益率为4%、2%和5%,则该投资者三年内平均收益率为3.66%。() 8、离散系数最适合于不同性质或不同水平数列算术平均数代表性的比较。() 9、当偏态系数α=0时,表明数据分布属于对称分布。() 10、当峰度系数β=0时,表明数据分布属于正态分布。() 三、单项选择题 1、由组距式数列确定众数时,如果众数组相邻两组的次数相等,则()。 A.众数为零B.众数组的组中值就是众数 C.众数不能确定D.众数组的组限就是众数 2、受极端数值影响最小的集中趋势值是()。 A.算术平均数B.众数和中位数C.几何平均数D.调和平均数 3、加权算术平均数中的权数为()。 A.变量值B.次数的总和C.变量值的总和D.次数比重 4、标准差系数抽象了()。 A.总体单位数多少的影响B.算术平均数高低的影响 C.总体指标数值大小的影响D.标志变异程度的影响 5、某车间三个班生产同种产品,6月份劳动生产率分别为2、3、4(件/工日),产量分别为400、500、600件,则该车间平均劳动生产率计算式应为()。

第4章 数据分布特征的测度

第四章 数据分布特征的测度 §1概述 §2 集中趋势的测度 一、集中趋势的含义 (一)集中趋势的概念 集中趋势(Central tendency )是指一组数据向某一中心值靠拢的倾向,测度集中趋势也就是寻找数据一般水平的代表值或中心值。 (二)集中趋势的内容 1.均值(Mean ) 算术平均数 调和平均数 几何平均数 切尾均值 2.位置平均数 中位数 四分位数 十分位数 百分位数 3.众数 二、众数 1.概念 众数(Mode )是一组数据中出现次数最多的变量值,用0M 表示。主要用于测度定类型数据的集中趋势。 2.单项分组数列 )max(0i f x M 例:为研究广告市场的状况,一家广告公司在某城市随机抽取200人就广告问题作了邮寄问卷调查,其中的一个问题是:“您比较关心下列哪一类广告?”

①商品广告;②服务广告;③金融广告;④房地产广告;⑤招生招聘广告;⑥其他广告。 表4-1 某城市居民关注广告类型的频数分布 =0M 商品广告 3.组距分组数列 ①确定众数组——频数最多的组 ②计算众数值 图4-1 众数值计算示意图 可见,众数实际上是频数最大组的下限加上按一定几何比例分配组距所得到的那段组距,即

X L M +=0 因为 2 11?+?+=?y x x d y x x 2 11 211)(?+??=+?+??= 所以 d L M 2 11 0?+??+ =(下限公式) 同理,可得上限公式: d U M 2 12 0?+??- = 例:某地区3000家农户的年收入情况资料如下: 解:57048010501=-=?; 45060010502=-=? 所以 75591000450 570570 70000=?++ =M (元) 三、位置平均数 1.中位数 中位数(Median )是一组数据按从小到大排序后,处于中间位置上的变量值,用e M 表示。中位数是一个位置代表值,它主要用于测度定序数据的集中趋势。 2.根据未分组资料确定中位数 ①按标志值大小进行排列得),,,(21n x x x Λ;

第四章随机变量的数字特征习题

第四章 随机变量的数字特征 一、填空题: 1. 设随机变量ζ~B(n,p) ,且5.0=ζE ,45.0=ζD ,则n= , p= 。 2. 设随机变量ξ表示10次独立重复射击中命中目标的次数,且每次射击命中目标的概率为0.4,则)(2 ξE = 。 3. 已知随机变量ξ的概率密度为1 22 1 )(-+-= x x e x π ?(+∞<<∞-x ),则 =)(ξE ,=)(ξD 。 4. 设随机变量ξ),(~b a U ,且2)(=ξE ,3 1)(= ξD ,则=a ,=b 。 5. 设随机变量ζ,有10=ζE ,25=ζD ,已知 0)(=+b a E ζ ,1)(=+b a D ζ 则 a= , b= , 或 a= , b= 。 6. 已知离散型随机变量ζ服从参数为2的普哇松分布,则随机变量23-=ζη的数学期望=ηE 。 7. 设随机变量1ξ]6,0[~U ,2ξ)2,0(~2 N ,且1ξ与2ξ相互独立,则 =-)2(21ξξD 。 8. 设随机变量n ζζζ,,,21 独立,并且服从同一分布。数学期望为a , 方差为2 σ, 令 i n i n ζζ∑==1 1 ,则 =ζE ,=ζD 。

9. 已知随机变量ζ与η的方差分别为49=ζD , 64=ηD , 相关系数 8.0=ζηρ,则=+)(ηζD ,=-)(ηζD 。 10. 若随机变量ζ的方差为004.0)(=ξD ,利用切比雪夫不等式知 {}≥<-2.0ξξE P 。 二、选择题: 1. 设随机变量ζ的函数为b a +=ζη,(a , b 为常数),且ζE ,ζD 均存在,则必有( C )。 A. ζηaE E = B. ζηaD D = C. b aE E +=ζη D. b aD D +=ζη 2. 设随机变量ζ的方差ζD 存在,则=+)(b a D ζ( B )(a , b 为常数)。 A. b aD +ζ B. ζD a 2 C. b D a +ζ2 D. ζD a 3. 如果随机变量ζ~),(2σμN ,且3=ζE ,1=ζD ,则=≤<-)11(ζP ( D ). A. 1)1(2-Φ B.)4()2(Φ-Φ C.)2()4(-Φ--Φ D.)2()4(Φ-Φ 4. 若随机变量ζ服从指数分布,且2 5.0=ζD ,则ζ的数学期望=ζE ( A ). A. 21 B. 2 C. 4 1 D. 4 5. 设随机变量ζ的分布函数为?? ???>≤≤<=1 ,110, , 0)(3 x x x x x F ,则=)(ξE ( B ). A. dx x ? +∞ 4 B. dx x ?1 2 3 C. ??+∞ +1 1 4 xdx dx x D. dx x ? +∞ 23 6. 设随机变量ζ的期望ζE 为一非负值,且2)12 ( 2 =-ζE ,2 1 )12 ( = -ζ D ,则

第四章 随机变量的数字特征课后习题参考答案

第四章 随机变量的数字特征 1. 解:令A 表示一次检验就去调整设备的事件,设其概率为p ,T 表示每次检验发现的次品个数,易知(10,0.1)T B ~,且(4,)X B p ~。 得, 0010119 1010(){1}1{1}1(0.1)(0.9)(0.1)(0.9)0.2639p P A P T P T C C ==>=-≤=--=。 因为(4,)X B p ~,得()4 1.0556E X p =?=。 2. 解:1500 3000 2220 1500 ()()(3000)5001000150015001500x x E X xf x dx dx x dx +∞ -∞ -= =+-=+=?? ?。 3. 解:1 ()(2)0.400.320.30.2k k i E X x p ∞ == =-?+?+?=-∑; 2 21 (35)(35)170.450.3170.313.4k k i E X x p ∞ =+=+=?+?+?=∑ 22(35)3()513.4E X E X +=+=。 4.解:(1)0 ()(2)2()2 ()22(| )2x x x E Y E X E X xf x dx x e dx xe e dx +∞ +∞ +∞ --+∞ --∞ ==== =-+=???. (2)223300 1 1 33 ()()()|X x x x E Y E e e f x dx e dx e +∞ +∞ ----+∞ -∞ == = =-=??. 5.解:(1)3 33 1 1 1 ()10.420.230.42i i i ij i i j E X x p x p ? ==== ==?+?+?=∑∑∑. 3 3 3 1 1 1 ()10.300.410.30j j j ij j j i E Y y p y p ?======-?+?+?=∑∑∑. (2) 7 1 11 ()10.2(0.50.1)...0.50.10.1315i i i E Z z p ===-?+-?++?+?=-∑。 2 2 1 ()40.400.340.3 2.8 k k i E X x p ∞ ===?+?+?=∑

中级经济基础知识-数据特征的测度(精选试题)

中级经济基础知识-数据特征的测度 1、下列离散程度的测度值中,能够消除变量值水平和计量单位对测度值影响的是()。 A.标准差 B.离散系数 C.方差 D.极差 2、中位数() A.不是平均数 B.是一种趋势值 C.是一种位置平均数 D.是一种位置 3、什么反映数据远离其中心值的趋势 A.集中趋势 B.离散程度 C.标准差系数 D.偏态和峰度 4、下面一组数据为9个家庭的人均月收入数据(单位:元):700、780、

850、960、1080、1300、1500、1650、1800,中位数为()。 A.700 B.960 C.1080 D.1800 5、数据的离散程度越小,集中趋势的测度值对该组数据的代表性()。 A.越好 B.越差 C.不变 D.不确定 6、某学校学生的平均年龄为15岁,标准差为2岁;该学校老师的平均年龄为30岁,标准差为3岁。比较该学校年龄的离散程度,则()。 A.教师年龄的离散程度大一些 B.学生年龄的离散程度大一些 C.学生年龄和教师年龄的离散程度相同 D.教师年龄的离散程度是学生年龄离散程度的1.5倍 7、下面是抽样调查的9个家庭住房面积(单位:平方米):657585909098105120210,这9个家庭住房面积的众数为()。

A.75 B.85 C.90 D.150 8、一组数据向某一中心值靠拢的程度称为()。 A.峰度 B.偏态 C.离散程度 D.集中趋势 9、以下属于位置平均数的是()。 A.众数 B.极差 C.几何平均数 D.算术平均数 10、下列数据特征的测度值中,受极端值影响的是()。 A.众数 B.中位数 C.位置平均数 D.加权算术平均数

统计学第四版课后答案

统计课后思考题答案 第一章思考题 1.1什么是统计学 统计学是关于数据的一门学科,它收集,处理,分析,解释来自各个领域的数据并从中得出结论。 1.2解释描述统计和推断统计 描述统计;它研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。 推断统计;它是研究如何利用样本数据来推断总体特征的统计方法。 1.3统计学的类型和不同类型的特点 统计数据;按所采用的计量尺度不同分; (定性数据)分类数据:只能归于某一类别的非数字型数据,它是对事物进行分类的结果,数据表现为类别,用文字来表述; (定性数据)顺序数据:只能归于某一有序类别的非数字型数据。它也是有类别的,但这些类别是有序的。 (定量数据)数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。 统计数据;按统计数据都收集方法分; 观测数据:是通过调查或观测而收集到的数据,这类数据是在没有对事物人为控制的条件下得到的。 实验数据:在实验中控制实验对象而收集到的数据。 统计数据;按被描述的现象与实践的关系分; 截面数据:在相同或相似的时间点收集到的数据,也叫静态数据。 时间序列数据:按时间顺序收集到的,用于描述现象随时间变化的情况,也叫动态数据。 1.4解释分类数据,顺序数据和数值型数据 答案同1.3 1.5举例说明总体,样本,参数,统计量,变量这几个概念 对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。 1.6变量的分类 变量可以分为分类变量,顺序变量,数值型变量。 变量也可以分为随机变量和非随机变量。经验变量和理论变量。 1.7举例说明离散型变量和连续性变量 离散型变量,只能取有限个值,取值以整数位断开,比如“企业数” 连续型变量,取之连续不断,不能一一列举,比如“温度”。 1.8统计应用实例 人口普查,商场的名意调查等。 1.9统计应用的领域 经济分析和政府分析还有物理,生物等等各个领域。 第二章思考题 2.1什么是二手资料?使用二手资料应注意什么问题 与研究内容有关,由别人调查和试验而来已经存在,并会被我们利用的资料为“二手资料”。

第四章 数据分布特征的测度

第四章数据分布特征的测度 教学目的与要求:统计平均指标是表明总体数量特征的一个重要指标,它是将总体各单位标志值的差异抽象化,反映总体各单位标志值的一般水平,揭示总体分布的集中趋势。变异指标是反映总体各单位标志值的差异程度,揭示总体分布离中趋势的又一重要数量特征指标。通过本章的学习,要求理解统计平均指标的意义和作用;掌握各种统计平均指标的特点、应用条件、应用范围和计算方法;理解变异指标的意义和作用;掌握各种变异指标的性质和计算方法;能运用变异指标衡量平均数代表性的大小。 教学重点与难点:重点为各种平均指标和变异指标的概念、特点、应用条件、应用范围和计算方法。难点是不同条件下平均指标和变异指标的计算。 统计数据经过整理和显示后,对数据分布的形状和特征就可以有一个大致的了解。为进一步掌握数据分布的特征和规律,进行更深入的分析,还需要找到反映数据分布特征的各个代表值。对一组数据分布的特征,可以从三个方面进行测度和描述:一是分布的集中趋势,反映各数据向其中心值靠拢和聚集的程度;二是分布的离散程度,反映各数据远离中心值的趋势;三是分布偏态和峰态,反映数据分布的形状。这三个方面分别反映了数据分布特征的不同侧面。 第一节集中趋势的测度 集中趋势是指一组数据向某一中心值靠拢的倾向,它反映了一组数据中心点的位置所在。测度集中趋势也就是寻找数据一般水平的代表值或中心值。低层次数据的集中趋势测度值适用于高层次的测量数据,反过来,高层次数据的集中趋势测度值并不适用于低层次的测量数据。因此,选用哪一个测度值来反映数据的集中趋势,要根据所掌握的数据的类型和特点来确定。 一、分类数据:众数(M o) 众数是指一组数据中出现次数最多的变量值。 ?出现次数最多的变量值 ?不受极端值的影响 ?一组数据可能没有众数或有几个众数 ?主要用于分类数据,也可用于顺序数据和数值型数据

数据分布特征的描述习题答案

第四章 数据分布特征的描述习题 一、填空题 1、数据分布集中趋势的测度值(指标)主要有 众数 、 中位数 和 均值 。其中 众数 和 中位数 用于测度品质数据集中趋势的分布特征, 均值 用于测度数值型数据集中趋势的分布特征。 2、标准差是反映 数据离散程度 的最主要指标(测度值)。 3、几何平均数是计算 平均比率 和 平均速度 的比较适用的一种方法。 4、当两组数据的平均数不等时,要比较其数据的差异程度大小,需要计算 标准系数 。 5、在测定数据分布特征时,如果M M e X 0==,则认为数据呈 对称 分布。 6、当一组工人的月平均工资悬殊较大时,用他们工资的 众数(中位数) 比其算术平均数更能代表全部工人工资的总体水平。 二、选择题 单选题: 1、 反映的时间状况不同,总量指标可分为( (2) ) (1)总量指标和时点总量指标 (2)时点总量指标和时期总量指标 (3)时期总量指标和时间指标 (4)实物量指标和价值量指标 2、某厂1999年完成产值200万元,2000年计划增长10%,实际完成了231万元,超额完成( (2) ) (1)% (2)5% (3)% (4) % 3、在同一变量数列中,当标志值(变量值)比较大的次数较多时,计算出来的平均数( (2) ) (1) 接近标志值小的一方 (2)接近标志值大的一方 (3)接近次数少的一方 (4)接近哪一方无法判断 4、在计算平均数时,权数的意义和作用是不变的,而权数的具体表现( (1) ) (1)可变的 (2)总是各组单位数 (2) 总是各组标志总量 (4)总是各组标志值 5、1998年某厂甲车间工人的月平均工资为520元,乙车间工人的月平均工资为540元,1999年各车间的工资水平不变,但甲车间的工人占全部工人的比重由原来的40%提高到了60%,则1999年两车间工人的总平均工资比1998年( (3) ) (1)提高 (2)不变 (3)降低 (4)不能做结论 6、在变异指标(离散程度测度值)中,其数值越小,则( (2) ) (1)说明变量值越分散,平均数代表性越低 (2)说明变量值越集中,平均数代表性越高 (3)说明变量值越分散,平均数代表性越高 (4)说明变量值越集中,平均数代表性越低 7、有甲、乙两数列,已知甲数列:07.7,70==甲甲 σX ;乙数列: 41.3,7==乙乙σX 根据以上资料可直接判断( (4) )

第四章随机变量的数字特征试题答案

第四章 随机变量的数字特征试题答案 一、选择(每小题2分) 1、设随机变量X 服从参数为2的泊松分布,则下列结论中正确的是(D ) A. E (X )=0.5,D (X )=0.5 B. E (X )=0.5,D (X )=0.25 C. E (X )=2,D (X )=4 D. E (X )=2,D (X )=2 2、设随机变量X 与Y 相互独立,且X~N (1,4),Y~N (0,1),令Y X Z -=,则D (Z )= ( C ) A. 1 B. 3 C. 5 D. 6 3、已知D (X )=4,D (Y )=25,cov (X ,Y )=4,则XY ρ =(C ) A. 0.004 B. 0.04 C. 0.4 D. 4 4、设X ,Y 是任意随机变量,C 为常数,则下列各式中正确的是( D ) A . D (X+Y )=D (X )+D (Y ) B . D (X+C )=D (X )+C C . D (X-Y )=D (X )-D (Y ) D . D (X-C )=D (X ) 5、设随机变量X 的分布函数为???? ???≥<≤-<=4, 14 2,12 2, 0)(x x x x x F ,则E(X)=(D ) A . 31 B . 21 C .2 3 D . 3 6、设随机变量X 与Y 相互独立,且)61,36(~B X ,)3 1 ,12(~B Y ,则)1(+-Y X D =(C ) A . 34 B . 37 C . 323 D . 3 26 7、设随机变量X 服从参数为3的泊松分布,)3 1 ,8(~B Y , X 与Y 相互独立,则)43(--Y X D =(C ) A . -13 B . 15 C . 19 D . 23 8、已知1)(=X D ,25)(=Y D ,XY ρ=0.4,则)(Y X D -=(B ) A . 6 B . 22 C . 30 D . 46 9、设)3 1,10(~B X ,则)(X E =(C ) A . 31 B . 1 C . 3 10 D . 10 10、设)3,1(~2 N X ,则下列选项中,不成立的是(B ) A. E (X )=1 B. D (X )=3 C. P (X=1)=0 D. P (X<1)=0.5 11、设)(X E ,)(Y E ,)(X D ,)(Y D 及),cov(Y X 均存在,则)(Y X D -=(C ) A . )(X D +)(Y D B . )(X D -)(Y D

统计学教(学)案(第5章数据分布特征的测度)

统计学

第一节总体分布集中趋势的测度 总体分布集中趋势是指总体中各单位的次数分布从两边向中间集中(靠拢)的趋势。 在分布数列中,越靠近中心值,标志值出现的次数越多,而远离中心值的次数较少。 由于对大多数统计总体来说,其总体单位的数值分布是以平均数为中心的,因此平均数反映了总体分布的集中趋势。所以,对集中趋势进行测度,就是寻找总体一般水平的中心值或代表值,就是计算总体的平均数(平均指标)。 一、平均指标的概念和作用 ㈠概念:平均指标是指在同质总体将各单位的数量差异抽象化,反映总体一般水平的代表值。 ㈡特点 ⒈将数量差异抽象化; ⒉必须具有同质性; ⒊反映总体变量值的集中趋势。 ㈢作用: ⒈可用于同类现象在不同空间的比; ⒉可用于同类现象在不同时间的比。

式中,m 代表各组标志总量,其余符号与前相同。 例: 某食堂购进某种蔬菜,相关资料如下,求这种蔬菜的平均价格。 4-13 某种蔬菜价格资料及其计算表 早午晚 价格(元/千克) 购买金额(元) 购买量(千克) x m m x 1.00 1.20 1.10 10.0 15.0 20.0 10.0 12.5 18.2 合计 - 45.0 40.7 根据上表计算食堂购进这种蔬菜的平均价格为: 10.015.020.045.0 1.106 /40.740.7m H m x ++= ===∑∑(元千克) 通过上例计算,可以看出,加权平均数实质上是加权算术平均数的一种变形式。其变换形式如下: m xf xf H m xf f x x = ==∑∑∑∑∑∑ 3.几何平均数 (1)概念 几何平均数是n 个比率乘积的n 次方根。 (2)几何平均数的计算 社会经济统计中,几何平均法适用于计算平均比率和平均速度。 简单几何平均数的计算公式为: n 21x x x G ???=Λ G表示几何平均数;x 表示变量值;n 表示变量值个数。 加权几何平均数的计算公式为

第四章 数字特征

第四章 随机变量的数字特征 ㈠ 考试内容 随机变量的数学期望(均值)、方差、标准差及其性质 随机变量简单函数的数学期望 矩、协方差、相关系数及其性质 ㈡ 考试要求 1、理解随机变量的数字特征(数学期望、方差,标准差、矩、协方差、相关系数)的概念,会运用数字特征的基本性质;掌握常用分布(二项分布、超几何分布、泊松分布、一维和二维均匀分布、指数分布、一维和二维正态分布)的数字特征(解题时可以直接利用这些数字特征). 2、会求随机变量简单函数的数学期望. 一维随机变量的数字随特征 一、随机变量的数学期望 例1 某商店向工厂进货,该货物有四个等级:一、二、三和等外,产品属于这些等级的概率依次是:0.50、0.30、0.15、0.05. 若商店每销出一件一等品获利10.50元,销出一件二、三等品分别获利8元和3元,而销出一件等外品则亏损6元,问平均销出一件产品获利多少元? 解:假设该商店进货量N 极大,则平均说来其中有一等品N 50.0件,二等品和三等品和等外品数分别为N 30.0件、N 15.0件、N 05.0件. 这N 件产品总的销售获利为 )6(05.0315.0830.05.1050.0-?+?+?+?N N N N (元) 故平均获利为 元) (8.7)6(05.0315.0830.05.1050.0)]6(05.0315.0830.05.1050.0[1 =-?+?+?+?=-?+?+?+?N N N N N (一)离散型随机变量的数学期望 定义: 设随机变量X 的分布列为)21(}{ ,,===i p x X p i i , 若级数∑∞=1 i i i p x 绝对收敛,则称∑∞ =1 i i i p x 为随机变量X 的数学期望,记作EX ,即 ∑∞ ==1i i i p x EX 如果级数∑∞ =1 i i i p x 发散,则称X 的数学期望不存在. (二)连续型随机变量的数学期望 定义:设连续型随机变量X 的概率密度为)(x f ,若积分?∞ +∞ -dx x f x )(绝对收敛,则称积分?∞ +∞ -dx x f x )(为X 的数学期望,记为EX ,即?∞+∞ -=dx x f x EX )(;若积分? ∞+∞ -dx x f x )(发散,则称X 的数学期望不存在. (三) 随机变量函数的数学期望 定理:设X 是一个随机变量,)(x g 为连续实函数. (1)若X 是离散型随机变量,其概率分布为 ,, ,21}{===i p x X p i i ,若级 数∑∞ =1 )(i i i p x g 绝对收敛,则)(X Eg 存在,且 ∑∞ ===1 )()(i i i p x g X Eg EY (2)若X 是连续型随机变量,其密度函数为)(x f X ,若积分?∞ +∞ -dx x f x g X )()(绝对收敛,则)(X Eg 存在, ?∞ +∞ -==dx x f x g X Eg EY X )()()(

第四章随机变量的数字特征

第四章 随机变量的数字特征 」、选择题 1 .X 为随机变量,E(X) = —1,D(X)=3,则 ERxfao = ( D ) A. 18 B.9 C.30 D. 32 2.设二维随机向量(X,Y)的概率密度函数为 A. 0 B.1/2 C.2 D. 1 3. ( X,Y )是二维随机向量,与C OV (X ,Y )=0不等价的是(D ). C. D (X _Y )= DX DY D. X 与 Y 独立 4. X,Y 独立,且方差均存在,则D(2X -3Y) =( C ). A. 2DX -3DY B. 4DX -9DY C. 5.若X,Y 独立,则(C ). A. D(X -3Y) = DX -9DY B. C. E {[ x-EX ][Y -EY ]} =0 D. 6.若Cov(X,Y)=0,则下列结论中正确的是(C ). A. X,Y 独立 B. D(XY)=DX DY C. D(X Y)=DX DY D. D(X-Y) = DX-DY 7. X,Y 为两个随机变量,且 E[(X -EX )(Y -EY)] =0,则 X,Y( D ). A.独立 B. 不独立 C. 相关 D. 不相关 8. 设D(X Y^DX DY,则以下结论正确的是(A ). A. X,Y 不相关 B. X,Y 独立 C. 6y=1 D. ?一 1 f (x, y) e" y),0 ::: x ::: ::,0 ::: 则 E(XY)=(D ). A. E(XY)二 EX EY B. D(X Y)二 DX DY 4DX 9DY D. 2DX 3DY D(XY) = DX DY P{Y 二 aX b} = 1

第24章 数据特征的测度

第二十四章数据特征的测度 一、单选题: 1、位置平均数和数值平均数是对(B190)的测度。 A、离散程度C、离散系数D、偏态 2A190) A、集中趋势 B、离散程度 C、偏态 D、峰度 3、以下属于位置平均数的是(C190+中位数AB→数值平均数) A、几何平均数 B、算术平均数 C、众数 D、极差 4、一组数据中出现频数最多的那个数值称为( C190 )。 A、中位数 B、极值 C、众数 D、平均数 5( D190 )。 A、众数 B、算术平均数 C、几何平均数 D、中位数 6、平均数指标反映了总体的( A190 )。 A、集中趋势 B、离散程度 C、变动趋势 D、分布特征 7、下列集中趋势测度值中,适用于品质数据的是(A190 BCD→适用于数值型数据) A、众数 B、简单算术平均数 C、标准差 D、加权算术平均数 8、下列数据特征的测度值中,不受极端值影响的是(C190+众数)。 A、简单算术平均数 B、极差 C、中位数 D、加权算术平均数 9、算术平均数与众数、中位数具有共同特点是(D190 )。 A、都属于分类数据 B、都适用于顺序数据 C、都不受极端值的影响 D、都适用于数值型数据 解析:众数、中位数不受极端值的影响;算术平均数易受极端值的影响。 众数→适用于品质(分类+顺序)、数值型数据中位数→适用于顺序、数值型数据 算术平均数→适用于数值型数据 10、某中学高中一年级840人、42人、42人、42人、44人、44人、45人、46人,其众数、中位数分别为(A190 )人。 A、42、43 B、43、43 C、43、42 D、46、43 解析:出现频数最多的数是42 中位数位置=(8+1)÷2=4.5→第四人与第五人之间 中位数=(42+44)÷2=43 11、某小学六年级8个班的学生人数由少到多依次为34人、34人、35人、35人、36人、36人、37人、37人,其中位数为(C190 )人。 A、34 B、35 C、36 D、37 解析:中位数位置=(8+1)÷2=4.5→第四人与第五人之间中位数=(35+36)÷2=35.5 ≈ 36人→人数要取整数 12、9个超市中食品的日销售额分别为(单位:元):500、300、400、350、350、500、450、700、600,其中位数为(C190 )人。 A、350 B、500 C、450 D、600 解析:先从小到大排序:300、350、350、400、450、500、500、600、700,中位数位置=(9+1)÷2=5 13、某连锁超市6个分店的职工人数由小到大排序后为57人、58人、58人、60人、63人、70人,其算术平均数、众数分别为(B191 )人。 A、59、58 B、61、58 C、61、59 D、61、70

第二章 数据分布特征的测度讲解

第二章数据分布特征的测度 对数据分布特征主要从三个方面进行测度和描述:一是分布的集中趋势,反映数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据远离其中心值的趋势;三是分布的形状,反映数据分布的偏斜程度和峰度。本章主要介绍如何使用函数以及“数据分析”工具对数据分布特征进行测度和描述。 第一节函数的介绍 本节主要介绍在统计分析中需要用到的一些函数,其中包括我们本章(描述统计)中以及在概率分布、参数估计与假设检验、方差分析、相关与回归等分析中涉及到的函数,读者在后面章节的学习中可以参阅本节的内容。 一、统计计算中经常用到的函数(函数列表)★ Excel为用户提供了数学、三角函数、统计函数、数据库函数、财务函数、工程函数、逻辑函数、文本函数、时间和日期函数、信息函数、查找和引用函数等10类300多种,可以满足多方面的需要。其中,统计函数最多达78种;此外还有14种数据库函数,以及在统计中经常使用的数学函数20种,合计112种。下面将这些函数名称及功能列表显示。 ★本小节摘自: 安维默主编,《统计电算化》第34~37页,中国统计出版社,2000

表2-1 可用于统计分析的函数(续2)

1、函数的语法 工作表函数包括两个部分:函数名和紧跟的一个或多个参数。函数名,例如SUM和A VERAGE,表明函数要执行的操作;参数则指定函数所使用的值或单元格。例如,在公式“=SUM(C3:C5)”中,SUM为函数名,C3:C5为参数。此函数计算单元格C3、C4和C5中值的总和。函数的参数可以为数值类型。例如,公式“=SUM(327,209,176)”中的SUM 函数将数字327、209和176求和。不过通常的做法是,先在工作表的单元格中输入使用的数字,然后将这些单元格作为函数的参数使用。请注意函数参数两端的括号:开括号表示参数的开始,必须紧跟在函数名后。如果在函数名和括号之间输入了空格或其他字符,那么Excel会显示错误信息“Microsoft Excel 在公式中发现了错误。建议更正如下:是否接受建议的修改?”如果单击【是】按钮,则Excel会自动更新公式;如果单击【否】按钮,则单元格中将显示错误值﹟NAME?。 如果在函数中使用多个参数,则要用逗号将参数隔开。例如,公式“=PRODUCT (C1,C2,C5)”告诉Excel将单元格C1,C2,和C5的数值相乘。函数中可使用的参数多达30个,但公式的长度不能超过1024个字符。参数可以是工作表中包括任意数目单元格的区域。例如,函数“=SUM(A1:A5,C2:C10,D3:D7)”只有3个参数,但对29个单元格的数据进行求和运算(第一个参数A1:A5,指从A1到A5的所有单元格,依此类推)。反过来,引用的单元格中也可以包括公式,这些公式引用更多的单元格或单元格区域。使用这些参数,就可以轻松地创建复杂的公式来执行功能强大的各种操作。 2、函数的输入 对一些单变量和比较简单的函数,可用键盘直接输入。其方法与在单元格中输入公式相

第四章 数字特征

第四章 数字特征练习题 一.单项选择题 1.设随机变量X 服从参数为2的泊松分布,则下列结论中正确的是( ) A.E (X )=0.5,D (X )=0.5 B.E (X )=0.5,D (X )=0.25 C.E (X )=2,D (X )=4 D.E (X )=2,D (X )=2 2.设随机变量X 与Y 相互独立,且X ~N (1,4),Y ~N (0,1),令Z=X -Y ,则D (Z )= ( ) A.1 B.3 C.5 D.6 3.已知D (X )=4,D (Y )=25,Cov (X ,Y )=4,则ρXY =( ) A.0.004 B.0.04 C.0.4 D.4 4.设X ,Y 是任意随机变量,C 为常数,则下列各式中正确的是( ) A .D (X+Y )=D (X )+D (Y ) B .D (X+C )=D (X )+C C . D (X-Y )=D (X )-D (Y ) D .D (X-C )=D (X ) 5.设随机变量X 与Y 相互独立,且X~B (36,61),Y~B (12,31 ),则D (X-Y+1)=( ) A .34 B .37 C . 3 23 D . 3 26 6.已知随机变量X 满足E (X )=-1,E (X 2)=2,则D (X )=___________. 7.设随机变量X ,Y 的分布列分别为 X 1 2 3 , Y -1 0 1 P 31 61 21 P 21 41 41 且X ,Y 相互独立,则E (XY )=___________. 二.填空题 1.设X ~B (4, 2 1),则E (X 2)=___________。 2.设E (X )=2,E (Y )=3,E (XY )=7,则Cov (X ,Y )=___________。 三.计算题 1.某用户从两厂家进了一批同类型的产品,其中甲厂生产的占60%,若甲、乙两厂产品的次品率分 别为5%、10%,今从这批产品中任取一个,求其为次品的概率. 2.100张彩票中有7张是有奖彩票,现有甲、乙两人且甲先乙后各买一张,试计算甲、乙两人中奖的概率是否相同? 3.设有两种报警系统Ⅰ与Ⅱ,它们单独使用时,有效的概率分别为0.92与0.93,且已知在系统Ⅰ失效的条件下,系统Ⅱ有效的概率为0.85,试求:

第四章 数据分布特征的测度讲解

第四章数据分布特征的测度 学习目的和要求: 通过本章的学习,掌握数据分布特征的各种描述方法;掌握不同测度方法的特点、应用条件及应用场合;能利用所学的方法对统计数据作各种统计描述。 难点释疑: (一)算术平均数通常用来反映总体分布的集中趋势,调和平均数往往只作为算术平均数的变形来使用,即在已知标志总量而未知总体单位总量的情况下计算调和平均数;而几何平均数较适用于计算平均比率和平均速度。 (二)调和平均数虽然是根据标志值的倒数计算的,但其结果不等于算术平均数的倒数。在计算和应用平均指标时,除了考虑数理方面的要求外,更重要的是要考虑其现实的经济意义。 (三)平均数的性质是简捷计算法的基础,也是计算标志变异指标的基础。掌握中位数和众数与算术平均数的关系的目的是能够根据其中的两个平均数大体计算出第三个平均数,并判断总体的分布状态。 (四)全距、四分位差、平均差、标准差在反映标志变异程度方面各有优缺点。全距是描述数据离散程度的最简单测度值,它计算简单,易于理解,但不能全面反映总体各单位标志值的差异程度。标准差与平均差的意义基本相同,但在数学性质上比平均差要优越,所以,在反映标志变动度大小时,一般都采用标准差。标准差是实际中应用最广泛的离散程度测度值。 (五)标准差系数的应用。为了对比和分析不同平均水平总体的标志差异程度,就需要使用标准差系数。它是标志变异的相对指标。它既消除了变量数列变量值差异程度的影响,也消除了变量数列水平高低的影响。 练习题: (一)单项选择题(在下列备选答案中,只有一个是正确的,请将其顺序号填入括号内) 1.平均指标反映了()。 ①总体变量值分布的集中趋势②总体分布的离散特征 ③总体单位的集中趋势④总体变动趋势

第四章 随机变量的数字特征总结

第四章 随机变量的数字特征 ㈠ 数学期望 表征随机变量取值的平均水平、“中心”位置或“集中”位置. 1、数学期望的定义 (1) 定义 离散型和连续型随机变量X 的数学期望定义为 {}?????==?∑∞ ∞ - d )( )()( , , 连续型离散型x x xf x X x X k k k P E 其中Σ表示对X 的一切可能值求和.对于离散型变量,若可能值个数无限,则要求级数绝对收敛;对于连续型变量,要求定义中的积分绝对收敛;否则认为数学期望不存在. ①常见的离散型随机变量的数学期望 1、离散型随机变量的数学期望 设离散型随机变量的概率分布为 ,若,则称级数为随 机变量 的数学期望(或称为均值),记为 , 即 2、两点分布的数学期望 设服从0—1分布,则 有 ,根据定 义,的数学期望为 . 3、二项分布的数学期望 设服从以 为参数的二项分布,,则。 4、泊松分布的数学期望 设随机变 量 服从参数 为的泊松分布, 即 ,从而有 。 ①常见的连续型随机变量的数学期望 1)均匀分布 设随机变量ξ服从均匀分布,ξ~U [a ,b ] (a

2)正态分布 设随机变量ξ服从正态分布,ξ~N(μ,σ2),它的概率密度函数为: (σ>0,- <μ<+ ) 则 令 得 ∴ E(ξ)=μ . 3)指数分布 设随机变量服从参数为的指数分布,的密度函数为 ,则. (2) 随机变量的函数的数学期望设) (x g y=为连续函数或分段连续函数,而X是任一随机变量,则随机变量) (X g Y=的数学期望可以通过随机变量X的概率分布直接来求,而不必先求出Y的概率分布再求其数学期望;对于二元函数) , (Y X g Z=,有类似的公式: (){} ? ? ? ? ?= = = ? ∑ ∞ ∞ . ; (连续型) 离散型 - d) ( ) ( ) ( ) ( x x f x g x X x g X g Y k k k P E E () (){}() ()()() ? ? ? ? ?= = = = ?? ∑∑ ∞ ∞ - ∞ ∞ - . ; 连续型 离散型 d d , , , , , y x y x f y x g y Y x X y x g Y X g Z i j j i j i P E E 设(,) X Y为二维离散型随机变量,其联合概率函数(,),,1,2,, i j ij P X a Y b p i j ==== 如果级数 (,) i j ij j i g a b p ∑∑ 绝对收敛,则(,) X Y的函数(,) g X Y的数学期望为 [(,)](,) i j ij j i E g X Y g a b p =∑∑ ;特别地 ();() i ij j ij i i j i E X a p E Y b p == ∑∑∑∑ . 设X为连续型随机变量,其概率密度为() f x,如果广义积分()() g x f x dx +∞ -∞ ?绝对收敛,则X的函数() g X的数学期望为[()]()() E g X g x f x dx +∞ -∞ =?.

相关主题
文本预览
相关文档 最新文档