当前位置:文档之家› 统计学教学案例一

统计学教学案例一

统计学教学案例一
统计学教学案例一

统计教学案例二

上市公司年报数据分析案例

经统计调查取得数据后,需要通过统计整理、综合指标计算与相关回归分析等方法技术对总体数据进行处理,以认识总体变量分布状态(如正态分布)、特征表现(如结构相对数、平均数和标准差)、相关关系(如相关系数)和变化规律(如回归模型),从而了解事物或现象的本质及其依存因素。其中统计整理技术包括总量指标、相对指标、平均指标和标志变异指标的揭示,他们的计算既是对总体基本特征的描述,又是对事物或现象进一步定量研究的基础;相关和回归是研究总体各事物或现象间相互关系的定量分析,用以测定不同特征相互联系的紧密程度,揭示变化形式和规律。本章案例主要通过对总体静态数据处理过程的介绍,帮助读者掌握统计整理、指标描述和相关回归分析技术结合运用的技术与经验。

本章由1个大型案例构成,案例以沪深股市制造业上市公司为对象,系统介绍了静态数据总体的统计处理过程,包括分布描述、分类研究和相关因素分析。

上市公司年报数据分析案例的教学目的:数据整理是统计分析的基础工作,在总体规模很大,数据量浩瀚、分布未知的情况下,如何对总体数据进行整理分类,描述总体分布及进一步分析总体各特征间的相互关系是对总体正确认识的关键。由于具体的工作过程与教科书的知识点讲授顺序并不完全一致,因此本案例通过对1999年沪深股市制造业上市公司年报数据分析过程的介绍,给读者以处理总体静态数据的思路和技巧,从而训练读者解决实际问题的能力。

案例的背景分析与数据资料

一、案例的现实意义

上市公司的经营业绩与其股票价格、市场价值息息相关,因此反映上市公司经营业绩的定期公开披露的中期会计报告、年度会计报告就成为社会各界密切关注的重要信息之一。对所有上市公司的财务报告进行统计整理和分析,把握上市公司整体的经营状况、经营业绩的水平和变化趋势,无论是对投资选择,还是政府的决策与监督,都是不可或缺的。

本案例探讨的就是面对大量的财务报告数据信息如何进行统计整理与分析,这对于投资者、投资咨询人员或是理论界研究者,都具有实际的指导意义。通过本案例的学习讨论,有助于大家掌握统计描述和相关回归分析的方法,同时积累应用这些方法的实际经验和教训。

二、案例所依托的总体及其现状与研究目的

(一)案例所依托的客体

本案例所依托的客体是1999年上市公司年报中的有关财务指标。1999年末,沪、深两市共有上市公司949家。这些上市公司分布在13个行业部门。根据中国证监会的《上市公司分类指引》中规定的分类方法,其中制造业共有578家,占60.91%。总股本1938亿元,占62.73%,制造业是上市公司最集中的行业。截止2000年4月30日,已公布年报的有560家。所以本案例研究的总体范围确定为如期公布年报的制造业560家上市公司。

(二)案例研究的目的与任务

1.上市公司年报财务数据统计分析的目的

通过对制造业1999年报有关数据进行系统的统计整理、描述和回归分析,揭示1999年制造业上市公司主要财务指标的总体分布、分行业的经营业绩水平和重要特征,从中掌握认识总体分布特征和数量变化的技巧和方法,提高用统计思想和方法解决实际问题的能力。

2.上市公司年报财务数据统计分析的任务

对纷繁的数据进行不同的分类、分组、汇总、综合、分析、归纳、推断,显示上市公司财务报告中的主要财务指标的分布形态和主要特性,寻找财务指标之间的相互关系和表现规律。

3.上市公司年报财务数据统计分析的对象

本案例所引用资料取自《上海证券报》,包括了制造业560家上市公司。共选有8个财务指标:

总资产、净利润、主营业务收入、股东权益、每股收益、每股净资产和股东权益比率。其中,前4个为反映资产、收益方面的总量指标,后4个为反映盈利能力、业绩水平的相对指标。

4.数据的初步分析——制造业上市公司行业结构

在制造业中,生产不同产品的企业或公司,具有不同的规模,占有不等的资源要素,他们的总股本、净利润、净资产收益率必然存在很大的差异。为了深入认识总体,首先要对制造业按其经济活动的特点进行行业分类。根据《上市公司分类指引》,制造业进一步分为10个行业种类,编码为C0、C1、C2、…、C9。分类统计属于定名测定。从上述资料经计数整理后即可得到如表一的分布数列。

表2—1 制造业上市公司行业分布

代码行业分类上市公司数比重(%)

C0 食品、饮料48 8.57

C1 纺织、服装、皮毛45 8.04

C2 木材、家具 2 0.36

C3 造纸、印刷16 2.86

C4 石油、化学130 23.21

C5 橡胶、塑料10 1.79

C6 金属、非金属96 17.14

C7 机械、仪表、设备151 26.96

C8 通讯、电子51 9.11

C9 其他11 1.96

合计560 100.00

这是一个品质标志分组的分布数列。从该数列中可以知道上市公司的行业结构。1999年560个制造业上市公司中,27%是机械、仪表、设备制造业(包括汽车、船舶、摩托车、家电等);23%是石化类行业;而冶金、钢铁等金属非金属类公司占17%;通讯电子章9%。所以,制造业上市公司中传统产业占了较大比重。这些行业中大部分是国有或国有控股企业,是国企改革中率先建立现代企业制度进入资本市场的排头兵。行业的分布也体现了国家的产业政策导向,在1999年新发行的A股中,大盘股和高科技股明显增多,有力地支持了国企改革和高科技企业的发展,推动了上市公司的行业结构优化。

方案设计

一、案例设计的思路

本案例研究的总体对象是某一特定时间的静态数据集,为了对它有一个全面和透彻的认识,一般应对其进行基本的特征描述和揭示各特征间主要的相互关系。根据这一目的,本案例按照如下顺序对数据进行处理:

1.分别对总体个单位的数量标志按值的大小作升序排列,以大概认识个变量的变化范围及其一般水平。

2.分别计算总体个变量的特征值,进一步抽象认识个变量的分布特征,包括算术平均数、众数、方差、峰度度、偏度等。

3.分别根据特征指标绘制各变量的分布图,以形成对各变量分布的直观认识。

4.分别按品质标志和数量标志对总体进行分类,通过计算派生指标,以深入认识总体各指标在不同类别间的差异,包括总体结构、强度,比例关系等。

5.分别对总体各指标进行相关分析,了解各指标间的依存关系,在相关关系成立的基础上进行回归分析,从而更深层次地认识总体的规律与特征。

6.在上述研究分析的基础上给出关于对对象的定性认识结论。 二、案例设计的工作过程 (一)数据整理与描述

1.编制按各财务指标的变量数列 (1) 将数据顺序排列。 (2) 计算描述统计指标。

在Excel “工具”的“数据分析”中,“描述统计”提供了所分析数据的主要描述指标和有关信息。其内容是;

平均——算术平均数,即x =n

x ∑

标准误差——抽样平均误差,即

n

σ

中值——中位数,即Me ; 模式——众数,即Mo ; 标准偏差——标准差,即σ; 样本方差——方差,即2

σ

峰值——峰度,即

4

4

σm

偏斜度——偏度,即3

m ;

区域——全距,即最大值减最小值; 求和——标志总量;

计数——总体单位总数; 最大(K )——第K 个最大值; 最小(K )——第K 个最小值;

置信度——“数据分析”中默认概率为95%(也可自行选择)的1/2误差范围。

(3)分析描述统计指标——比较平均数、众数、中位数的大小;偏度系数的大小、方向等。 (4)确定组数和组距——当偏度系数不大时,用斯特吉斯经验公式确定组数;偏度系数较大、分布明显偏态时,以平均数为中心,以K 倍标准差为组距。

(5)整理成频数分布和直方图(或其他图形),显示总体分布特征。 2.制造业公司主要财务指标的分布 (1)总资产分布数列和直方图

总资产描述统计1

平均 标准误差 中值

158315.1 8970.946 95296.9

模式

标准偏差;样本方差峰值

偏斜度

区域

最小值

最大值

求和

计数

置信度(95%)212291.3 4.51E+10 30.19077 4.705128 2178598 12256.69 2190846 88656452

560 17620.89

总资产描述统计2

平均

标准误差中值

模式

标准偏差;样本方差峰值

偏斜度

区域

最小值

最大值

求和

计数

置信度(95%)144640.7 6388.948 95410.48

149424.9 2.23E=10 9.916375 2.885238 955269.6 21671.49 976941.1 79118478 547 12549.92

从描述统计1看,560家公司的总资产呈高度偏态。总资产最大值是上海石化219亿元,最小值是ST黔凯涤1.2亿元,相差近200倍。将6个总资产100亿和7个2亿元以下的数据作为极值舍去,计算得到描述统计2,此时的标准差和偏度系数都降低了,说明数据间的差异小了。但仍呈偏态,不能用斯特吉斯经验确定组数。

不论何种分布,均值和方差其分布的两个主要特征值。根据切比雪夫定理,可以平均数为中心,以K倍的标准差为组距,因为此时平均数 K倍的标准差所涵盖的数据范围不小于1-1/2

K。

本例中,均值14.5亿元,中位数9.5亿元,标准差15亿元,说明560家公司的总资产分布为右偏态。若以1个标准差为组距,则中位数以下部分的描述势必过于概括。所以考虑用1/2标准差,即7.5亿元为组距,由于100亿元以上只有7家,将105亿元以上并为一组,组数=15。分组后变量数列及直方图如表二和图一所示。

表2—2 560家上市公司总资产分组统计

分组(万元)频数频率(%)

75000以下75000~150000 150000~225000 225000~300000 300000~375000 375000~450000 450000~525000 525000~600000 600000~675000 675000~750000 750000~825000 825000~900000 900000~975000 975000~1050000 1050000以上209

192

64

33

18

15

4

2

4

6

2

1

3

1

6

37.32

34.29

11.43

5.89

3.21

2.68

0.71

0.36

0.71

1.07

0.36

0.18

0.54

0.18

1.07

合计560 100.00

从图表中可以知道,制造业中,总资产8866亿元,平均规模在15亿元左右。82%的上市公司总姿产在22.5亿元以下,100亿元以上的只有1%。在各行业中,总资产规模最大的是C8——通信电子行业20.3亿元,最低的是C2——木材家具业6.38亿元,另外,C4——石油化工、C5——橡胶塑料、C6——金属非金属的总资产规模在平均之上。

频数0

50

100

150

200

250

7500

1500

00

2250

00

3000

00

3750

00

4500

00

5250

00

6000

00

6750

00

7500

00

8250

00

9000

00

9750

001050000

其他

图2—1 560家制造业公司总资产分布

(2)净利润分布数列和直方图

净利润描述统计

平均 标准误差 中值 模式 标准偏差; 样本方差 峰值 偏斜度 区域 最小值 最大值 求和 计数 置信度 (95%)

6669.48 516.2828 4120.164 # N/A 12217.48 1.49E+08 11.33344 2.485572 112886.5 -37417.9 75468.6 3734913 560 1014.092

净利润分布呈右偏态。以1/2标准差6500万元为组距,可分17组。分组后3.25亿元以上各组不仅频数少,而且有两组频数为0。这种情况下可考虑合并这些组,因为合并后的数列并未影响总体特征的描述。见表2—3和图2—2。

表2—3 560家上市公司净利润分布

净利润分组(万元)

频 数 (个)

频 率 (%)

-13000以下 -13000~-6500

-6500~0 0~6500 6500~13000 13000~19500 19500~26000 26000~32500 32500以上 14 10 22 332 112 24 13 16 17 2.50 79 3.93 59.29 20.00 4.29 2.32 2.86 3.04 合 计

560

100.00

频数

50100150200250300350-13000-6500

6500

13000195002600032500

其他

净利润分组(万元) 图2—2 560家上市公司净利润分布

将亏损1.3亿元以下的公司合并为一组,3.25亿元以上的公司合并为一组,组数减少到9组,总体仍为右偏态。

从整理后的净利润的资料我们注意到:

第一,制造业中,1999年度46家公司亏损,亏损面8.2%,最多的亏损3.7亿元。

第二,制造业1999年度净利润总额373.9亿元,受亏损公司的影响,560家公司总体平均利润只有6500万元。79%的上市公司净利润在70万~1.3亿元之间。

第三,上海汽车、邯郸钢铁、上海石化、仪征化纤、首钢股份等大型国企全年利润均在7亿元以上;

年净利润在4.5亿元以上的公司有16个,不足总数的3%,但它们的净利润占到制造业全行业的25.5%,充分体现了大型国企确实是国民经济的脊梁。

第四,进一步研究各行业的利润水平,可以看到有三个行业高与总体水平;C0——食品饮料净利闰0.79亿元;C6——金属非金属净利闰0.85亿元;C8——通信电子净利闰1亿元。

(3)每股收益分布数列和直方图

每股收益描述统计 1

平均

标准误差中值

模式

标准偏差;样本方差峰值

偏斜度

区域

最小值

最大值

求和

计数

置信度(95%)0.199427 0.011551 0.2225 0.21

0.273352 0.074721 6.75641 -1.51182 2.632

-1.28 1.352 111.6792 560

0.022689

每股收益描述统计2

平均

标准误差中值

模式

标准偏差;样本方差峰值

偏斜度

区域

最小值

最大值

求和

计数

置信度(95%)0.204943 0.010571 0.223

0.21

0.249255 0.062128 4.912174 -1.27499 1.8891

-0.98 0.9091 113.9482 556

0.020764

每股收益是一强度相对指标。从描述统计指标看,舍弃一个最大值后,均值、中位数、众数比较接近,偏度系数也不很大。尝试按经验公式确定组数:

组数=1+3.322×㏒560=10;

组距=2/10=0.2,极值用开口组处理。见表2—4 和图2—3。

表2—4 560家上市公司每股收益分组统计

分 组 频数(个)

频率(%) —0.6以下 -0.6~-0.4 -0.4~—0.2 -0.2~0 0~0.2 0.2~0.4 0.4~0.6 0.6~0.8 0.8~1.0 1.0以上 14 6 13 13 197 231 60 19 6 1 2.50 1.07 2.32 2.32 35.18 41.25 10.71 3.39 1.07 0.18 合 计

560

100.00

频数

50100150200250-0.6

-0.4

-0.2

0.2

0.4

0.6

0.8

1

每股收益分组(元)

图2—3 560家上市公司每股收益分布

每股收益是按总股本平均的净利润,它排除了股本规模大小对净利润水平高低影响,反映了上市公司经营业绩水平。不仅在行业之间,而且可以在公司之间进行比较。从表2—4图2—3看560家公司每股收益的特点:

第一,1999年制造业的每股收益的分布略乘左偏态,即平均数为0.2元,但是相对多数的公司每股收益高于0.2元。

第二,35%的公司在0.01~0.2元的微利水平,52%的公司盈利水平再0.2~0.6元之间。26家公司盈利水平较高,在0.6元以上,但只占4.5%。1999年的改制表状元是五粮液,达到每股收益1.35元。

第三,分行也看,经营业绩差别的行业因素非常明显:最高的是C0——食品饮料,达到每股收益0.31元;大于等于每股收益0.2元的还有C1—纺织、服装,C5——橡胶塑料, C8 ——同新点子,C9——其他;最低的事C2——木材家具,只有0.08元。

(4)净资产收益率分布数列和直方图

净资产收益率1

平均

标准误差中值

模式

标准偏差;样本方差峰值

偏斜度

区域

最小值

最大值

求和

计数

置信度(95%)2.971477 1.993256 9.04

6.21

47.08475 2216.974 117.5889 -10.1028 736.156 -639.53 96.626 1658.08 558

3.915216

净资产收益率2

平均

标准误差中值

模式

标准偏差;样本方差峰值

偏斜度

区域

最小值

最大值

求和

计数

置信度(95%)8.006386 0.352228 9.14

6.21

8.185041 66.9949 6.881908 -1.63102 69.26

-34.92 34.34 4323.448 540

0.691909

由于资料中两个公司(0515PT渝钛白和600818ST永久)的净利润净资产为负值,所以此处只有58个公司的数据。

558个公司的净资产旅呈高度左偏态。净资产收益率过高或过低,都数不正常情况。

舍弃40%以上和-40%以下的18个极端值后,描述指标基本正常。以1倍标准差8%为组距、48%以上和-48%一下合并各1组,共分14组。表2——5和图2——4显示,集中趋势非常明显。

表2——5 560家公司净资产收益率分组统计

分组(%)频数频率(%)

小于-48 13 2.33

-48~-40 -40~-32 -32~-24 -24~-16 -16~-8 -8~0 0~8 8~16 16~24 24~32 32~40 40~48 大于48 1 2 5 6 8 10 190 270 39 7 3 1 3 0.18 0.36 0.90 4.08 1.43 1.79 34.05 48.39 6.99 1.25 0.54 0.18 0.54 合计

558

100.00

频数

50

100

150

200

250

300

-48

-40

-32

-24

-16

-8

8

16

24

32

40

48

其他

净资产收益率分组(%)

图2—4 560家上市公司净资产收益率分布

净资产收益率是评价净资产盈利能力的综合指标,他代表了总体的或行业的盈利水平。从统计资料看到:

第一,1999年度,制造业的总体净资产收益率9%(这里采用了中位数,因为忽略极值厚中位数没有

变化,但平均数却差了几倍,而净资产收益率极端值时有个别特殊原因所致)。

第二,8%的公司亏损,与每股收益分析的结论一致;并且有两个公司净资产为负数,以资不抵债。

第三,34%的公司净资产收益率在0.1%~8%之间;48%的公司在0.8%~16%之间。

第四,8%的公司净资产在16%~32%的高水平上,从行业看,这些公司集中在生物制药、通信电子、汽车等高新技术产业,显示出发展最快、盈利水平最强的势头。

3.制造业各行业主要财务指标的分布

接下来利用符合分组表统计表的形式,总体分组的划分,展示制造业内部各行业的净利润、每股收益、净资产收益率的分布特征。

(1)制造业各行业净利润分布频数统计表和频率统计表

合计栏显示的是总体的净利润分布频数或频率,其他各栏显示的是个行业的分布(见表2—6、表2—5)。

表2—6 制造业各行业净利润分布统计(频数)

代码

净利润分组(万

元)

行业分类

-1.

3

-1.

3

-0.

65

-0.

65

~0

0~

0.6

5

0.6

5

1.3

1.3

1.9

5

1.9

5

2.6

2.6

3.2

5

3.2

5

C0 食品、饮料 1 27 14 3 1 1 1 48

C1 纺织、服装、皮毛 1 1 2 27 13 1 45

C2 木材、家具 1 1 2

C3 造纸、印刷 1 12 3 16

C4 石油、化工 2 2 5 81 28 6 2 4 130 C5 橡胶、塑料8 1 1 10

C6 金属、非金属 3 4 2 53 17 4 3 5 5 96

C7 机械、仪表、设备 6 10 94 24 4 5 4 4 151 C8 通信、电子 2 2 1 22 10 3 4 4 3 51

C9 其他7 2 2 11 合计14 10 22 332 112 24 13 16 17 560

从表2—6、2—7中可以看到:

第一,总共45个亏损公司,占全部公司的8%,他们的行业间分布是:C7——机械、仪表、设备行业亏损面最大,有16家,占行业10.7%;其次是C8、C6和C1——分别为9.8%、9.4%、8.8%;C2——木材家具仅有2家公司,亏损1家。

第二,C5——橡胶、塑料和C9——其他行业无亏损企业,且净利润水均衡,集中在0~19500万元。

第三,净利润绝对水平的高低与行业类别有关联,3亿元以上净利润集中在酿酒、石化、冶金、电子通信设备等行业;利润水平较低的有纺织、木材家具及印刷、造纸行业。

表2—7 制造业各行业净利润分布统计(频率%)

代码净利润分组(万

元)

-1.

-1.

3

-0.

65

~0

0~

0.6

5

0.6

5

1.3

1.9

1.9

5

2.6

3.2

3.2

合计

行业分类 3 -0.

65

1.3 5

2.6 5 5

C0 食品、饮料 2.1 56.

3 29.

2

6.3 2.1 2.1 2.1 100.0

C1 纺织、服装、皮毛 2.2 2.2 4.4 60.

0 28.

9

2.2 100.0

C2 木材、家具50 50.

100.0

C3 造纸、印刷 6.3 75.

0 18.

8

100.0

C4 石油、化工 1.5 1.5 3.8 62.

3 21.

5

4.6 1.5 3.1 100.0

C5 橡胶、塑料80.

0 10.

10.

100.0

C6 金属、非金属 3.1 4.2 2.1 55.

2 17.

7

4.2 3.1

5.2 5.2 100.0

C7 机械、仪表、设备 3.3 6.7 62.

7 16.

2.7

3.3 2.7 2.7 100.0

C8 通信、电子 3.9 3.9 2.0 43.

1 19.

6

5.9 7.8 7.8 5.9 100.0

C9 其他63.

6 18.

2

18.

2

100.0

合计 2.3 1.8 3.9 59.

4 20.

4.3 2.3 2.9 3.0 100.0

(2)制造业各行业每股净收益分布频数统计和频率统计

表2—8、2—9显示的是不同行业每股收益的不同水平的分布。在91.8%的盈利公司中,若每股收益0.6元以上为绩优股,则绩优股的比率4.7%。绩优股的行业特征也非常明显:食品行业最高,为8.4%,其后依次是通信电子行业7.9%、机械仪表设备7.3%。从表面上看其他行业最高(9.1%),但是其他行业属于主营收入不明显的“收容”类,其较高的每股收益得益于多元化经营,因此在比较时,应予以忽略。

表2—8 制造业各行业每股收益分布统计(频数)

代码

净利润分组

(元)

行业分类

-0.

6

-0.

6

-0.

4

-0.

4

-0.

2

-0.

2~

0.2

0.2

0.4

0.4

0.6

0.6

0.8

0.8

1.0

1.0

C0 食品、饮料 1 10 24 9 2 1 1 48 C1 纺织、服装、皮毛 1 2 1 11 27 1 2 45 C2 木材、家具 1 1 2 C3 造纸、印刷 1 8 7 16 C4 石油、化工 3 1 2 3 58 52 9 2 130 C5 橡胶、塑料 4 4 2 10

C6 金属、非金属 2 6 1 32 43 10 2 96 C7 机械、仪表、设备 2 3 4 7 56 52 16 9 2 151 C8 通信、电子 4 1 14 16 12 3 1 51 C9 其他 4 5 1 1 11 合计14 6 13 13 197 231 60 19 6 1 560

表2—9 制造业各行业每股收益分布统计(频率%)

代码

净利润分组

(元)

行业分类

-0.

6

-0.

6

-0.

4

-0.

4

-0.

2

-0.

2~

0.2

0.2

0.4

0.4

0.6

0.6

0.8

0.8

1.0

1.0

合计

C0 食品、饮料 2.1 20.

9 50.

18.

8

4.2 2.1 2.1 100.0

C1 纺织、服装、皮毛 2.2 4.4 2.2 24.

4 60.

2.2 4.4 100.0

C2 木材、家具50.

0 50.

100.0

C3 造纸、印刷 6.3 50.

0 43.

8

100.0

C4 石油、化工 2.3 0.8 1.5 2.3 44.

6 40.

6.9 1.5 100.0

C5 橡胶、塑料40.

0 40.

20.

100.0

C6 金属、非金属 2.1 6.3 1.0 33.

3 44.

8

10.

4

2.1 100.0

C7 机械、仪表、设备 1.3 2.0 2.6 4.6 37.

1 34.

4

10.

6

6.0 1.3 100.0

C8 通信、电子7.8 2.0 27.

5 31.

4

23.

5

5.9 2.0 100.0

C9 其他36.

4 45.

5

9.1 9.1 100.0

合计 2.5 1.1 2.3 2.3 35.

2 41.

3

10.

7

3.4 1.1 0.2 100.0

(二)相关和回归分析

本案例相关和回归分析研究主要是8个财务指标间的相互关系问题。各财务指标分别说明上市公司的财务状况的某一侧面。那么这些指标之间有无关系?若有关系,是什么样的关系?通过本案例的探讨,可以帮助我们筛选主要个财务指标作为分析公司业绩变动的因素。

1.制造业业绩指标之间的关系研究

表2—10是8个财务指标的两两指标间的线性相关系数。

表2—10 制造业有关业绩指标相关系数矩阵

净资产收益率净利

净资

总资产主营业

务收入

每股

收益

每股

净资

股东权

益比率

净资产收益率 1

净利润0.248 1

净资产0.074 0.676 1

总资产0.052 0.626 0.929 1

主营业务收入0.072 0.705 0.838 0.910 1

每股收益0.531 0.602 0.150 0.110 0.193 1

每股净资产0.277 0.376 0.270 0.188 0.207 0.599 1

股东权益比率0.311 0.196 0.123 -0.111 -0.081 0.384 0.475 1

从相关系数矩阵看,可以得到以下几点共性的结论:

(1)主营业务收入与总资产、净资产、净利润这些总量指标显著相关,其中与总资产高度正相关。总资产比较大时,主营业务收入也倾向于比较大,而主营业务收入比较大时,净资产、净利润也比较高。这从实际情况看是可以理解的。在正常情况下,制造业的净资产除了货币资金外,主要就存货和厂房、设备等固定资产。尤其是固定资产,使生产活动的物质技术基础,其数量的多少、技术的高低决定了产品的方向及生产方式,从而决定了收入水平,并且决定了净资产的水平。

(2)虽然净资产收益率等于净利润除以净资产,但是净资产除了与净利润微弱相关外,与其他总量指标几乎不相关,也就是说,净资产收益率与资产规模、主营业务收入没有线性关系。主营业务收入水平高低并不决定盈利能力。

(3)几个相对指标之间,净资产收益率和每股收益显著正相关。在绝大多数行业中,这种相关程度均高于制造业总体的相关系数0.53。这一点告诉我们,在说明上市公司经营业绩时,净资产收益率和每股收益两个指标选择其中之一就够了。

(4)每股收益、每股净资产作为总量指标的派生指标,除每股收益与净利润外,其他均与净利润、净资产和总资产微弱相关,说明他们抽象了投入规模的不同,可载的行业、各类型的上市公司之间比较。

(5)一般地,派生指标与他们的分子指标相关系数要高于与它们的分母指标之间的相关系数。例如:净资产收益率与净利润的相关关系属要高于与净资产的相关系数。

(6)就不同行业来看,各指标之间的相关系数均有所差别,表2—11显示:不论从整个制造业还是个行业,主营业务收入、净资产与总资产高度正相关是一致的;在相对指标上产生了分化。其他行业由于主业不明,指标之间相关也很微弱。除此之外,净资产收益率与净利润和每股收益呈现不同程度的相关,机械行业表现得最明显。

表2—11 制造业上市公司行业有关指标的相关系数

行业分类主营业务收

入与总资产净资产与

总资产

净资产收益

率与净利润

净资产收益率

与每股收益

C0食品、饮料0.81 0.90 0.59 0.85 C1纺织、服装、皮毛0.83 0.86 0.64 0.85 C3造纸、印刷0.85 0.88 0.55 0.92 C4石油、化工0.96 0.95 0.36 0.89 C5橡胶、塑料0.96 0.97 0.88 0.94

C6金属、非金属 0.88 0.96 0.46 0.90 C7机械、仪表、设备 0.86 0.85 0.27 0.52 C8通信、电子 0.92 0.93 0.37 0.65 C9其他

0.81 0.39 0.08 -0.06 合 计

0.91

0.93

0.25

0.53

2.制造业业绩指标间的回归分析

回归分析是用函数关系近似描述相关关系的表现形式,它反映的是变量之间的一种变动规律。一般地,选择哪种形式的回归模型可以通过:观察散点图;根据专业知识和经验判断。本案例中,除以上两点外,还可以根据相关系数判断,由于皮尔生积矩相关系数是对两变量线性相关程度的侧度,所以对显著相关程度以上的变量可建立线性回归函数来模拟变量间的关系,即:

ε++++= 22110X B X B B Y

(1)主营业务收入与总资产的回归分析

由于主营业务收入与总资产的线性相关系数最大,以主营业务收入为因变量Y, 总资产为自变量X ,用560家制造业公司数据建立一元线性回归方程:

ε++=110X B B Y

Excel “工具”栏中“数据分析”的“回归”提供了相关和回归分析的结果: Multiple R ——相关系数;

R Square ——判定系数;

Adjusted R Square ——调整的判定系数 t

e

SS SS p n n ?----

11

1

标准误差——估计标准误xy S ; 观测值——X 、Y 变量的对数。 方差分析有关指标含义见表2—12。

表2—12

df

SS

df

SS MS =

F 值

Significance F

回归分析

回归偏差 自由度

回归偏差 平方和 回归偏差平均平方和 2

1-=

n SS SS F e R

)2,1(-n F α

残差

剩余偏差 自由度

剩余偏差 平方和 剩余偏差平均 平方和 总计

总偏差 自由度

总偏差 平方和

总偏差平均 平方和

Intercept ——截距a ;

X Variable ——一元回归的回归系数b ;

标准误差——截距a 的标准差为a σ

?;回归系数b 的标准误差为b σ?; T 统计量——对a 和b 检验时采用的统计量; P-value —— P 值;

Lower95%, Uooer95%;——截距a 或回归系数b 的95%置信峡县、置信上限;此为墨任值,若选择其他置信水平,相应的置信下限、置信上限在后面列出。

回归统计

Multiple R R Square

Adjusted R Square 标准误差 观测值

0.909813 0.82776 0.827451 65866.64 560

方差分析

df SS MS F Significance F 回归分析 残 差 1 1.16E+13 1.16E+13 2681.661 2.8E-215 558 2.42E+12 4.34E+09 总 计

559 1.41E+13

主营业务收入对总资产的一元线性方程: Y = -13975+0.68X

回归系数说明, 总资产每增加1万元, 制造业主营业务收入平均增加0.68万元. 从判定系数看,在总资产对主营业务收入的影响中, 有83%可以由该线性回归方程解释, 从t 检验看,回归系数是显著的.

回归分析中, 对随机误差, 我们要求它均值为0, 并假定其服从正态分布. 从F 检验看,假定成立, 从残差分布图看, 其分布是”杂乱无章”的, 回归方程是合适的.

建立回归方程, 不仅为我们描述了主营业务收入和总资产这两个指标间的联系形式,我们利用它还可以进行预报和控制.

给定总资产, 可以对主营业务收入水平作区间估计. 本案例样本较大, 当X=X 0时,Y 的1-a 置信区间:

Y=XY S Z Y

2?α±

这里的S XY 是残差平均平方和MS 的平方根, 即”回归统计”表中的”标准误差”或从”方差分析”

Coeffici- 标 准 T 统 下限 上限 ents 误 差 计 量 P 值 95.0% 95.0% Intercept X1 Variable -13975 3473.233 -4.02362 6.52E-05 -20797.2 -7152.77 0.679562 0.013123 51.78476 2.8E-215 0.653786 0.705339

表资料中可以计算得到; Y ?是X=X 0时回归方程得到的点估计值; 2

Z 是给定a 时的临界值。

例如, 我们想知道, 当X=20万元时, 主营业务收入95%置信区间:

点估计值是Y

? =-13975+0.68×200000=122025(万元) 估计值标准误差是残差MS

2

1 =(4340000000)1/2=65879

主营业务收入置信区间:122025-1.96×65879≤Y ≤122025+1.96×65879=-7098~251148 即总资产为20亿元规模时, 估计主营业务收入的上限为25亿元,下限可能是亏损的. (2) 净利润与主营业务收入和每股收益的二元回归分析

由于指标间的关系在不同行业表现各异, 本案例仅研究了C8----通信电子行业. 通信电子行业相关系数矩阵见表2—12

表2—12 通信电子有关业绩指标相关系数矩阵

净资产 收益率

净利润

净资产

总资产

主营业务收入

每股 收益 每股净资产 股东权益比率

净资产收益率

1 净利润 0.368 1 净资产 0.121 0.698 1 总资产 0.10

2 0.752 0.938 1 主营业务收入 0.137 0.758 0.790 0.921 1 每股收益 0.645 0.70

3 0.215 0.261 0.336 1 每股净资产 0.432 0.692 0.628 0.673 0.682 0.57

4 1 股东权益比率

0.546

0.340

0.235

0.037

-0.02

0.444

0.405

1

从定性分析角度知道, 净利润与主营业务收入、总资产、净资产有密切关系,其相关系数又从定量角度给予证明. 另外, 从表中还看到, 净利润与每股收益、每股净资产也表现出了显著正相关的关系, 可能的解释在于: 财务指标不是孤立的,它们之间彼此有直接关系的影响, 同时包含了间接关系的影响. 可以用多元回归研究净利润和其他指标的关系. 但是, 在主营业务收入、总资产、净资产之间存在着高度关系, 研究净利润与多个指标的关系时它们或者可以相互替代, 或者必须删去以避免多重共线性对回归模型的影响. 因此, 这里选择主营业务收入和每股收益(它们之间的相关系数0.34,小于0.5), 建立净利润与主营业务收入和每股收益的二元线性回归方程.

计算结果如下:

回归统计

Multiple R R Square

Adjusted R Square 标准误差 观测值

0.80514 0.64825 0.633594 8921.934 51

方差分析

df SS MS F Significance F 回归分析 残 差 2 7.04E+09 3.52E+09 44.23029 1.29E-11 48 3.82E+09 79600902 总 计

50 1.09E+10

净利润Y 与主营业务收入X 1和每股收益X 2的线性回归方程为: Y=3329.8+0.05X 1+35.5X 2

T 检验的P 值, 除了截距B0的P 值稍大, B1、B2的P 值均小于0.05, 回归系数是显著的. F 检验的结果证明, 模型整体也是显著的, 即净利润与主营业务收入及每股收益整体看存在线性相关关系.

复相关系数0.81, 高于净利润与主营业务收入及与每股收益的单相关系数. 偏相关系数经计算可得:

72

.0)

34.0(1)

76.0(134.076.07.078

.0)

34.0(1)

7.0(134.07.076.02

2

)1(22

2

)2(1=--?-=

=--?-=y y r r

两个指标对净利润仍旧是正相关的关系, 比较而言, 主营业务收入(X 1)的影响更大些。 三、数据整理和分析的客观评价

(一) 案例对560家上市公司1999年报8个财务指标数据整理分析过程的优点

1.整理频数分布的时候首先借助于描述指标的判断, 使统计整理工作有了着眼点当面对纷繁的、大量的原始数据, 总体的分布及数据的分布特征根本无从得知. 因此编制数据的频数分布从那里着手呢? 根据的是什么呢? 当然是数据总体的几个主要特征值:平均数(众数、中位数)、全距、方差、偏度等. 而应用Excel 的”数据分析”,这些特征值很容易得到. 掌握了这些特征值, 对分组的组数、组距的确定才有了依据. 所以案例提出的方法, 解决了整理频数分布的可操作性问题。

2.在研究指标(变量)间关系时, 利用相关系数矩阵全面比较判断, 使进一步确定建立回归函数的形式、建立回归模型有了明确的依据。 (二) 几个有待进一步研究的问题

1.频数分布的编制没有固定的模式, 因此不是唯一的, 采用不同的组距、组限, 就有不同的分布数列. 如何评价哪一个数列最恰当或者最确切反映总体分布特征是一个值得研究的问题。

2.统计整理中的制造业行业分组所汇总的统计表, 是按照全行业整理时的组距分组的. 对不同行业来说, 这种组距、组数的划分不一定是最恰当的. 若要研究某一行业情况, 可根据其指标(变量)差异情况另行分组。

3.相关系数矩阵表描述的是一元线性相关系数, 反映的是线性关系的程度. 线性相关系数值很小, 只是说明两指标(变量)间不存在线性相关, 但是否存在非线性相关, 需进一步测定. 本案例中, 通过散点图(图5-6、图5-7)可以发现, 有些指标如主营业务收入和每股收益之间, 就存在非线性关系, 其规律有待进一步研究。

(本案例参考李晓玉编著的《统计描述与相关回归分析》案例)

Coeffici- 标 准 T 统 下限 上限 ents 误 差 计 量 P 值 95.0% 95.0%

Intercept X1 Variable X2 Variable

3329.767 1534.467 2.169983 0.034988 244.5164 6415.017 0.048945 0.005851 8.365005 6.22E-11 0.03718 0.060709 35.4842 11.39523 3.113951 0.00311 12.57256 58.39583

现代心理与教育统计学第07章习题解答

1. 何谓点估计与区间估计,它们各有哪些优缺点? 点估计就是总体参数不清楚时,用一个特定的值,即样本统计量对总体参数进行估计,但估计的参数为数轴上某一点。 区间估计是用数轴上的一段距离来表示未知参数可能落入的范围,它不具体指出总体参数是多少,能指出总体未知参数落入某一区间的概率有多大。 点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。 区间估计的优点是用概率说明估计结果的把握程度,缺点是不能确定一个具体的估计值。 2以方差的区间估计为例说明区间估计的原理 根据χ2分布: 总体方差的.95或.99置信区间为: 即总体参数(方差)落入上述区间的概率为1-α,其值为95%或99% 3.总体平均数估计的具体方法有哪些? 总体方法为点估计好区间估计,区间估计又分为: (1) 当总体分布正态方差已知时,样本平均的分布为正态分布,故依据正态分布理论估计其区间;(2)当总体分布正态方差未知时,样本平均数的分布为T 分布,依据T 分布理论估计其区间;(3)当总体非分布正态方差未知时,只有在n 大于30时渐近T 分布,样本平均数的分布渐近T 分布,依据T 分布理论估计其区间。 4总体相关系数的置信区间,应根据何种分布计算? 应根据Fisher 的Z 分布进行计算 5.解 依据样本分布理论该样本平均数的分布呈正态 其标准误为: 其置信区间为: 该科成绩的真实分数有95%的可能性在78.55----83.45之间。 6.解:此题属于总体分布正态总体方差未知的情形,故样本平均数的分布呈T 分布 其标准误为: 用df=99差T 值表,然后用直线内插法求得t α/2=1.987 其置信区间为: 该学区教学成绩的平均值有95%的可能在78.61---81.39之间。 7解:此题属于总体分布正态总体方差已知 计算标准误 ()()222212221σσσχnS S n X X n =-=-=-∑()()22/121222/2111)(ααχσχ----<<-n n S n S n 25.116 5===n x σσ45 .8355.7825.1*96.18125.1*96.1812/2/<<+<<-?+<

《统计学基础(第2版)》教学大纲

《统计学基础》课程教学大纲 适用专业工商企业管理、市场营销、金融保险、电子商务课程类型职业基础课学分数3 学时数48 第一部分总纲 一、课程性质、教学目的 1.课程性质 统计学基础是为经济与管理学科各专业学生开设的一门必修的重要的专业基础课,也是经济管理工作者和经济研究人员所必备的一门知识。它研究如何用科学的方法去搜集、整理、分析国民经济和社会发展的实际数据,并通过统计所特有的统计指标和指标体系,表明所研究的社会经济现象的规模、水平、速度、比例和效益,以反映社会经济现象发展规律在一定时间、地点、条件下的作用,描述社会经济现象数量之间的联系关系和变动规律,也是进一步学习其他相关学科的基础。 2.教学目的通过教学,培养学生系统地掌握统计工作的基础理论、主要方法和基本技能;以社会经济统计工作的一般原理和原则为主,密切联系实际,培养学生获取信息的能力以及分析问题和解决问题的能力,为从事各项经济工作、财会工作和管理工作奠定分析研究的基础。 3.前导课程与后续课程 该课程的开出一般在经济数学、经济学基础之后。

二、推荐教材及主要参考资料 1. 宋粉鲜,陈世文.《统计学基础》,现代教育出版社,2012年1月。 2. 宋粉鲜,陈世文.《统计学基础——习题与实训》,现代教育出版社,2012年1月。 3. 栗方忠.《统计学原理》,东北财经大学出版社,2011年1月。 4. 栗方忠.《统计学原理标准化题型习题集》,东北财经大学出版社,2011年1月。 5. 马庆国.《管理统计》,科学出版社,2 002年8月。 6. 贾俊平.《统计学基础》,中国人民大学出版社,2006年。 7. Douglas A. Lind, William G. Marchal, Robert D. Ma son. Statistical Techniques in th Business and Economics(11 ed.).中信出版社,2002年。 8. Ron Larson, Betsy Farber. Elementary Statistics.清华大学出版社,2004。 三、大纲执行说明 本课程教学内容包括理论教学和实训教学两部分。

现代心理与教育统计学复习资料

现代心理与教育统计学 复习资料 Revised as of 23 November 2020

1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。 4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。

统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、 次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 (三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。 所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 %100 N f

统计学课程教学大纲.doc

《统计学》 教 学 大 纲 郑州大学商学院

绪论 内容 绪论中所阐述的内容,是对课程全面的概括和归纳,学习好绪论中的有关概念和思想,对本课程学习的全过程是十分必要的。 (一)考核知识点 1、统计数据与统计学 2、统计学的产生和发展 3、统计学与其他学科的关系 (二)考核要求 1、统计数据与统计学 (1)了解:统计学的概念。 (2)理解:统计数据与统计学、统计方法与数量规律性的关系。 2、统计学的产生和发展 (1)了解:统计学的三个源头。 (2)理解:统计学的发展原因。 3、统计学与其他学科的关系 (1)了解:统计学与数学的关系。 (2)理解:统计学与其他学科的关系。 第一章统计数据的搜集与整理 内容 统计数据是我们利用统计方法进行分析的基础。那么,我们从哪里取得所需的统计数据呢?在取得统计数据之后,怎样才能使这些数据适合于我们分析的需要呢?本章所讲述的就是有关数据的搜集与整理方法,具体内容包括数据的计量与类型、统计数据的搜集、整理和显示的方法等问题。

学习本章时,应在了解数据的计量尺度和类型的基础上,系统掌握统计调方案的内容,并能根据特定的调查内容设计具体的调查方案;掌握统计调查的具体方法以及不同方法的特点及适用条件;重点掌握统计数据的整理及显示方法,能够运用所学习的方法将原始数据整理成适当的频数分布表,并能利用图形显示统计数据;掌握统计表的构成内容和设计方法。 (一)考核知识点 1、数据的计量尺度 (1)数据的计量尺度。 (2)数据的类型。 2、统计数据的搜集 (1)统计调查方案。 (2)统计调查方法。 (3)统计数据的间接来源。 3、统计数据的整理 (1)统计数据的审核。 (2)统计分组与频数分布。 (3)频数分布的图示和类型。 (4)统计表。 (二)考核要求 1、统计数据的计量与类型 (1)数据的计量尺度 ① 了解:四种数据计量尺度的含义。 ② 理解:四种数据计量尺度的区别和特征。 (2)数据的类型 ① 了解:数据两种类型的含义。 ② 理解:数据两种类型的区别和应用。 2、统计数据的搜集 (1)统计调查方案 ① 了解:统计调查方案的作用。 ② 理解:统计调查方案的主要内容。 ③ 掌握:调查对象、调查单位、变量、变量值的涵义。 (2)统计调查方法 ① 了解:统计报表、普查、典型调查、重点调查的涵义。

最新统计学第一章练习题27395电子教案

第一题:单项选择题 1.同质性、大量性、差异性() A只有有限总体具有 B只有无限总体具有 C有限总体和无限总体都具有 D有限总体和无限总体都不具有 2.”统计”的基本含义是() A统计调查、统计整理、统计分析 B统计分析、统计推断、统计描述 C统计工作、统计资料、统计学 D统计分组、统计指标、统计分析 3.研究生招生目录中,201为英语、202为俄语、203为日语。这里语种属于() A定类数据 B定序数据 C定距数据 D定比数据 4.电视观众对收费频道是否应该插入广告的态度为不应该、应该、无所谓。这里“不应该、应该、无所谓”是() A定类数据 B定序数据 C定距数据 D定比数据 5.学生的智商等级是() A定类数据 B定序数据 C定距数据 D定比数据 6.下列表述正确的是() A定序数据包含定类数据和定距数据的全部数据 B定类数据包含定序数据的全部信息 C定序数据与定类数据是平行的 D定比数据包含了定类数据、定序数据和定距数据的全部信息 7.用部分数据去估计总体数据的理论和方法,属于() A理论统计学 B应用统计学 C描述统计学 D推断统计学 8.了解学生的学习情况,要调查足够多的学生,这个方法称为() A大量观察法 B统计分组法 C综合指标法 D相关分析法 9.了解居民的消费支出情况,则()

A所有居民的消费支出额是总体单位 B所有居民是总体 C某个居民的消费支出额是总体 D所有居民是总体单位 10.统计学的数量性特点表现在它是() A一种纯数量的研究 B利用大量的数字资料建立数学模型 C在质与量的联系中来研究现象总体的数量特征 D以数学公式为基础的定量研究 11.统计学的总体性特点是指() A研究现象各个个体的数量特征 B研究由大量个别事物构成的现象整体的数量特征 C从认识总体入手开始研究现象的数量特征 D从现象量的研究开始来认识现象的性质和规律 12.统计研究中的大量观察法是指() A一种具体的调查研究方法 B对总体中的所有个体进行观察和研究的方法 C收集大量总体资料的方法 D要认识总体的数量特征就必须对全部或足够多个体进行观察和研究13.对全市工业企业职工的生活状况进行调查,调查对象是() A该市全部工业企业 B该市全部工业企业的职工 C该市每一个工业企业 D该市工业企业的每一个职业 14.某年全国汽车总产量是() A随机变量 B连续变量 C离散变量 D任意变量15.要反映我国工业企业的整体业绩水平,总体单位是()

现代心理与教育统计学复习资料

第一章 1、数据类型 称名数据 计数数据离散型数据 顺序数据 等距数据 测量数据连续型数据 等比数据 2、变量:是可以取不同值的量。统计观察的指标都是具有变异的指标。当我们用一个量表示这个指标的观察结果时,这个指标是一个变量。 用来表示随机现象的变量,称为随机变量。一般用大写的X或Y表示随机变量。 随机变量所取得的值,称为观测值。一个随机变量可以有许多个观测值。 3、需要研究的同质对象的全体,称为总体。 每一个具体研究对象,称为一个个体。 从总体中抽出的用以推测总体的部分对象的集合称为样本。 样本中包含的个体数,称为样本的容量n。 一般把容量n ≥30的样本称为大样本;而n <30的样本称为小样本。

4、统计量和参数 5、统计误差 误差是测得值与真值之间的差值。 测得值=真值+误差 统计误差归纳起来可分为两类:测量误差与抽样误差。 由于使用的仪器、测量方法、读数方法等问题造成的测得值与真值之间的误差,称为测量误差。 由于随机抽样造成的样本统计量与总体参数间的差别,称为抽样误差 第二章 一、数据的整理 在进行整理时,如果没有充足的理由证明某数据是由实验中的过失造成的,就不能轻易将其排除。对于个别极端数据是否该剔除,应遵循三个标准差法则。 二、次数分布表 (一)简单次(频)数分布表 (二)相对次数分布表 将次数分布表中各组的实际次数转化为相对次数,即用频数比率(f /N )或百分比( )来表示次数,就可以制成相对次数分布表 %100 N f

(三)累加次数分布表 (四)双列次数分布表 双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。所谓有联系的两列变量,一般是指同一组被试中每个被试两种心理能力的分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果。 三、次数分布图 使一组数据特征更加直观和概括,而且还可以对数据的分布情况和变动趋势作粗略的分析。 简单次(频)数分布图——直方图、次数多边形图 累加次数分布图——累加直方图、累加曲线 (一)简单次数分布图--直方图 (二)简单次数分布图-次数多边图 次数分布多边形图是一种表示连续性随机变量次数分布的线形图,属于次数分布图。凡是等距分组的可以用直方图表示的数据,都可用次数多边图来表示。 绘制方法:以各分组区间的组中值为横坐标,以各组的频数为纵坐标,描点;将各点以直线连接即构成多边图形。 (三)累加次数分布图—累加直方图 (四)累加次数分布图——累加曲线 四、其他统计图表 条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。 圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。

2018统计学课程教学大纲

2018《统计学》课程教学大纲一、课程总述

二、教学时数分配

三、单元教学目的、教学重难点和内容设置 第一章数据与统计学 教学目的: 通过本章的学习,要求明确统计学的性质和特点,掌握数据的基本类型,正确地理解统计学中常用的基本术语,了解统计学的基本应用范围,从大的方面、从体系和主线上掌握这门课程的内容,这是学习《统计学》的起点。 本章的重点、难点: 重点:统计学的学科性质及其特征;描述统计与推断统计的区分;统计 学的基本概念。 难点:统计学的基本概念;统计研究方法 内容设置: 1.1统计学的性质及其种类 1.2统计的应用领域 1.3统计学中的几个基本概念 1.4 统计研究方法

第二章数据的采集、整理和显示 教学目的: 通过本章的学习,使学生了解统计数据搜集与整理的基本方法,掌握各种方法的特性。能够灵活运用各种数据调查方式和方法,并对所得数据进行科学的加工整理,为以后各章学习统计分析方法打下基础。 本章的重点、难点: 重点:统计调查方法;统计调查体系;统计分组;频数分布与变量数列 的编制;全距、组距与组数的关系 难点:统计分组;频数分布数列的编制方法与技巧 内容设置: 2.1数据的采集 2.2数据的整理 2.3频数分布 2.4数据的显示 第三章统计数据的描述 教学目的: 通过本章学习,掌握数据分布集中趋势和离散趋势的测度,重点掌握分组数据的均值和标准差及变异系数的计算,并能加以灵活运用,了解数据分布形状(即偏度与峰度)及其测度。 本章重点、难点: 重点:集中趋势的测度指标及其计算方法;离散趋势的测度指标及其计算方法; 难点:调和平均数、几何平均数的计算方法与应用场合;离散程度测度指标的计算方法与应用场合 内容设置: 3.1集中趋势的测度 3.2离散趋势的测度 3.3偏度和峰度的测度(自学) 3.4 相对位置的测度及异常值的检测 第四章时间序列分析 教学目的: 通过本章的学习,了解时间数列的定义、种类,掌握计算时间序列的水

统计基础知识第一章概述(娄庆松杨静主编)教案

第一章概述 学习目标 知识点 理解统计和统计学的含义和统计活动、统计研究的基本方法;掌握统计学中常用的基本概念。能力点 能结合现实中所遇到的具体事例说明什么是总体、总体单位、标志、指标、指标体系、变量;能识别统计数据的类型 本章结构图 一、统计学和统计活动 二、统计学中常用的基本概念

第一节统计学和统计活动 教学目标; 1. 统计和统计学的含义 2.统计学的研究对象及其特点 3. 统计工作过程和统计的职能 4. 统计研究的具体方法 教学重难点: 1. 统计和统计学的含义 2.统计学的研究对象及其特点 3. 统计研究的具体方法 教学方法: 知识讲解法、学生自学和引导 课时安排: 2课时 讲授新课: 一、统计和统计学的含义 在日常生活中,人们离不开统计数据。例如,教学班级每天都要统计出勤人数,同学们考试后要统计总成绩、平均成绩、及格率、优良率等;企业管理人员要统计供、产、销、利、税等数字;许多媒体要报道国内生产总值、物价指数、证券股票指数等。这些数字就是统计数据。统计数据室人们通过实际统计活动获得的。统计就是一门研究数据的技术。。

二、统计学的研究对象及其特点 (一)统计学的研究对象 统计学研究些什么,怎样研究,也即统计学的研究对象是什么,是学习统计学首先要解决的问题。 统计学的研究对象是指统计研究所要认识的客体,它决定着统计学的研究领域以及相应的研究方法。一般地说,统计学的研究对象是如何去认识客观事物的数量特征和数量关系的理论与方法。人们要认识客观事物,就必须通过试验或调查来采集有关数据,并加以整理、归纳和分析,以便对客观事物规律性的数量表现做出统计上的解释。例如,统计需要哪一类数据,怎样去采集和加工这些数据,怎样从复杂纷繁的数据中得出结论并解释这个结论,没有统计理论和方法的指导是无法进行的。所以说统计学是一门关于如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学。 (二)社会经济统计的特点 本书阐述统计学中的社会经济统计学,所涉及的统计工作指社会经济统计工作。 社会经济统计的研究对象是大量社会经济现象总体的数量方面,即研究社会经济现象总体的数量特征和数量关系。 社会经济统计学从其性质来讲它是一种对社会经济现象总体数量方面的认识活动,是一门研究方法论的社会科学。因此,社会经济统计具有如下特点: 三、统计工作过程和统计的职能 (一)统计工作过程

张厚粲现代心理与教育统计学第4版知识点总结课后答案

第1 章绪论 1.1 复习笔记 本章重点 ?心理与教育统计的研究内容 ?选择使用统计方法的基本步骤 ?统计数据的基本类型 ?心理与教育统计的基本概念 一、统计方法在心理和教育科学研究中的作用 (一)心理与教育统计的定义与性质 1.心理与教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析心理与教育科学研究中获得的随机性数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 2.具体讲,就是在心理与教育研究中,通过调查、实验、测量等手段有意地获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 3.统计学大致分为理论统计学(theoretical statistics)和应用统计学(appliedstatistics)两部分。前者侧重统计理论与方法的数理证明,后者侧重统计理论与方法在各个实践领域中的应用。心理与教育统计学属于应用统计学范畴,是应用统计学的一个分支。类似的还有生物统计、社会统计、医学统计、人口统计、经济统计等。 (二)心理与教育科学研究数据的特点 1.心理与教育科学研究数据与结果多用数字形式呈现。 2.心理与教育科学研究数据具有随机性和变异性。 3.心理与教育科学研究数据具有规律性。 4.心理与教育科学研究的目标是通过部分数据来推测总体特征。 (三)学习心理与教育统计应注意的事项 1.学习心理与教育统计学要注意的几个问题: (1)学习心理与教育统计学时,必须要克服畏难情绪。心理与教育统计学偏重于应用,只要有中学数学知识就具备了学好心理与教育统计学的前提。 (2)在学习时要注意重点掌握各种统计方法使用的条件。 (3)要做一定的练习。 2.应用心理与教育统计方法时要做到: (1)克服“统计无用”与“统计万能”的思想,注意科研道德。 (2)正确选用统计方法,防止误用和乱用统计。 二、心理与教育统计学的内容 心理与教育统计学的研究内容,可依不同的分类标志划分为不同的类别: (一)分类一 依据统计方法的功能进行分类,统计学可分为下述三种类别,这是由于数理统计的发展历史所决定的,也是最常见的分类方法。如图1-1 所示:

统计学课程教程教案

统计学课程教程教案(1) 2010~2011学年第一学期 课程名称:统计学(statistics)课程代码:62251020(62251030) 学时:54 学分:3 适用专业:税务财务管理会计旅游管理物流管理电子商务国际经济与贸易课程类别:专业主干课 先修课程:政治经济学、经济数学参考教材:《统计学基础》陈仁恩、厦门大学出版社 一、课程目的、任务 统计学是经济与管理学科各专业的学生必修的一门重要基础课,本课的内容既包括统计方法,也包括必要的社会经济指标核算的基本知识。通过课堂教学使学生能掌握统计学的基本知识和技能,能运用所学的统计理论对社会经济现象进行调查研究,并能运用统计方法分析、研究有关经济问题,为国民经济的管理提供真实可靠的数字资料,提高经济管理水平。因此,在教学上要通过本课程的学习,使学生能够掌握统计学的基本原理、基本方法及基本统计指标的核算,并能运用所学知识,完成对统计资料的搜集、整理和分析,提高学生对社会经济问题的数量分析能力。 在经济与管理学科各专业的教学中,对统计知识的需求不一样,因此有的内容对不同的专业有不同的要求,具体的要求将在各章的教学内容中加以说明。 在各章的教学要求中,有关基本概念、基本理论的内容按“了解、一般了解、重点理解”三个层次要求;有关指标的基本公式、计算方法及数量分析方法等内容按“会、掌握、熟练掌握”三个层次要求。

二、课程教学基本要求 教学要求:学习《统计学》课程,总的要求是要熟悉统计学基本理论、理解和掌握统计学的基本分析方法。 教学目标:学生初步掌握对统计信息资料基本分析方法的运用。 主要教学环节安排:理论教学45学时,实验教学9学时 教学方法:课堂理论讲授与实例分析相结合。本课程以教师讲授和学生自主学习为主,同时组织相应教辅材料、教学活动以配合本课程教学的顺利进行。 教学形式:以教师讲授的板书内容为主(教学内容中的粗体字),同时组织相应统计实验(以实验大纲和实验指导书为标准)、统计习题。 考核方式:闭卷考试+实践报告 三、课程教学重点 1、统计学的有关基本概念; 2、统计实践活动的环节; 3、统计基本分析方法。 课程教学难点 统计调查方式理解与选择;统计资料的分组整理;统计分析指标及统计分析方法。

统计学课后第一章习题答案教案资料

第1章导论 1、某森林公园的一项研究试图确定哪些因素有利于成年松树长到60英尺以上的高度。经估计,森林公园生长着25000颗成年松树,该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究的总体是() A、250颗成年松树 B、公园中25000颗成年松树 C、所有高于60英尺的成年松树 D、森林公园中所有年龄的松树 2、某森林公园的一项研究试图确定成年松树的高度。该研究需要从中随机抽取250颗成年松树并丈量它们的高度后进行分析。该研究所感兴趣的变量是() A、森林公园中松树的年龄 B、森林公园中松树的数量 C、森林公园中松树的高度 D、森林公园中数目的种类 3、推断统计的主要功能是() A、应用总体的信息描述样本 B、描述样本中包含的信息 C、描述总体中包含的信息 D、应用样本信息描述总体 4、对高中生的一项抽样调查表明,85%的高中生愿意接受大学教育。这一叙述是()的结果 A、定性变量 B、试验 C、描述统计 D、推断统计 5、一名统计学专业的学生为了完成其统计学作业,在图书馆找到一本参考书中包含美国50个州的家庭收入中位数。在该生的作业中,他应该将此数据报告来源于() A、试验 B、实际观察 C、随机抽样 D、已发表的资料

6、某大公司的人力资源部主任需要研究公司雇员的饮食习惯。他注意到,雇员的午饭要么从家里带来,要么在公司餐厅就餐,要么在外面的餐馆就餐。该研究的目的是为了改善公司餐厅的现状。这种数据的收集方式可以认为是() A、观察研究 B、设计的试验 C、随机抽样 D、全面调查 7、下列不属于描述统计问题的是() A、根据样本信息对总体进行的推断 B、感兴趣的总体或样本 C、图、表或其他数据汇总工具 D、了解数据分布特征 8、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的总体是() A、该大学的所有学生 B、所有的大学生 C、该大学所有的一年级新生 D、样本中的200名新生 9、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生在教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。该研究人员感兴趣的变量是()A、该大学一年级新生的教科书费用 B、该大学的学生数 C、该大学新生的年龄 D、大学生的生活成本 10、在下列叙述中,关于推断统计的描述是() A、一个饼图描述了某医院治疗过的癌症类型,其中2%是肾癌,19%是乳腺癌; B、.从一个果园中采摘36个橘子,利用这36个橘子的平均重量估计

现代心理与教育统计学(张厚粲)课后习题答案

现代心理与教育统计学(张厚粲)课后习题答案 第一章绪论(略) 第二章统计图表(略) 第三章集中量数 4、平均数约为36.14;中位数约为36.63 5、总平均数为91.72 6、平均联想速度为5.2 7、平均增加率约为11%;10年后的毕业人数约有3180人 8、次数分布表的平均数约为177.6;中位数约为177.5;原始数据的平均数约为176.7 第四章差异量数 5、标准差约为1.37;平均数约为1.19 6、标准差为26.3;四分位差为16.03 7、5cm组的差异比10cm组的离散程度大 8、各班成绩的总标准差是6.03 9、次数分布表的标准差约为11.82;第一四分位为42.89;第三四分位为58.41;四分位差为7.76 第五章相关关系 5、应该用肯德尔W系数。 6、r=0.8;r R=0.79;这份资料只有10对数据,积差相关的适用条件是有30对以上数据,因此这份资料适用等级相关更合适。 7、这两列变量的等级相关系数为0.97。 8、上表中成绩与性别有很强的相关,相关系数为0.83。 9、r b=0.069小于0.2.成绩A与成绩B的相关很小,成绩A与成绩B的变化几乎没有关系。 10、测验成绩与教师评定之间有一致性,相关系数为0.87。 11、9名被试的等级评定具有中等强度的相关,相关系数为0.48。 12、肯德尔一致性叙述为0.31。 第六章概率分布 4、抽得男生的概率是0.35 5、出现相同点数的概率是0.167 6、抽一黑球与一白球的概率是0.24;两次皆是白球与黑球的概率分别是0.36和0.16 7、抽一张K的概率是4/54=0.074;抽一张梅花的概率是13/54=0.241;抽一张红桃的概率是13/54=0.241;抽一 张黑桃的概率是13/54=0.241;抽不是J、Q、K的黑桃的概率是10/54=0.185

2018统计学课程教学大纲

2018《统计学》课程教学大纲、课程总述

、教学时数分配

三、单元教学目的、教学重难点和内容设置 第一章数据与统计学 教学目的: 通过本章的学习,要求明确统计学的性质和特点,掌握数据的基本类型,正确地理解统计学中常用的基本术语,了解统计学的基本应用范围,从大的方面、从体系和主线上掌握这门课程的内容,这是学习《统计学》的起点。 本章的重点、难点: 重点:统计学的学科性质及其特征;描述统计与推断统计的区分;统计学的基本概念。 难点:统计学的基本概念;统计研究方法 内容设置: 1.1统计学的性质及其种类 1.2统计的应用领域 1.3统计学中的几个基本概念 1.4统计研究方法

第二章数据的采集、整理和显示 教学目的: 通过本章的学习,使学生了解统计数据搜集与整理的基本方法,掌握各种方法的特性。能够灵活运用各种数据调查方式和方法,并对所得数据进行科学的加工整理,为以后各章学习统计分析方法打下基础。 本章的重点、难点: 重点:统计调查方法;统计调查体系;统计分组;频数分布与变量数列的编制;全距、组距与组数的关系 难点:统计分组;频数分布数列的编制方法与技巧 内容设置: 2.1 数据的采集 2.2 数据的整理 2.3 频数分布 2.4 数据的显示 第三章统计数据的描述 教学目的: 通过本章学习,掌握数据分布集中趋势和离散趋势的测度,重点掌握分组数据的均值和标准差及变异系数的计算,并能加以灵活运用,了解数据分布形状(即偏度与峰度)及其测度。 本章重点、难点: 重点:集中趋势的测度指标及其计算方法;离散趋势的测度指标及其计算方法; 难点:调和平均数、几何平均数的计算方法与应用场合;离散程度测度指标的计算方法与应用场合 内容设置: 3.1 集中趋势的测度 3.2 离散趋势的测度 3.3 偏度和峰度的测度(自学) 3.4 相对位置的测度及异常值的检测 第四章时间序列分析 教学目的:通过本章的学习,了解时间数列的定义、种类,掌握计算时间序列的水平指标分析法与速度指标分析法,了解时间序列的各项构成因素,掌握时间序列的趋势分析方法。 本章重点、难点:重点:时间序列的水平指标分析法、速度指标分析法,时间序列的趋势分析方法。

统计学基础教案

统计学基础教亲 哈尔滨金融髙等专科学校管理系 第一章总论 学习重点:本章是全课程的总纲,主要讲述统计学的对象和方法、统计的作用和统讣学的基本概念,难点是统计学概念的理解和运用以及概念之间的相互关系。 第一节统计学的产生和发展 看了上面的资料,你能说出什么是统计吗?你能否体会到统计已是人们在社会经济生活中必不可少的工具,是人们认识世界、探索现象数量差异的本质极其规律的方法,是人们进行明智决策的一门艺术,随着人类社会进入信息时代,统计作为一种方法和工具就变得越来越重要。 一、统计的概念

在日常生活中,我们经常会接触到“统计”这一术语。一提到统计,很多人可能首先想到的是统讣工作,这种理解是不全面的。统计作为一种社会实践活动, 已有悠久的历史,可以说,自从有了国家就有了统计实践活动。最初,统计只是一种讣数活动,为统治者管理国家的需要而搜集资料,通过统计计数以弄清国家的人力、物力和财力,作为国家管理的依据。然而在今天,"统计”一词已被人们赋予多种含义,在不同的场合、不同的语言环境中已有许多种不同的解释。 请思考:下列资料中"统计” 一词的含义是什么? (1)小王是学统计的 (2)他已搞了儿十年统计了 (3)据统计,今年一季度物价指数出现负增长 (4)请找统计登记一下 (5)请统计一下今天的销售量 那么,把统讣作为一种专业用语,其含义到底是什么?目前,在国际统计理论界,关于统计?一词的含义比较趋于一致的解释为:统计包含统计工作、统计资料和统计学三个方面的含义。 一是统计工作,即统讣实践,是对社会经济现象客观存在的现实数量方面进行搜集、整理和分析预测等活动的总称。一个完整的统汁工作过程一般包括统计设计、统计调查、统计整理、统计分析等环节。 统计工作是统计一词最基本的含义,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。如银行的讣划统计科,每月编制项LI报表,这个过程就是统计?工作。乂如:我国进行人口普查时要经过方案设计、入户登记、数据汇总、分析总结和资料公布等一系列过程都是统计工作。在我国, 各级政府机构基本上都有统计部门,如统讣局,它们的职能主要就是从事统计数据的搜集、整理和分析工作。 二是统计资料(统计信息):统计工作过程中所取得的各项数字资料和与之相关的其他实际资料的总称。如: (1)我国国土面积960万平方公顷,其中山地约320万平方公顷,高原约250 万平方公顷,平原约"5万平方公顷,丘陵约95万平方公顷。 (2)2003年我国全年全部工业增加值53612亿元,比上年增长12.6%,其中规模以上工业企业(即国有工业企业及年产品销售收入500万元以上的非国有工业企业)增加值增长17.0%。工业产品销售率98.1%,比上年提i?0.1个白分点。 这些山文字和数字共同组成的数字化的信息就是统汁资料,是统计提供数据信息的基本表现形式,是统计工作的直接成果。 统计资料包括原始资料和整理后的资料即次级资料。例如企业各车间的统计抬帐、人口普查时初次登记的资料就是原始资料,而统讣公报、调查分析报告等现实和历史资料就是次级资料。统讣资料的表现形式有统计表、统计图、统计分析报告、统

现代心理与教育统计学

心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来得大量数据科学得科学得加以整理概括与表述 作用:使杂乱无章得数字更好得显示出事物得某些特征,有助于说明问题得实质。 具体内容:1数据分组:采用图与表得形式。 2计算数据得特征值:集中量数(平均数中数)离散量数(方差) 3计算量事物间得相关关系:积差相关(2列 3列多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供得信息,依据数理统计提供得理论与方法,推论总体情形。 作用:用样本推论总体。 具体内容:1如何对假设进行检验。 2如何对总体参数特征值进行估计。 3各种非参数得统计方法。 心理与教育统计基础概念 数据类型 一从数据来源来划分 1计数数据:计算个数或次数而获得得数据。(都就是离散数据) 2测量数据:借助一定测量工具或测量标准而获得得数据。(连续数据) 二根据数据所反映得测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类得数据。

特点:数字只就是事物得符号,而没有任何数量意义。 统计方法:百分数次数众数列联相关卡方检验等。(非参检验) 2顺序数据(分类排序) 定义:指代事物类别,能够表明不同食物得大小等级或事物具有得某种特征得程度得数据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征得真正数量。 统计方法:中位数百分位数等级相关肯德尔与谐系数以及常规得非参数检验方法。3等距数据(分类排序加减(相等单位))(真正应用最广泛得数据) 定义:不仅能够指代物体得类别等级,而且具有相等得单位得数据。(成绩温度) 特点:真正得数量,能进行加减运算,没有绝对零点,不能进行乘除计算。 统计方法:平均数标准差积差相关 Z检验 t检验 F检验等。 4比率数据(分类排序加减法乘除法(绝对零点)) 定义:表明量得大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正得数字,有绝对零点,可以进行加减乘除运算。 在统计中处理得数据大多就是顺序数据与等距数据。 三按照数据就是否具有连续性 离散数据连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得得数据。数据获得前用“x”表示,即为一个可以取不同熟知得物体得属性或事件,其数值具有不确定性,因而称为变量。观测值:就是研究中确定得某一变量得取值。 随机变量:表示随机现象各种结果得变量称为随机变量 三总体样本个体 总体:具有某种共同特质得一类事物。(欲研究得研究范围) 样本:构成总体得每个基本单元。

《教育统计学-教学大纲》

《教育统计学》课程教学大纲 课程名称:教育统计学/Educational Statistics 课程编码:040000702总学时数/学分数:32/2 实验学时:0上机学时:0 课程所属部门:所有学院课程负责人: 制定日期:2014年5月 一、课程定位 本课程是我校培养职教师资的基础课程,授课对象是所有修读职教师资培养课程专业的学生。 教育统计学是运用数理统计的原理和方法,研究教育问题的一门应用科学。它的主要任务是研究如何搜集、整理、分析由教育调查和教育实验所获得的数字资料,并以此为依据,进行科学推断,揭示教育现象所蕴涵的客观规律。 学习本课程须预先修完《教育学》、《心理学》、《概率论与数理统计》等基础课程。同时,本课程也是进一步学习《教育测量与评价》、《教育科学研究方法》等课程的重要基础。 本课程主要培养学生在教育研究中分析与处理数据的能力,是提升学生研究素养、能力与技能的核心课程,具有较强的应用性、实践性。在师范专业知识体系中,本课程是教育科学研究方法课程群的重要组成部分,其知识与技能渗透在《教育测量与评价》、《教育科学研究方法》、《教学法》等课程中,在人才培养方案中具有不可替代性。 二、教学目标 通过本课程的学习,使学生了解数据整理、分析、解释等方面的理论与方法,初步掌握从数量方面研究教育现象特征、探讨教育规律、进行有关决策的方法;初步具备从事心理与教育科学研究的基础知识和基本技能;使学生在掌握数据处理的基本理论与方法时,重点理解和掌握基本的统计推断的方法,尤其是各种统计方法的应用条件和如何科学解释统计计算结

果;掌握教育统计学的基本概念、基本原理和基本方法,能够运用教育统计学的基本原理和方法分析处理实验数据、解决实际问题;培养学生科学的思维方式,提高学生科学管理及教育科学研究的能力。 三、课程规范要求 学生在修读本课程的过程中需要遵循以下规范和要求: 1本课程以课堂讲授为主,学生须严格遵守上课考勤制度,每次上课出勤率须在90%以上,并且每名学生缺课次数不得累计超过3次。 2在课堂教学中教师通过实际案例讲解抽象的统计原理和方法,并注重讲练结合,通过解题操练和实践应用来加深理解、巩固强化,因此学生不仅要认真听讲,更要及时独立完成课堂练习,边学边练、及时强化,从而保障课堂学习效果。 3针对课程重点难点,学生须做必要的课前准备,进行充分预习,从而使课堂学习有明确的针对性、目的性,从而提高课堂学习效率;并且要按时独立完成课后练习,及时复习学过的内容。 四、教材、参考书和阅读材料 (1)教材: 《教育统计学》,王孝玲编著,华东师范大学出版社,2012年出版(第四版)。 (2)参考书: 《现代心理与教育统计学》,张厚粲、徐建平编著,北京师范大学出版社,2007年出版。 《教育与心理统计学》,张敏强编著,人民教育出版社,2010年出版。《心理与教育统计学》,绍志芳主编,上海科学普及出版社,2004年出版。《教育与心理研究中数据分析方法》,潘玉进编著,科学出版社,2010年出版。 《教育统计学》,王景英编著,高等教育出版社,2001年出版。

现代心理与教育统计学课后题完整版

第一章绪论 1. 名词解释 随机变量:在统计学上,把取值之前不能预料取到什么值的变量称之为随机变量 总体:又称为母全体、全域,指据有某种特征的一类事物的全体 样本:从总体中抽取的一部分个体,称为总体的一个样本 个体:构成总体的每个基本单元称为个体 次数:指某一事件在某一类别中出现的数目,又成为频数,用f表示 频率:又称相对次数,即某一事件发生的次数被总的事件数目除,亦即某一数据出现的次数被这一组数据总个数去除。频率通畅用比例或百分数表示 概率:又称机率。或然率,用符号P表示,指某一事件在无限的观测中所能预料的相对出现的次数,也就是某一事物或某种情况在某一总体中出现的比率 统计量:样本的特征值叫做统计量,又叫做特征值 参数:总体的特性成为参数,又称总体参数,是描述一个总体情况的统计指标观测值:在心理学研究中,一旦确定了某个值,就称这个值为某一变量的观测值,也就是具体数据 2. 何谓心理与教育统计学学习它有何意义 心理与教育统计学是专门研究如何运用统计学原理和方法,搜集。整理。分析心理与教育科学研究中获得的随机数据资料,并根据这些数据资料传递的信息,进行科学推论找出心理与教育活动规律的一门学科。 3. 选用统计方法有哪几个步骤 首先要分析一下试验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的 其次要分析实验数据的类型,不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要 第三要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件 4. 什么叫随机变量心理与教育科学实验所获得的数据是否属于随机变量 随机变量的定义:①率先无法确定,受随机因素影响,成随机变化,具有偶然性和规律性②有规律变化的变量5. 怎样理解总体、样本与个体 总体N据有某种特征的一类事物的全体,又称为母体、样本空间,常用N表示,其构成的基本单元为个体。特点:①大小随研究问题而变(有、无限)②总体性质由组成的个体性质而定 样本n:从总体中抽取的一部分交个体,称为总体的一个样本。样本数目用n表示,又叫样本容量。 特点:①样本容量越大,对总体的代表性越强②样本不同,统计方法不同 总体与样本可以相互转化。 个体:构成总体的每个基本单元称为个体。有时个体又叫做一个随机事件或样本点 6. 统计量与参数之间有何区别和关系 参数:总体的特性称参数,又称总体参数,是描述一个总体情况的统计指标 统计量:样本的特征值叫做统计量,又称特征值二者关系:参数是一个常数,统计量随样本而变化参数常用希腊字母表示,统计量用英文字母表示当试验次数=总体大小时,二者为同一指标当总体无限时,二者不同,但统计量可在某种程度上作为参数的估计值 7. 试举例说明各种数据类型之间的区别 8. 下述一些数据,哪些是测量数据哪些是计数数据其数值意味着什么 17.0千克89.85厘米199.2秒93.5分是测量数据 17人25本是计数数据 9. 说明下面符号代表的意义 卩反映总体集中情况的统计指标,即总体平均数或期望值 X反映样本平均数 P表示某一事物两个特性总体之间关系的统计指标,相关系数 r样本相关系数 b反映总体分散情况的统计指标标准差 s样本标准差 B表示两个特性中体之间数量关系的回归系数第三章集中量数 1. 应用算术平均数表示集中趋势要注意什么问题 应用算术平均数必须遵循以下几个原则: ①同质性原则。数据是用同一个观测手段采用相同的观测标准,能反映某一问题的同一方面特质的数据。 ②平均数与个体数据相结合的原则 ③平均数与标准差、方差相结合原则 2. 中数、众数、几何平均数、调和平均数个适用于心理与教育研究中的哪些资料 中数适用于:①当一组观测结果中出现两个极端数目时② 次数分布表两端数据或个别数据不清楚时 ③要快速估计一组数据代表值时

相关主题
文本预览
相关文档 最新文档