当前位置:文档之家› 统计学

统计学

统计学
统计学

《统计学》2011年7月考试考前练习题

一、单项选择题

1.关于均值,下列说法正确的是( A )。

A .均值不适用于定类数据和定序数据

B .均值不适用于定距数据和定比数据

C .各变量与其均值的离差之和等于1

D .几何平均数不适用于定比数据

2.我国目前的零售价格指数的特点是( D )。

A .是根据全部零售商品计算而得

B .对所选商品使用的价格是该商品的市价

C .对所选商品使用的价格是该商品的议价

D .是采用加权算术平均形式计算的

3.在使用基期价格作权数计算商品销售量指数时,( C )。

A .包含了价格变动的影响

B .包含了价格和销售量变动的影响

C .消除了价格变动的影响

D .消除了价格和销售量变动的影响

4.如果A 与B 互斥,则有( A )。

A .)()()(

B P A P B A P += B .)()()(B P A P B A P +=

C .)()()(B P A P B A P ?=

D .)()()(B P A P B A P ?=

5.下列哪种指数是个体指数( B )。

A .消费价格指数

B .生猪价格指数

C .道琼斯指数

D .恒生指数

6.假设检验所依据的是( B )。

A .中心极限定理

B .小概率原理

C .反证法

D .排中律

7.帕氏指数的特点之一是( A )。

A .更多地用于计算质量指数而非数量指数

B .采用了基期变量值加权

C .不同时期的帕氏指数具有可比性

D .帕氏指数不宜用来计算综合指数

8.在无交互作用的双因素方差分析中,如果因素A 有r 个水平,因素B 有S 个水平,则SST ,SSA ,SSB 的自由度分别为( C )。

A .rS ,r ,S

B .()()11--S r ,1-r ,1-S

C .1-rS ,1-r ,1-S

D .1-rS ,r ,S

9.指数按其反映的内容不同可分为( A )。

A .数量指数和质量指数

B .个体指数和综合指数

C .简单指数和加权指数

D .定基指数和环比指数

10.以1980年为基期,1998年为报告期计算的国内生产总值的平均发展速度应开( B )次方。

A .17

B .18

C .19

D .20

11.今有34?列联表,总频数320,52.172=χ,则其V 相关系数等于( D )。

A .0.233

B .0.229

C .0.135

D .165.0

12.若已知一数列的环比增长速度分别为%5、%7、%10、%13,则该数列的定基增长速度为( B )。

A .%113%110%107%105

??? B .()1%113%110%107%105-??? C .()1%113%110%107%105+??? D .%13%10%7%5???

13.用水平法计算平均发展速度,实际上只与数列的( D )相关联。

A .最初水平

B .中期水平

C .最末水平

D .A 和C

14.平均增长量与累计增长量的关系是( B )。

A .平均增长量乘时期数等于累计增长量

B .平均增长量等于累计增长量除以时间数列项数1-

C .平均增长量的连乘积等于累计增长量

D .平均增长量乘时间数列项数1-等于累计增长量

15.置信水平表达了区间估计的( A )。

A .可靠性

B .精确性

C .显著性

D .有效性

16.()2,~σμN X ,2σ未知,00:μμ≥H ,则0μ的拒绝域为( A )。

A .αt t -≤

B .αt t -≥

C .αt t ≤

D .2αt t ≥

17.若00μμ=:H ,抽出一个样本,其均值0μ

A .肯定拒绝原假设

B .有可能拒绝原假设

C .肯定接受原假设

D .以上说法都不对

18.已知变量x 与y 之间存在着负相关,指出下列方程中( C )肯定是错误的。

A .x y 7.08?--=

B .x y 8.0150?-=

C .x y 34.0130?+-=

D .x y 053.025?-=

二、多项选择题

1.关于方差和标准差,正确的说法是( BD )。

A .方差有量纲

B .标准差有量纲

C .方差和标准差都有量纲

D .方差的平方根是标准差

E .方差的实际意义比标准差清楚

2.在方差分析中,如果MSE MSA

F =近似等于1,则说明( BCE )。

A .方差分析中应该拒绝原假设

B .方差分析中应该接受原假设

C .组间方差中不包含系统因素的影响

D .组间方差中包含系统因素和随机因素的影响

E .r 个总体的均值没有显著差异

3.设X 是任一离散型随机变量,()()n i p x X p i i ,,2,1 ===是X 的概率函数,则必然有( ABE )。

A .()1≤==i i p x X P n i ,,2,1 =

B .()0≥==i i p x X P n i ,,2,1 =

C .1)(≥==i i p x X P n i ,,2,1 =

D .()0

11==

=∑∑==n i n i i i p x X P

E .()1

11==

=∑∑==n i n

i i i p x X P

4.现在有三道判断题,事件i A 表示第i 道判断题正确()3,2,1=i ,则至少有两道判断题正确可以表示为( BC

)。

A .321321321A A A A A A A A A -

--

++

B .321321321321A A A A A A A A A A A A +++-

--

C .3213231212A A A A A A A A A -++

D .-

----

-++323121A A A A A A

E .321A A A

5.对于单因素方差分析的误差平方和SSE ,以下正确的选项有( AD )。

A .反映随机因素的影响

B .反映随机因素和系统因素的影响

C .自由度为1-r ,1-r 为水平个数

D .自由度为1-n ,n 为样本数据个数

E .自由度为1-r

6.现根据样本数据建立的单位产品成本(元)对产量(千件)的一元线性回归方程为x y 8.470?-=,这就意味着( ABD )。

A .产量每增加1千件,单位成本平均降低4.8元

B .产量为1千件时,单位成本为65.2元

C .产量每增加1千件,单位成本平均增加4.8元

D .单位成本与产量之间存在着负相关

E .单位成本与产量之间存在着正相关

7.在指数体系中,总量指数与各因素指数之间的数量关系是( BE )。

A .总量指数等于各因素指数之和

B .总量指数等于各因素指数的乘积

C .总量指数等于各因素指数之比

D .总量的变动差额等于各因素变动差额之积

E .总量的变动差额等于各因素变动差额之和

8.不能运用乘除运算方法的计量尺度有( ABC )。

A .列名水平

B .有序水平

C .间隔水平

D .比较水平

E .定比尺度

9.若(n x x x .,,21 )是来自总体X 的一个样本,()

2,~σμN X ,则( AC )。 A .21-n s 是2σ的无偏估计 B .2n s 是2σ的无偏估计 C .x 是μ的无偏估计

D .2x 是2

σ的无偏估计 E .1-n s 是σ的无偏估计

10.根据各年的月度资料计算的季节比率( CE )。

A .其均值为%400

B .其总和为%100

C .其平均数为%100

D .其总和为%400

E .其总和为%1200 11.若置信区间为])[(2221

21221n n z x x σσα+±-,则下列哪种说法是正确的( ABCDE )。 A .两个正态总体,方差2221σσ、已知

B .两个非正态总体,大样本,方差

2221σσ、已知

C .)(21x x -的数学期望为21μμ-

D .)(21x x -的方差为222121n n σσ+

E .)(21x x -服从正态分布

12.在编制加权综合指数时,确定权数需要考虑的问题有( ABD )。

A .现象之间的内在联系

B .权数的所属时期

C .权数的具体数值

D .权数的具体形式

E .权数的稳定性和敏感性

三、填空题

1.检验回归系数的显著性时,检验的统计量t =_____;检验相关系数r 的显著性时,检验的统计量t =_____。 解答:

b s b 212r n r --

2.方差分析是通过误差的分析,判断多个_____是否相等的一种统计方法。

解答:正态总体均值

3.对于正态总体均值的假设检验,如果假设为00:μμ=H ,01:μμ≠H ,则接受域为_____,此时称为_____检验。 解答:

2αZ Z ≤ 双侧

4.统计上把α称为假设检验中的_____水平。

解答:显著性

5.统计推断是由_____和_____组成的。

解答:参数估计 假设检验

6.在无交互作用的双因素方差分析中,若因素A 有5个水平,因素B 有4个水平,则SST 的自由度为_____,SSA 的自由度为_____,SSE 的自由度为_____。

解答:19 4 12

7.设)1,0(~N X ,()x F 与()x f 分别是其分布函数和概率密度函数,则()=0F ______;==)0(x P ______。

解答:0.5 0

8.掷一枚均匀的骰子,出现3点的概率为_____;出现3点以下的概率为_____;出现3点的整数倍数的概率为_____。

解答:61 31 31

9.测定季节变动常用的方法有_____和_____它们均以_____指标来反映季节波动。

解答:按月(季)平均法 趋势剔除法 季节比率(指数)

四、简答题

1.众数、中位数和均值之间存在什么样的数量关系?

解答:

众数、中位数和均值是三种描述数据集中趋势的主要测量值。当数据呈正态分布时,三个测量值完全相等;当分布出现偏态时,三者表现出差别。如果是右偏分布,则X >Me>M0;如果是左偏分布,则M0>Me>X 。一般说来,均值与中位数间的距离约是中位数与众数间距离的1/2。这个规律可以大致表示为:M0"P X -3(X -Me)

2.什么是定比尺度?它具有哪些特征?

解答:定比尺度又称比率尺度或比较水平,其英文译为Ratio Scale ,它是对事物之间比值的一种测度,可用于参数与非参数统计推断。虽然它与定距尺度同属于一个等级的计量尺度,但其功能要比定距尺度强一些,其主要特征体现为:

①除能区分类别、排序、比较大小、求出大小差异、可采用加减运算以外,还可以进行乘除运算。

②具有绝对零点,即"0"表示"没有"或"不存在"。

③所有统计量均可对其进行分析。

即不仅包括其它三种计量尺度可以采用的统计量,如:频数、频率、众数、中位数、四分位数、均值、标准差等,而且还可以采用其他更为复杂的统计量,如T 统计量、Z 统计量、F 统计量、2

χ统计量等。

3.怎样理解在统计分组过程中的"互斥"、"不重不漏"、"上限不包括在内"、"下限不包括在内"的原则?

解答:在统计分组中的"互斥"原则,就是指各组中不应相互包含。所谓"不重"就是指一项数据只能归入其中的一组,而不能同时归入两个或两个以上的组。所谓"不漏"就是指各组别能够穷尽,即在所分的全部组别中,每项数据都能分在其中的一组而没有遗漏。为了解决"不重"问题,在统计分组中习惯上规定,对于越大越好的数值,采用"上限不包括在内"的原则,即当采用重叠组限时,某一变量值恰与组限同值,应将其归入下限组,而不是上限组;对于越小越好的数

值,则采用"下限不包括在内"的原则,即当采用重叠组限时,某一变量值恰与组限同值,则应将其归入上限组,而不是下限组。为了解决"不漏"的问题,在分组时可以采用开口组,这样可以将极端值包括在分组中,不被遗漏。

4. 事件的独立和互斥有何区别和联系?

解答:两个事件互斥是指两个事件不可能同时发生。而两个事件独立是指其中任一事件发生与否并不影响另一事件。

如果两个事件互斥,则它们之间不可能独立。因为如果A 出现则B 的概率为0,如果B 出现A 的概率也为0,所以互斥事件是相互依赖(不独立)的。

如果两个事件不互斥,则可能独立,也可能不独立。然而独立的事件不可能是互斥的。

5. 假设检验分为哪几个步骤?

解答:分为五个步骤:(1)提出原假设和替换假设;(2)确定适当的检验统计量;(3)规定显著性水平α;(4)计算检验统计量的值;(5)作出统计决策并加以解释。

6. 简述应用方差分析的条件。

解答:应用方差分析要求符合两个条件:

(1)各个水平的观察数据,要能看作是从服从正态分布的总体中随机抽取的样本。

(2)各组观察数据是从具有相同方差的相互独立的总体中抽得的。

7. 在对两组数据差异程度进行比较时,能否直接比较两组数据的标准差?

解答:标准差的大小,不仅取决于各个变量值与其均值离差的大小,还取决于变量值水平的高低。如果两组数据的计量单位相同,且均值水平相同,可以利用标准差来比较差异程度,但如果两组数据的计量单位不同,或均值水平不同,就不可以直接比较两组数据的标准差,而应当比较两数据的离散系数。

8. 置信区间的直观意义是什么?

解答:置信区间表达了区间估计的准确性或精确性。对此,我们可以这样理解。由于估计量θ、θ都是样本的函数,一旦得到了一组样本观察值n x x x ,,,21?,就可以计算出一对数值θ()n x x x ,...,,21和θ()n x x x ,...,,21,反复抽取样本,就能得到多组不同的样本值,从而得出多对θ、θ数值,确定多个置信区间。在给定显著性水平α的条件下,当我们建立了100个置信区间,那么平均就有α-1个置信区间包含真值θ,或说对每一个置信区间有α-1的概率包含了θ;同时有100α个置信区间不包含θ,或说对每一个置信区间有α概率不包含θ。这就是置信区间的直观含义或意义。

9. 在统计分析中为什么要把绝对数和相对数结合起来运用?

解答:绝对数反映了现象的总规模和总水平,但不易说明现象的发展程度和差别;相对数能够揭示事物内部的联系和现象间的对比关系,却把现象的具体规模抽象了。绝对数和相对数各有长处和弱点,只有把它们结合起来,才能使我们对事物的认识更为全面。

五、计算题(需写出计算过程,答案精确到小数点后两位)

1.一个口袋里装有5个白球,3个红球,从袋里随机取球三次,均不放回。

求:(1)取到3个球都是红球的概率。

(2)取到3个球都是白球的概率。

(3)取到的球的颜色不相同的概率。

解答:(1)

5613833

1==C C P (2)2853835

2==C C P

(3)取到的球的颜色不相同,即2红1白或者1红2白。则:

38251315233C C C C C P += 5645

=

或者:2131P P P --=

5645

2855611=--

=

2.有甲乙两个生产小组,甲组平均每个工人的日产量为36件,标准差为9.6件。乙组工人日产量资料如下:

要求:(1)计算乙组平均每个工人的日产量和标准差。

(2)比较甲、乙两生产小组哪个组的日产量差异程度大?

解答:(1)

986.8F )X X (F ,5.29133438151345343538251515F

X F 4

1i i 4

1i 2i i 41

-i i

41

i i i

=-=+++?+?+?+?=∑∑∑∑=====乙乙σX (2)

305.0X ,267.0X ==乙乙乙甲甲甲==σσV V

说明乙组日产量差异程度大于甲组。

3. 某农贸市场三种商品的资料如下:

计算:(1)三种商品的成交额指数;

(2)三种商品的价格总指数和销售量总指数,并分析价格和销售量变动对销售额的影响程度。

解答:(1)三种商品的成交额指数:

%29.1140.70.8001

10/1===∑∑q p q p v

增加的绝对额:

∑∑=-=-)(0.10.70.80011万元q p q p

(2)三种商品的价格总指数:

%26.1056.70.8/111011

10/1==?=∑∑q p p p q p p

增加绝对额:

∑∑=-=?-)(4.06.70.8/1110111万元q p p p q p

(3)三种商品的销售量总指数:

%57.1080.76.700100000010/1===?=∑∑∑∑q p q p q p q p q q

q

增加绝对额:

∑∑=-=-?)(6.00.76.7000001

万元q p q p q q

4. 某市调查职工平均每天用于家务劳动的时间。该市统计局主持这项调查的人认为职工用于家务劳动的时间不超过2

小时。随机抽取225名职工进行调查的结果为:8.1=x 小时,44.12=s 。

问:调查结果是否支持调查主持人的看法?(05.0=α,645.105.0=t ,645.105.0=Z )

解答:解一:

(1)2:2:10<≥μμH H

(2)05.0=α 当225=n 时相等与ααz t 。故645.1==ααz t

(3)

5.22252.128.10-=-=-=n s x t μ (4)拒绝域αt t -≤ 645.15.2-<-

(5)拒绝0H ,即可以接受调查主持人的看法。

解二:由于225=n 为大样本,可用z 统计量。

2:2

:10<≥μμH H 5.22252.128.10-=-=-=n s x z μ

645.1=αz ,z <αz -

落入拒绝域,即调查结果支持该调查人的看法。

应用统计学论文

应用统计学课程论文 经过这学期短暂的学习应用统计学,我对这门学科也有了一定认识。应用统计学是一门运用统计学的原理和方法,研究各个领域有关数据收集、整理、分析的科学是经济、管理类专业的一门重要专业基础课程。掌握统计学的基本理论和方法,具有较好的科学素养,能熟练地运用计算机分析数据,能从事统计调查、统计信息管理、数量分析、市场研究、质量控制等工作。在当前的社会发展中,是市场经济和信息经济的时代,社会各个方面的发展都需要对信息进行收集、分析和整理,所以学好应用统计对不久即将走向社会的我们是只有好处,没有坏处的。 绪论 一、应用统计学的发展: 从统计学的发展过程来看,可以把统计学大致分为古典统计学、近代统计学和现代统计学三个时期。 第一、古典统计学时期: 古典统计学时期是指17世纪初至18世纪末,这是统计学的创立时期,亦称古典统计学时期。在这时期出现了政治算术学派和德国的国势学派两个统计学派. 1、国势学派 国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。 2、政治算术学派 政治算术学派产生于19世纪中叶的英国,其创始人是威廉和约翰.“算术”是指统计方法。主要利用实际资料,运用数字、重量和尺度等统计方法对实际情况作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。 第二、近代统计学时期: 近代统计学是指18世纪末到19世纪末这一百年的统计学,它是古典统计学的继续和发展,是古典统计学向现代统计学过渡的统计学。近代统计学的发端,不能不提到著名的统计学家阿道夫·凯特勒的卓越员献。他既继承了国势学和政治算术的传统,把统计学从作为管理国家行政的“政治医学”,扩展到作为研究社会内在矛盾及其规律性数量表现的科学认识方法,又积极地把古典概率引人统计学,以研究社会经济现象偶然变化中的规律性表现。 1、数理统计学派 指概率论引进统计学形成数理统计学,以概率作为理论基础,抽象掉统 计学的社会经济现象内涵,变成了抽象的数学分析和推断技术. 2、社会统计学派 指研究社会现象变动的原因和规律性的实质性科学。社会统计学在这里也称为社会经济统计学,包括政治统计.经济统计.人口统计.犯罪统计等多方面内容. 第三、现代统计学时期:

统计学统计学概率与概率分布练习题

第5章 概率与概率分布 练习题 5.1 写出下列随机事件的基本空间: (1) 抛三枚硬币。 (2) 把两个不同颜色的球分别放入两个格子。 (3) 把两个相同颜色的球分别放入两个格子。 (4) 灯泡的寿命(单位:h )。 (5) 某产品的不合格率(%)。 5.2 假定某布袋中装有红、黄、蓝、绿、黑等5个不同颜色的玻璃球,一次从中取出3个球, 请写出这个随机试验的基本空间。 5.3 试定义下列事件的互补事件: (1) A ={先后投掷两枚硬币,都为反面}。 (2) A ={连续射击两次,都没有命中目标}。 (3) A ={抽查三个产品,至少有一个次品}。 5.4 向两个相邻的军火库发射一枚导弹,如果命中第一个和第二个军火库的概率分别是、, 而且只要命中其中任何一个军火库都会引起另一个军火库的爆炸。试求炸毁这两个军火库的概率有多大。 5.5 已知某产品的合格率是98%,现有一个检查系统,它能以的概率正确的判断出合格品, 而对不合格品进行检查时,有的可能性判断错误(错判为合格品),该检查系统产生错判的概率是多少 5.6 有一男女比例为51:49的人群,已知男人中5%是色盲,女人中%是色盲,现随机抽中 了一个色盲者,求这个人恰好是男性的概率。 根据这些数值,分别计算: (1) 有2到5个(包括2个与5个在内)空调器出现重要缺陷的可能性。 (2) 只有不到2个空调器出现重要缺陷的可能性。 (3) 有超过5个空调器出现重要缺陷的可能性。 5.8 设X 是参数为4=n 和5.0=p 的二项随机变量。求以下概率: (1))2(

5.9 一条食品生产线每8小时一班中出现故障的次数服从平均值为的泊松分布。求: (1) 晚班期间恰好发生两次事故的概率。 (2) 下午班期间发生少于两次事故的概率。 (3) 连续三班无故障的概率。 5.10 假定X 服从12=N ,7=n ,5=M 的超几何分布。求: (1))3(=X P 。(2))2(≤X P 。(3))3(>X P 。 5.11 求标准正态分布的概率: (1))2.10(≤≤Z P 。 (2))49.10(≤≤Z P 。 (3))048.0(≤≤-Z P 。 (4))037.1(≤≤-Z P 。 (5))33.1(>Z P 。 5.12 由30辆汽车构成的一个随机样本,测得每百公里的耗油量数据(单位:L )如下: 试判断该种汽车的耗油量是否近似服从正态分布 5.13 设X 是一个参数为n 和p 的二项随机变量,对于下面的四组取值,说明正态分布是否 为二项分布的良好近似 (1)30.0,23==p n 。(2)01.0,3==p n 。 (3)97.0,100==p n 。(4)45.0,15==p n 。

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系[1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1. 三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量2222 12n =+X X χ++…X 为 服从自由度为n 的2χ分布,记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值 的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n αχχ,对给定的实数 ),10(<<αα称满足条件: αχχαχα==>? +∞ ) (222 )()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student”的笔名首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量 T = 服从自由度为n 的t 分布,记为~()T t n . t 分布的密度函数为

常用医学统计学方法汇总

选择合适的统计学方法 1连续性资料 1.1 两组独立样本比较 1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。 1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。 1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。 1.2 两组配对样本的比较 1.2.1 两组差值服从正态分布,采用配对t检验。 1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。 1.3 多组完全随机样本比较 1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。 1.4 多组随机区组样本比较 1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey 法,Scheffe法,SNK法等。 1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。 ****需要注意的问题: (1)一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t 检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。 (2)当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两

应用统计学

应用统计学 课程编码:202136 课程英文译名:Practical Statistics 课程类别:学科基础选修课 开课对象:工业工程专业 开课学期:5 学分: 2学分; 总学时: 32学时; 理论课学时: 32 学时; 实验学时: 0学时; 上机学时: 0 学时 先修课程:概率论 教材:应用统计,朱洪文,高等教育出版社,2001.2 参考书:【1】应用统计学,倪加勋,中国人民大学出版社,1994 一、课程的性质、目的和任务 应用统计学是一门认识方法论的科学,通过对社会经济现象的数量方面资料的搜索、整理、分析和推断,阐明社会经济现象本质及其内在的规律性,以达到对社会经济现象整体的具体的认识。该课程作为经济、管理类专业的专业基础课开设。 通过本课程的教育需达到以下目的:1、为经济管理提供统计调查,资料整理汇总和统计分析的一般原则和方法;2、为进一步学习有关专业知识,奠定理论和方法基础;3、为学习其他经济管理课程和从事经济研究工作提供数量分析的方法。学习中要正确理解课程中的各个基本概念,了解统计工作的各个阶段,掌握统计的基础理论和基本方法,并能综合运用所学的理论知识分析应用经济统计信息,以满足工作的需要。 二、课程的基本要求 1.明确统计的对象及其特点,了解统计的性质与作用以及统计工作的基本环节。透彻理解统计学中的基本范畴,初步建立统计思想。 2.理解统计调查的概念,了解统计调查方法的种类,掌握统计报表制度和各种专门调查的概念、特点以及各种调查方法的结合运用。 3.了解统计调查方案的基本内容,理解统计整理的概念,统计分组的概念和作用,了解次数分布的类型,统计表的结构,掌握制表的一

地统计分析

实验五加利佛尼亚州的大气臭氧浓度的地统计分析 (综合实验) 实验目的: 通过对数据的具体分析,掌握ArcGIS下地统计分析模块的功能,了解完整的地统计分析过程,并能使用其解决科研问题中的实际问题。 实验内容: 美国环保局负责对加利佛尼亚州的大气臭氧浓度进行监测。利用地统计分析模块提供的许多工具,通过检测所有采样点之间的关系,对生成一个关于臭氧浓度值、预测标差(不确定性)的连续表面,从而使对其他点的浓度值进行最佳预测成为可能。 1、数据检查 2、模型拟合 3、模型精度比较 4、臭氧浓度制图 实验数据: 数据集描述 Ca_outline 加州轮廓图 Ca_ozone_pts 臭氧采样点数据(单位:ppm) Ca_cities 加州主要城市位置图 实验步骤: 一、数据加载 1、生成子集 将特定位置上的预测值同这些区域内的实测值相对比,是评价一个输出表面质量的最严格的方法。其方法是将原始数据集划分成两个部分:一个部分用于建立模型,也就是用来生成输出表面;另外一个部分用于测试,即验证输出表面。 (1)在Geostatistical Analyst 工具栏中单击Create Subsets命令; (2)Input Layer:选择要划分子集的图层; (3)拖动滑块到合适位置,来选择训练和测试数据的相对百分比; (4)单击完成,训练和测试数据集会在Personal Geodatabase中。 2、应用子数据集进行验证 (1)validation:input 选择测试数据集 (2)attribute:选择与生成表面时相同的属性 (3)打开验证图层 二、数据检查 你可以用三种方式对数据进行检验: (1)检测数据分布

应用统计学概念整理

应用统计学概念整理 第一章:导论 1.只能归类于某一类别的非数字型数据称为分类数据 2.只能归于某一有序类别的非数字型数据称为顺序数据 3.按数字尺度测量的观测值称为数值型数据 4.包含所研究的全部个体的集合称为总体 5.从总体中抽取的一部分的元素的集合称为样本 6.用来描述总体特征的的概括性数字度量称为参数 7.用来描述样本特征的概括性数字度量称为统计量 8.说明事物类别的一个名称称为分类变量 9.说明事物有序类别的一个名称称为顺序变量 10.说明事物数字特征的一个名称称为数值型变量 11.只能取可数值的变量称为离散型变量 12.可以在一个或多个区间中取任何值的变量称为连续型变量 第二章:数据收集 1.从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征 的数据收集方法,称为抽样调查。 2.为特定目的而专门组织的全面调查称为普查 3.按照国家有关法律规定,自上而下地统一布置,自下而上地逐级提供基本数据的调查方 式称为统计报表 第三章:数据的图表展示 1.落在某一特定类别或组中的数据个数,称为频数 2.把各个类别及其落在其中的相应频数全部列出,并用表格形式表示出来,称为频数分布 3.一个样本或总体中各个部分的数据与全部数据之比,称为比例 4.将比例乘以100得到的数值,称为百分比或百分数,用%表示 5.样本或总体中各不同类别数值之间的比值,称为比率 6.分类数据的图示:条形图,pareto图,对比条形图,饼图 7.将各有序类别或组的频数逐级累加起来得到的频数称为累计频数 8.将各有序类别或组的百分比逐级累加起来称为累计频率 9.顺序数据的图示:累计频数分布图,环形图 10.根据统计研究的需要,将原始数据按照某种标准划分成不同的组别称为数据分组 11.分组后的数据称为分组数据 12.把变量值作为一组称为单变量值分组 13.将全部变量值一次划分为若干个区间,并将这一区间的变量值作为一组,称为组距分组 14.在组距分组中,一个组的最小值称为下限,最大值称为上限 15.一个组的上限与下限的差称为组距 16.各组组距相等的组距分组称为等距分组 17.各组组距不相等的组距分组称为不等距分组 18.每一组的下限和上限之间的重点值称为组中值

概率论与数理统计学1至7章课后标准答案

第五章作业题解 5.1 已知正常男性成人每毫升的血液中含白细胞平均数是7300, 标准差是700. 使用切比雪 夫不等式估计正常男性成人每毫升血液中含白细胞数在5200到9400之间的概率. 解:设每毫升血液中含白细胞数为,依题意得,7300)(==X E μ,700)(==X Var σ 由切比雪夫不等式,得 )2100|7300(|)94005200(<-=<

三大抽样分布

三大抽样分布 众所周知,在概率论中有二项分布、正态分布、泊松分布着三大分布,而统计学中也有三大抽样分布,分别是x2 分布、t布和F分布。这三大抽样分布的发现正好是现代统计学的形成时期,对于以参数统计推断为主要内容的现代统计学理论的形成有着重要意义。X2分布的发现来源于Kad Pears0n创立X2拟合优度理论的过程,而t分布的发现来源于Gosset小样本理论的创立过程,F分布则是来源于Fisher创立方差分析理论的过程。 三大抽样分布的研究意义 c.R.Rao曾经说过“在终极的分析中,一切知识都是历史,在抽象的意义下,一切科学都是数学,在理性的基础上,所有的判断都是统计学。”这句话一语道破统计学的重要性。三大抽样分布在统计学理论中占据着重要地位,由此可见,研究三大抽样分布对于科学研究有着重要意义。在实际工作中,统计工作者对于三大抽样分布的研究必不可少,通过研究三大抽样分布的产生、发展和完善,能够充分了解三大抽样分布理论的重要性。具体到统计学三大分布,对于三大分布理论的研究,能够在充分吸收前人研究成果的基础上不断进行理论创新,从而推动科学技术的进步。纵观所有的科技进步,无一不是在充分研究前人成果的基础上发展而来的研究统计学三大抽样分布,对于我国社会经济发展有着重要的推动作用。三大抽样分布产生于19世纪末20世纪初,在统计学的发展过程中,每一次新的分析统计数据概率模型的发现,统计学理论都会发生一次重大飞跃。为此,要想研究三大抽样分布,就应该对其发展过程进行研究。统计量是样本的函数,是随机变量,有其概率分布,统计量的分布称为抽样分布。 X2分布 x2的早期发展 由于受到中心极限定理和正态误差理论的影响,正态分布一直在统计学中占据重要地位。在很多数学家和哲学家心目中,正态分布是唯一可用的分析和解释统计数据的方法。但是随着时代的发展,一些学者开始对正态性提出了质疑,随后,在多位科学家的试验验证下,正态分布与实际数据拟合不好的情况日渐凸显出来,科学家纷纷开始研究比正态分布范围更广的分布类型,波那个人产生了偏态分布,其中,x2就是最早的偏态分布最早引入偏态分布的是JamesClerk Maxwel,他在研究气体分子运动的过程中引入了X2分布。1891年,X2分布首次被作为统计量的分布导出。Pizzetti在求线性 模型最小二乘估计残差平方和的分布时,通过富氏分析法得出了X2的分布。随着时代的发展,正态分布理论的局限更加明显,更加推动了偏态分布的发展。KarlPearson是对偏态分布贡献最大的人,成为了一代统计学巨人。按照他的观点,统计学应该把在模型基础上对观测数据进行有效预测作为基本任务,所以他开创了一族曲线对观测数据进行拟合,使得分布拟台数据的应用范围进一步扩大。 X2模型

统计学第5章概率论作业

一、选择 1、一项试验中所有可能结果的集合称为() A事件B简单事件C样本空间D基本事件 2、每次试验可能出现也可能不出现的事件称为() A必然事件B样本空间C随机事件D不可能事件 3、抛3枚硬币,用0表示反面,1表示正面,其样本空间Ω=() A{000,001,010,100,011,101,110,111} B{1,2,3}C{0,1}D{01,10} 4、随机抽取一只灯泡,观察其使用寿命t,其样本空间Ω=() A{t=0} B{t<0} C{t>0} D{t≥0} 5、观察一批产品的合格率P,其样本空间为Ω=() A{0

应用统计学的基本概念

第八讲 应用统计学的基本概念 Dr. Alan Moses 我是Alan Moses博士, 是马萨诸塞州波士顿的Joslin糖尿病中心的高级副院长和首席医生。在这部分讲座中,我们将学习应用统计学的基本概念。我们首先回顾在临床研究中统计学的作用。然后学习统计学的基本概念及常用统计学检验。最后我们将讨论一些所谓的“数据分析中的捣蛋鬼”。 临床研究中统计学的作用是什么?我们所做的就是区分事实和偶然性。我们需要比较组间差异,并检验干预的效应。 那么,临床研究中生物统计学家的作用是什么?虽然我们希望得到令人满意数据并知道如何设计试验及进行分析数据,但通常我们需要依靠生物统计学家的专业知识来选择适当的试验设计和计算适合的样本量。我们都应认识到样本量是由对结果的测定决定的,涉及其精确度、准确度、可重复性和可行性。此外,在进行数据分析时,生物统计学家帮助我们决定使用何种分析工具。在试验开始之前就应确定所使用的统计方法,非常重要的是, 分析方法决不能在试验完成之后加以改变. 在对试验进行分析时,统计学的作用是什么?我们应当记住,统计方法仅仅是一种帮助我们解释试验中所获得的数据的工具。它们是一种工具而不是试验的最终结果。而且像任何工具一样,使用统计工具必须小心。计算机可以产生一些或有统计学意义的数据,但是只有研究者才知道该使用何种统计学检验来进行统计学分析。已参加培训的研究者可以很容易地选择统计学检验方法,必须记住的很重要的一点是,对于没有足够知识的人而言,有强大功能的统计软件包可能导致致命性的错误。 生物统计学的重要概念之一是其正确性(validity)。对于关键性的数据分析、试验的结果尤其是结果的发表,正确性都是其核心。有两种正确性: 内部的和外部的(可推广性)。 内部的正确性就是在设定的试验范围内结果是准确的,使用的方法和分析经受得住检验,数据和相关的医学文献均支持研究者对试验结果的解释和结论。 外部正确性或可推广性决定了试验设计是否能够允许所做的观察和所得的结论推广到整个人群。试验人群的选择决定了最大可推广范围,这个概念我们在这个讲座的其它部分已经谈到过。如果研究对象包括男性、女性、不同的种族、不同的年龄分层,那么就有更多的机会将临床试验的结果应用于普通人群。另一方面,受试者的选择也将决定研究和结论可应用的人群范围。例如,如果在临床试验中选择年龄介于5-10岁的儿童,那么该试验的结果就仅能应用于该人群。如果选择45岁以上的亚洲男性作为受试者,那么试验结果就只能应用于这个人群。 在正确性的概念中,应该认识到须有足够的样本量以支持所得出的结论,同时要选择适当的对照人群,特别是强调随机双盲对照这一临床研究的根本的科学方法。著名科学家Isaac

(完整word版)统计学三大分布与正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍 2分布,t 分布,F 分布和正态分布的定义及基本性质, 然后 用理论说明2分布,t 分布,F 分布与正态分布的关系,并且利用数学软件 MATLAB 来验证之. 1.三大分布函数[2] 1.1 2分布 2(n )分布是一种连续型随机变量的概率分布。这个分布是由别奈梅 (Benayme )赫尔默特(Helmert )、皮尔逊分别于1858年、1876年、1900年所发 现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量X 1,X 2,…X n 相互独立,且都来自正态总体 N (0,,),则称 统计量 2 =x ; X ;…+X ;为服从自由度为n 的2分布,记为 2 2 ~ (n ). 2 分布的概率密度函数为 1 x e 2 x 0 J x 0 其中伽玛函数(X ) e t t x 1dt,x 0, 2 分布的密度函数图形是一个只取非负值 的偏态分布,如下图? x 2 n 2° f(x; n)

2(n2) ,X!,X2相互独立,则X! X2~ 2g n2); 性质3: n 时,2(n) 正态分布; 性质4:设2~ 2(n),对给定的实数 (0 1),称满足条件: P{ 2 2(n)} 2(、f(x)dx (n) 的点2(n)为2(n)分布的水平的上侧分位数. 简称为上侧分位数.对不同的与n,分位 数的值已经编制成表供查 分布,是由英国统计学家戈赛特在1908年“student的'笔名 布在数理统计中也占有重要的位置. 1), Y?2(n), X,Y相互独立,,则称统计量T —X VY/ n 分布,记为T~t( n). 为 性质1: E( 2(n)) n,D( 2(n)) 2n ; 性质2:若X! 2(nJ,X2

统计学常用分布及其分位数

§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t

统计学分析报告

. . . 统计学调查报告 (08级) 上海商学院学生消费状况调查报告 (奉浦校区) 徐伟杰,景宝龙,苏淳,张玮,贾金诚小组成员 指导教师姓名崔峰 物流管理系 系名称 论文提交日期2010.12.23

目录 一,调查目的: (3) 二,调查对象: (3) 三,调查项目: (3) 四,调查时间和时限 (3) 五,调查的组织工作 (4) 六,调查结果: (4) 七,调查问卷 (4) 上海市大学生消费状况调查问卷 (4) 八,调查分析: (6) (一)基本信息 (6) (二)消费结构状况分析: (7) (三)具体消费情况: (8) 九,预测分析 (14) 十,调查分析 (16) 十一,附录:调查统计汇总表 (17)

一,调查目的: 随着社会的发展,大学生的消费方式及消费状况引起了社会各界的极大关注,社会消费观念的转变和周围环境影响他们的消费观念和行为。大学生有着较为前卫的消费观念,消费来源主要有家庭父母供给,构成了一个比较特殊的消费群体,随着大学生数量的不断攀升,他们的消费行为在一定程度上形象着整个社会的消费观念和消费行为。而上海有拥有30所本科院校,大学生的数量比较庞大,并且有着更加前卫的消费观念。就此我们针对上海商学院学生的消费情况展开调查,了解我校学生的消费特征,进而探求更为科学的消费方式和行为,提高大学生的消费效益。 二,调查对象: 统计调查对象:上海上海商学院奉浦校区在读学生 统计调查单位:每一位在上海商学院奉浦校区就读的学生 统计填报单位:物流管理082班景宝龙、徐伟杰 三,调查项目: 统计标志:户籍所在地、就读年级、家庭月收入、个人月生活费、生活费来源、各方面的消费金额分配、是否满意目前的消费金额、期望月消费金额、消费计划、期望消费项目、超前消费的情况 四,调查时间和时限 调查时间:2010年10月 调查时限:两个月 五,调查分工: 问卷设计:徐伟杰 问卷校验:苏淳,张玮,景宝龙 问卷调查:景宝龙,张玮,苏淳,徐伟杰,贾金诚

统计学在生产生活中的应用

一、统计学在社会生活中的应用 统计学的出生是研究国家状况的,譬如统计全国人口状况、农业收成、经济情况等数据,对一国经济与社会发展做统计性调查与研究。经过多年的发展,统计学在社会生活中的应用被专家学家们系统化专业化,形成了不同流派不同类别的统计学。而现在的人文社会统计分类便是对社会生活中统计学应用的专业化成果。 前面提到过的人口普查、经济情况调查等都是统计学在社会生活中的应用。早在17世纪,统计学在社会生活中的应用就被提出了。在约翰·格朗特1662年出版了《对死亡表的自然观察和政治考察》一书中,格朗特通过观察客观现象的数量关系,揭示出一系列统计规律,如男婴出生高于女生,男性死亡高于女性等,同时他还用最新颖的方法编制出了死亡率表。18世纪中末叶到19世纪中末叶期间概率论与统计学成功结合,使得统计学在生活中的应用更加被加以重视。 在当代社会,统计学的应用越来越普及,人口学中的统计学应用(进行优生优育)、社会发展与评价、持续发展与环境保护、资源保护与利用、宏观经济监测与预测、政府统计数据收集与质量保证等都依赖于各类科学的统计方法。 二、统计学在企业生产及社会经济生活中的应用 统计学在企业生产、经济生活中的应用很广,其中包括了保险精算、金融业数据库建设与风险管理、宏观经济监测与预测等一系列经济研究应用问题。 在金融业的统计学应用方面,运用统计方法研究金融风险,建立风险监测系统,不仅能够为管理层宏观调控金融市场提供科学的理论依据,而且对投资个人和机构实施风险控制具有重要指导作用。 企业经济管理对统计学的运用也是必不可少的。其中,统计方法在企业质量管理中的应用研究就是一个典型的应用实例。“九五”期间,“ISO9000”认证成为国际贸易中所要求的供方质量保证能力和水平的标志。ISO9000族标准中有许多要素涉及到统计技术与方法的应用,例如紧密结合某企业或某产品的生产过程,运用统计方法,实施产品设计、生产的全过程控制,同时还可将统计学中的“6”质量标准应用于企业的质量管理中。 统计学知识在企业生产管理中的应用当然不只限于企业质量管理。利用统计学知识还可以进行企业财务风险分析、顾客行为分析、

统计学三大分布及正态分布的关系

统计学三大分布与正态分布的关系 [1] 张柏林 41060045 理实1002班 摘要:本文首先将介绍2χ分布,t 分布,F 分布和正态分布的定义及基本性质, 然后用理论说明2χ分布,t 分布,F 分布与正态分布的关系,并且利用数学软件MATLAB 来验证之. 1.三大分布函数[2] 1.12χ分布 2()n χ分布是一种连续型随机变量的概率分布。这个分布是由别奈梅(Benayme)、赫尔默特(Helmert)、皮尔逊分别于1858年、1876年、1900年所发现,它是由正态分布派生出来的,主要用于列联表检验。 定义:若随机变量12n ,,X X …X 相互独立,且都来自正态总体01N (,) ,则称统计量222 212n =+X X χ++…X 为服从自由度为n 的2χ分布, 记为22~()n χχ. 2χ分布的概率密度函数为 122210(;),2()200n x n x e x n f x n x --?≥??=Γ???? ,2χ分布的密度函数图形是一个只取非负值的偏态分布,如下图.

卡方分布具有如下基本性质: 性质1:22(()),(())2E n n D n n χχ==; 性质2:若221122(),()X n X n χχ==,12,X X 相互独立,则21212~()X X n n χ++; 性质3:2 n χ→∞→时,( n )正态分布; 性质4:设)(~2 2n α χχ,对给定的实数),10(<<αα称满足条 件:αχχα χα ==>?+∞ ) (2 22)()}({n dx x f n P 的点)(2 n α χ为)(2n χ分布的水平α的上侧分位数. 简称为上侧α分位数. 对不同的α与n , 分位数的值已经编制成表供查 用. 2()n χ分布的上α分位数 1.2t 分布 t 分布也称为学生分布,是由英国统计学家戈赛特在1908年“student ”的笔名 首次发表的,这个分布在数理统计中也占有重要的位置. 定义:设2 ~0~X N χ(,1),Y (n ),,X Y 相互独立,,则称统计量/T Y n = 服从自由度为n 的t 分布,记为~()T t n .

统计学常用分布

二项分布(,)B n p n 为试验次数,p 为每次成功概率 {}x x n x n p X x C p q -== 其中1p q += (),()E X np Var X npq == ()()tX t n E e q pe =+其中t -¥<<¥ 解释:n 重贝努里实验中正好成功x 次的概率 几何分布()Geo p p 为成功概率 ()x P X x pq == 2(),()E X q p Var X q p == ()(1),ln tX t E e p qe t q =-<- 解释:n 重贝努里实验中首次成功正好在第x+1次 负二项分布(,),1NB k p k >,k 为成功次数,01p <<,p 为成功概率 1{}x k x k x P X x C p q +-== 2(),()E X kq p Var X kq p == ()(),ln 1tX k t p E e t q qe =<-- 解释:贝努里实验系列中第k 次成功正好出现在第x +k 次实验上地概率 泊松分布()P l {},0! x P X x e x l l l -==> (),()E X Var X l l == (1)()t tX e E e e l -=,t -¥<<¥ 解释:贝努里概型中的实验次数很大,但每次成功的概率很小,平均成功次数接近于常数

均匀分布(,)U a b 1 (),X f x a x b b a =<<-;(),X x a F x a x b b a -=<<- 2 ()(),()212a b b a E X Var X +-== 11 ()(1)()r r r b a E X r b a ++-=+- 正态分布2(,)N m s 2 1) 2()x X f x m s -- = 2(),()E X Var X m s == 22 1 2()t t tX E e e m s += 对数正态分布2log (,)N m s 2 1 ln () 2()x X f x m s --=2 221 22(),()(1)E X e Var X e e m m s s ++==- 22 1 2()t t t E X e m s += 解释:如果X~2log (,)N m s ,则logX ~2(,)N m s 指数分布()Exp l ()x X f x e l l -=,()1x X F x e l -=- 21 1 (),()E X Var X l l == (1) ()r r r E X l G += 1()(1,X t M t t l l -=-<

地统计学实验

地统计学上机实验指导 一、实验目的和要求 1、实验目的 力图通过本实验课程的学习,掌握地统计学的基本概念、基本操作方法,并能够根据实验结果做出合理的解释。 2、实验要求 本实验课程主要学习探索性空间数据分析、结构分析(计算和模拟临近位置的表面属性)、表面预测与结果评估。 要求学生实验前认真准备,实验后提供实验报告,给出详细的实验过程和实验结果。 实验报告内容应包括:实验名称、目的、内容和实验步骤、实验结果说明。 二、实验环境介绍 实验软件:选用Office Excel软件、ESRI公司ArcGIS软件的地统计(Geostatistics)分析扩展模块。 三、实验内容和学时分配

实验一 相关分析 一、 实验目的 掌握在Office Excel 软件中进行相关分析(包括散点图绘制、相关系数计算、相关性解释)。 二、 实验数据 简单相关分析:“实验一相关分析. xlsx ”中沟壑密度和平均坡度字段 偏相关、复相关分析:“实验一相关分析. xlsx ”中沟壑密度、平均坡度、平均坡长字段 三、 实验内容 1、 简单相关分析 分析沟壑密度与平均坡度的相关性? (1) 绘制相关图 (2) 计算简单相关系数 ● 函数计算法:correl(array1,array2) ● 利用分析工具计算 (3) 相关系数t-检验 2 12 --= n r r t 相关系数的t 值=r/sqrt((1-r^2)/(12-2)) ● t 临界值=tinv(0.05,n-2) 若abs(t)>= t 临界值,则相关性显著。 ● P 值=tdist(t,n-2,2) (tdist 返回t 分布的百分点) 若P<0.05,则认为相关性显著。 2、 偏相关分析 计算沟壑密度分别与平均坡度、平均坡长的一阶偏相关系数 (1) 计算各要素的简单相关系数矩阵 利用数据分析工具中的“相关系数” (2) 计算相关系数矩阵的逆矩阵 minverse ()

相关主题
文本预览
相关文档 最新文档