第五章 非参数统计
- 格式:ppt
- 大小:900.50 KB
- 文档页数:24
非参数统计方法介绍非参数统计方法是一种不依赖于总体分布形态的统计方法,它不对总体分布做出任何假设,而是直接利用样本数据进行统计推断。
非参数统计方法的优势在于适用范围广,可以处理各种类型的数据,不受总体分布形态的限制。
本文将介绍非参数统计方法的基本原理和常用的方法。
一、非参数统计方法的基本原理非参数统计方法是基于样本数据进行统计推断的方法,不对总体分布形态做出任何假设。
其基本原理是通过对样本数据的排序、排名或计数等操作,来获得总体的统计特征。
非参数统计方法主要包括秩和检验、分布自由度检验和重抽样方法等。
二、秩和检验秩和检验是一种常用的非参数统计方法,它主要用于比较两个独立样本的差异。
秩和检验的基本思想是将两个样本合并后,对样本数据进行排序,然后根据排序结果计算秩和统计量,再通过对比临界值来判断两个样本是否存在显著差异。
三、分布自由度检验分布自由度检验是一种用于检验总体分布是否符合某种特定分布的非参数统计方法。
它不依赖于总体分布形态的假设,而是通过对样本数据的排序、排名或计数等操作,来获得总体的统计特征。
常见的分布自由度检验方法包括Kolmogorov-Smirnov检验、Anderson-Darling检验和Cramér-von Mises检验等。
四、重抽样方法重抽样方法是一种通过对样本数据进行有放回抽样来获得总体统计特征的非参数统计方法。
重抽样方法的基本思想是通过对样本数据的重复抽样,来模拟总体分布,并通过对模拟样本数据的分析,得到总体的统计特征。
常见的重抽样方法包括自助法、Jackknife法和Bootstrap法等。
五、非参数统计方法的应用领域非参数统计方法广泛应用于各个领域的数据分析中。
在生物医学领域,非参数统计方法常用于比较不同治疗方法的疗效、评估药物的副作用等。
在金融领域,非参数统计方法常用于风险评估、投资组合优化等。
在环境科学领域,非参数统计方法常用于分析环境污染物的浓度分布、评估环境质量等。
非参数统计Non-parametricStatistics一、课程基本信息学时:48(含实验8学时)学分:3考核方式:考试,平时成绩占总成绩30%。
中文简介:非参数统计为有效地分析试验设计及其实际问题中所获得的数据提供了丰富的统计工具。
本课程从问题背景与动机、方法引进、理论基础、计算机实现、应用实例等诸多方面介绍了非参数统计方法,其内容包括:基于二项分布的检验、列联表、秩检验、Ko1mogorov-Smirnov 型统计量等。
本课程在强调实用性的同时,突出了应用方法与理论的结合。
在人才培养体系中,该课程属于选修课程,但建议每个统计学专业的学生必须掌握若干种非参数统计方法,以其作为其他重要统计方法的补充。
特别是针对名义数据分析及有序数据分析时相当有用。
二、教学目的与要求非参数统计是研究随机现象存在的统计规律的学科,其在经济、工农业生产和科学技术等领域有广泛的应用,是一门应用性很强的一门课程。
本课程(1)使学生掌握非参数理论的基本原理和方法,重点掌握单样本,多样本的位置检验和尺度检验,以及相关检验和分布检验。
注意与参数统计的区别;(2)结合实际例子,运用非参数理论,提高学生运用该工具解决实际问题的能力。
(3)使学生进一步掌握具体与抽象、偶然与必然、特殊与一般等辨证关系,培养学生辨证唯物主义观点。
三、教学方法与手段教学中主要采用课堂教学的方法,当中穿插大量的案例,同时预留课堂讨论与练习的时间让学生进行实际的操作。
本课程同时设立计算机上机课程,由老师自编实验指导书详细指导学生进行上机实践,强调动脑与动手相结合,理论与实践相结合。
o五、推荐教材和教学参考资源教材:非参数统计:基于R语言案例分析,柳向东编,暨南大学出版社,2010年12月(第1版)参考资料:1)非参数统计,王星编著,北京:中国人民大学出版社,2(X)5年1月(第一版)2)非参数统计方法,吴喜之等,北京:高等教育出版社,1996年(第1版)3)孙山泽.非参数统计讲义.北京:北京大学出版社,2000。
课后习题参考答案第一章p23-252、(2)有两组学生,第一组八名学生的成绩分别为x 1:100,99,99,100,99,100,99,99;第二组三名学生的成绩分别为x 2:75,87,60。
我们对这两组数据作同样水平a=0.05的t检验(假设总体均值为u ):H 0:u=100 H 1:u<100。
第一组数据的检验结果为:df=7,t 值为3.4157,单边p 值为0.0056,结论为“拒绝H 0:u=100。
”(注意:该组均值为99.3750);第二组数据的检验结果为:df=2,t 值为3.3290,单边p值为0.0398;结论为“接受H 0:u=100。
”(注意:该组均值为74.000)。
你认为该问题的结论合理吗?说出你的理由,并提出该如何解决这一类问题。
答:这个结论不合理(6分)。
因为,第一组数据的结论是由于p-值太小拒绝零假设,这时可能犯第一类错误的概率较小,且我们容易把握;而第二组数据虽不能拒绝零假设,但要做出“在水平a时,接受零假设”的说法时,还必须涉及到犯第二类错误的概率。
(4分)然而,在实践中,犯第二类错误的概率多不易得到,这时说接受零假设就容易产生误导。
实际上不能拒绝零假设的原因很多,可能是证据不足(样本数据太少),也可能是检验效率低,换一个更有效的检验之后就可以拒绝了,当然也可能是零假设本身就是对的。
本题第二组数据明显是由于证据不足,所以解决的方法只有增大样本容量。
(4分)第三章p68-713、在某保险种类中,一次关于1998年的索赔数额(单位:元)的随机抽样为(按升幂排列): 4632,4728,5052,5064,5484,6972,7596,9480,14760,15012,18720,21240,22836,52788,67200。
已知1997年的索赔数额的中位数为5064元。
(1)是否1998年索赔的中位数比前一年有所变化?能否用单边检验来回答这个问题?(4分) (2)利用符号检验来回答(1)的问题(利用精确的和正态近似两种方法)。
非参数统计定义数理统计学的一个分支。
如果在一个统计问题中,其总体分布不能用有限个实参数来刻画,只能对它作一些诸如分布连续、有密度、具有某阶矩等一般性的假定,则称之为非参数统计问题。
举例说明例如,检验“两个总体有相同分布”这个假设,若假定两总体的分布分别为正态分布N(μ1,σ2)和N(μ2,σ2),则问题只涉及三个实参数μ1,μ2,σ2,这是参数统计问题。
若只假定两总体的分布为连续,此外一无所知,问题涉及的分布不能用有限个实参数刻画,则这是非参数统计问题。
又如,估计总体分布的期望μ,若假定总体分布为正态 N(μ,σ2),则问题是参数性的;若只假定总体分布的期望值存在,则问题是非参数性的。
不过参数统计与非参数统计之间并没有泾渭分明的界线例外有的统计问题,从不同的角度,可以理解为参数性的,也可以理解为非参数性的。
例如线性回归(见回归分析)问题,若关心的是估计回归系数,它只是有限个实参数,因而可以看成是参数性的。
但是,如果对随机误差的分布类型没有作任何假定,则从问题的总体分布这个角度看,也可以看成是非参数性的。
统计方法重要的非参数统计方法秩方法是基于秩统计量(见统计量)的一类重要的非参数统计方法。
设有样本X1,X2,…,Xn,把它们由小到大排列,若Xi 在这个次序中占第Ri个位置(最小的占第1个位置), 则称Xi的秩为Ri(i=1,2,…,n)。
1945年F.威尔科克森提出的"两样本秩和检验"是一个有代表性的例子。
设X1,X2,…,Xm和Y1,Y2,…,Yn分别是从分布为 F(x)和 F(x-θ)的总体中抽出的样本,F连续但未知,θ也未知,检验假设H:θ=0,备择假设为θ>0(见假设检验)。
记Yi在混合样本(X1,X2,…,Xm,Y1,Y2,…,Yn)中的秩为Ri,且为诸秩的和,当W >C时,否定假设H,这里C 决定于检验的水平。
这是一个性能良好的检验。
秩方法的一个早期结果是C.斯皮尔曼于1904年提出的秩相关系数。