- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
非参数统计
目录
第一章 绪论 第二章 S-Plus基础 第三章单一样本的推断问题 第四章两样本位置和尺度检验 第五章多总体的统计检验 第六章分类数据的关联分析 第七章秩相关分析和秩回归
第一章 绪 论
主要内容
1. 统计的实践 2. 非参数统计方法简介 3. 参数统计过程与非参数统计的比较 4. 非参数统计的历史 5. 必要的准备知识
3. 参数统计与非参数统计比较
非参数检验的优点
对总体假定较少,有广泛的适用 性,结果稳定性较好。
1. 假定较少 2. 不需要对总体参数的假定
3. 与参数结果接近
针对几乎所有类型的数据形态。 容易计算
在计算机盛行之前就已经1. 可能会浪费一些信息
特别当数据可以使用参数模型的时候。 Example: Converting Data From Ratio to Ordinal Scale
Pitman于1948年回答了非参数统计方法相对于 参数方法来说的相对效率方面的问题;
非参数统计的历史(续)
60年代中后期,Cox和Ferguson最早将非参数方法应 用于生存分析。 70年代到80年代,非参数统计借助计算机技术和大量 计算获得更稳健的估计和预测,以P.J.Huber以及 F.Hampel为代表的统计学家从计算技术的实现角度, 为衡量估计量的稳定性提出了新准则。 90年代有关非参数统计的研究和应用主要集中在非参 数回归和非参数密度估计领域,其中较有代表性的人 物是Silverman和J. Fan。
Frequency
25 30 29 34 24 25 13 32 24 30 32 37
9.5 14.0 12.0 21.0 7.5 9.5 2.0 17.5 7.5 14.0 17.5 24.0
5
4
3
2 Std. Dev = 9.17 Mean = 14.8 0 0.0 5.0 10.0 15.0 20.0 25.0 N = 15.00
3. 有很强的假定
Example: 正态分布
4. 例子: Z Test, t Test, 2 Test
一个例子:
对两组学生进行语法测试,如何比较两 组学生的成绩是否存在差异?
原始数据
秩
Histogram
For GROUP= Group2
6
Histogram
44 33 22 8 47 31 40 30 33 35 18 21 35 28 22 26.0 19.5 5.5 1.0 27.0 16.0 25.0 14.0 19.5 22.5 3.0 4.0 22.5 11.0 5.5
2. 大样本手算相当麻烦
3. 一些表不易得到
本学期内容结构体系
第一章 S-Plus 基础
第二章 非参数统计基础
第三章 单一总体的 统计推断
第四章 两总体位置 和尺度推断
第五章 多总体位置 和尺度推断
第六章 定性数据的 独立性
第七章 定量数据的相 关性和回归
第八章 非参数密度估计
第九章 非参数回归
1. 统计的实践
我们周围的世界
符号和数据就是整个世界。 数据繁衍,信息匮乏:观察数据激增,设计数据 细分。 数据的复杂性和不确定性的特点更为突出。 数据分析方法和手段不足。
统计的方法论
就方法论而言,统计分析主要解决两方面的 问题:
寻找数据内部差异中共同的特征。 寻找数据之间本质的差异。
2. 数据的形态各异
定量数据
定序数据
Example: Good-Better-Best
名义数据
Example: Male-Female
3.例子: Wilcoxon Rank Sum Test/Run Test
F, F, F, F, F, F, F, F, M, M, M, M, M, M, M F, M, F, M, F, M, F, M, F, M, F, M, F, M, F
统计分析的目标是从数据中发现比数据本身 更为有用的知识
2. 非参数统计方法简介
参数方法
定义:样本被视为从分布族的某个参数族抽取出来的 总体的代表,而未知的仅仅是总体分布具体的参数值, 推断问题就转化为对分布族的若干个未知参数的估计 问题,用样本对这些参数做出估计或者进行某种形式 的假设检验,这类推断方法称为参数方法。 比如: (1)研究保险公司的索赔请求数时,可能假定索赔请求 数来自泊松分布P(a);
(2)研究化肥对农作物产量的影响效果时,平均意义 之下,每测量单元(可能是)产量服从正态分布 N(a,b).
一个典型的参数检验过程
1. 总体参数
Example: Population Mean
2. 假定数据的形态为
Whole Numbers or Fractions
Example: Height in Inches (72, 60.5, 54.7)
非参数统计的主要内容
内容 非参数检验 中位数检验 秩和检验 符号检验 Wilcoxon 检验 Kruskal-Wallis 检验 Friedman检验 Spearman秩相关 Kolmogorov-Smirnov 相应的参数检验
2独立样本
2 配对样本 /单一样本 >2独立样本 两因素 相关性检验 分布的检验
1
For GROUP= Group1
6
5
RANK of SCORE
4
3
2 Std. Dev = 6.28 Mean = 13.0 0 0.0 5.0 10.0 15.0 20.0 25.0 N = 12.00
Frequency
1
RANK of SCORE
非参数检验过程
1.不涉及总体的分布
Example: Probability Distributions, Independence
独立样本t检验
成对样本 t-检验 单一因素ANOVA 双因素ANOVA Pearson相关性检验
4. 非参数统计的历史
非参数统计的历史
非参数统计的形成主要归功于20世纪40年代~ 50年代化学家F.Wilcoxon等人的工作。 Wilcoxon于1945年提出两样本秩和检验,1947 年Mann和Whitney二人将结果推广到两组样 本量不等的一般情况;