数理统计中的非参数估计方法
- 格式:docx
- 大小:37.19 KB
- 文档页数:2
数据分布非参数估计的基本公式
数据分布非参数估计的基本公式是指根据数据的样本来推算出
数据总体的概率分布函数,而不需要对数据的分布进行任何先验假设。
以下是非参数估计的基本公式:
1. 核密度估计公式:
$$hat{f}_{h}(x)=frac{1}{nh}sum_{i=1}^{n}Kleft(frac{x-X_{i}} {h}right)$$
其中,$hat{f}_{h}(x)$是在$x$处的核密度估计值,$n$是样本量,$h$是带宽参数,$K(u)$是核函数,$X_{i}$是样本点。
2. 经验分布函数公式:
$$hat{F}_{n}(x)=frac{1}{n}sum_{i=1}^{n}I_{{X_{i}leq x}}$$
其中,$hat{F}_{n}(x)$是在$x$处的经验分布函数估计值,$n$是样本量,$X_{i}$是样本点,$I_{{X_{i}leq x}}$是指示函数。
3. 分位数估计公式:
$$hat{q}_{p}(X)=X_{(k)}+(ncdot p-k)cdot
frac{X_{(k+1)}-X_{(k)}}{n}$$
其中,$hat{q}_{p}(X)$是$p$分位数的估计值,$X_{(k)}$是第$k$个有序样本,$n$是样本量,$p$是要估计的分位数。
- 1 -。
参数统计与非参数统计参数统计和非参数统计是统计学中两个重要的概念。
它们是用来描述和推断数据的统计特征的方法。
在统计学中,参数是用于描述总体特征的统计量,而非参数是不依赖于总体分布的统计方法。
本文将从定义、应用、优劣势等方面对参数统计和非参数统计进行详细分析。
首先,我们来了解一下参数统计。
参数统计是基于总体参数的估计和推断的统计方法。
总体参数是指对整个数据集进行总结的数量,如平均值、方差、标准差等。
参数统计的方法是通过从样本中获取数据来估计总体参数。
常见的参数估计方法包括样本均值估计总体均值、样本方差估计总体方差等。
参数统计的优点是可以提供关于总体的精确估计和推断结果。
然而,参数统计要求总体数据必须服从特定的概率分布,例如正态分布、二项分布等。
如果总体数据不符合这些分布,参数统计的结果可能会有偏差。
接下来,我们来介绍非参数统计。
非参数统计是不依赖于总体分布的统计方法。
这意味着非参数统计不对总体的概率分布做出任何假设。
相反,它使用基于排序和排名的方法进行统计推断。
常见的非参数统计方法包括Wilcoxon符号秩检验、Kruskal-Wallis检验等。
非参数统计的优点是可以在数据不符合特定分布情况下使用,并且对异常值不敏感。
然而,非参数统计通常需要更多的数据以获得稳健的结果,并且在处理大规模数据时的计算负担较重。
参数统计与非参数统计的应用领域不同。
参数统计主要应用于数据符合特定分布的情况下,例如医学研究中对患者的生存率进行分析、工业生产中对产品质量的控制等。
非参数统计则主要应用于数据分布不明确或数据不符合特定分布的情况下,例如社会科学中对调查结果的分析、财务领域中对公司经营绩效的评估等。
在参数统计和非参数统计的比较中,我们可以看到它们各自的优势和劣势。
参数统计的优势是可以提供精确的估计和推断,并且通常需要较少的数据。
然而,参数统计对总体数据的分布有严格的要求,如果分布假设不正确,结果可能产生误差。
非参数统计的优势是可以在数据分布不明确的情况下进行分析,并且对异常值不敏感。
贝叶斯参数估计和非参数估计文档下载说明Download tips: This document is carefully compiled by this editor. I hope that after you download it, it can help you solve practical problems. The document 贝叶斯参数估计和非参数估计can be customized and modified after downloading, please adjust and use it according to actual needs, thank you! In addition, this shop provides you with various types of practical materials, such as educational essays, diary appreciation, sentence excerpts, ancient poems, classic articles, topic composition, work summary, word parsing, copy excerpts, other materials and so on, want to knowdifferent data formats and writing methods, please pay attention!贝叶斯参数估计和非参数估计是统计学中两种重要的参数估计方法,它们在不同情境下有着不同的应用和特点。
本文将深入探讨这两种估计方法的原理、特点以及应用。
贝叶斯参数估计。
贝叶斯参数估计是一种基于贝叶斯理论的参数估计方法。
在贝叶斯理论中,参数被视为随机变量,并且通过引入先验分布来描述参数的不确定性。
具体步骤如下。
1. 先验分布。
在进行实际观测之前,根据先验知识或者经验,给定参数的一个先验分布。
参数方法和非参数方法引言在统计学中,参数方法和非参数方法是两种常用的统计分析方法。
参数方法是基于某些假设条件下,通过对总体分布进行近似推断的方法;而非参数方法则是不对总体分布作出任何假设,通过对样本数据进行直接分析的方法。
本文将从定义、应用范围、优点和缺点等方面对参数方法和非参数方法进行综合探讨。
一、参数方法1.1 定义参数方法是一种基于总体分布假设的统计分析方法。
在参数方法中,我们假设总体服从某种特定的分布(如正态分布、二项分布等),并通过样本数据进行推断,从而得到总体参数的估计值。
1.2 应用范围参数方法在许多领域中得到广泛应用,如市场调研、医学研究等。
通过参数方法,我们可以对总体的特性进行准确、精确的估计,并进行统计推断。
1.3 优点参数方法的优点主要体现在以下几个方面: - 精确性高:通过对总体分布的假设,参数方法可以得到对总体参数的精确估计。
- 推断性强:参数方法可以利用参数估计的结果,进行统计推断和假设检验,得到较为可靠的结论。
1.4 缺点参数方法的缺点主要体现在以下几个方面: - 对总体分布的假设:参数方法要求对总体分布做出合理的假设,如果假设不合理,可能导致估计结果的失真。
- 复杂性:参数方法在推断过程中可能涉及到复杂的统计理论和计算方法,需要一定的专业知识和技能。
二、非参数方法2.1 定义非参数方法是一种不对总体分布作出任何假设的统计分析方法。
在非参数方法中,我们通过直接对样本数据进行计算和分析,得到对总体分布的估计。
2.2 应用范围非参数方法在一些场景中具有优势,例如样本数据不满足参数方法假设条件、总体分布未知等情况下,非参数方法能够给出相对可靠的结果。
2.3 优点非参数方法的优点主要体现在以下几个方面: - 数据分布要求低:非参数方法不对总体分布作出任何假设,因此适用范围更广,对样本数据的分布要求较低。
-灵活性高:非参数方法可以灵活地应对各种数据类型和样本规模的情况,并给出相对稳健的结果。
数据分布非参数估计公式
数据分布非参数估计公式是指在没有先验假设或假设分布的情
况下,通过样本数据推断出总体分布的方法。
非参数估计方法的优点在于不需要事先对总体分布进行假设,因此可以适用于更广泛的数据类型和分布形态。
其中,最常用的非参数估计方法是核密度估计。
核密度估计通过在每个数据点上加上一个核函数,然后将这些核函数加和起来得到总体分布函数的估计值。
核函数通常采用高斯核函数,其公式为:
K(x)=1/(√(2π)σ) * exp(-x^2/2σ^2)
其中,x是数据点与核函数中心的距离,σ是核函数的带宽参数(即核函数的宽度)。
在此基础上,可以得到核密度估计的公式:
f(x)=1/n * ∑_(i=1)^n K((x-Xi)/h)
其中,n是样本容量,Xi是第i个样本数据点,h是带宽参数。
除了核密度估计外,还有其他的非参数估计方法,如分位数估计、最大似然估计等。
这些方法都是通过样本数据的统计量估计总体分布,具有较高的适用性和稳健性。
- 1 -。
数据分布非参数估计的公式数据分布的非参数估计公式通常包括以下几种方法:1. 核密度估计法核密度估计法是一种常用的非参数概率密度估计方法,其基本思想是将每个数据点周围的一小段区间用一个核函数来表示其分布。
具体的公式如下:$$\hat{f}_{h}(x)=\frac{1}{nh}\sum_{i=1}^{n} K\left(\frac{x-x_{i}}{h}\right) $$其中,$\hat{f}_{h}(x)$表示在点$x$处的密度估计值,$K$表示核函数,通常取高斯核函数或更平滑的Epanechnikov核函数,$h$表示核函数的带宽参数,控制核函数的宽度,$n$表示数据样本大小,$x_{i}$为其中的样本点。
2. 直方图法直方图法也是一种常用的非参数概率密度估计方法,其基本思想是将数据集划分为若干个区间,然后计算每个区间内数据点的数量占总数据点数量的比例。
具体的公式如下:$$\hat{f}_{h}(x) =\frac{1}{n h}\sum_{i=1}^{n} I_{\left(x_{i} \inB_{j}\right)}$$其中,$\hat{f}_{h}(x)$表示在点$x$处的密度估计值,$B_{j}$表示第$j$个区间,$n$表示数据样本大小,$h$表示每个区间的长度,$I_{\left(x_{i} \in B_{j}\right)}$为指示函数,当$x_{i}$属于区间$B_{j}$时,取值为1,反之为0。
3. 分位数法分位数法也是一种常用的非参数概率密度估计方法,其基本思想是根据数据点的分位数来估计概率密度函数。
具体的公式如下:$$\hat{f}_{h}(x)=\sum_{i=1}^{n} \frac{1}{h\left(q_{i}-q_{i-1}\right) }I_{[q_{i-1}, q_{i})}(x)$$其中,$\hat{f}_{h}(x)$表示在点$x$处的密度估计值,$q_{i}$表示第$i$个分位数,$I_{[q_{i-1},q_{i})}(x)$为指示函数,当$x$落在范围$[q_{i-1},q_{i})$内时,取值为1,反之为0。
非参估计方法
非参估计方法是一种统计学方法,它不依赖于对总体分布的假设,而是通过观测数据来估计总体参数。
这种方法通常在数据分布未知或复杂的情况下使用。
常见的非参估计方法包括核密度估计、经验分布函数、生存分析等。
其中,核密度估计是一种通过对样本数据进行平滑处理来估计总体密度函数的方法。
经验分布函数则是通过对样本数据的累计分布函数进行估计,来推断总体分布情况。
生存分析是一种通过对生存时间数据进行分析,来推断某个事件发生的概率或时间的方法。
非参估计方法通常适用于样本容量较小或数据分布不规则的情
况下,但是由于需要对样本数据进行计算和处理,所以在大样本数据和计算能力充足的情况下,也可以使用非参估计方法。
总之,非参估计方法是一种重要的统计学方法,它可以有效地处理复杂的数据分布,为数据分析提供更加灵活和精确的工具。
- 1 -。
数理统计中的非参数统计与鲁棒统计在数理统计学中,我们经常遇到对数据进行分析和推断的问题。
为了解决这些问题,统计学家们发展了许多不同的统计方法和技术。
其中,非参数统计与鲁棒统计是两个重要的分析方法。
本文将介绍非参数统计与鲁棒统计的概念、应用以及优点。
一、非参数统计非参数统计是一种不依赖于总体分布的统计方法。
它不对总体分布做出任何假设,而是从样本本身的分布出发来进行推断和分析。
非参数统计方法适用于总体分布形式未知或不满足正态分布等假设的情况。
常见的非参数统计方法有秩次统计、符号检验、威尔科克森秩和检验等。
非参数统计的主要优点是具有更广泛的适用性。
它不需要对总体分布的形状做任何假设,因此适用于各种复杂的数据类型和分布形式。
此外,非参数统计方法不受异常值的影响,能够更好地处理存在极端值的数据。
非参数统计方法常用于以下几个方面:1. 非正态数据的分析:对于非正态数据,非参数方法能够提供更准确的估计和推断。
2. 非线性关系的检验:非参数回归方法可以用于检验变量之间的非线性关系,比如典型相关性分析等。
3. 非参数的假设检验:对于总体分布未知或不满足正态分布的情况,非参数方法提供了一种有效的假设检验方法。
二、鲁棒统计鲁棒统计是一种能够在数据中存在异常值或偏差的情况下,仍能有效地进行分析和推断的统计方法。
鲁棒统计忽略或减小了异常值的影响,并保持对数据全局特征的有效估计。
鲁棒统计的核心思想是通过使用鲁棒估计量来进行推断。
常见的鲁棒统计方法有中位数、经验分位数回归、高维鲁棒统计等。
鲁棒统计方法具有以下几个优点:1. 对异常值和偏差具有鲁棒性:鲁棒统计方法对异常值和偏差的影响较小,能够准确估计数据的整体结构。
2. 适用范围广泛:鲁棒统计方法适用于各种分布形式和数据类型,无需过多考虑总体分布的假设。
3. 提高统计推断的可靠性:通过使用鲁棒估计量,鲁棒统计方法能够降低统计推断的误差。
鲁棒统计方法在许多领域中都有广泛的应用:1. 金融领域:对于金融数据中的异常值和离群点,鲁棒统计方法能够提供更可靠的分析结果。
概率密度函数的估计非参数估计概率密度函数(Probability Density Function, PDF)的估计是统计学中一项重要的任务,用于描述随机变量的概率分布。
这是一种非参数估计方法,即不对概率分布函数做任何假设,而是通过对样本数据进行分析来估计其分布。
这种非参数估计方法的优点之一是其灵活性,可以应用于各种类型的数据分布。
而参数估计方法则需要对分布函数做出假设,如果假设不合理,估计结果可能会产生偏差。
非参数估计方法通常涉及以下步骤:1.数据收集:从样本数据中获取一组观测值。
2.直方图估计:直方图是一种用于表示数据分布的图形,可以将数据集划分为若干个区间,并计算每个区间内的观测值数量。
通过对直方图进行归一化,可以获得概率密度函数的估计。
3.核密度估计:核密度估计是一种将每个观测值都视为一个概率密度函数的方法。
在估计过程中,为每个观测值放置一个核函数,并对所有核函数求和得到概率密度函数的估计。
4.非参数回归:非参数回归是一种使用滑动窗口来减小噪声的方法。
在非参数回归中,通过在每个数据点周围放置一个窗口,并计算窗口内数据点的平均值或加权平均值来估计概率密度函数。
以上方法都可以用来估计概率密度函数,具体选择哪种方法取决于数据的特点和假设。
非参数估计方法有以下优点:1.适用广泛:非参数估计方法不需要对概率分布函数做出任何假设,因此可以适用于各种类型的数据分布。
2.灵活性:非参数估计方法可以避免对数据分布做出错误的假设,因此对于未知的数据分布可以获得较好的估计。
3.鲁棒性:非参数估计方法对噪声和异常值相对较为鲁棒,不会对这些因素产生过大的影响。
然而,非参数估计方法也存在一些缺点:1.计算复杂度高:非参数估计方法通常需要大量的计算来获得准确的估计结果。
2.模型选择困难:由于非参数估计方法没有对概率分布做出假设,因此对于模型的选择可能比较困难。
在实际应用中,非参数估计方法常常结合参数估计方法使用。
参数估计方法可以提供一些假设的分布函数,而非参数估计方法可以通过对残差分布进行检验来判断假设是否合理。
第32卷第7期2010年07月武 汉 工 程 大 学 学 报J. Wuhan Inst. T ech.Vo l.32 N o.7Jul. 2010收稿日期:2010-04-02基金项目:国家自然科学基金(60872075);国家高技术发展计划(2008AA 01Z227);高等学校科技创新工程重大项目培育资金项目(706028)作者简介:张煜东(1985-),男,江苏苏州人,哥伦比亚大学博士后.研究方向:人工智能、数据挖掘、脑图像处理.文章编号:1674-2869(2010)07-0099-08非参数估计方法张煜东1,2,颜 俊1,王水花1,吴乐南1(1.东南大学信息科学与工程学院,江苏南京210096;2.哥仑比亚大学精神病学系脑成像实验室,纽约州纽约10032)摘 要:为了解决函数估计问题,首先讨论了传统的参数回归方法.由于传统方法需要先验知识来决定参数模型,因此不稳健,且对模型敏感.因此,引入了基于数据驱动的非参数方法,无需任何先验知识即可对未知函数进行估计.本文主要介绍最新的8种非参数回归方法:核方法、局部多项式回归、正则化方法、正态均值模型、小波方法、超完备字典、前向神经网络、径向基函数网络.比较了不同的算法,给出算法之间的相关性与继承性.最后,将算法推广到高维情况,指出面临计算的维数诅咒与样本的维数诅咒两个问题.通过研究指出前者可以通过智能优化算法求解,而后者是问题固有的.关键词:参数统计;非参数统计;核方法;局部多项式回归;正则化方法;正态均值模型;小波;超完备字典;前向神经网络;径向基函数网络中图分类号:O 212.7 文献标识码:A doi:10.3969/j.issn.1674-2869.2010.07.0250 引 言函数估计[1]是一个经典反问题,一般定义为给定输入输出样本对,求未知的系统函数[2].传统的方法为参数方法,即构建一个参数模型,再定义某个误差项,通过最小化误差项来求解模型的参数[3].参数方法尽管较为简单,但不够灵活.例如参数模型假设有误,则会导致整个求解流程失败[4].因此学者们发展出不少新技术,非参数估计就是其中一项较好的方法.该方法无需提前假设参数模型的形式,而是基于数据结构推测回归曲面[5].本文首先研究了经典的2种参数回归方法:最小二乘法与内插函数法,分析了它们的不足,然后主要讨论8种非参数回归方法:核方法、局部多项式回归、正则化方法(样条估计)、正态均值模型、小波方法、过完全字典、前向神经网络、径向基函数网络,尤其详细介绍了其间的相关性与继承性.最后,研究了高维情况下面临的计算维数诅咒与样本维数诅咒.1 回归模型考虑模型y i =r (x i )+ i (1)式(1)中(x i ,y i )为观测样本,假定误差 具有方差齐性,则r =E(y |x )称为y 对x 的回归函数,简称回归.一般地,可以假设x 取值在[0,1]区间内.定义 规则设计 为x i =i/n(i =1,2, ,n).并定义风险函数为R =ni=1[r(x i)-^r (x i)]2=ni=1[y i-^r (x i)]2(2)式(2)中^r 为系统函数r 的估计.回归一词源于高尔顿(Galto n),他和学生皮尔逊(Pearson)在研究父母身高和子女身高的关系时,以每对夫妇的平均身高为x ,取其一个成年儿子的身高为y ,并用直线y =33.73+0.512x 来描述y 与x 的关系.研究发现:如果双亲属于高个,则子女比他们还高的概率较小;反之,若双亲较矮,则子女以较大概率比双亲高.所以,个子偏高或偏矮的夫妇,其子女的身高有 向中心回归 的现象,因此高尔顿称描述子女与双亲身高关系的直线为 回归直线 [6].然而,并非所有的x -y 函数均有回归性,但历史沿用了这个术语.更为精确的表达是 函数估计 .100武汉工程大学学报第32卷2 传统方法理论上描述一个函数需要无穷维数据,因此函数估计本身也可称为 无穷维估计 [7].传统的估计方法有下列两种极端情形.2.1 最小二乘法此时假设^r(x)= 0+ 1x,采用最小二乘法计算权值 =( 0, 1),得到的解为最小二乘估计[8],^r(x)=(X T X)-1X T Y(3)则对给定样本点的估计r=[^r(x1),^r(x2), ,^r(x n)]T可写为r=X^ =LY(4)这里Y=(y1,y2, ,y n)T.L=X(X T X)-1X T称为帽子矩阵[9].以5个样本点的一维规则设计矩阵为例,此时X=0.20.40.60.81.0L=0.0180.0360.0540.0720.0900.0360.0720.1090.1450.1810.0540.1090.1630.2180.2720.0720.1450.2180.2900.3630.0900.1810.2720.3630.454(5)L满足L=L T,L2=L.另外,L的迹等于输入数据的维数p,即trace(L)=p.这里输入数据是一维的,所以trace(L)=1.2.2 内插函数法此时对^r(x)不加任何限制,得到的是该数据的一个内插函数[10].同样以5个样本点的一维规则设计矩阵为例,由于样本点的估计r=[^r(x1), ^r(x2), ,^r(x n)]T完全等于(y1,y2, ,y n)T,所以帽子矩阵为L=1000001000001000001000001(6)2.3 两种方法的缺陷图1给出了这两种极端拟合的示意图,数据是被高斯噪声干扰的正弦函数,采用上述两种方法拟合,结果表明:最小二乘法过光滑,未展现数据内部的关系;而内插函数法忽略了噪声影响,显得欠光滑.从帽子矩阵也可看出,式(5)表明最小二乘法对每个数据的估计都利用了所有样本,这显然导致过光滑,且x值越大的数据权重越大,这明显与经验不符;反之,式(6)表明内插函数法仅仅利用了最邻近的样本数据,这显然导致欠光滑.图1 两种极端拟合F ig.1 T wo ex tr eme fitting2.4 非参数回归的优势非参数回归(non-parametric r eg ression)作为最近兴起的一种函数估计方法,是一种分布无关(distribution free)的方法,即不依赖于数据的任何先验假设.与此对应的是参数回归(param etric r eg ressio n),通常需要预先设置一个模型,然后求取该模型的参数.非参方法的本质在于:模型不是通过先验知识而是通过数据决定.需要注意的是, 非参数 并不表示没有参数,只是表示参数的数目、特征是可变的(flexible).由于非参方法无需数据先验知识,其应用范围较参数方法更广,且性能更稳健.其另一个优点是使用过程较参数方法更为简单.然而,它也存在缺点,一般结构更复杂,需要更多的运算时间.2.5 线性光滑器需要说明的是,最小二乘法、内插函数法、核方法、正则化方法、正态均值模型均是线性光滑器.定义为:若对每个x,存在向量l(x)=[l1(x), ,l n(x)]T,使得r(x)的估计可写为^r(x)= n i=1l i(x)y i(7)则估计^r为一个线性光滑器[11].显然权重l i(x)随着x而变化,这与信号处理中的 自适应滤波器 非常相似.3 核回归核方法[12]定义为^r(x)= n i=1l i(x)Y i(8)权重l i由式(9)给出l i=Kx-x ihni=1Kx-x ih(9)这里h是带宽,K是一个核,满足K(x) 0,以及K(x)d x=1, xK(x)d x=0, x2K(x)d x>0,(10)常用的核函数见表1.第7期张煜东,等:非参数估计方法101表1 常用的核公式Table1 Fr equen tly-u sed kernel formula核公式boxcar K(x)=0.5*I(x)Gau ssian K(x)=12ex p-x22Epan echnikov K(x)=3(1-x2)I(x)T ricube K(x)=7081(1-|x|3)3I(x)以bo xcar核为例,帽子矩阵为L=1/21/20001/31/31/30001/31/31/30001/31/31/30001/21/2(11)显然,这可视作最小二乘法与内插函数法的折中.为了估计带宽h,首先必须估计风险函数,一般可采用缺一交叉验证得分CV=R^(h)=1n ni=1[y i-^r-i(x i)]2(12)这里^r-i(x i)为未用第i个数据所得到的估计,使C V最小的h,即为最佳带宽.为了加速运算,可将式(12)重新写为R^(h)=1n ni=1y i-^r(x i)1-L ii2(13)这里L ii是光滑矩阵L的第i个对角线元素.另一种方法是采用广义交叉验证法,规定G CV(h)=R^(h)=1nni=1y i-^r(x i)1-v/n2(14)这里v=tr(L).4 局部多项式回归采用核回归常会碰到下列2个问题[13]:1)若x不是规则设计的,则风险会增大,称为设计偏倚(desig n bias);2)核估计在接近边界处会出现较大偏差,称为边界偏倚(boundary bias).为了解决这2个问题,可采用局部多项式回归.局部多项式回归[14]可视作核估计的一个推广,首先定义权函数 i(x)=K[(x i-x)/h],选择a=^r(x)来使得下面的加权平方和最小ni=1i(x)(y i-a)2(15)利用高等数学知识,可以看出解为^r(x)= ni=1i(x)y ini=1i(x)(16)可见式(16)正好是核回归估计.这表明核估计是由局部加权最小二乘得到的局部常数估计.因此,若利用一个p阶的局部多项式而不是一个局部常数,就可能改进估计,使曲线更光滑.定义多项式P x(u;a)=a0+a1(u-x)+a22!(u-x)2++a pp!(u-x)p(17)则局部多项式的思想是:选择使下列局部加权平方和ni=1i(x)[y i-P x(x i;a)]2(18)最小的a,估计^a=(^a0,^a1,^a p)T依赖于目标值x,最终有^r(x)=P x(x;^a)=^a0(x)(19)当p等于0时,等于核估计;当p=1时,称为局部线性回归(local linear regr ession)估计[15],由于其算法简单且性能优越,较为常用.5 基于正则化的回归为了描述方便,这里假设数据点为[(x0,y0),(x1,y1), (x n-1,y n-1)].在风险函数(2)后增加一项惩罚项,一般设为r(x)的二阶导数J= n-1i=0y i-^r(x i)2+ [r (x)]2d x(20)控制了解的光滑程度:当 =0时,解为内插函数;当 时,解为最小二乘直线;当0< <时,^r(x)是一个自然三次样条.需要注意下列事项:首先三次样条表示曲线在结点(knot)之间是三次多项式,且在结点处有连续的一阶和二阶导数;其次一个m阶样条为一个逐段m-1阶多项式,所以三次样条是4阶的(m=4);第三,自然样条表示在边界点处二阶导数为0,即在边界点外是线性的;第四,样条的结点等于数据点.为了加速计算,将数据点重新排序,假设a,b为样本点x的上下界,令a=t1 t2 t n-1=b,这里t是x重新排序后的点,称为结点.可用B样条基(B-spline basis)[16]作为该三次样条的基,即^r(x)= n-m-1i=0P i b i,m(t) t [t m-1,t n-m](21)P i称为控制点,共n-m个,形成一个凸壳.n-m个B样条基可通过如下计算,首先初始化:b j,0(t)=1 if t j<t<t j+10 otherw ise(22)然后对i=1,逐步+1,直到i=m-1,重复迭代下式:102 武汉工程大学学报第32卷b j,i (t)=t -t jt j +m -1-t j b j,i -1(t)+t j +m -tt j +m -t j +1b j,i +1(t)(23)若结点等距,则称B 样条是均匀的(uniform ),否则称为不均匀.如果两个结点相等,计算过程会出现0/0情况,此时默认结果为0.令矩阵B 的第(i,j )元素b ij =b j (x i ),矩阵 的第(i,j )元素 ij =b n i (x )b nj (x )d x ,则控制点可由式(24)求得P =(B TB + )-1B TY(24)可见,样条也是一个线性光滑器.表面上看,基于核的估计与基于正则化的估计原理与模型均不一致,但是Silver man 证明了如下定理,样条估计^r (x )可视作如下所示的一种渐近的核估计l i (x )1f (x i )h(x i )Kx i -x h (x i )(25)式中,f (x )是x 的密度函数.h(x )=nf (x )1/4(26)K (x )=12ex p -|x |2sin |x |2+4(27)显然,若样本x 是规则设计,则f (x )=1,h(x )=( /n)1/4=h,l i (x ) K [(x i -x )/h],即此时样条估计可视作形如式(27)的渐近核估计.6 正态均值模型令 1, 2, 为一个标准正交基,则显然r (x )可以展开为r(x )=i=1i i ,定义Z j =1nni=1y ij(x i )(28)则随机变量Z j 是正态分布,且均值与方差满足:E(Z j )= j V(Z j )= 2/n (29)可见,若估计出 ,则可近似求得^r (x )ni=1i i.因此正态均值模型将n 个样本的函数估计问题转换为估计n 个正态随机变量Z j 的均值 的问题[17].若直接令^ =Z,则显然得到一个很差的估计,下面给出风险更小的估计.首先,必须做出一个关于^ 的风险估计,Stein 给出下列定理:令Z ~N ( ,V ),^ =^ (Z)为 的一个估计,并令g(Z 1, ,Z n )=^ -Z.则^ 的风险的一个无偏估计为J^(z )=tr (V)+2tr (VD)+ ig2i(z )(30)式中g i =^ i -z i ,且D 的第(i,j )个元素为g (z 1, ,z n )的第i 个元素关于z j 的偏导数[18].假设^ =b Z =(b 1Z 1, ,b n Z n ),式中b 称为调节器,根据b 的设置,存在下列3种情况:b =(b,b, ,b),称为常数调节器(constant m odulator),此时令式(30)最小的称为Jam es -Stein 估计;b =(1, ,1,0, ,0),称为嵌套子集选择调节器(nested subset selection modulator ),此时令式(30)最小的^b 称为REACT 方法.需要注意的是,若基选择傅立叶基,则该方法类似于频域低通滤波器方法.b =(b 1,b 2, ,b n )满足1 b 1 b 2 b n 0,称为单调调节器(monotone m odulator ),该方法理论最优,但是需要的运算量太大,几乎不实用.7 小波方法小波方法[19]适用于空间非齐次(spatially inhomog eneous )函数,即函数的光滑程度随着x 会有本质性的变化.它可视作正态均值模型的推广,但存在两点区别:一是采用小波基代替传统的正交基,因为小波基较一般的正交基具有局部化的优点,能实现多分辨率分析;另一点是采用了一种称为 阈 的收缩方式.不妨假定父小波为 ,母小波为 ,同时规定下标(j ,k)的意义如下:f j,k (x )=2j/2f (2jx -k)(31)为了估计函数r,用n =2J 项展开来近似r ,r (x )2J0-1k=0j 0,k(x ) j 0,k (x )+ Jj =J2j-1k=0j ,kj ,k (x )(32)这里J 0是任取常数,满足0 J 0 J. 称为刻度系数, 称为细节系数.那么如何估计这些系数?首先计算S k =1n ij 0,k(x i )y i (33)D jk =1nij,k(x i )y i(34)S k 、D jk 分别称为经验刻度系数与经验细节系数,可知S k N ( j 0,k , 2/n),D jk N ( j,k , 2/n),可估计方差为median (|D j -1,k -median (D j -1,k )第7期张煜东,等:非参数估计方法103| k =0, ,2J -1-1)0.6745(35)然后根据S k 、D jk 、^ 可得 与 的估计如下:^ j 0,k =S k (36) 的估计形式稍许复杂,采用硬阈与软阈的方式分别为^ jk =0 |D jk |< D jk |D jk |(37)^jk =sig n (D jk )|D jk |- +(38)之所以采用阈的形式,是因为稀疏性(sparse )的思想[20]:对某些复杂函数,在小波基上展开时系数也是稀疏的.因此,需要采用一种方式来捕获稀疏性.然而,传统的L 2范数不能捕捉稀疏性,相反,L 1范数与非零基数能够较好地捕捉稀疏性.例如,考虑n 维向量a =(1,0, ,0)与b =(1/n 1/2, ,1/n 1/2),有 a 2= b 2=1,可见,L 2范数无法区分稀疏性.反之, a 1=1, b 1=n 1/2,因此,L 1范数能提取稀疏性;另外,若令非零基数为J ( )={#(i 0)},则J (a)=1,J (b)=n,因此,非零基数也能提取稀疏性.最后,在正则化估计中若惩罚项分别为L 1范数或非零基数,则最优估计恰好对应着软阈估计与硬阈估计.最后,需要解决阈估计中 的计算问题,这里介绍两种最简单的方式:一是通用阈值(universal thresho ld ),即对所有水平的分辨率阈值均一致,=^2log nn(39)另一种是分层阈值(leve-l by -levelthresho ld ),即对不同分辨率采用不同阈值,一般是通过最小化下式求得S( j )=njk=1^ 2n -2^ 2nI |^ jk j +min (^ 2jk , 2j )(40)j [0,(^ /n j )2log n j ]式中n j =2j -1为在水平j 的参数个数.8 超完备字典小波基较标准正交基的改进在于更加局部化,因此能实现对跳跃的捕捉.然而,虽然小波基非常复杂,但面对各种复杂的函数还是不够灵活.这种缺陷的根源在于:小波基是标准正交基,任意两个基函数之间正交,这保证了基函数简单完整的同时,也丧失了灵活性.基追踪(basis pursuit)方法[21]的思想是采用一种超完备(overcomplete)的基,例如对 光滑加跳跃 的函数,传统的傅立叶基能够捕捉光滑部分,但是难以捕捉跳跃部分;采用小波基能轻易捕捉跳跃部分,但是描述光滑部分较为困难.此时若将 傅立叶基 与 小波基 合并成一个新的基,则显然这种基能够轻松地估计 光滑加跳跃 函数.但是,这种新的基不再正交,它以牺牲正交性来获得更好的灵活性[22],故此时用 字典 来描述更精确,而本文为了简便统一仍采用 基 表述.9 前向神经网络以一个双层神经网络为例,记网络的输入神经元个数为m,隐层神经元个数为n,输出层神经元个数为q ,则网络结构如图2所示.图2 前向神经网络F ig.2 F or war d neural netw or k与上面几节线性方法不同的是,神经网络属于非线性统计数据建模(nonlinear statistical data m odeling),其隐层暗含了 特征提取 的思想,且可视作输入数据在一种 自适应的非线性非正交的基 上的映射.同样地,此时基牺牲了正交性、线性、不变性,增加了计算负担,但换来了更加强大的灵活性[23].简而言之,前向神经网络采用了类似基追踪的方法[24],但基是自适应变化的、非线性的,因此更加灵活.前向神经网络与基追踪相似之处在于,两者的基都不是正交的,都是根据给定数据而自适应选取的最佳基.前向神经网络的优势在于无不需预选字典,字典在算法中自动生成,并可作为特征选择的一种方法.10 径向基函数网络首先观察径向基函数(RBF)神经元如图3所示.图3 RBF 神经元图F ig.3 N euron of R BF图中输入向量p 的维数为R ,首先p 与输入层权值矩阵I W 相减,然后求距离函数dist ,再与104 武汉工程大学学报第32卷偏置b 1相乘,最后求径向基函数radbas (n)=ex p (-n 2),得到神经元的输出为a =radbas ( IW -pb 1)(41)整个RBF 网络由两层神经元组成,第1层为S 1个如图3所示的RBF 神经元,第2层为S 2个线性神经元,如图4所示.在第2层开始时,第1层的输出a 首先经过线性层权值矩阵LW 后与偏置b 2相加,再通过一个纯线性(purelin)函数purelin (n)=n,得到网络输出y 为y =purelin (LW a +b 2)(42)图4 RBF 神经网络结构图F ig.4 St ruct ur e of RN N比较式(41)与式(9)可见,RBF 网络与核方法非常类似,不同之处在于RBF 网络的L W 需要通过求解一个方程组,而核方法的权重是直接通过归一化计算求得,因此RBF 网络预测结果更为逼近完全内插函数估计(注意不是未知函数r ),而核方法计算更为简便[25].11 维数灾难将函数估计推广到高维,则会碰到维数诅咒(curse of dimensionality)[26](图5),它意味着当观测值的维数增加时,估计难度会迅速增大.维数诅咒有两层含义:一是计算的维数诅咒,指的是某些算法的计算量随着维数的增长而成指数增加.解决方法通常采用优化算法,例如遗传算法、粒子群算法、蚁群算法等[27].二是样本的维数诅咒,指的是数据维数为d 时,样本量需要随着d 指数增长.在函数估计中,第二层含义更为重要,这里给予详细解释.图5 样本的维数诅咒示意图Fig.5 Dimensio nality cur se o f samples假设一个半径r 维数为d 的超球,被一个边长为2r 维数为d 的超立方体所包围,假设超立方体内存在一个均匀分布的点,则由于超球的体积为2r dd /2/[d (d/2)],超立方体的体积为(2r )d,因此该点同时也落在超球内的概率P 为P =d/2d 2d -1 (d/2)(43)令维数d 由2逐步增长到20,则对应的概率P 如图6所示.显然,当d =20时,P 仅为2.46 10-8.因此,若在2维空间中1个样本在半径r 的意义下能逼近一个正方形,则在20维空间内,则需要1/2.46 10-8=4.06 107个样本才能在半径r 的意义下逼近超立方体.图6 概率P 与维数d 的关系F ig.6 T he cur ve of pro bability Pagainst dimensio na lit y d因此,在高维问题中,由于数据非常稀少,导致局部邻域中包含极少的数据点[28],因此估计变得异常困难.目前还没有较好的办法解决.12 结 语将文中阐述的方法归结并示于图7.图7 非参数回归方法Fig.7 Sur vey of non -par ametric r egr essio n metho ds不同类型方法的特点总结如下:a.核方法、正则化方法、正态均值模型可以视作最基本最原始的方式.另外,正则化方法与正态均值模型可视作一类特殊的核方法.b.核方法、局部多项式方法、正则化方法、正态均值模型、小波等方法在大多数情况下均非常类似.这些方法都包含了一个偏倚-方差平衡,所以都需要选择一个光滑参数.由于这些方法均是线性光滑器,所以均可以采用第4节中基于CV 、第7期张煜东,等:非参数估计方法105GC V的方法.c.小波方法一般面向空间非齐次函数.如果需要一个精确的函数估计,而且噪声水平较低,则小波方法非常有效.但若面对一个标准的非参数回归问题,而且感兴趣于置信集,则小波方法并不比其它方法明显更好.d.超完备字典缺陷是丧失了基的正交性,因此估计系数变得复杂;优点是更为灵活,能够采用稀疏的系数描述复杂函数.e.前向神经网络与RBF神经网络是基于不同的模型独立推导出来的,二者不可混淆.另外,神经网络方法的缺点是一般不考虑置信带,并常用训练误差代替风险函数,容易过拟合;优点是面向应用、思想简单且设计灵活.f.理论上,这些方法没有大的差别,特别在用置信带的宽度来评价时.每种方法都有其拥护者与批评者,没有哪一种方法目前获得应用上的优势.一种解决方案是对每个问题都利用所有可行的方法,如果结果一致,则选择简单者;如果结果不一致,则必须探讨内在的原因.g.所讨论的方法能够用于高维问题,然而,即使通过智能优化算法解决了计算的维数诅咒,仍然面对样本的维数诅咒.计算一个高维估计相对容易,然而该估计将不如一维情况下那么精确,其置信区间会非常大.但这并不表示方法失效,而是表示问题的固有困难.参考文献:[1] N eumey er N.A not e on unifor m consistency o fmonoto ne functio n estimato rs[J].Statistics&P robability L etter s,2007,77(7):693-703[2] Sheena Y,G upta A K.N ew estimato r for funct ions o fthe canonical cor relat ion co eff icients[J].Journal o fStatistical Planning and Inference,2005,131(1):41-61.[3] 张煜东,吴乐南,李铜川,等.基于PCN N的彩色图像直方图均衡化增强[J].东南大学学报,2010,40(1):64-68.[4] 詹锦华.基于优化灰色模型的农村居民消费结构预测[J].武汉工程大学学报,2009,31(9):89-91. [5] Wasserman L.A ll of No nparametr ic Statistics[M].N ew Y or k:Spring er-V erlag,Inc.[6] 张煜东,吴乐南,吴含前.工程优化问题中神经网络与进化算法的比较[J].计算机工程与应用,2009,45(3):1-6.[7] H ansen C B.Asym pto tic pr operties o f a robustvar iance matr ix estimator for panel data when T islarg e[J].Jo ur na l of Eco no metrics,2007,141(2):597-620.[8] Po khar el P P,L iu W F,P rincipe J C.K ernel leastmean squar e a lg orithm wit h constr ained g row th[J].Sig nal Pr ocessing,2009,89(3):257-265.[9] Ka liv as J H.Cyclic subspace r eg ressio n w ith analy sisof the hat matrix[J].Chemomet rics and Intellig entLabo rato ry Sy st ems,1999,45(1):215-224.[10] 张煜东,吴乐南.基于二维T sa llis熵的改进PCN N图像分割[J].东南大学学报:自然科学版,2008,38(4):579-584[11] G e kinli N C,Yav uz D.A set o f o ptimal discretelinear smoo ther s[J].Sig nal Pro cessing,2001,3(1):49-62.[12] A ntoniot ti M,Car rer as M,F arinaccio A,et al.A napplication of ker nel methods to g ene clustertempor al meta-ana lysis[J].Com puters&O per atio ns Research,2010,37(8):1361-1368. [13] H sieh P F,Cho u P W,Chuang H Y.An M RF-basedkernel metho d fo r no nlinear featur e ex tractio n[J].Imag e and V ision Co mputing,2010,28(3):502-517.[14] K atkovnik V.M ultireso lution lo cal po lynom ialr egr essio n:A new appro ach to po int wise spat ialadapt at ion[J].Dig ital Signal Pr ocessing,2005,15(1):73-116.[15] Ba llo A,G ran A.Lo ca l linear regr ession fo rfunct ional predicto r and scalar respo nse[J].Journalo f M ultiv ariate Analysis,2009,100(1):102-111.[16] Zhang J W,K rause F L.Ex tending cubic unifo rm B-splines by unified t rig onometr ic and hy perbo lic basis[J].G raphical M o dels,2005,67(2):100-119. [17] 张煜东,吴乐南,韦耿,等.用于多指数拟合的一种混沌免疫粒子群优化[J].东南大学学报,2009,39(4):678-683.[18] Chaudhur i S,Perlman M D.Co nsistent est imatio n ofthe minimum norma l mean under t he tr ee-orderr est riction[J].Journal of Stat istical Planning andInference,2007,137(11):3317-3335.[19] L abat D.Recent advances in w avelet analy ses:P art1.A r eview o f co ncepts[J].Journal o f H y dr olo gy,2005,314(1):275-288.[20] K uno th A.A dapt ive Wavelets fo r Spar seRepresentatio ns o f Scattered Data[J].Studies inComputatio nal M athematics,2006,12:85-108. [21] D onoho D L,Elad M.O n the stability of the basispursuit in the pr esence o f no ise[J].SignalP ro cessing,2006,86(3):511-532.[22] M algo uyres F.Rank related pro per ties fo r BasisP ur suit and tota l var iation reg ularization[J].SignalP ro cessing,2007,87(11):2695-2707.106武汉工程大学学报第32卷[23] 张煜东,吴乐南,韦耿.神经网络泛化增强技术研究[J].科学技术与工程,2009,9(17):4997-5002. [24] 屠艳平,管昌生,谭浩.基于BP网络的钢筋混凝土结构时变可靠度[J].武汉工程大学学报,2008,30(3):36-39.[25] Z hang Y D,W u L N,N egg az N,et al.Remo te-sensing Imag e Classificatio n Based on an Impro vedPro babilistic N eural N etw ork[J].Sensor s,2009,9:7516-7539.[26] A leksandr ow icz G,Barequet G.Co unting po ly cubesw ithout the dimensionality curse[J].DiscreteM athematics,2009,309(13):4576-4583.[27] 张煜东,吴乐南,奚吉,等.进化计算研究现状(上)[J].电脑开发与应用,2009,22(12):1-5.[28] 王忠,叶雄飞.遗传算法在数字水印技术中的应用[J].武汉工程大学学报,2008,30(1):95-97.Survey of non-parametric estimation methodsZHANG Yu-dong1,2,Y AN Jun1,W ANG Shui-hua1,WU Le-nan1(1.Schoo l o f Info rmation Science&Engineer ing,So ut heast U niv ersity,N anjing210096,China;2.Br ainimag ing L ab.,Depar tment o f Psycholog y,Co lumbia U niver sity,N ew Y or k NY10032,U SA)Abstract:In or der to so lve the pro blem of functio n estimation,w e first discuss traditional param etric regression metho d.Since it needs a pr io ri kno w ledge to deter mine the model,the par am etric m ethod is no t robust and is mode-l sensitive.Thus,data-driven non-par am etric metho d is intro duced,w hich needs no t any a prior know ledge to estim ate the unknow n function.Eig ht m ajo r no n-parametric m ethods are discussed as kernel method,local poly no mial regression,regularization method,nor mal mean m odel, w av elet method,ov ercomplete dictionary,fo rw ar d neur al netw ork,and radial basis function netw ork. These alg orithms are com pared,and their coher ence and inher itance ar e investigated.Finally,g eneralize the algo rithms to high dimensionality and po int out tw o pro blems as curse of dimensionality of com putation and sam ple.The for mer can be settled dow n by intelligent methods w hile the latter is pro blem intrinsic.Key words:par am etric statistics;no n-parametric statistics;kernel method;local polynom ial r eg ressio n; regular ization m ethod;no rmal mean mo del;w avelet;ov er-co mplete dictionary;forw ard neural netw ork; radial basis function netw ork本文编辑:龚晓宁。
概率论与数理统计知识点总结一、概率论1.随机试验和样本空间:随机试验是具有不确定性的试验,其结果有多个可能的取值。
样本空间是随机试验所有可能结果的集合。
2.事件及其运算:事件是样本空间中满足一定条件的结果的集合。
事件之间可以进行并、交、补等运算。
3.概率的定义和性质:概率是描述随机事件发生可能性的数值。
概率具有非负性、规范性和可列可加性等性质。
4.条件概率和独立性:条件概率是在已知一事件发生的条件下,另一事件发生的概率。
事件独立表示两个事件之间的发生没有相互关系。
5.全概率公式和贝叶斯公式:全概率公式是一种计算事件概率的方法,将事件分解成互斥的多个事件的概率之和。
贝叶斯公式是一种用于更新事件概率的方法。
6.随机变量和分布函数:随机变量是样本空间到实数集的映射,用来描述试验结果的数值特征。
分布函数是随机变量取值在一点及其左侧的概率。
7.常用概率分布:常见的概率分布包括离散型分布(如二项分布、泊松分布)和连续型分布(如正态分布、指数分布)。
8.数学期望和方差:数学期望是随机变量的平均值,用于描述随机变量的中心位置。
方差是随机变量离均值的平均距离,用于描述随机变量的分散程度。
二、数理统计1.统计量和抽样分布:统计量是对样本数据进行总结和分析的函数。
抽样分布是统计量的概率分布,用于推断总体参数。
2.估计和点估计:估计是利用样本数据对总体参数进行推断。
点估计是利用样本数据得到总体参数的一个具体数值。
3.估计量的性质和评估方法:估计量的性质包括无偏性、有效性和一致性等。
评估方法包括最大似然估计、矩估计等。
4.区间估计:区间估计是对总体参数进行估计的区间范围。
置信区间是对总体参数真值的一个区间估计。
5.假设检验和检验方法:假设检验是在已知总体参数的条件下,对总体分布做出的统计推断。
检验方法包括参数检验和非参数检验。
6.正态总体的推断:当总体近似服从正态分布时,可以利用正态分布的性质进行推断。
7.方差分析和回归分析:方差分析用于比较两个或多个总体均值是否相等。
统计学中的非参数统计方法统计学是一门研究收集、整理、分析和解释数据的科学,旨在通过数理方法得出数据背后的规律和结论。
在统计学中,有两种基本的统计方法,即参数统计方法和非参数统计方法。
本文将重点介绍统计学中的非参数统计方法。
一、非参数统计方法的定义非参数统计方法是一种不依赖于数据分布假设的统计方法。
与参数统计方法相比,非参数方法可以更灵活地利用数据自身信息进行分析和推断,因此在某些情况下更为适用。
二、非参数统计方法的应用领域非参数统计方法广泛应用于各个领域,以下是其中几个典型的应用领域。
1. 生态学研究生态学研究中经常需要分析物种多样性、群落结构等生态指标。
由于生态数据常常呈现非正态分布或具有明显的异常值,非参数统计方法在生态学领域中得到广泛应用。
例如,Wilcoxon秩和检验可用于比较两组样本的物种丰富度,Kruskal-Wallis检验可用于比较多个组别间的物种多样性。
2. 医学研究在医学研究中,研究对象往往是人群的特征和健康状况。
由于人群的分布和变异性通常较为复杂,非参数统计方法在医学研究中得到广泛应用。
例如,Mann-Whitney U检验可用于比较两组样本的医学指标,McNemar检验可用于比较两次测量结果的差异。
3. 社会科学调查社会科学调查常常需要对受访者进行评估和比较,例如问卷调查、民意测验等。
非参数统计方法可用于处理涉及受访者个体差异较大或数据不满足正态分布的情况。
例如,符号检验可用于检验受访者对某一观点的偏好,Friedman秩和检验可用于比较多个相关样本的评分。
4. 质量控制与工程管理在质量控制和工程管理中,通常需要对生产过程或产品进行统计分析和评估,以判断其是否符合标准。
非参数统计方法可用于处理样本容量小,数据分布未知或不满足正态分布的问题。
例如,符号检验可用于判断两个工艺是否存在差异,Wilcoxon符号秩和检验可用于比较两个工艺的中位数。
三、非参数统计方法的优势相对于参数统计方法,非参数统计方法具有以下几个优势:1. 数据分布假设不敏感:非参数方法不依赖于数据分布假设,因此对于数据分布未知或不满足正态分布的情况下依然有效。
中国海洋大学本科生课程大纲课程名称非参数统计Nonparametric Statistics课程代码0753********课程属性 专业知识 课时/学分48/3课程性质 选修 实践学时责任教师 张立振 课外学时96课程属性:公共基础/通识教育/学科基础/专业知识/工作技能,课程性质:必修、选修一、 课程介绍1.课程描述:非参数统计是数理统计学的一个分支,它是针对参数统计而言的。
所谓参数统计,简单地说就是建立在总体具有明确分布形式,通常多为正态分布形式的假定基础之上,所建立的统计理论和统计方法。
而非参数统计是在不假定总体分布形式或在较弱条件下,例如总体分布形式完全未知或分布形式是对称的,诸如这样一些宽泛条件下,尽量从数据本身获得的信息,建立对总体相关统计特征进行分析和推断的理论、方法。
2.设计思路:本课程是在已学数理统计基础上,通过非参数统计的学习,引导数学专业学生进一步增强对一般总体分析、推断的能力并加深对相关理论和方法的理解。
课程内容着重于基本知识点的理解,避免难度较大或较长定理的证明。
目的是使学生对理论有一个基本的理解和在应用能力上的提高。
课程内容包括以下四个方面:(1).非参数统计的基本概念:非参数统计方法的主要特点,次序统计量及其分布,U统计量,秩统计量的概念,一些统计量的近似分布。
(2).非参数估计的方法:总体分位数的估计,对称中心的估计,位置差的估计。
(3).非参数检验的方法: 总体p分位数的检验,总体均值检验,两样本的比较,随机性与独立性检验,多总体的比较。
- 1 -(4).总体分布类型的估计与检验:分布函数的估计与检验,概率密度估计。
3. 课程与其他课程的关系:先修课程:《概率论》,《数理统计》,《多元统计分析》;并行课程:《应用回归分析》;后置课程:《统计软件》。
非参数统计是应用数学专业、信息与计算科学专业的选修课程,但对于今后从事统计研究和统计应用工作的学生来讲可以作为专业必修课学习。
数理统计中的非参数估计方法数理统计是应用数学原理和统计学方法来研究和解释现象、收集和分析数据的科学。
在统计学中,参数估计是一个重要的主题,它涉及根据样本数据推断总体参数的值。
而非参数估计方法则是一种不依赖于总体分布假设的参数估计方法,它在某些情况下比参数估计更加灵活和实用。
本文将介绍数理统计中的几种主要的非参数估计方法。
1. 核密度估计法
核密度估计法用于估计未知概率密度函数。
它基于样本数据,通过在每个观测点周围放置一个核函数,来估计该点处的密度。
核函数通常是一个非负函数,且满足积分为1。
核密度估计法的优点是不需要对总体分布做出假设,而且可以适用于各种类型的数据。
然而,它对于样本数据的选择和参数的选择较为敏感。
2. 经验分布函数法
经验分布函数法是一种常用的非参数估计方法,用于估计未知总体分布函数。
它通过对每个观测值赋予等概率的权重,构建一个经验分布函数。
经验分布函数在每个观测点处的取值是样本数据中小于等于该观测点的观测值的比例。
经验分布函数的优点是简单易懂,而且在大样本下收敛性较好。
然而,它对于极端值和离群点较为敏感。
3. 重抽样法
重抽样法是一种基于重新选择样本数据的非参数估计方法。
它通过从样本中有放回地重新选择出新的样本,然后利用这些新的样本数据
进行参数推断。
重抽样法的优点是可以直接利用原始样本数据进行估计,避免了对总体分布的假设,而且可以通过重复抽样来估计参数的分布。
然而,它需要大量的计算,适用于小样本数据。
4. 秩和秩差法
秩和秩差法是一种用于估计总体位置参数的非参数方法。
它将样本数据转化为排序后的秩次,然后利用秩次来进行参数估计。
秩和秩差法的优点是对于总体分布的假设要求较低,而且对于离群值和稳健性较好。
然而,它可能对于分布偏态较大的数据不适用。
5. 分位数回归法
分位数回归法是一种用于估计条件分布的非参数方法。
它基于分位数的概念,通过对分位数进行建模来估计条件分布。
分位数回归法的优点是可以灵活地处理不同分位数,适用于各种类型的数据。
然而,由于它对于极端值比较敏感,需要对极端值进行一定的处理。
总结起来,数理统计中的非参数估计方法是一种灵活和实用的统计分析工具。
核密度估计法、经验分布函数法、重抽样法、秩和秩差法和分位数回归法都是常用的非参数估计方法,每种方法都有其适用的场景和假设条件。
在实际应用中,根据问题的具体要求和数据的特点选择合适的非参数估计方法是非常重要的。
通过对样本数据进行适当的分析和估计,可以更准确地理解和解释数据的特征和规律。