《非参数统计》与MATLAB编程 第二章 描述性统计
- 格式:doc
- 大小:90.00 KB
- 文档页数:12
王静龙《非参数统计分析》课后习题计算题参考答案习题一1.One Sample t-test for a MeanSample Statistics for xN Mean Std. Dev. Std. Error-------------------------------------------------26 1.38 8.20 1.61Hypothesis TestNull hypothesis: Mean of x = 0Alternative: Mean of x ^= 0t Statistic Df Prob > t---------------------------------0.861 25 0.397695 % Confidence Interval for the MeanLower Limit: -1.93Upper Limit: 4.70则接受原假设认为一样习题二1.描述性统计习题三1.1{}+01=1339:6500:650013=BINOMDIST(13,39,0.5,1)=0.026625957S n H me H me P S +==<≤另外:在excel2010中有公式 BINOM.INV(n,p,a) 返回一个数值,它使得累计二项式分布的函数值大于或等于临界值a 的最小整数***0*0+1inf :2BINOM.INV(39,0.5,0.05)=141sup :1132S 1313n m i n d i n m m i n d d m i d αα==⎧⎫⎛⎫⎪⎪⎛⎫=≥⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫≤=-=⎨⎬ ⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭=≤=∑∑= 以上两种都拒绝原假设,即中位数低于65001.2****01426201inf :221inf :122BINOM.INV(40,0.5,1-0.025)=26d=n-c=40-26=14580064006200nn i c n m i n c c i n m m i x x me x αα==⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭====∑∑2.{}+01=4070:6500:65002402*(1-BINOMDIST(39,70,0.5,1))=0.281978922S n H me H me P S +==≠≥=则接受原假设,即房价中位数是65003.1{}+01=15521552527207911::22n 1552=5.33E-112S n H p H p P S φ+=+==>⎛≥≈ ⎝比较大,则用正态分布近似**+**0:=1552155252720791inf :221inf :122m=BINOM.INV(2079,0.5,0.975)=1084nn i c n m i S n n c c i n m m i αα===+=⎧⎫⎛⎫⎪⎪⎛⎫=≤⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭⎧⎫⎛⎫⎪⎪⎛⎫=≥-⎨⎬⎪ ⎪⎝⎭⎝⎭⎪⎪⎩⎭∑∑另外则拒绝原假设,即相信孩子会过得更好的人多3.2P 为认为生活更好的成年人的比例,则1522=0.7465132079p 的比估计是:4.{}00.90610.90618154157860:65:6510.9060.094~(,)181541BINOMDIST(18153,157860,0.094,1)=0S n H P H P p S b n p P S +++===>=-=≥=-因为0〈0.05则拒绝原假设习题四1.()()++0.025+W =6+8+10+1+4+12+9+11+2+7=70p 2P W 70n=12c =65p 2P W 65=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即拒绝原假设2.()()++0.025+W =2.5+2.5+7+7+7+7+10.5+14+14+14+14+14+17.5+17.5+19+20+23+24=234.5p 2P W 234.5n=25 c =236p 2P W 236=0.05≥≥符号秩和检验统计量:值为,当得所以值小于即接受原假设{}011826:0:02182*(1-BINOMDIST(17,25,0.5,1))=0.043285251S n H me H me P S +===≠≥=+符号检验:则拒绝原假设t t =0.861df=25 p=0.3976检验:统计量接受原假设3.(1)+0.0250.0250.025++=5+2+2=9833(1)322(3)0.052(9)0.05W n c n n d c P W P W ==+=-=≤=≤>查表可得:则 接受原假设(2)Walsh 平均由小到大排列:50 55 60 65 65 70 70 70 75 75 75 80 80 80 80 80 80 80 85 85 85 85 85 90 90 90 90 90 90 95 95 95 95 95 95 100 100 100 100 100 100 100 105 105105 105 105 110 110 110 110 110 115 115 120 N=55 则对称中心为()()^281/290N W W θ+===()()1/1/1/40.527.50.5 1.967.771011461/40.527.50.5 1.9647.22898853d n n U c n n U αα--=+--=--==+++++=因为c 不是整数,则^+1k d L k k w w θ()()介于与之间,其中表示比大的最小整数即为8 ^L θ为70与75之间,即为72.5 []-%72.5,105H L 则的点估计为90 95的区间估计为习题五1.171(,24,25,50)0.005060988i p P i p ===∑值很小,则拒绝原假设即认为女职工的收入比男职工的低。
如何使用Matlab进行非参数统计分析统计分析是一种用来处理和解释数据的方法,而在统计学中,非参数统计分析是指不对数据做出任何分布或参数假设的一种方法。
与参数统计分析相比,非参数统计分析更加灵活,适用于各种类型的数据,尤其是在数据分布未知或非正态分布时更为有用。
本文将介绍如何使用Matlab进行非参数统计分析,帮助读者更好地理解和应用这种方法。
1. 数据准备在进行非参数统计分析之前,首先需要准备好数据。
在Matlab中,可以通过导入、读取或生成数据的方式来准备数据。
例如,可以使用`xlsread`函数导入Excel文件中的数据,使用`load`函数读取.mat文件中的数据,或使用Matlab内置的函数生成符合特定要求的数据。
无论使用何种方式,确保数据被正确地导入到Matlab的工作环境中。
2. 非参数假设检验非参数假设检验是非参数统计分析的核心部分,用来验证某个假设在给定数据中是否成立。
Matlab提供了一系列函数用于进行非参数假设检验,包括`ranksum`、`kstest`、`signrank`等。
这些函数分别对应了Wilcoxon秩和检验、Kolmogorov-Smirnov检验和符号检验等常见的非参数检验方法。
通过调用这些函数并传入相应的参数,可以在Matlab中进行非参数假设检验并获取检验结果。
3. 非参数回归分析除了假设检验,非参数统计分析还可以用于回归分析。
在回归分析中,非参数方法可以更好地处理非线性关系和异方差性等问题,同时能够减轻对数据的假设和约束。
在Matlab中,可以使用`fitrgp`函数来进行非参数回归分析。
这个函数实现了高斯过程回归方法,通过拟合训练数据来推断模型,并提供了预测新数据的能力。
4. 非参数密度估计非参数密度估计是一种用于估计数据概率密度函数的方法,并且不需要对数据分布进行任何参数假设。
在Matlab中,可以使用`ksdensity`函数进行非参数密度估计。
MATLAB数据分析⽅法第2章数据描述性分析2.1 基本统计量与数据可视化1.均值、中位数、分位数、三均值均值、中位数:mean(A)、media(A)分位数:prctile(A,P),P∈[0,100]prctile(A,[25,50,75]) %求A的下、中、上分位数三均值:w=[0.25,0.5,0.75];SM=w*prctile(A,[25,50,75])%例:计算安徽16省市森林资源统计量A=xlsread('senlin.xls','sheet1')M=mean(A); %均值,MD=median(A); %中位数SM=[0.25,0.5,0.25]*prctile(A,[25,50,75]); %三均值[M;MD;SM]2.⽅差、标准误、变异系数⽅差:var(A,flag),flag默认0表⽰修正的⽅差,取1为未修正标准差:std(A,flag),同上变异系数:v=std(A)./abs(mean(A))k阶原点矩、中⼼距:ak=mean(A.^k)bk=mean((A-mean(A)).^k)%中⼼距系统命令bk=moment(A,k)3.极差、四分位极差(上、下分位数之差)R=rangr(A)R1=iqr(A)4.异常点判别(截断点)XJ=parctile(A,[25])-1.5*R1SJ=parctile(A,[75])+1.5*R15.偏度、峰度偏度:sk=skewness(A,flag),默认1,取0为样本数据修正的偏度峰度:ku=kurtosis(A,flg)-3,同上2.1.2 多维样本数据协⽅差:cov(A)相关系数:corr(A)标准化:zscore(A)2.1.3 样本数据可视化1.条形图bar(x)%样本数据x的条形图,横坐标为1:length(x)bar(x,y)%先把x和y⼀⼀对应,然后将x从⼩到⼤排序画图2.直⽅图hist(x,n)%数据x的直⽅图,n为组数,确省时n=10[h,stats]=cdfplot(x)%x的经验分布函数图,stats给出数据最⼤最⼩值、中位数、均值、标准差直⽅图基础上附加正态密度曲线histfit(x)histfit(x,nbins)%nbins指定bar个数,缺省时为x中数据个数的平⽅根3.盒图,五个数值点组成:最⼩值、下四分位数、中位数、上四分位数、最⼤值。
matlab中数据的统计描述和分析MATLAB是一种基于计算机语言的数学软件包,它提供了处理各种数学和工程问题的工具,并在数据统计描述和分析方面发挥了重要作用。
在本文中,我们将探讨MATLAB中数据的统计描述和分析方法。
1. 数据的导入与预处理数据的导入是数据分析的第一步,MATLAB支持各种数据格式的导入,包括CSV,XLS,MAT等文件类型。
在导入数据后,预处理成为必要的步骤。
预处理的目的是删除异常值和不一致的数据点,以确保数据的准确性。
MATLAB提供了各种功能,例如删除重复值和缺失值、转换数据类型、缩放数据、标准化数据、去除噪声等,有助于准确性。
2. 数据的可视化数据的可视化是了解数据中存在的模式和趋势的重要方法,MATLAB提供了许多可视化工具,包括条形图、折线图、散点图、热力图等,以及专门用于可视化统计数据的Anova、Boxplot等工具。
3. 统计描述统计描述提供了对数据的整体理解的方法。
MATLAB提供了许多统计描述的函数,如mean(平均数)、median(中位数)、min(最小值)、max(最大值)、range(极差)、var(方差)、std(标准差)、skewness(偏度)、kurtosis(峰度)、cov(协方差)和corrcoef(相关系数)等函数可以用于计算数据的统计描述信息。
例如,假设我们有一个高斯分布的数据集,可以使用MATLAB的“randn”函数生成一个具有100项的随机高斯数据集。
data = randn(100,1);现在,使用MATLAB的“mean”和“std”函数可以计算出这些数据的统计描述信息。
平均数和标准差告诉我们有关数据的“中心”位置和分散程度的一些信息。
sigma = std(data)4. 假设检验假设检验是判断所提出的关于总体参数的假设是否显著的一种统计分析方法。
假设检验包括参数检验和非参数检验两类。
MATLAB中包含了各种假设检验的函数,例如单样本t检验、双样本t检验、方差分析、卡方检验、K-S检验等。
Matlab中常用的统计分析技巧介绍统计分析是研究数据的特征、规律和变化趋势的一种方法。
作为一款功能强大的科学计算软件,Matlab提供了丰富的统计分析工具和函数,可用于处理和分析各种类型的数据。
本文将介绍Matlab中常用的统计分析技巧,帮助读者更好地利用Matlab进行数据分析和解释。
一、数据导入与处理在进行统计分析之前,首先需要将数据导入Matlab并进行相应的处理。
Matlab 提供了多种导入数据的函数,如`xlsread`、`csvread`和`importdata`等,可根据数据的来源和格式选择合适的函数进行导入。
同时,Matlab还提供了丰富的数据处理函数,如`reshape`、`sort`和`filter`等,可用于数据的重塑、排序和滤波等操作,便于后续的分析和计算。
二、描述性统计分析描述性统计分析是了解和概括数据特征的一种方法。
在Matlab中,我们可以使用`mean`、`median`、`std`、`max`和`min`等函数计算数据的均值、中位数、标准差、最大值和最小值等统计量。
此外,Matlab还提供了`hist`和`boxplot`等函数,可用于绘制数据的直方图和箱线图,直观展示数据的分布和离散情况。
三、假设检验假设检验是统计学中经典的方法之一,用于判断样本数据与假设之间的差异是否显著。
在Matlab中,我们可以使用`ttest`、`anova1`和`chisquare`等函数进行假设检验。
例如,`ttest`函数可以用于对比两组样本的均值是否存在显著差异,`chisquare`函数可以用于分析分类数据的关联性。
假设检验结果一般会给出显著性水平和p值,以帮助我们判断差异是否具有统计学意义。
四、回归和相关性分析回归和相关性分析是研究变量之间关系的一种常用方法。
Matlab中提供了`regress`和`corrcoef`等函数,可用于简单线性回归和相关性分析。
例如,`regress`函数可以用于求解线性回归模型的回归系数和拟合优度,`corrcoef`函数可以用于计算变量之间的相关系数矩阵。
Matlab数据的统计分析与描述实验⽬的 (1)熟悉统计的基本概念、参数估计、假设检验。
(2.)会⽤参数估计和假设检验对实际问题进⾏分析。
实验要求 实验步骤要有模型建⽴,模型求解、结果分析。
实验内容(1)某校60名学⽣的⼀次考试成绩如下:93 75 83 93 91 85 84 82 77 76 77 95 94 89 91 88 86 83 96 81 79 97 78 75 67 69 68 84 83 81 75 66 85 70 94 84 83 82 80 78 74 73 76 70 86 76 90 89 71 66 86 73 80 94 79 78 77 63 53 551)计算均值、标准差、极差、偏度、峰度,画出直⽅图;2)检验分布的正态性;3)若检验符合正态分布,估计正态分布的参数并检验参数.(2)据说某地汽油的价格是每加仑115美分,为了验证这种说法,⼀位学者开车随机选择了⼀些加油站,得到某年⼀⽉和⼆⽉的数据如下:⼀⽉:119 117 115 116 112 121 115 122 116 118 109 112 119 112 117 113 114 109 109 118⼆⽉:118 119 115 122 118 121 120 122 128 116 120 123 121 119 117 119 128 126 118 1251)分别⽤两个⽉的数据验证这种说法的可靠性;2)分别给出1⽉和2⽉汽油价格的置信区间;3)给出1⽉和2⽉汽油价格差的置信区间.实验步骤1、解:主要使⽤MATLAB与SPSS求解,具体求解步骤如下, (1)编写MATLAB程序求解,代码如下1 %数据2 x=[93,75,83,93,91,85,84,82,77,76,77,95,94,89,91,88,86,83,96,81,79,97,78,75,67,69,68,84,83,81,75,66,85,70,94,84,83,82,80,78,74,73,76,70,86,76,90,89,71,66,86,73,80,94,79,78,77,63,53,55];3 %总样本数4 n=length(x);5 %平均值6 x_bar=sum(x)*1/n7 %标准差8 temp1=0;9for i=1:n10 c=x(i)-x_bar;11 temp1=temp1+c^2;12 end13 s=sqrt(temp1*(1/(n-1)))14 %极差15 x_max=max(x);16 x_min=min(x);17 x_jicha=x_max-x_min18 %偏度19 temp2=0;20for i=1:n21 c=x(i)-x_bar;22 temp2=temp2+c^3;23 end24 g1=(1/s)^3*temp225 %峰度26 temp3=0;27for i=1:n28 c=x(i)-x_bar;29 temp3=temp3+c^4;30 end31 g2=(1/s)^4*temp332 %画出直⽅图33 bar(x)题1_MATLAB 运⾏结果,平均值标准差极差偏度峰度80.109.7144.00-27.39 1.8380.109.7144.00-27.39 1.83 见图 (2)SPSS求解步骤: ⾸先,做出正态曲线直⽅图: 由上图可见,该校这60名学⽣的的成绩分布与正态分布相近。
使用Matlab进行统计分析的基本步骤统计分析是指通过对收集到的数据进行整理、描述、分析和解释,从而揭示数据背后的规律和关联性。
Matlab是一种强大的数值计算和科学工程软件,广泛应用于各个领域的数据分析和建模。
本文将介绍使用Matlab进行统计分析的基本步骤。
一、数据准备和导入进行任何统计分析之前,首先需要准备和导入数据。
数据可以来自于实验、调查、采样等方式收集得到。
在Matlab中,可以通过各种途径导入数据,如文本文件、Excel文件、数据库等。
在导入数据之前,需要确保数据格式正确、无误,并进行必要的清洗和预处理。
二、数据的描述统计描述统计是对数据进行描述和分析的过程。
通过描述统计,可以获得数据的中心趋势、离散程度、分布特征等信息。
在Matlab中,可以使用一系列函数进行描述统计分析。
例如,mean函数可以计算数据的均值,std函数可以计算标准差,median函数可以计算中位数,hist函数可以绘制直方图等。
三、数据的可视化分析数据可视化是将数据以图形或图表的形式展示出来,以便更直观地理解数据之间的关系和趋势。
Matlab提供了强大的绘图功能,可以绘制散点图、柱状图、折线图等多种图形。
通过调用相应的绘图函数,可以将数据可视化展示出来,并进行进一步的分析和解读。
四、假设检验与推断统计假设检验与推断统计是统计学中重要的分析方法,用于对总体参数、分布或数据之间的关系进行推断。
在Matlab中,可以使用ttest函数进行单样本或双样本的假设检验,使用anova 函数进行方差分析,使用corrcov函数计算相关系数矩阵等。
这些函数可以帮助我们进行假设检验和推断统计,以得出对总体或样本的推断性结论。
五、回归分析和建模回归分析是研究变量之间相互依赖关系的一种统计方法,常用于预测、数据建模和因果推断。
在Matlab中,可以通过调用regress函数实现线性回归分析,使用fitlm函数进行多元线性回归分析,使用glm函数进行广义线性模型分析等。
003--matlab中数据的统计描述和分析-122-数据的统计描述和分析数理统计研究的对象是受随机因素影响的数据,以下数理统计就简称统计,统计是以概率论为基础的一门应用学科。
数据样本少则几个,多则成千上万,人们希望能用少数几个包含其最多相关信息的数值来体现数据样本总体的规律。
描述性统计就是搜集、整理、加工和分析统计数据,使之系统化、条理化,以显示出数据资料的趋势、特征和数量关系。
它是统计推断的基础,实用性较强,在统计工作中经常使用。
面对一批数据如何进行描述与分析,需要掌握参数估计和假设检验这两个数理统计的最基本方法。
我们将用Matlab 的统计工具箱(Statistics Toolbox)来实现数据的统计描述和分析。
§1 统计的基本概念1.1 总体和样本总体是人们研究对象的全体,又称母体,如工厂一天生产的全部产品(按合格品及废品分类),学校全体学生的身高。
总体中的每一个基本单位称为个体,个体的特征用一个变量(如x )来表示,如一件产品是合格品记0=x ,是废品记1=x ;一个身高170(cm )的学生记170=x 。
从总体中随机产生的若干个个体的集合称为样本,或子样,如n 件产品,100名学生的身高,或者一根轴直径的10次测量。
实际上这就是从总体中随机取得的一批数据,不妨记作n x x x ,,,21 ,n 称为样本容量。
简单地说,统计的任务是由样本推断总体。
1.2 频数表和直方图一组数据(样本)往往是杂乱无章的,作出它的频数表和直方图,可以看作是对这组数据的一个初步整理和直观描述。
将数据的取值范围划分为若干个区间,然后统计这组数据在每个区间中出现的次数,称为频数,由此得到一个频数表。
以数据的取值为横坐标,频数为纵坐标,画出一个阶梯形的图,称为直方图,或频数分布图。
若样本容量不大,能够手工作出频数表和直方图,当样本容量较大时则可以借助Matlab这样的软件了。
让我们以下面的例子为例,介绍频数表和直方图的作法。
第二章描述性统计2.1 表格法和图形法表2.1 灯丝寿命数据107 73 68 97 76 79 94 59 98 57 73 81 54 65 71 80 84 88 62 61 79 98 63 65 66 62 79 86 68 74 61 82 65 98 63 71 62 116 65 88 64 79 78 79 77 86 89 76 74 85 73 80 68 78 89 72 58 69 82 72 92 78 88 77 103 88 63 68 88 81 64 73 75 90 62 89 71 71 74 70 74 70 85 61 65 81 75 62 94 71 85 84 83 63 92 68 81 62 79 83 93 61 65 62 92 65 64 66 83 70 70 81 77 72 84 67 59 58 73 83 78 66 66 94 77 63 66 75 68 76 73 76 90 78 71 101 78 43 59 67 61 71 77 91 96 75 64 76 72 77 74 65 82 86 79 74 66 86 96 89 81 71 85 99 59 92 94 62 68 72 77 60 87 84 75 77 51 45 63 102 85 67 87 80 84 93 69 76 89 75 59 77 83 68 72 67 92 89 82 96a =Columns 1 through 17107 73 68 97 76 79 94 59 98 57 7381 54 65 71 80 8479 98 63 65 66 62 79 86 68 74 6182 65 98 63 71 6264 79 78 79 77 86 89 76 74 85 7380 68 78 89 72 5892 78 88 77 103 88 63 68 88 81 6473 75 90 62 89 7174 70 85 61 65 81 75 62 94 71 8584 83 63 92 68 8193 61 65 62 92 65 64 66 83 70 7081 77 72 84 67 5978 66 66 94 77 63 66 75 68 76 7376 90 78 71 101 7861 71 77 91 96 75 64 76 72 77 74 65 82 86 79 74 6681 71 85 99 59 92 94 62 68 72 77 60 87 84 75 77 5185 67 87 80 84 93 69 76 89 75 59 77 83 68 72 67 92Columns 18 through 2088 62 61116 65 8869 82 7271 74 7062 79 8358 73 8343 59 6786 96 8945 63 10289 82 96注:a不能复制到MATLAB中。
b=reshape(a,200,1);[min(b) max(b)]ans =43 116n=histc(b,[40,50,60,70,80,90,100,110,120])n =2105264452241n/200ans =0.01000.05000.26000.32000.22500.11000.02000.0050bar([40,50,60,70,80,90,100,110,120],n,'histc')表2.2 灯丝寿命数据频率分布灯丝寿命(小时)个数频率(%)40—50 2 150—60 10 560—70 52 2670—80 64 3280—90 45 22.590—100 22 11100—110 4 2110-120 1 0.5合计200 100c=[2 32 24 19 10 6 3 2 1 1]bar(c)表2.7 赔款样本数据直方图x=[1 2 2 2 2 3 3 5 7 8 9];y=[1 1 2 3 4 1 2 1 1 1 1];plot(x,y,'*','markersize',30,'linewidth',4)axis([0,10,0,5])图2.8[mean([1,2,2,2,2,3,3,5,7,8,9]) median([1,2,2,2,2,3,3,5,7,8,9])] ans =4 3切尾均值:trimmeantrimmean(x,percent) ,其中percent为0到100。
当x为向量时,切尾均值为:先去掉x的percent/2的最大值和最小值,再求算术平均值。
注意:若length(x)×percent/2恰好为整数时,则就x按大小排序后,两端去掉length(x)×percent/2个数,如果不是整数,则去掉length(x)×percent/2四舍五入数(若小数点后正好等于5,则取小的整数,如1.5还是取1)。
如:a=[4 9 12.4 23 33.5 45 56 67 76 99] 回车trimmean(a,50) 回车ans =39.4833(25/2)%×length(x)=2.5,两端切掉2个数。
即等于:mean([12.4 23 33.5 45 56 67]) 回车ans =39.4833然后当:trimmean(a,51) 回车ans =39.3750(51/2)%×length(x)=2.55,即两端切掉3个数。
mean([23 33.5 45 56]) 回车ans =39.3750Trimmean 也可处理矩阵,不过只是计算矩阵每列的切尾均值。
继续上面,如:b=a';c=[1:10]';d=[b,c];trimmean(d,51) 回车ans =39.3750 5.50002.2.2 表示离散程度的数值 [var(b) std(b) range(b)] ans =145.4548 12.0605 73.0000百分位数:prctile(x,percent) ,其中percent 为0到100,x 可为向量或矩阵。
[prctile(b,25) prctile(b,75)] ans =66.5000 84.0000四分位间距:iqr(x) 其中x 可为向量或矩阵,当x 为向量时,iqr(x)为x 的75%的百分位数减去25%的百分位数。
iqr(b) ans = 17.5000V a l u e sColumn NumberX-上四分位数>1.5IQR 或下四分位数-X>1.5IQR 时 ,X 为野值。
称“下四分位数-1.5IQR”和“上四分位数+1.5IQR”两个数为内篱笆,“下四分位数-3IQR”和“上四分位数+3IQR”两个数为外篱笆,位于内、外篱笆之间的数称为弱异常值,而在外篱笆的数称为强异常值。
区间估计:双侧均值的区间估计:[h,sig,ci,stats]=ttest(b,75,0.05)% 95%的置信区间h =sig =0.2197ci =74.3683 77.7317stats =tstat: 1.2312df: 199sd: 12.0605[mean(b)-tinv(0.975,199)*std(b)/(200^0.5)mean(b)+tinv(0.975,199)*std(b)/(200^0.5)]ans =74.3683 77.7317单侧区间估计:[h,sig,ci,stats]=ttest(b,75,0.05,1)h =sig =0.1098ci =74.6407 Infstats =tstat: 1.2312df: 199sd: 12.0605[h,sig,ci,stats]=ttest(b,75,0.05,-1)h =sig =0.8902ci =-Inf 77.4593stats =tstat: 1.2312df: 199sd: 12.0605[mean(b)-tinv(0.95,199)*std(b)/(200^0.5) mean(b)+tinv(0.95,199)*std(b)/(200^0.5)] ans =74.6407 77.4593§2.2.2 偏度 format longskewness(b)%不修正的偏度系数 ans =0.27494548340412 moment(b,3)/std(b,1)^3 ans =0.27494548340412 moment(b,3)/moment(b,2)^1.5 ans =0.27494548340412(sum((b-mean(b)).^3)/200)/std(b,1)^3 ans =0.27494548340412 不修正的偏度系数:()()()2/32333//∑∑--==n x x nx x u skewness σskewness(b,0) %修正的偏度系数 ans =0.27702753367296200*(200/(199*198))*moment(b,3)/std(b)^3 ans =0.27702753367296 修正的偏度系数:()3)2(1∑⎪⎪⎭⎫ ⎝⎛---=s x x n n n skewness i 2*(1-normcdf(bs*sqrt(200/6)))ans =0.10972748638965在0.05显著性水平下,接受原假设。
为正态分布。
§2.2.5 峰度x = -6:0.1:6;y = tpdf(x,8);z = normpdf(x,0,8/6);plot(x,y,'-.',x,z,'-','linewidth',5)legend('T 分布','正态分布')图2.12 正态分布和t 分布x1 = 3.5:0.01:6;y1= tpdf(x1,8);z1= normpdf(x1,0,8/6);plot(x1,y1,'-.',x1,z1,'-','linewidth',5)legend('T分布','正态分布')图2.13 正态分布和t分布的尾部kurtosis(b)ans =3.00483762647840moment(b,4)/std(b,1)^4ans =3.00483762647840kurtosis(b,0)ans =3.03557145622493ku=kurtosis(b,0)ku =3.035571456224932*(1-normcdf((ku-3)*sqrt(200/24)))ans =0.91821222565534。