统计专业实验-实验3-多元正态总体检验
- 格式:pdf
- 大小:239.87 KB
- 文档页数:13
实验零多元正态总体检验(均值向量检验)1.实验目的:本实验讨论利用多元正态总体检验中的均值向量检验方法去判断满足多元正态分布的总体的均值是否等于预先判断的向量(单正态总体检验)或判断两个独立的、满足多元正态分布的总体的均值是否相等(双正态总体检验)。
通过该实验,能够起到如下的效果:(1) 理解多元正态总体检验中的均值向量检验方法的作用、思想、数学基础、方法和步骤;(2) 熟悉如何利用多元正态总体检验中的均值向量检验方法,提出问题、分析问题、解决问题、得出结论;(3)会调用SAS软件实现多元正态总体检验中的均值向量检验方法的各个步骤,根据计算的结果进行分析,得出正确的结论,解决实际的问题。
2.知识准备:多元正态总体检验中的均值向量检验是从判断满足多元正态分布的总体的均值是否等于预先判断的向量(单正态总体检验)或判断两个独立的、满足多元正态分布的总体的均值是否相等(双正态总体检验)。
其思想和步骤是:1.假设“需判断的总体均值等于预先判断的向量(单正态总体检验)”或“需判断的两个总体的均值相等(双正态总体检验)”;2.在该假设下,构造适当的统计量并给出其分布;3.根据观测数据算出其统计量的值;4.根据预先确定的检验水平查阅相应的分布表确定临界值和拒绝域;5.根据结果判断接受或拒绝原假设,得出结论。
(具体见书【1】第三章)3.实验内容:一、单正态总体检验:人出汗多少与人体内钠、钾含量有一定关系。
今测20名健康成年女性出汗多少(X1)、钠含量(X2)、钾含量(X3),其数据如下表1:表1 健康成年女性出汗情况的基本数据序号X1 X2 X3 序号X1 X2 X31 3.7 48.5 9.3 11 3.9 36.9 12.72 5.7 65.1 8 12 4.5 58.8 12.33 3.8 47.2 10.9 13 3.5 27.8 9.84 3.2 53.2 12 14 4.5 40.2 8.45 3.1 55.5 9.7 15 1.5 13.5 10.16 4.6 36.1 7.9 16 8.5 56.4 7.17 2.4 24.8 14 17 4.5 71.6 8.28 7.2 33.1 7.6 18 6.5 52.8 10.99 6.7 47.4 8.5 19 4.1 44.1 11.210 5.4 54.1 11.3 20 5.5 40.9 9.4利用多元正态总体检验中的单正态均值向量检验方法判断“(X1,X2,X3)的均值是否等于(4,50,10)”【1】(假设总体服从正态分布,分别取检验水平为0.05、0.01)。
多元实验报告实验一:多元正态总体的均值和方差的假设检验〔综合性实验〕实验原理:利用正态检验统计量对给定的多维数据进行正态性检验。
实验目的:〔1〕掌握单一多元正态总体均值的检验;〔2〕掌握两个多元正态总体均值向量的检验。
实验内容:单一多元正态总体均值向量的检验,有相等协差阵的两个正态总体均值向量的检验,有相等未知协差阵的两个正态总体均值向量的检验,协差阵不等的两个正态总体均值向量的检验。
实验题目:实验二:判别分析〔设计性实验〕实验原理:判别分析是判别样品所属类型的一种统计方法。
判别分析是在研究对象分成假设干类型〔或组别〕并已取得各种类型的一批样品的观测数目,在此根底上根据某些准那么建立判别式,然后对未知类型的样品进行判别分类。
本实验要求学生应用距离判别准那么〔即,对任给的一次观测,假设它与第i类的重心距离最近,就认为它来自第i类〕,对两总体和多总体情形下分别进行判别分析。
实验中需注意协方差矩阵相等时,选取线性判别函数;协方差矩阵不相等时,应选取二次判别函数。
实验目的及要求:判别分析是判别样品所属类型的一种统计方法。
本实验要求学生应用距离判别准那么〔即,对任给的一次观测,假设它与第i类的重心距离最近,就认为它来自第i类〕,对两总体和多总体情形下分别进行判别分析。
实验中需注意协方差矩阵相等时,选取线性判别函数;协方差矩阵不相等时,应选取二次判别函数。
实验题目:实验三:聚类分析〔设计性实验〕〔2课时〕实验原理:聚类分析的目的是将分类对象按一定规那么分为假设干类,这些类不是事先给定的,而是根据数据的特征确定的。
在同一类里的这些对象在某种意义上倾向于彼此相似,而在不同的类里的对象倾向于不相似。
系统聚类法是聚类分析中用的最多的一种,其根本思想是:开始将n个对象各自作为一类,并规定对象之间的距离和类与类之间的距离,然后将距离最近的两类合并成一个新类,计算新类与其它类之间的距离;重复进行两个最近类的合并,每次减少一类,直至所有的对象合并为一类。
一、实验名称多元正态分布实验二、实验目的1. 理解多元正态分布的概念及其在统计学中的应用。
2. 掌握多元正态分布的概率密度函数及其计算方法。
3. 学习使用Python进行多元正态分布的模拟与数据分析。
三、实验原理多元正态分布是描述多个随机变量联合分布的一种重要概率分布。
在多元正态分布中,每个随机变量都服从正态分布,且不同随机变量之间存在相关性。
多元正态分布的概率密度函数由均值向量、协方差矩阵以及维度决定。
四、实验过程1. 数据准备本实验采用Python编程语言进行模拟和分析。
首先,我们需要准备一个二维随机向量,其服从二元正态分布。
具体操作如下:```pythonimport numpy as np# 定义均值向量mean = [0, 0]# 定义协方差矩阵cov = [[1, 0.5], [0.5, 1]]# 生成1000组二元正态分布样本data = np.random.multivariate_normal(mean, cov, 1000)```2. 概率密度函数计算根据多元正态分布的概率密度函数,我们可以计算样本点的概率密度值。
具体操作如下:```pythonfrom scipy.stats import multivariate_normal# 计算样本点的概率密度值prob_density = multivariate_normal.pdf(data, mean, cov)```3. 数据可视化为了直观地展示多元正态分布的特征,我们可以绘制样本点的散点图。
具体操作如下:```pythonimport matplotlib.pyplot as plt# 绘制散点图plt.scatter(data[:, 0], data[:, 1], c=prob_density, cmap='viridis', alpha=0.5)plt.colorbar(label='Probability Density')plt.xlabel('X')plt.ylabel('Y')plt.title('Scatter plot of bivariate normal distribution')plt.show()```4. 协方差矩阵变化对分布的影响为了观察协方差矩阵变化对多元正态分布的影响,我们可以改变协方差矩阵中的元素。
《统计学》四篇实验报告实验一:用Excel构建指数分布、绘制指数分布图图1-2:指数分布在日常生活中极为常见,一般的电子产品寿命均服从指数分布。
在一些可靠性研究中指数分布显得尤为重要。
所以我们应该学会利用计算机分析指数分布、掌握EXPONDIST函数的应用技巧。
指数函数还有一个重要特征是无记忆性。
在此次实验中我们还学会了产生“填充数组原理”。
这对我们今后的工作学习中快捷地生成一组有规律的数组有很大的帮助。
实验二:用Excel计算置信区间一、实验目的及要求1、掌握总体均值的区间估计2、学习CONFIDENCE函数的应用技巧二、实验设备(环境)及要求1、实验软件:Excel 20072、实验数据:自选某市卫生监督部门对当地企业进行检查,随机抽取当地100家企业,平均得分95,已知当地卫生情况的标准差是30,置信水平0.5,试求当地企业得分的置信区间及置信上下限。
三、实验内容与步骤某市卫生监督部门对当地企业进行检查,随机抽取当地100家企业,平均得分95,已知当地卫生情况的标准差是30,置信水平0.5,试求当地企业得分的置信区间及置信上下限。
第1步:打开Excel2007新建一张新的Excel表;第2步:分别在A1、A2、A3、A4、A6、A7、A8输入“样本均值”“总体标准差”“样本容量”“显著性水平”“置信区间”“置信上限”“置信下限”;在B1、B2、B3、B4输入“90”“30”“100”“0.5”第3步:在B6单元格中输入“=CONFIDENCE(B4,B2,B3)”,然后按Enter键;第4步:在B7单元格中输入“=B1+B6”,然后按Enter键;第5步:同样在B8单元格中输入“=B1-B6”,然后按Enter键;计算结果如图2-1四、实验结果或数据处理图2-1:实验二:用Excel产生随机数见图3-1实验二:正态分布第1步:同均匀分布的第1步;第2步:在弹出“随机数发生器”对话框,首先在“分布”下拉列表框中选择“正态”选项,并设置“变量个数”数值为1,设置“随机数个数”数值为20,在“参数”选区中平均值、标准差分别设置数值为30和20,在“输出选项”选区中单击“输出区域”单选按钮,并设置为D2 单元格,单击“确定”按钮完成设置。
第三章 多元正态总体参数的假设检验3.1 几个重要统计量的分布一、正态变量二次型的分布1、分量独立的n 维随机向量X 的二次型设),,1)(,(~21n i N X i i =σμ,且相互独立,记⎥⎥⎥⎦⎤⎢⎢⎢⎣⎡=n X X X 1,则),(~2n n I N X σμ,其中)',,(1n μμμ =。
X 的二次型具有以下一些结论:结论1 当),,1(0n i i ==μ,12=σ时,则)(~'212n XX X ni iχξ∑===;当),,1(0n i i ==μ,12≠σ时,则)(~'122n X X χσ(或记为)(~'22n X X χσ)。
结论2 当),,1(0n i i =≠μ,X X '的分布常称为非中心2χ分布。
Def3.1.1 设n 维随机向量)0)(,(~≠μμn n I N X ,则称随机向量X X '=ξ为服从n 个自由度、非中心参数∑===ni i 12'μμμδ的2χ分布,记为)(~'),(~'22δχδχn X X n X X 或。
若时且1),0)(,(~22≠≠σμσμn n I N X ,有)(~'122δχσn X X 。
结论3 设),0(~2n n I N X σ,A 为对称矩阵,且r A rank =)(,则二次型 A A r AX X =⇔222)(~/'χσ(A 为对称幂等矩阵)。
结论4 设),(~2n n I N X σμ,'A A =,则),(~'122δχσr AX X ,其中A A A =⇔=22'1μμσδ,且)()(n r r A rank ≤=。
结论5 二次型与线性函数的独立性:设),(~2n n I N X σμ,A 为n 阶对称矩阵,B 为n m ⨯矩阵,令)(,'维随机向量为m Z BX Z AX X ==ξ,若O BA =,则AX X BX '和相互独立。