应用数理统计1
- 格式:ppt
- 大小:497.50 KB
- 文档页数:45
应用数理统计学习辅导第一章 绪论数理统计:数理统计是一门对客观不确定现象进行数据搜集、整理、表列和分析的科学.其目的是了解客观情况,探索数据内在结沟及现象之间的规律性。
描述统计:对搜集的全部数据加以整理来研究这些数据的特征;推断统汁:建立在样本数据的基础上对总体的特征做出估计和推断。
数理统计学的发展大致经历了古典统计学,近代统计学和现代统计学三个阶段。
第二章 数据的搜集、整理与描述统计表最主要的内容:指标名称与指标数值。
数据集中趋势的计量:(1)均值:算术平均数、加权算术平均数(2)几何平均数(3)中位数(4)众数(5)切尾均值数据离散趋势的计量:(1)极差:又称全距。
极差是数据中最大值与最小值之差(2)四分位差(3)平均差:数据值与其均值之差的绝对值的平均数(4)方差和标准差。
方差是数据值与其均值离差平方和的平均数。
方差不仅可以向来反映均值代表性的高低,而且也是数据离散趋势的最主要的统计量特征。
(5)离散系数。
第三章 概率基础随机试验:凡是一个行动或过程会导致一系列可能的结果之一,但具体发生哪一个结果是不确定的,这种行动或过程统称为随机试验。
样本空间:随机试验所有可能结果的集合称作样本空间。
随机事件:随机试验的每一个可能的结果称为随机事件。
必然事件:必然发生的事件称为必然事件Ω记作不可能事件:必然不发生的事件称为不可能事件φ记作。
包含:如果事件A 的发生必然导致事件B 的发生.则称事件A 包含事件B ,记作A ⊂B 。
事件的并:两个事件A 、B 中至少有一个发生称为两个事件的并.记作A ∪B 。
事件的交:两个事件A 、B 同时发生称为两个事件的交,记作A ∩B 。
事件的差:事件A 发生而事件B 不发生称为两个事件的差,记作A -B 或B A 。
对立事件:样本空间与事件A 的差称为事件A 的逆事件或对立事件、互补事件。
记作A A -Ω=。
互斥事件:事件A 与事件B 不可能同时发生称为两个事件互不相容或互斥.记A ∩B=Ф。
一 填空题 1设621,,,X X X 是总体)1,0(~N X 的一个样本,26542321)()(X X X X X X Y +++++=。
当常数C = 1/3 时,CY 服从2χ分布。
2 设统计量)(~n t X ,则~2X F(1,n) ,~12X F(n,1) 。
3 设n X X X ,,,21 是总体),(~2σu N X 的一个样本,当常数C = 1/2(n-1) 时,∑-=+-=11212)(n i i i X X C S 为2σ的无偏估计。
4 设)),0(~(2σεεβαN x y ++=,),,2,1)(,(n i y x i i =为观测数据。
对于固定的0x ,则0x βα+~ ()20201,x x N x n Lxx αβσ⎛⎫⎡⎤- ⎪⎢⎥++ ⎪⎢⎥ ⎪⎢⎥⎣⎦⎝⎭。
5.设总体X 服从参数为λ的泊松分布,,2,2,, 为样本,则λ的矩估计值为ˆλ= 。
6.设总体212~(,),,,...,n X N X X X μσ为样本,μ、σ2 未知,则σ2的置信度为1-α的置信区间为 ()()()()222212211,11n S n S n n ααχχ-⎡⎤--⎢⎥⎢⎥--⎢⎥⎣⎦。
7.设X 服从二维正态),(2∑μN 分布,其中⎪⎪⎭⎫ ⎝⎛=∑⎪⎪⎭⎫⎝⎛=8221,10μ令Y =X Y Y ⎪⎪⎭⎫ ⎝⎛=⎪⎪⎭⎫ ⎝⎛202121,则Y 的分布为 ()12,02TN A A A A μ⎛⎫= ⎪⎝⎭∑ 。
8.某试验的极差分析结果如下表(设指标越大越好):表2 极差分析数据表则(1)较好工艺条件应为22121A B C D E 。
(2)方差分析中总离差平方和的自由度为 7 。
(3)上表中的第三列表示 A B ⨯交互作用 。
9.为了估计山上积雪溶化后对河流下游灌溉的影响,在山上建立观测站,测得连续10年的观测数据如下表(见表3)。
则y 关于x 的线性回归模型为 ()ˆ 2.356 1.813~0,1.611yx N εε=++ 10设总体12~(,1),,,...,n X U X X X θθ+为样本,则θ的矩估计量为 12x - ,极大似然估计量为 max{X 1,X 2,…,X n } 。
应用数理统计基础数理统计是统计学的一门重要分支,通过分析和整理数据,以及运用概率论和数理方法,来研究和解释现实世界中的各种现象和问题。
它在各个领域都有着广泛的应用,如经济学、医学、环境科学等。
本文将介绍数理统计的基础知识和一些常见的应用。
数理统计的基础概念是概率和统计量。
概率是描述事件发生的可能性的数值,统计量是通过对数据进行整理和计算得到的结果。
概率论提供了一种描述和计算随机事件发生概率的方法,统计学则通过对数据的收集和分析来推断总体的特征,并对不确定性进行估计。
数理统计的基本方法有描述统计和推断统计。
描述统计是通过对样本数据的整理和分析,来描述总体数据的特征和规律。
常见的描述统计方法有平均数、中位数、标准差等。
推断统计是通过样本数据对总体数据进行推断,如对总体均值、总体比例等进行估计和假设检验。
在实际应用中,数理统计常常用于数据的收集和分析。
例如,在市场调研中,通过对样本数据进行统计分析,可以推断总体的市场需求和消费行为。
在医学研究中,通过对患者的数据进行统计分析,可以评估治疗效果和预测疾病的风险。
在金融领域中,通过对股票价格的统计分析,可以预测市场趋势和风险。
数理统计的应用还涉及到模型的建立和参数的估计。
通过建立合适的数学模型,可以对现实世界中的问题进行描述和分析。
例如,在经济学中,通过建立经济模型,可以对市场供求关系和价格变动进行分析。
在环境科学中,通过建立气候模型,可以预测气候变化和环境污染的趋势。
数理统计还与其他学科有着密切的联系。
例如,数理统计与数据挖掘和机器学习有着紧密的关系。
数据挖掘是从大量数据中挖掘出有用的信息和模式,而机器学习则是通过机器自动学习和优化算法,来实现对数据的分析和预测。
数理统计作为一门重要的学科,具有广泛的应用领域和重要的理论基础。
它通过对数据的整理和分析,帮助人们理解和解释现实世界中的各种现象和问题。
在不同领域的应用中,数理统计为决策和预测提供了有力的支持,促进了科学和社会的发展。
教授:柳金甫1、概率论复习与补充数学共性——构造一个数学模型,引进一组有着确切定义的符号.........以及有关这些符号的运算..。
第一章 随机事件及其概率。
1.随机试验:需满足⑴相同条件下可以独立重复无数次。
⑵每次试验只有一个结果。
⑶结果的范围是已知的,但不能预测下一次结果。
ω-样本点,Ω-样本空间。
A Φ⊂⊂Ω,当A 是Ω的真子集时,A 必然发生或不发生;当A ω∈,称“A ”发生,否则称“A ”没有发生。
A 即为随机事件。
A 出现的频率=A A n n⎧⎨⎩频数(出现)总次数()()an n n f A P A n→∞−−−→令等于,从动于某个数的周围。
频率的发生具有稳定性。
例:取球 a 白,b 黑→○○○……○ A .“最后剩下了白球” B .“最后一个取到白球” 此命题A=B 。
2、古典概型n ⎧⎨⎩①结果有限()个。
②诸结果发生等可能。
①n 个座位,n 人坐。
(1)21!n n n -⋅= ②n 个座位,m 人坐。
!(1)(1)()!m n n n n n m P n m --+==-③n 个座位,m 个女同学坐,n m -个男同学坐。
!()!()!mm n n n C m n m ==-。
④n 个乒乓球分成2堆,一堆k 个,另一堆()n k -个。
mn C ⇒。
⑤n 个球分成k 堆,第一堆1r 个,第二堆2r 个,……,第k 堆k r 个。
12!!!!k n r r r ⇒{}ω基本事件。
例:n 个人圆桌而坐,则(P “甲乙相邻”)=?A 表示“甲乙相邻”,则2(2)2()1!n n P a n n ⋅⋅-==-甲的坐法乙的坐法其他人的坐法随意坐法解法2:2()1P a n =-甲乙坐好后乙的坐法甲坐好后其他(含乙)人坐法,假设甲已经坐好。
例:100个产品,有5个次品,随机抽取3个次品的概率。
325955100C C C ⋅ 3、概率的公理化系统。
①非负有界:0()1P A ≤≤ ②规定性:()1P Ω=。
<应用数理统计>实验习题二1.某切割机在正常工作时,切割每段金属棒的平均长度为10.5cm.今从一批产品中随机地抽取15段,测得其长度(单位:cm)如下10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2 10.9 10.6 10.8 10.5 10.7 10.2 10.7设金属棒长度服从正态分布,且标准差没有变化,(04.02=σ),试问(1)该机工作是否正常(05.0=α)?(2)上题中假定切割的长度服从正态分布,问该机切割的金属棒的平均长度有无显著变化(05.0=α)?(3)如果只假定切割的长度服从正态分布,问该机切割的金属棒长度的标准差有无显著变化(05.0=α)?>> clear all>>x=[10.4,10.6,10.1,10.4,10.5,10.3,10.3,10.2,10.9,10.6,10.8,10.5,10.7,10.2,10.7];>> [h,p,ci,u]=ztest(x,10.5,0.2,0.05,1)h =p =0.650710.3951 Infu =-0.3873一>> [h,p,ci,u]=ztest(x,10.5,0.2,0.05,0)h =p =0.6985ci =10.3788 10.5812-0.3873二[h,sig]=ztest(x,10.5,0.2,0.05,0)h =sig =0.6985三x=[10.4,10.6,10.1,10.4,10.5,10.3,10.3,10.2,10.9,10.6,10.8,10.5,10.7,1 0.2,10.7];>> [p,sig]=xtest(x,0.2,0.05,0)p =1sig =2.下表列出了18个5~8岁儿童的重量和体积.(1) 画出散点图;(2) 求y 关于x 的线性回归方程,ˆˆˆx b a y+=并作回归分析;。
应用数理统计基础(庄楚强)考试共8道题1、样本的数据期望与方差2、2χ分布的概念与性质3、一连续型函数(只有一个未知参数)的无偏估计4、一正态分布的置性区间5、两个未知参数函数的矩估计6、①求一离散型的总体似然估计②求未知参数的信息量③求得的似然估计是否是最小方差估计7、正态分布的假设检验8、一离散型总体的假设检验第二章、数理统计的基本概念与抽样分布第一节、数理统计的几个基本概念重点:统计量,书中例题2、习题第四题第三节、常用统计分布重点:常用统计分布(2χ、t、F)的定义及性质第四节、抽样分布重点:定理1及推论、定理4及推论本章习题4、5、7、9、13、19、20第三章、参数估计掌握:矩估计、极大似然估计、区间估计本章习题1、2、3、4、10、11、15、16、18、27、29第四、章假设检验重点:第二节、一个正态总体均值与方差的检验第三节、两个正态总体均值与方差的检验第四节、非正态总体均值的假设检验书上的例题、习题37、38、39、40第一章概率论复习与补充1、概率2、期望数据期望的性质性质1:常量的期望就是这个常量本身, 即E(c)=c.推论:E(Eξ) = Eξ性质2:随机变量ξ与常量 c 之和的数学期望等于ξ的期望与这个常量 c 的和E(ξ+c)=Eξ+c性质3:E(cξ) = cE ξ性质4:随机变量的线性函数的数学期望等于这个随机变量期望的同一线性函数E(k ξ+c)=k E ξ+c3、方差方差的性质性质1:常量的方差等于零。
即:设c为常数,则Dc = 0性质2:随机变量与常量之和的方差就等于随机变量的方差本身即:D(X+c)=DX性质3:常量与随机变量乘积的方差,等于常量的平方与随机变量方差的乘积。
即:D(cX )=c2DX性质4:设k , b为常数,则:D(kX +b)=k2DX性质5:两个独立随机变量和(差)的方差,等于这两个随机变量方差的和。
即:D(X Y ) = DX +DY第二章数理统计的基本概念与抽样分布1、统计量(第一题样本数据期望与方差)预测类似题目可能会有二项分布B(n,p)、0—1分布B(1,p)、均匀分布R[a,b]、指数分布E(λ)、正态分布N(μ,σ2)。
参数估量(温习)通过对样本的处置,对整体的未知参数(如:数学期望、方差等)作出较好的估量.一. 点估量量的求法:1. 矩法:① 参数:设)(~θξ;x F 或)(~θξ;x p Θ∈θ称为参数② 点估量: 设 n ξξξξ,,,21 → 参数θ未知则构造统计量),,,(21n T ξξξ 去估量θ称),,,(21n T ξξξ 为θ的估量量,),,,(21n x x x T 为θ的估量值, 估量量、估量值统称估量。
这种对未知参数的定值估量称为点估量θˆ 。
③ 矩法:用样本矩),,,(),,,(ˆ22llE E E f Q f Qξξξξξξ =→=总体矩 一般步骤是:设),,,(~21l x F θθθξ ;,其中 参数l θθθ,,,21 待估.(i )n ξξξξ,,,21 →,计算 lξξξ,,,2;(ii )由 kE ξ=),,,(),,,(2121l k l k f x F d x θθθθθθ =⎰+∞∞-;或∑=ii k i kp x E ξ),,,(21l k f θθθ = l k ,,2,1 =即:⎪⎪⎩⎪⎪⎨⎧===k l k l l E f E f E f ξθθθξθθθξθθθ),,,(),,,(),,,(212212211 ⎪⎪⎩⎪⎪⎨⎧===−−→−),,,(),,,(),,,(2222211l l ll l E E E E E E E E E iξξξθθξξξθθξξξθθθ 解出⎪⎪⎩⎪⎪⎨⎧∆=∆=∆=−−−→−),,,(),,,(ˆ),,,(),,,(ˆ),,,(),,,(ˆ212212222211211n l l l ln lnl E h h h k k ξξξξξξθθξξξξξξθθξξξξξξθθξξ 得换用即:有l 个估量量 ),,,(ˆ21n k kh ξξξθ = l k ,,2,1 =例:(P110)设 )(~θξ;x p =θθxe -21 )(+∞<<-∞x 0>θ,求 θˆ 。
说明:试题仅供参考哈,祝大家考试顺利~~^_^试卷一1.设x1,…,x n为取自总体x∼N(μ,σ2)的样本:(1)求μ,σ2得矩估计和极大似然估计,并说明它们是否是μ,σ2的无偏估计、一致估计;(2)求μ的置信度为1-α的置信区间。
2.设x1,…,x n和y1,…,y n分别是从N(μ1,σ2) 和N(μ2,σ2)的总体中抽取的独立随机样本:(1)如果σ2未知,对检验问题H0:cμ1+dμ2=δ↔ H1:cμ1+dμ2≠δ。
给定水平α,求检验统计量和拒绝域w;(2)如果σ2已知,对检验问题H0:cμ1+dμ2=0 ↔ H1:cμ1+dμ2=1。
给定水平α,求检验的犯两类错误的概率。
3.(1)某汽车销售商对各种颜色的汽车销售情况调查,发现红、黄、银、白、黑的销售量分别为n1,…,n5,问如何检验顾客对颜色是否有偏爱,即检验销售情况是否均匀α=0.05 ;(3)设三组小白鼠分别接种三种不同病菌的存活日分别为x i1,…,x in,i=1,2,3.设存活日数服从方差相等的正态分布。
问如何判断不同细菌对小白鼠平均存活日数的影响是否有显影响α=0.05。
4.(1)设(x 1,…,x n)为取自总体X的样本,求与的相关系数。
(2) 设x1,…,x n为取自总体x∼N(μ,σ2)的样本1≤m≤n,,,,求的分布。
5.在一元线性回归模型,ε∼N(0,σ2)中,(1)求β0,β1的置信区间。
(2)给出检验假设H0:β1=0,设检验统计量与拒绝域。
试卷二1.ξ1,ξ2取自正态分布N(a,σ2)(1)证明:ξ1+ξ2,ξ1-ξ2相互独立。
(2)若a=0,求的概率分布。
2.ξ∼N(a,σ2),a,σ2未知,ξ1,…,ξn为总体的样本,给定显著水平α,求下列假设检验问题的检验统计量的拒绝域。
(1) H0:a=a0↔ H A:a≠a0(2) H0:σ2=σ20↔ H A:σ2>σ203.设总体ξ的密度函数样本为ξ1,…,ξn,求θ的矩估计以及极大似然估计量。