数理统计老师划重点(个人记录)
- 格式:doc
- 大小:24.50 KB
- 文档页数:1
数理统计期末重点知识期末考试重点目录5.3 统计量及其分布 (1)5.4 三大抽样分布 (2)内容概要 (2)§6.1 点估计的几种方式 (6)§ 6.2 点估计的评价标准 (11)内容概要 (11)§7.1 假设检验的基本思想 (19)内容概要 (19)§正态总体参数假设检验 (26)5.3 统计量及其分布样本方差与样本标准差 样本方差有两个,样本方差2*s 与样本无偏方差2*s2*s =n121)(-=-∑x x ni i , 112-=n s 21)(-=-∑x x ni i 。
实际中常用的是无偏样本方差2s ,这是因为:当2σ为总体方差时,总有E(2s *)=21σnn -, E(22)σ=s . 2s 的计算有如下三个公式可供选用:2s =22222()111()[][].111i i ii x x x x x nx n n n n -=-=----∑∑∑∑ 在分组样本场合,样本方差的近似计算公式为221111()[],11k ki i i i i i s f x x f x nx n n ===-=---∑∑ 1.从指数总体exp(1/θ)中抽取了40个样品,试求x 的渐进分布240(,)N θθ 2.设125,x x 是从均匀分布U(0,5)抽取的样本,试求样本均值x 的渐进分布 51,.212N ⎛⎫⎪⎝⎭3. 设x 1,, x20是从二点分布b(1,p)抽取得样本,试求样本均值x 的渐近线分布(1),20p p N p -⎛⎫ ⎪⎝⎭4.设116,,x x 是来自N ()4,8的样本,试求下列概率(1)(16)(10)P x >; (2)(1)(5)P x >.解:(1) 10(16)(16)1(10)1(10)1((10))P x P x P x >=-≤=-≤1616108110.84130.9370,0⎛-⎫⎛⎫=-Φ=-= ⎪ ⎪⎝⎭⎝⎭(2 )()()161616(1)158(5)(5)1 1.50.3308.2P x P x ⎛-⎫⎛⎫>=>=-Φ=Φ=⎡⎤ ⎪ ⎪⎣⎦⎝⎭⎝⎭5.4 三大抽样分布内容概要1. 三大抽样分布:χ2分步,F 分布,t 分布设x 1,x 2,…,x n 和y 1,y 2,…,y n 是来自标准正态分布的两个相互独立的样本,则此三个统计量的构造及其抽样分布人员下表所示2221)/)/n m n x y m x n y ++++++2)/n x n+今后正态总体参数的置信区间与假设检验大多数将基于这三大抽样分布 2. 一个重要的定理设x 1,x 2,…,x n 是来正态总体N(μ,σ2)的的样本,其样本均值与样本方差分别为∑==n i i x n x 11 和 ,)(1122∑--=x x n s i 则有(1)x 与2s 相互独立;(2)x ~)/,(2n N δμ;(3)22)1(δs n ⋅-~)1(2-n χ.3. 一些重要推论(1)设n x x ,,1 是来自正态总体),(2δμN 的样本,则有sx n t )(μ-=~)1(-n t , 其中x 为样本均值,为样本标准差.(2)设m x x ,,1 是来自),(211δμN 的样本,n y y ,,1 是来自),(222δμN 的样本,且此两样本相互独立,则有222212δδyx s s F =~)1,1(--n m F ,其中22,y x s s 分别是两个样本方差.若2221δδ=,则22y xs s F =~)1,1(--n m F .1. 在总体)4,6.7(N 中抽取容量为n 的样本,如果要求样本均值落在)6.9,6.5(内的概率不小于0.95,则至少为多少?解:样本均值x ~)4,6.7(nN ,从而按题意可建立如下不等式95.0)46.76.946.746.76.5()6.96.5(≥-<-<-=<<nnx nP x P ,即95.01)(2≥-Φn ,所以975.0)(≥Φn ,查表,975.0)96.1(=Φ,故96.1≥n 或84.3≥n ,即样本量n 至少为4.2.设n x x ,,1 是来自)25,(μN 的样本,问n 多大时才能使得95.0)1|(|≥<-μx P 成立?解:样本均值x ~)25,(nN μ,因而(||1)|210.95x P x P μ⎛⎫-<=<=Φ-≥ ⎝, 所以975.0)5(≥Φn ,96.15≥n ,这给出04.96≥n ,即n 至少为97时,上述概率不等式才成立..设161,,x x 是来自),(2δμN 的样本,经计算32.5,92==s x ,试求)6.0|(|<-μx P .解:因为)1()1(||)(22---=-n sn n x sx n δδμμ~)1(-n t ,用)(15x t 表示服从)15(t 的随机变量的分布函数,注意到t 分布是对称的,故1)0405.1(2)6.04||4()6.0|(|15-=⨯<-=<-t ss x P x P μμ. 统计软件可计算上式.譬如,使用MATLAB 软件在命令行输入tcdf(1.0405,15)则给出0.8427,直接输入2* tcdf(1.0405,15)-1则给出0.6854.这里的tcdf(x,k)就是表示自由度为可 k 的t 分布在x 处的分布函数,于是有(||0.6)20.842710.6854.P x μ-<=⨯-=3.设n x x ,,1 是来自)1,(μN 的样本,试确定最小的常数c,使得对任意的0≥μ,有α≤<P )|(|c x .解:由于)1,(~nx μN ,所以)|(|c x <P 的值依赖于μ,它是μ的函数,记为g(μ),于是))(())(()()|(|)(μμμμ--Φ---Φ=<<-P =<P =c n c n c x c c x g ,其导函数为))](())(([)('μϕμϕμ-----=c n c n n g , 其中)(x ϕ表示)1,0(N 的密度函数,由于0,0≥≥μc ,故μμ-≥--c c ,从而)),(())((μϕμϕ-≤--c n c n 这说明)(,0)('μμg g ≤为减函数,并在0=μ处取得最大值,即.1)(2)()())}(())(({m ax 0-Φ=-Φ-Φ=--Φ--Φ≥c n c n c n c n c n μμμ于是,只要,1)(2α≤-Φc n 即n u c /)0(2/)1(α+≤≤就可保证对任意的,0≥μ有.)|(|α≤<P c x 最大的常数为 ./2/)1(n u c α+=4.设21,x x 是来自),0(2σN 的样本,试求22121⎪⎪⎭⎫ ⎝⎛-+=x x x x Y 的分布.解: 由条件,),2,0(~),2,0(~221221σσN x x N x x -+故),1(~2),1(~222212221χσχσ⎪⎭⎫⎝⎛-⎪⎭⎫ ⎝⎛+x x x x 又0)()(),(212121=-=-+x Var x Var x x x x Cov ,且2121x x x x -+与服从二元正态分布,故 2121x x x x -+与独立,于是 ).1,1(~)2/)(()2/)((22122122121F x x x x x x x x Y σσ-+=⎪⎪⎭⎫ ⎝⎛-+=5.设总体为N(0,1),21,x x 为样本,试求常数k,使得.05.0)()()(221221221=⎪⎪⎭⎫ ⎝⎛>++-+P k x x x x x x 解:由上题,,1)()()(),1,1(~22122122122121Y Y x x x x x x z F x x x x Y +=++-+=⎪⎪⎭⎫ ⎝⎛-+= 由于Z 的取值与(0,1),故由题目所给要求有0<k<1,从而.05.0)1()1()(=->=>+=>kkY P k Y Y P k Z P于是,45.161)1,1(195.0==-F k k 这给出.9938.045.161145.161=+=k6.设从两个方差相等的正态总体中分别抽取容量为15,20的样本,其样本方差分别为,,2221s s 试求).2(2221>S S p 解 不妨设正太总体的方差为2σ,则有),19(~19),14(~1422222221χσχσs s 于是).19,14(~2221F s s F =利用统计软件计算可算出.0798.0)2()2(2221=>=>F P s s P 譬如,可使用MATLAB 软件计算上式:在命令行输入1-fcdf (2,14,19)则给出0.0798,这里的fcdf ),,(21k k x 就表示),(21k k 自由度为 的F 分布在x 处的分布函数。
高考数理统计知识点高考数理统计知识点统计科学既是统计工作经验的理论总结,也是指导统计工作的原则、原则和方法。
下面是编辑老师整理的统计知识点,希望能帮助你提高学习效率。
(1)随机抽样(1)能从现实生活或其他学科中提出一些有价值的统计问题。
结合具体实际问题情况,了解随机抽样的必要性和重要性。
在解决统计问题的过程中,学会用简单的随机抽样方法从整个人群中抽取样本;通过实例分析,我们可以了解分层抽样和系统抽样的方法。
数据可通过实验、查阅资料、设计问卷等方式收集。
(2)用样本估计总体。
通过实例体会分布的意义和作用。
在表示样本数据的过程中,学会列出频率分布表,画出频率分布直方图、频率折线图和茎叶图(见例1),体验它们各自的特点。
通过实例了解样本数据标准差的含义和作用,学会计算数据标准差。
根据实际问题的需要合理选取样本,从样本数据中提取基本的数字特征(如均值和标准差),并做出合理的解释。
在解决统计问题的过程中,我们会进一步理解用样本估计总体的思想,用样本的频率分布估计总体分布,用样本的基本数字特征估计总体的基本数字特征;体验样本频率分布和数字特征的随机性。
会用随机抽样的基本方法和样本估计的思想来解决一些简单的实际问题;通过对数据的分析,可以为理性决策提供一定的依据,了解统计的作用,体会统计思维与确定性思维的区别。
形成对数据处理过程的初步评价意识。
(3)变量的相关性通过收集实际问题中两个相关变量的数据制作散点图,利用散点图直观了解变量之间的相关性。
体验用不同的估计方法描述两个变量之间线性相关性的过程。
了解了X最小二乘法的思想,就可以根据线性回归方程的给定系数公式建立线性回归方程。
统计知识点已经呈现在考生面前。
希望同学们认真阅读和学习,更多精彩的事情将在高考频道上演!。
概率论与数理统计重点笔记
概率论与数理统计是数学中的重要分支,它涉及到随机现象的
规律性和统计规律的研究。
在学习概率论与数理统计时,重点笔记
可以包括以下内容:
1. 概率论的基本概念,包括样本空间、随机事件、事件的概率、事件的运算规律等内容。
重点理解事件的概率定义、概率的性质和
概率的运算法则。
2. 随机变量及其分布,重点掌握随机变量的定义、离散随机变
量和连续随机变量的概念,以及它们的分布律、密度函数、分布函
数等。
还要重点理解常见的离散分布(如二项分布、泊松分布)和
连续分布(如正态分布、指数分布)。
3. 大数定律和中心极限定理,重点掌握大数定律和中心极限定
理的表述和应用,理解随机变量序列的收敛性质,以及大样本时样
本均值的渐近正态性质。
4. 参数估计,包括点估计和区间估计的基本概念和方法,重点
理解最大似然估计、矩估计等常用的参数估计方法。
5. 假设检验,理解假设检验的基本思想、原理和步骤,掌握显著性水平、拒绝域、接受域等相关概念,重点理解假设检验的错误类别和势函数的概念。
6. 相关性和回归分析,重点理解相关系数、回归方程、残差分析等内容,掌握相关性和回归分析的基本原理和方法。
总之,在学习概率论与数理统计的过程中,重点笔记应该围绕着基本概念、常用分布、极限定理、参数估计、假设检验和回归分析展开,全面理解这些内容并掌握其应用是十分重要的。
希望以上内容能够帮助你更好地理解概率论与数理统计。
第一章 随机事件及其概率1. 事件的关系与运算必然事件:Ω—随机试验全部结果构成的集合。
不可能事件:φ一般事件A :A φ⊂⊂Ω若A 、B 为两事件 若B A ⊂,则其蕴含:“A 发生导致B 发生”。
若φ=⋂=B A AB ,这表示A 发生时,B 必不发生,反之亦然。
若 A-B=A ,则AB=φ;若 AB=A ,则B A ⊂;若A ∪B =A ,则B ⊂A 。
若n A A A ,,21为n 个事件,由它们的运算可产生诸多新事件,如1111,,n n n i i i i i i i i A A A A ∞=====等等。
例1 事件n i i A 1=发生等于“n A A A ,,21至少有1个发生”。
2.常用概率公式(1)1)(≤≤A P O ,1)(=ΩP ,0)(=φP(2)若B A ⊂,则)()(B P A P ≤(3))()()()(AB P B P A P B A P -+=⋃;当φ=AB ,则)()()(B P A P B A P +=⋃)()()()()()()()(ABC P BC P AC P AB P C P B P A P C B A P +---++=⋃⋃(4))(1)(A P A P -=(5))()()(AB P A P B A P -=-(6)若n A A A ,,21两两互不相容,则∑===ni i n i i A P A P 11)()((7)若n A A A ,,21相互独立,则 )()()()(211n ni i A P A P A P A P ==)()()()(211n n i i A P A P A P A P ==例2 设1.0)(,4.0)(,2.0)(===AB P B P A P 则5.0)()()(1)(1)(=+--=⋃-=⋃AB P B P A P B A P B A P1.0)()()()(=-=-=AB P A P B A P B A P3.古典概型古典概型:当随机试验的结果为有限个且诸结果等可能发生时,任一事件A 的概率为的样本点个数的样本点个数Ω==A n r A P )( 例3 从五个球(其中两个白球、三个红球)中任取两球,设A :取到两个白球;B :一白一红球,求)(),(B P A P(1)无放回抽样:101)(2522==C C A P 53)(251312==C C C B P (2)有放回抽样:每次有放回的取一球,连取两次2)52()(=A P 1223()()()55P B C = [注]:若设X 为两次有放回取球中取到白球数,则X ~)52,2(B ,从而12122)521()52()2()(--===C X P A P4.条件概率(1)若0)(>B P ,则)()()(B P AB P B A P =,其中A 为任一事件。
数理统计笔记整理Studying mathematical statistics can be both challenging and rewarding. 数理统计的学习可以是具有挑战性和收获的过程。
It requires a good understanding of mathematical concepts and a solid foundation in statistics. 这需要对数学概念有很好的理解,以及扎实的统计基础。
As you delve deeper into the subject, you will discover the beauty of using mathematical tools to analyze and interpret data. 当你深入研究这一主题时,你会发现使用数学工具来分析和解释数据的美妙之处。
The ability to make sense of complex data sets and draw meaningful conclusions is a valuable skill in today's data-driven world. 在今天这个数据驱动的世界中,理解复杂数据集并得出有意义的结论的能力是一种宝贵的技能。
One of the key concepts in mathematical statistics is probability theory. 数理统计中的一个关键概念是概率论。
Probability theory deals with the likelihood of events occurring and provides a framework for understanding uncertainty. 概率论涉及事件发生的可能性,并提供了理解不确定性的框架。
By studying probability theory, you can make informed decisions based on the likelihood of different outcomes. 通过学习概率论,你可以基于不同结果发生的可能性做出明智的决策。
全面复习河南省考研数学数理统计重点梳理考研数学数理统计是河南省考研数学专业的重要科目之一,也是很多考生备考中的难点之一。
针对这一问题,本文将全面梳理河南省考研数学数理统计的重点内容,帮助考生进行有针对性的复习。
一、概率论概率论是数理统计的基础,是考研数学数理统计中的重中之重。
在概率论中,重点内容包括:随机事件及其概率、事件的运算与性质、条件概率与独立性、重要概率分布等等。
考生在复习概率论时,应注重掌握这些基础概念和性质,并能够熟练运用到解题中。
二、数理统计1. 抽样与统计量在数理统计中,抽样与统计量是一个重要的概念。
考生需要了解抽样的基本原理和方法,并熟悉各种常用统计量的定义和性质。
此外,还需要复习样本分布与抽样分布的相关知识,以及大数定律和中心极限定理等。
2. 参数估计参数估计是数理统计中的核心内容之一,也是考研数学数理统计考试经常出现的题型。
在参数估计中,重点内容包括:点估计与区间估计、最大似然估计法、矩估计法等。
考生需要了解这些估计方法的基本原理和步骤,并掌握如何应用到实际问题中。
3. 假设检验假设检验是数理统计中非常重要的一部分内容,也是考研数学数理统计中的难点之一。
在假设检验中,考生需要了解假设检验的基本原理和步骤,以及常用的假设检验方法。
同时,还需要掌握如何进行假设检验的决策与结论,并能够正确解读检验结果。
4. 方差分析方差分析是数理统计中的一个重要内容,用于研究不同因素对统计指标的影响。
在方差分析中,考生需要了解单因素方差分析和多因素方差分析的基本原理和步骤,并能够应用到实际问题中。
三、线性回归与相关分析线性回归与相关分析是数理统计的重点之一,也是考研数学数理统计中常考的题型。
在线性回归与相关分析中,考生需要了解回归分析和相关分析的基本原理和方法,包括简单线性回归和多元线性回归等。
同时,考生还需要能够运用这些方法进行实际问题的分析和解决。
四、时间序列分析时间序列分析是数理统计中的一部分,用于研究时间序列数据的规律和趋势。
概率论与数理统计是经管类各专业的基础课,概率论研究随机现象的统计规律性,它是本课程的理论基础,数理统计则从应用角度研究如何处理随机数据,建立有效的统计方法,进行统计推断。
概率论包括随机事件及其概率、随机变量及其概率分布、多维随机变量及其概率分布、随机变量的数字特征及大数定律和中心极限定理。
共五章,重点第一、二章,数理统计包括样本与统计量,参数估计和假设检验、回归分析。
重点是参数估计。
预备知识(一)加法原则引例一,从北京到上海的方法有两类:第一类坐火车,若北京到上海有早、中、晚三班火车分别记作火1、火2、火3,则坐火车的方法有3种;第二类坐飞机,若北京到上海的飞机有早、晚二班飞机,分别记作飞1、飞2。
问北京到上海的交通方法共有多少种。
【答疑编号:10000101针对该题提问】解:从北京到上海的交通方法共有火1、火2、火3、飞1、飞2共5种。
它是由第一类的3种方法与第二类的2种方法相加而成。
一般地有下面的加法原则:办一件事,有m类办法,其中:第一类办法中有n1种方法;第二类办法中有n2种方法;……第m类办法中有n m种方法;则办这件事共有种方法。
(二)乘法原则引例二,从北京经天津到上海,需分两步到达。
第一步从北京到天津的汽车有早、中、晚三班,记作汽1、汽2、汽3第二步从天津到上海的飞机有早、晚二班,记作飞1、飞2问从北京经天津到上海的交通方法有多少种?【答疑编号:10000102针对该题提问】解:从北京经天津到上海的交通方法共有:①汽1飞1,②汽1飞2,③汽2飞1,④汽2飞2,⑤汽3飞1,⑥汽3飞2。
共6种,它是由第一步由北京到天津的3种方法与第二步由天津到上海的2种方法相乘3×2=6生成。
一般地有下面的乘法原则:办一件事,需分m个步骤进行,其中:第一步骤的方法有n1种;第二步骤的方法有n2种;……第m步骤的方法有n m种;则办这件事共有种方法。
(三)排列(数):从n个不同的元素中,任取其中m个排成与顺序有关的一排的方法数叫排列数,记作或。
数理统计考试点汇总第一章数理统计的基本概念统计的基本概念、基本思想;常见统计量;经验分布函数;三大分布,定义会判别;正态总体下的抽样分布。
第二章参数估计概念、涵义;点估计、矩估计、极大似然估计(会求);无偏性、有效性、一致性;最小偏差无偏估计量(会证明);区间估计的含义。
第三章假设检验基本原理:小概率事件在一次试验中不发生;基本概念:原假设、备责假设;假设检验中易犯的两类错误、含义;正态总体下的···检验,非参数假设检验,差方和优度检验,秩和检验(了解),卡方列联表检验,总之是一大波各种公式,不过还是要记。
(1)假设检验,重点看单个正态总体,方差已知的U检验;如假设检验,你只需记住U检验公式就可以了,其它的不用记其它:1. 至少要回双因素方差分析2. 方差分析的假设条件方差分析只看有交互作用的双因素方差分析,其它的不用正交设计肯定考极差分析,非常简单的计算(2)方差分析,考核有交互作用的双因素方差分析;(3)正交设计,极差分析法;(4)列联表计算;(5)回归分析(要考不知道怎么考)(6)参数估计会证明最小方差无偏估计量;注:没有听清楚老师对正交实验设计和回归分析说了什么。
题型:选择、填空、计算、证明(最小偏差无偏估计),不能用计算器。
Excel表题目的考点:1. 指出因变量和自变量;2. 写出回归方程;3. 分析回归方程的拟合优度;4. 对回归线性模型进行显著性检验,方差分析。
貌似有一个题是和这个excel表有关(大题)每一章都会出一个大题老师可能会抠掉表格里的内容让我们填还有什么经验分布公式还有证明题,好像是最小方差无偏估计选择,填空,计算,证明数理统计重点:1、每章都有大题。
2、我根据老师讲的和自己领会的大题有:(1)假设检验,重点看单个正态总体,方差已知的U检验;(2)方差分析,考核有交互作用的双因素方差分析;(3)正交设计,极差分析法;(4)列联表计算;(5)回归分析(要考不知道怎么考)(6)参数估计会证明最小方差无偏估计量;我知道的就这些了,题型,填空、选择、证明计算;还有就是树立统计老师不会让学生不过的!如假设检验,你只需记住U检验公式就可以了,其它的不用记方差分析只看有交互作用的双因素方差分析,其它的不用正交设计肯定考极差分析,非常简单的计算。
山东省考研数学复习资料数理统计学重点知识点总结一、概述数理统计学是一门研究如何收集、处理和分析数据以及进行概率推断的学科。
在山东省考研数学复习中,数理统计学是一个重要的考试科目。
本文将总结数理统计学的重点知识点,帮助考生更好地备考。
二、数据的分类1. 定性数据和定量数据定性数据是描述性质或特征的数据,如性别、民族等;定量数据是用数字表示某种度量或计数的数据,如身高、体重等。
2. 离散数据和连续数据离散数据是在一定区间内取有限个数值的数据,如家庭人口数;连续数据是在一定区间内可以取得无穷多个数值的数据,如身高、体重等。
三、描述统计量1. 均值均值是一组数据所有观测值之和除以观测值的个数,用来表示数据的集中趋势。
2. 中位数中位数是将一组数据按大小排列后,位于中间位置的观测值,用来表示数据的中心位置。
3. 众数众数是一组数据中出现次数最多的观测值,用来表示数据的集中趋势。
4. 极差极差是一组数据中最大值与最小值之差,用来表示数据的离散程度。
5. 方差和标准差方差是一组数据离均差平方的平均数,用来表示数据的离散程度;标准差是方差的平方根。
四、概率论基础1. 随机试验和样本空间随机试验是能够在相同的条件下重复进行,每次结果不确定的试验;样本空间是随机试验所有可能结果的集合。
2. 事件和事件的概率事件是在一次试验中可能发生的结果,事件的概率是指该事件发生的可能性大小。
3. 随机变量和概率分布随机变量是取值不确定的变量,可以分为离散随机变量和连续随机变量;概率分布是随机变量各取值的概率。
五、常见概率分布1. 二项分布二项分布是指在n次独立重复试验中,成功的次数符合一定的概率分布。
常用于二分类、成功与失败等情况。
2. 正态分布正态分布是指以均值为中心,标准差为单位,呈钟形对称分布的概率分布。
在实际应用中,许多自然现象与人类行为都符合正态分布。
3. 泊松分布泊松分布是一种用于计算单位时间(或单位空间)内事件发生次数的概率分布,适用于稀有事件发生的情况。
统计重点知识点总结1. 概率概率是统计学中的核心概念之一,它描述了一个随机事件发生的可能性。
在统计学中,概率通常用来描述随机变量的分布,以及在给定条件下事件发生的概率。
在概率理论中,有许多重要的概念需要掌握,包括事件、样本空间、概率分布、条件概率、独立性等。
了解这些概念对于理解统计推断和数据分析非常重要。
2. 抽样在统计学中,抽样是指从总体中选择一个样本的过程。
抽样的目的是通过对样本进行观察和分析来推断总体的特征。
在抽样理论中,有许多重要的知识点需要掌握,包括简单随机抽样、分层抽样、系统抽样、多阶段抽样等。
了解这些抽样方法以及它们的优缺点对于进行有效的数据收集和分析非常重要。
3. 统计推断统计推断是指从样本中获得总体的信息的过程。
在统计学中,有两种重要的推断方法,包括参数估计和假设检验。
参数估计是指根据样本数据推断总体参数的过程,常用的方法包括点估计和区间估计。
假设检验是指通过对样本数据进行统计检验来对总体假设进行推断的过程,常用的方法包括t检验、F检验、卡方检验等。
4. 回归分析回归分析是统计学中常用的数据分析方法之一,它用来研究自变量和因变量之间的关系。
在回归分析中,有许多重要的知识点需要掌握,包括线性回归、非线性回归、多元回归、逻辑回归等。
了解这些回归方法以及它们的应用条件对于进行有效的数据建模和预测非常重要。
5. 统计软件在实际数据分析中,统计软件是必不可少的工具。
目前市面上有许多统计软件可供选择,包括R、Python、SPSS、SAS等。
掌握统计软件的基本操作和高级功能对于进行有效的数据分析非常重要。
同时,熟练掌握统计软件可以提高数据分析的效率和准确性。
总而言之,统计学是一门非常重要的学科,它对于许多领域的研究和实践都具有重要的意义。
掌握统计学的重要知识点可以帮助我们更好地理解和分析数据,从而做出更加准确和有效的决策。
希望本文的总结能够帮助读者更好地了解统计学的核心知识点,提高数据分析的能力和水平。
第一章 概率论的基本概念1 随机试验1.对随机现象的观察、记录、试验统称为随机试验.2.随机试验E 的所有结果构成的集合称为E 的样本空间,记为{}S e =, 称S 中的元素e 为基本事件或样本点.3.可以在相同的条件下进行相同的实验;每次实验的可能结果不止一个,并且能事先明确试验的所有可能结果;进行一次试验之前不能确定哪一个结果会实现.2.样本空间、随机事件1.对于随机试验,尽管在每次试验之前不能预知试验结果,但试验的所有可能结果组成的集合是已知的.我们将随机试验E 的所有可能结果组成的集合称为E 的样本空间,记为S 样本空间的元素,即E 的每个结果称为样本点.2.一般我们称S 的子集A 为E 的随机事件A ,当且仅当A 所包含的一个样本点发生称事件A 发生.如果将S 亦视作事件,则每次试验S 总是发生,故又称S 为必然事件。
为方便起见,记φ为不可能事件,φ不包含任何样本点.3.若A B ⊂,则称事件B 包含事件A ,这指的是事件A 发生必导致事件的发生。
若A B ⊂且B A ⊂,即A B =,则称事件A 与事件B 相等.4.和事件{}AB x x A x A A B =∈∈或:与至少有一发生.5.当AB φ=时,称事件A 与B 不相容的,或互斥的.这指事件A 与事件B 不能同时发生.基本事件是两两互不相容的.,{,{,,A A S A A SA A AB AA AB ===∅=∅的逆事件记为若则称互逆,互斥.6.,A B A B A B AB 当且仅当同时发生时,事件发生.也记作.,A B A B A B AB 当且仅当同时发生时,事件发生,也记作.7. 事件 A 的对立事件:设 A 表示事件 “A 出现”, 则“事件 A 不出现”称为事件 A 的对立事件或逆事件. 事件间的运算规律:,,, A B C 设为事件则有,A B B A AB BA ==(1)交换律:()(),A B C A B C =(2)结合律:()()AB C A BC = ()()()A B C A C B C ACBC ==(3)分配律:,de Morgan AB AB AB AB ==(4)律:3.频率和概率1.记()An n f A n=()A n A f A A n --其中n 发生的次数(频数);n 总试验次数.称为在这次试验中发生的频率.频率 反映了事件A 发生的频繁程度. 2.频率的性质:10()12()1n n kkf A f S ≤≤=。
1.学习统计学都要掌握哪些知识点我是厦门大学一名大二的学生,在修WISE(厦门大学王亚南经济学院)的统计双学位,希望我的回答能帮助到你。
与其说学统计需要学习哪些知识点,不如说说统计在本科阶段主要涵盖了哪些课程吧。
必须要说明的是,此处谈论的是统计(经济)而非统计(数学)。
前者与经济金融的关系更加紧密,是放在经济学院的,后者更加学术,是放在数学学院的。
本校的统计双学位课程主要有商务沟通与文化交流,经济学原理,概率论,数理统计,金融经济学/资产定价,随机过程,计算数据分析——使用统计软件,时间序列分析,微观经济学及其应用,回归分析,保险与精算,应用金融计量,多元统计分析,数据挖掘,金融衍生品分析,属性数据分析,金融风险管理,数理金融学,公司金融,实验设计与方差分析。
以上学科一部分是选修,一部分是必修,按照时间先后排序。
可以看出来,因为经济学院的原因,里面很多选修课程都与经济关系相当之大,事实上,很多经济学科就是需要运用到统计的知识。
必修的基础课程莫过于概率论和数理统计两门,别的理工学科4个课时上完的概率论与数理统计,统计学的孩子们要花两个学期各4个课时。
主要涵盖了概率论(各种概型与分布),抽样分布,参数估计,假设检验等等。
希望我的回答能够对你有所帮助。
2.概率论与数理统计复习提纲及常用公式,跪求概率论与数理统计复习提纲一,事件的运算如果A,B,C为三事件,则A+B+C为至少一次发生,ABC为同时发生,AB+BC+AC为至少两次发生,为恰有两次发生.为恰有一次发生,等等,要善于将语言翻译成事件运算公式以及将公式翻译成语言..如果A,B为对立事件,则,因此,二,加法法则如A与B互不相容,则P(A+B)=P(A)+P(B) 而对于任给的A与B有P(A+B)=P(A)+P(B)-P(AB) (1) 因此, P(A+B),P(A),P(B),P(AB)这四个概率只要知道三个,剩下一个就能够求出来.因将B分解为AB与两个互不相容事件,则(2)将这两个式子分别代入到(1)式,可以得因此P(A+B),P(A)及这三个概率只要知道两个,剩下那个就能求出来,同样,P(A+B),P(B)及只要知道两个,剩下那个就能求出来.例如,在已知P(A+B),A与B只有一件发生的概率为由(2)式可知因此A与B只有一件发生的概率为三,全概率公式和贝叶斯公式设A1,A2,…,构成完备事件组,则任给事件B有(全概率公式),及(贝叶斯公式)其中,最常用的完备事件组,就是一个事件A与它的逆,即任给事件A,B有通常是将试验想象为分为两步做,第一步的结果将导致A或者之一发生,而这将影响到第二步的结果的事件B是否发生的概率. 如果是已知第一步的各事件概率及第一步各事件发生条件下第二步事件B发生的概率,并要求B发生的概率,就用全概率公式. 而如果是要求在第二步事件B已经发生条件下第一步各事件的概率,就用贝叶斯公式.四,随机变量及分布 1. 离散型随机变量一元: P(ξ=xk)=pk (k=1,2,…),二元:P{ξ=xk,η=yj)=pij (i,j=1,2,…) 边缘分布与联合分布的关系:要注意二元随机变量的函数的计算中,要合并计算后的值有重合的情况.2. 连续型随机变量,,性质:分布函数为,且有如ξ~φ(x),η=f(ξ),则求η的概率密度函数的办法,是先求η的分布函数Fη(x),,然后对Fη(x)求导即得η的概率密度函数.五,随机变量的数字特征数学期望:离散型:连续型:方差:离散型:先计算,则连续型:先计算则六,几种常用的分布二项分布ξ~B(n,p)是指 . 它描述了贝努里独立试验概型中,事件A发生k次的概率. 试验可以同时进行,也可以依次进行. 均匀分布ξ服从[a,b]上的均匀分布,是指如ξ服从[0,1]上的均匀分布,η=kξ+c,则η服从[c, k+c]上的均匀分布.七,无偏估计对参数的估计是无偏估计,是指,一般来讲,是Eξ的无偏估计,而S2是Dξ的无偏估计. 但是,在是的无偏估计时,不能肯定f( )是f( )的无偏估计,须另作分析.八,最大似然估计对于n个样本值x1,x2,…,xn 如总体ξ为连续型随机变量,ξ~φ(x;θ),则似然函数而如总体ξ为离散型随机变量, P(ξ=xi)=p(xi;θ),则似然函数则解似然方程解得θ的最大似然估计值九,区间估计在正态总体下,即总体ξ~N(μ,σ2)时,如果σ2为已知,则,则在给定检验水平α时,查正态分布表求uα使,则置信度为1-α的置信区间为如果σ2为未知,则,其中S为样本方差的开平方(或者说测得的标准差. 查t-分布表求tα使,则置信度为1-α的置信区间为 .十,假设检验在正态总体下,即总体ξ~N(μ,σ2)时,在σ2为已知条件下,检验假设H0:μ=μ0,选取统计量,则在H0成立的条件下U~N(0,1),对于给定的检验水平α,查正态分布表确定临界值uα,使,根据样本观察值计算统计量U的值u与uα比较,如|u|>uα则否定H0,否则接收H0. 如σ2为未知,则选取统计量,在H0假设成立时T~t(n-1),对于给定的检验水平α和样本容量n,查t-分布表确定临界值tα使P(|T|>tα)=α,根据样本观察值计算统计量T的值t与tα比较,如|t|>tα则否定H0,否则接收H0. 如果是大样本情况下,t-分布接近标准正态分布,因此又可以查正态分布表。
一、名解1、小概率事件:若在一次观察或实验中某事件发生的概率很小,可以看做很可能不发生,该事件称小概率事件。
不同研究问题对小概率的要求不同,习惯上,把P≤0.05或P ≤0.01称为“小概率事件”,这种小概率事件虽然不是不可能发生,但一般认为小概率事件在一次随机试验中基本不会发生,这就是小概率原理。
2、抽样误差:由于个体差异存在造成的样本均数与样本均数之间、样本均数与总体均数之间的差异。
抽样误差是随机的、不可预知的、不可避免的,但抽样误差是有规律的可以被认识的,其大小用标准误表示,可以用适当增加样本含量来减小抽样误差。
3、同质:一个总体中包含许多个体,性质相同的事物为同质,否则称异质。
4、变异:同质事物间,各观察单位的差别。
5、标准差:反映一组数据的平均离散水平或变异程度,适用于对称分布的资料,特别对正态分布或近似正态分布的资料。
方差开平方:公式见书。
6、四分位数间距:比极差稳定,并未考虑所有变量值,常用于偏态分布资料的变异度,Q=P75-P257、均数的标准误:用于表示均数抽样误差大小的指标,反映样本均数之间的离散程度,也反映样本均数抽样误差的大小。
8、标准正态分布:正态分布经转换后变为总体均数为0,总体标准差为1的正态分布称标准正态分布。
9、均数为95%的CI值(置信区间):按一定的概率或可信度(1-a)用一个区间来估计总体参数所在的范围,这个范围称作可信度为1-a的可信区间(CI)又称置信区间,95%的可信区间中的95%是可信度,即,所求的可信区间包含总体参数的可信程度为95% 10、第一类错误:如实际情况与H0一致,仅仅由于抽烟的原因,使得假设检验的结论为拒绝原本正确的H0,导致推断结论错误,这样的错误称为~第二类错误:如实际情况和H0不一致,由于抽样原因使得假设检验的结论为不拒绝原本错误的H0,则导致了另一种推断错误,这样的错误称为~检验效能:1-b成为检验效能,即当两总体的确有差别(H0不成立),按照事先确定的检验水准a,假设检验能发现该差异(拒绝H0)的能力,1-b 也取单尾11、P值:是指H0成立从所规定的总体中随机抽样,所获得等于及大于(或等于及小于)现有样本计算获得的检验统计量值的概率。
内蒙古自治区考研统计学复习必备数理统计与应用统计重点整理统计学作为一门重要的学科,广泛应用于各个领域,对于统计学的内容的掌握,是考研的重要一环。
在考研中,数理统计与应用统计是统计学的两个重要分支,他们有着密切的联系,互为补充,相辅相成。
在本文中,将对内蒙古自治区考研统计学中数理统计与应用统计的重点内容进行整理,帮助考生更好地复习和准备考试。
一、数理统计1. 随机变量与概率分布数理统计中的随机变量是指具有随机性的变量,而概率分布则是描述随机变量的分布规律。
对于考研数理统计而言,重点内容包括离散型随机变量和连续型随机变量的概率分布,如二项分布、泊松分布、正态分布等。
考生需要掌握这些概率分布的定义、性质、特点以及相关的计算方法。
2. 多元随机变量与联合分布多元随机变量是指由多个随机变量组合而成的随机变量,它描述了随机变量之间的关系。
对于考研数理统计,需要重点掌握多元随机变量的联合分布、边缘分布和条件分布的计算方法,以及相关的性质和应用。
3. 统计量与抽样分布统计量是从样本数据中计算得到的统计指标,通过统计量可以对总体的未知参数进行推断。
常用的统计量包括样本均值、样本方差、样本相关系数等。
考生需要了解统计量的定义、计算方法、性质以及与总体参数之间的关系。
同时,还需重点掌握抽样分布的概念和常见分布的性质及应用,如t分布、F分布和卡方分布等。
4. 参数估计与假设检验参数估计是利用样本数据对总体参数进行估计,其中包括点估计和区间估计两种方法。
假设检验是用于检验总体参数是否符合某种假设的统计方法。
对于考研数理统计,考生需要掌握最大似然估计、矩估计等常用的参数估计方法,以及假设检验的基本原理、步骤和常见的检验方法。
二、应用统计1. 数据描述与可视化数据描述是将收集到的数据进行整理和总结的过程,常用的数据描述方法包括平均数、中位数、标准差等。
数据可视化是将数据以图表的形式展示出来,常见的图表包括直方图、散点图、箱线图等。
《概率论与数理统计》课程重点与难点要记第一章:随机事件及其概率题型一:古典概型1.房间里有10个人,分别佩戴从1号到10号的纪念章,任选3人记录其纪念章的号码,求最小号码为5的概率,及最大号码是5的概率。
2.设袋中有5个白球,3个黑球,从袋中随机摸取4个球,分别求出下列事件的概率: 1)采用有放回的方式摸球,则四球中至少有1个白球的概率; 2)采用无放回的方式摸球,则四球中有1个白球的概率。
3.一盒子中有10件产品,其中4件次品,每次随机地取一只进行检验, 1)求第二次检验到次品的概率; 2)求第二才次检验到次品的概率。
4.在1-2000的整数中随机的取一个数,问取到的整数既不能被6整除,又不能被8整除的概率是多少?(合理的设置事件,通过概率的性质解题也很重要) 课后习题:P16:2,3,4,5, 7,9,10,11,12,13,14 P30:8,9,10,16题型二:利用条件概率、乘法公式及事件的独立性计算事件的概率1。
3人独立去破译一个密码,他们能译出的概率分别为1/5、1/4、1/3,问能将此密码译出的概率。
2。
设口袋有2n-1只白球,2n 只黑球,一次取出n 只球,如果已知取出的球都是同一种颜色,试计算该颜色是黑色的概率。
3。
设袋中装有a 只红球,b 只白球,每次自袋中任取一只球,观察颜色后放回,并同时放入m 只与所取出的那只同色的球,连续在袋中取球四次,试求第一、第二次取到红球且第三次取到白球,第四次取到红球的概率。
课后习题:P23:1,2,3,4,6,10,11 P28:1,2,4,5,6,7,9,10,12,13题型三:全概率与贝叶斯公式1.在一个每题有4个备选答案的测验中,假设有一个选项是正确的,如果一个学生不知道问题的正确答案,他就作随机选择。
知道正确答案的学生占参加测验者的90%,试求: (1)学生回答正确的概率;(2)假如某学生回答此问题正确,那么他是随机猜出的概率。
2.一通讯通道,使用信号“0”和“1”传输信息。
概率论与数理统计各章重点知识整理第一章 概率论的基本概念一.基本概念随机试验E:(1)可以在相同的条件下重复地进行;(2)每次试验的可能结果不止一个,并且能事先明确试验的所有可能结果;(3)进行一次试验之前不能确定哪一个结果会出现.样本空间S: E 的所有可能结果组成的集合. 样本点(基本事件):E 的每个结果.随机事件(事件):样本空间S 的子集.必然事件(S):每次试验中一定发生的事件. 不可能事件(Φ):每次试验中一定不会发生的事件. 二. 事件间的关系和运算1.A ⊂B(事件B 包含事件A )事件A 发生必然导致事件B 发生.2.A ∪B(和事件)事件A 与B 至少有一个发生.3. A ∩B=AB(积事件)事件A 与B 同时发生.4. A -B(差事件)事件A 发生而B 不发生.5. AB=Φ (A 与B 互不相容或互斥)事件A 与B 不能同时发生.6. AB=Φ且A ∪B=S (A 与B 互为逆事件或对立事件)表示一次试验中A 与B 必有一个且仅有一个发生. B=A, A=B .运算规则 交换律 结合律 分配律 德•摩根律 B A B A = B A B A =三. 概率的定义与性质1.定义 对于E 的每一事件A 赋予一个实数,记为P(A),称为事件A 的概率.(1)非负性 P(A)≥0 ; (2)归一性或规范性 P(S)=1 ;(3)可列可加性 对于两两互不相容的事件A 1,A 2,…(A i A j =φ, i ≠j, i,j=1,2,…),P(A 1∪A 2∪…)=P( A 1)+P(A 2)+…2.性质(1) P(Φ) = 0 , 注意: A 为不可能事件P(A)=0 .(2)有限可加性 对于n 个两两互不相容的事件A 1,A 2,…,A n ,P(A 1∪A 2∪…∪A n )=P(A 1)+P(A 2)+…+P(A n ) (有限可加性与可列可加性合称加法定理)(3)若A ⊂B, 则P(A)≤P(B), P(B -A)=P(B)-P(A) .(4)对于任一事件A, P(A)≤1, P(A)=1-P(A) .(5)广义加法定理 对于任意二事件A,B ,P(A ∪B)=P(A)+P(B)-P(AB) .对于任意n 个事件A 1,A 2,…,A n()()()()+∑+∑-∑=≤<<≤≤<≤=n k j i k j i n j i j i n i i n A A A P A A P A P A A A P 11121 …+(-1)n-1P(A 1A 2…A n )四.等可能(古典)概型1.定义 如果试验E 满足:(1)样本空间的元素只有有限个,即S={e 1,e 2,…,e n };(2)每一个基本事件的概率相等,即P(e 1)=P(e 2)=…= P(e n ).则称试验E 所对应的概率模型为等可能(古典)概型.2.计算公式 P(A)=k / n 其中k 是A 中包含的基本事件数, n 是S 中包含的基本事件总数.五.条件概率1.定义 事件A 发生的条件下事件B 发生的条件概率P(B|A)=P(AB) / P(A) ( P(A)>0).2.乘法定理 P(AB)=P(A) P (B|A) (P(A)>0); P(AB)=P(B) P (A|B) (P(B)>0).P(A 1A 2…A n )=P(A 1)P(A 2|A 1)P(A 3|A 1A 2)…P(A n |A 1A 2…A n-1) (n ≥2, P(A 1A 2…A n-1) > 0)3. B 1,B 2,…,B n 是样本空间S 的一个划分(B i B j =φ,i ≠j,i,j=1,2,…,n, B 1∪B 2∪…∪B n =S) ,则 当P(B i )>0时,当P(A)>0, P(B i )>0时,. 六.事件的独立性1.两个事件A,B,满足P(AB) = P(A) P(B)时,称A,B 为相互独立的事件.(1)两个事件A,B 相互独立⇔ P(B)= P (B|A) .2.三个事件A,B,C 满足P(AB) =P(A) P(B), P(AC)= P(A) P(C), P(BC)= P(B) P(C),称A,B,C 三事件两两相互独立. 若再满足P(ABC) =P(A) P(B) P(C),则称A,B,C 三事件相互独立.3.n 个事件A 1,A 2,…,A n ,如果对任意k (1<k ≤n),任意1≤i 1<i 2<…<i k ≤n.有()()()()k k i i i i i i A P A P A P A A A P 2121=,则称这n 个事件A 1,A 2,…,A n 相互独立.第二章 随机变量及其概率分布一.随机变量及其分布函数1.在随机试验E 的样本空间S={e}上定义的单值实值函数X=X (e)称为随机变量.2.随机变量X 的分布函数F(x)=P{X ≤x} , x 是任意实数. 其性质为:(1)0≤F(x)≤1 ,F(-∞)=0,F(∞)=1. (2)F(x)单调不减,即若x 1<x 2 ,则 F(x 1)≤F(x 2).(3)F(x)右连续,即F(x+0)=F(x). (4)P{x 1<X≤x 2}=F(x 2)-F(x 1).二.离散型随机变量 (只能取有限个或可列无限多个值的随机变量)1.离散型随机变量的分布律 P{X= x k }= p k (k=1,2,…) 也可以列表表示. 其性质为:(1)非负性 0≤P k ≤1 ; (2)归一性 11=∑∞=k k p .2.离散型随机变量的分布函数 F(x)=∑≤xX k k P 为阶梯函数,它在x=x k (k=1,2,…)处具有跳跃点,其跳跃值为p k =P{X=x k } .3.三种重要的离散型随机变量的分布(1)X~(0-1)分布 P{X=1}= p ,P{X=0}=1–p (0<p<1) .(2)X~b(n,p)参数为n,p 的二项分布P{X=k}=()k n k p p k n --⎪⎪⎭⎫ ⎝⎛1(k=0,1,2,…,n) (0<p<1)(3))X~π(λ)参数为λ的泊松分布 P{X=k}=λλ-e k k !(k=0,1,2,…) (λ>0) 三.连续型随机变量1.定义 如果随机变量X 的分布函数F(x)可以表示成某一非负函数f(x)的积分F(x)=()dt t f x⎰∞-,-∞< x <∞,则称X 为连续型随机变量,其中f (x)称为X 的概率密度(函数).2.概率密度的性质(1)非负性 f(x)≥0 ; (2)归一性 ⎰∞∞-dx x f )(=1 ;(3) P{x 1<X ≤x 2}=⎰21)(x x dx x f ; (4)若f (x)在点x 处连续,则f (x)=F / (x) .注意:连续型随机变量X 取任一指定实数值a 的概率为零,即P{X= a}=0 .3.三种重要的连续型随机变量的分布(1)X ~U (a,b) 区间(a,b)上的均匀分布 ⎩⎨⎧=-0)(1a b x f 其它b x a << . (2)X 服从参数为θ的指数分布.()⎩⎨⎧=-0/1θθx e x f 00≤>x x 若若 (θ>0). (3)X~N (μ,σ2 )参数为μ,σ的正态分布 222)(21)(σμσπ--=x e x f -∞<x<∞, σ>0.特别, μ=0, σ2 =1时,称X 服从标准正态分布,记为X~N (0,1),其概率密度2221)(x e x -=πϕ , 标准正态分布函数 ⎰=Φ∞--x t dt e x 2221)(π , Φ(-x)=1-Φ(x) .若X ~N ((μ,σ2), 则Z=σμ-X ~N (0,1), P{x 1<X ≤x 2}=Φ(σμ-2x )-Φ(σμ-1x ).若P{Z>z α}= P{Z<-z α}= P{|Z|>z α/2}= α,则点z α,-z α, ±z α/ 2分别称为标准正态分布的上,下,双侧α分位点. 注意:Φ(z α)=1-α , z 1- α= -z α.四.随机变量X 的函数Y= g (X)的分布1.离散型随机变量的函数若g(x k ) (k=1,2,…)的值全不相等,则由上表立得Y=g(X)的分布律.若g(x k ) (k=1,2,…)的值有相等的,则应将相等的值的概率相加,才能得到Y=g(X)的分布律.2.连续型随机变量的函数若X 的概率密度为f X (x),则求其函数Y=g(X)的概率密度f Y (y)常用两种方法:(1)分布函数法 先求Y 的分布函数F Y (y)=P{Y ≤y}=P{g(X)≤y}=()()dx x f k y X k∑⎰∆其中Δk (y)是与g(X)≤y 对应的X 的可能值x 所在的区间(可能不只一个),然后对y 求导即得f Y (y)=F Y /(y) .(2)公式法 若g(x)处处可导,且恒有g /(x)>0 (或g / (x)<0 ),则Y=g (X)是连续型随机变量,其概率密度为 ()()()()⎩⎨⎧'=0y h y h f y f X Y 其它βα<<y 其中h(y)是g(x)的反函数 , α= min (g (-∞),g (∞)) β= max (g (-∞),g (∞)) .如果f (x)在有限区间[a,b]以外等于零,则 α= min (g (a),g (b)) β= max (g (a),g (b)) .第三章 二维随机变量及其概率分布一.二维随机变量与联合分布函数1.定义 若X 和Y 是定义在样本空间S 上的两个随机变量,则由它们所组成的向量(X,Y)称为二维随机向量或二维随机变量.对任意实数x,y,二元函数F(x,y)=P{X ≤x,Y ≤y}称为(X,Y)的(X 和Y 的联合)分布函数.2.分布函数的性质(1)F(x,y)分别关于x 和y 单调不减.(2)0≤F(x,y)≤1 , F(x,- ∞)=0, F(-∞,y)=0, F(-∞,-∞)=0, F(∞,∞)=1 .(3) F(x,y)关于每个变量都是右连续的,即 F(x+0,y)= F(x,y), F(x,y+0)= F(x,y) .(4)对于任意实数x 1<x 2 , y 1<y 2P{x 1<X ≤x 2 , y 1<Y ≤y 2}= F(x 2,y 2)- F(x 2,y 1)- F(x 1,y 2)+ F(x 1,y 1)二.二维离散型随机变量及其联合分布律1.定义 若随机变量(X,Y)只能取有限对或可列无限多对值(x i ,y j ) (i ,j =1,2,… )称(X,Y)为二维离散型随机变量.并称P{X= x i ,Y= y j }= p i j 为(X,Y)的联合分布律.也可列表表示.2.性质 (1)非负性 0≤p i j ≤1 .(2)归一性 ∑∑=i j ij p 1 .3. (X,Y)的(X 和Y 的联合)分布函数F(x,y)=∑∑≤≤x x y y ij i j p三.二维连续型随机变量及其联合概率密度 1.定义 如果存在非负的函数f (x,y),使对任意的x 和y,有F(x,y)=⎰⎰∞-∞-y xdudv v u f ),( 则称(X,Y)为二维连续型随机变量,称f(x,y)为(X,Y)的(X 和Y 的联合)概率密度.2.性质 (1)非负性 f (x,y)≥0 . (2)归一性 1),(=⎰⎰∞∞-∞∞-dxdy y x f . (3)若f (x,y)在点(x,y)连续,则yx y x F y x f ∂∂∂=),(),(2 (4)若G 为xoy 平面上一个区域,则⎰⎰=∈Gdxdy y x f G y x P ),(}),{(.四.边缘分布1. (X,Y)关于X 的边缘分布函数 F X (x) = P{X ≤x , Y<∞}= F (x , ∞) .(X,Y)关于Y 的边缘分布函数 F Y (y) = P{X<∞, Y ≤y}= F (∞,y)2.二维离散型随机变量(X,Y)关于X 的边缘分布律 P{X= x i }= ∑∞=1j ij p = p i · ( i =1,2,…) 归一性 11=∑∞=•i i p .关于Y 的边缘分布律 P{Y= y j }= ∑∞=1i ij p = p ·j ( j =1,2,…) 归一性 11=∑∞=•j j p .3.二维连续型随机变量(X,Y)关于X 的边缘概率密度f X (x)=⎰∞∞-dy y x f ),( 归一性1)(=⎰∞∞-dx x f X关于Y 的边缘概率密度f Y (y)=x d y x f ⎰∞∞-),( 归一性1)(=⎰∞∞-dyy f Y五.相互独立的随机变量1.定义 若对一切实数x,y,均有F(x,y)= F X (x) F Y (y) ,则称X 和Y 相互独立.2.离散型随机变量X 和Y 相互独立⇔p i j = p i ··p ·j ( i ,j =1,2,…)对一切x i ,y j 成立.3.连续型随机变量X 和Y 相互独立⇔f (x,y)=f X (x)f Y (y)对(X,Y)所有可能取值(x,y)都成立.六.条件分布1.二维离散型随机变量的条件分布定义 设(X,Y)是二维离散型随机变量,对于固定的j,若P{Y=y j }>0,则称 P{X=x i |Y=y j } 为在Y= y j 条件下随机变量X 的条件分布律.同样,对于固定的i,若P{X=x i }>0,则称P{Y=y j |X=x i } 为在X=x i 条件下随机变量Y 的条件分布律.第四章 随机变量的数字特征一.数学期望和方差的定义随机变量X离散型随机变量 连续型随机变量 分布律P{X=x i }= p i ( i =1,2,…) 概率密度f (x)数学期望(均值)E(X) ∑∞=1i i i p x (级数绝对收敛)⎰∞∞-dx x xf )((积分绝对收敛) 方差D(X)=E{[X-E(X)]2} []∑-∞=12)(i i i p X E x ⎰-∞∞-dx x f X E x )()]([2 =E(X 2)-[E(X)]2 (级数绝对收敛) (积分绝对收敛) ,}{},{jj i j j i p p y Y P y Y x X P •=====,}{},{•=====i j i i j i p p x X P y Y x X P函数数学期望E(Y)=E[g(X)] i i i p x g ∑∞=1)((级数绝对收敛) ⎰∞∞-dx x f x g )()((积分绝对收敛)标准差σ(X)=√D(X) .二.数学期望与方差的性质1. c 为为任意常数时, E(c) = c , E(cX) = cE(X) , D(c) = 0 , D (cX) = c 2 D(X) .2.X,Y 为任意随机变量时, E (X ±Y)=E(X)±E(Y) .3. X 与Y 相互独立时, E(XY)=E(X)E(Y) , D(X ±Y)=D(X)+D(Y) .4. D(X) = 0 ⇔ P{X = C}=1 ,C 为常数.三.六种重要分布的数学期望和方差 E(X) D(X)1.X~ (0-1)分布P{X=1}= p (0<p<1) p p (1- p)2.X~ b (n,p) (0<p<1) n p n p (1- p)3.X~ π(λ) λ λ4.X~ U(a,b) (a+b)/2 (b-a) 2/125.X 服从参数为θ的指数分布 θ θ26.X~ N (μ,σ2) μ σ2四.矩的概念随机变量X 的k 阶(原点)矩E(X k ) k=1,2,…随机变量X 的k 阶中心矩E{[X-E(X)] k }随机变量X 和Y 的k+l 阶混合矩E(X k Y l ) l=1,2,…随机变量X 和Y 的k+l 阶混合中心矩E{[X-E(X)] k [Y-E(Y)] l }第六章 样本和抽样分布一.基本概念总体X 即随机变量X ; 样本X 1 ,X 2 ,…,X n 是与总体同分布且相互独立的随机变量;样本值x 1 ,x 2 ,…,x n 为实数;n 是样本容量.统计量是指样本的不含任何未知参数的连续函数.如: 样本均值∑==n i i X n X 11 样本方差()∑--==n i i X X n S 12211 样本标准差S 样本k 阶矩∑==n i k i k X n A 11( k=1,2,…) 样本k 阶中心矩∑-==n i k i k X X n B 1)(1( k=1,2,…) 二.抽样分布 即统计量的分布 1.X 的分布 不论总体X 服从什么分布, E (X ) = E(X) , D (X ) = D(X) / n . 特别,若X~ N (μ,σ2 ) ,则X ~ N (μ, σ2 /n) . 2.χ2分布 (1)定义 若X ~N (0,1 ) ,则Y =∑=ni i X 12~ χ2(n)自由度为n 的χ2分布.(2)性质 ①若Y~ χ2(n),则E(Y) = n , D(Y) = 2n .②若Y 1~ χ2(n 1) Y 2~ χ2(n 2) ,则Y 1+Y 2~ χ2(n 1 + n 2).③若X~ N (μ,σ2 ), 则22)1(σS n -~ χ2(n-1),且X 与S 2相互独立.(3)分位点 若Y~ χ2(n),0< α <1 ,则满足αχχχχαααα=<>=<=>--))}(())({()}({)}({22/122/212n Y n Y P n Y P n Y P的点)()(),(),(22/122/212n n n n ααααχχχχ--和分别称为χ2分布的上、下、双侧α分位点.3. t 分布(1)定义 若X~N (0,1 ),Y~ χ2(n),且X,Y 相互独立,则t=n Y X ~t(n)自由度为n 的t 分布. (2)性质①n →∞时,t 分布的极限为标准正态分布.②X ~N (μ,σ2)时, n S X μ-~ t (n-1) . ③两个正态总体 相互独立的样本 样本均值 样本方差X~ N (μ1,σ12 ) 且σ12=σ22=σ2 X 1 ,X 2 ,…,X n1X S 12 Y~ N (μ2,σ22 ) Y 1 ,Y 2 ,…,Y n2 Y S 22则 212111)()(n n S Y X w +---μμ~ t (n 1+n 2-2) , 其中 2)1()1(212222112-+-+-=n n S n S n S w (3)分位点 若t ~ t (n) ,0 < α<1 , 则满足αααα=>=-<=>)}({)}({)}({2/n t t P n t t P n t t P 的点)(),(),(2/n t n t n t ααα±-分别称t 分布的上、下、双侧α分位点.注意: t 1- α (n) = - t α (n).4.F 分布 (1)定义 若U~χ2(n 1), V~ χ2(n 2), 且U,V 相互独立,则F =21n V n U ~F(n 1,n 2)自由度为(n 1,n 2)的F 分布.(2)性质(条件同3.(2)③) 22212221σσS S ~F(n 1-1,n 2-1)(3)分位点 若F~ F(n 1,n 2) ,0< α <1,则满足)},({)},({21121n n F F P n n F F P αα-<=>ααα=<>=-))},(()),({(212/1212/n n F F n n F F P 的点),(),(),,(),,(212/1212/21121n n F n n F n n F n n F αααα--和分别称为F 分布的上、下、双侧α分位点. 注意: .).(1),(12211n n F n n F αα=-第七章 参数估计一.点估计 总体X 的分布中有k 个待估参数θ1, θ2,…, θk .X 1 ,X 2 ,…,X n 是X 的一个样本, x 1 ,x 2 ,…,x n 是样本值.1.矩估计法先求总体矩⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111k k k k k θθθμμθθθμμθθθμμ 解此方程组,得到⎪⎩⎪⎨⎧===),,,(),,,(),,,(2121222111kk k k k μμμθθμμμθθμμμθθ ,以样本矩A l 取代总体矩μ l ( l=1,2,…,k)得到矩估计量⎪⎪⎩⎪⎪⎨⎧===∧∧∧),,,(),,,(),,,(2121222111k k k k k A A A A A A A A A θθθθθθ,若代入样本值则得到矩估计值. 2.最大似然估计法若总体分布形式(可以是分布律或概率密度)为p(x, θ1, θ2,…, θk ),称样本X 1 ,X 2 ,…,X n 的联合分布∏==ni k i k x p L 12121),,,,(),,,(θθθθθθ 为似然函数.取使似然函数达到最大值的∧∧∧k θθθ,,,21 ,称为参数θ1, θ2,…,θk 的最大似然估计值,代入样本得到最大似然估计量.若L(θ1, θ2,…, θk )关于θ1, θ2,…, θk 可微,则一般可由似然方程组 0=∂∂i L θ 或 对数似然方程组 0ln =∂∂iLθ (i =1,2,…,k) 求出最大似然估计. 3.估计量的标准(1) 无偏性 若E(∧θ)=θ,则估计量∧θ称为参数θ的无偏估计量.不论总体X 服从什么分布, E (X )= E(X) , E(S 2)=D(X), E(A k )=μk =E(X k ),即样本均值X , 样本方差S 2,样本k 阶矩A k 分别是总体均值E(X),方差D(X),总体k 阶矩μk 的无偏估计,(2)有效性 若E(∧θ1 )=E(∧θ2)= θ, 而D(∧θ1)< D(∧θ2), 则称估计量∧θ1比∧θ2有效. (3)一致性(相合性) 若n →∞时,θθP →∧,则称估计量∧θ是参数θ的相合估计量. 二.区间估计1.求参数θ的置信水平为1-α的双侧置信区间的步骤(1)寻找样本函数W=W(X 1 ,X 2 ,…,X n ,θ),其中只有一个待估参数θ未知,且其分布完全确定. (2)利用双侧α分位点找出W 的区间(a,b),使P{a<W <b}=1-α. (3)由不等式a<W<b 解出θθθ<<则区间(θθ,)为所求. 2.单个正态总体待估参数 其它参数 W 及其分布 置信区间μ σ2已知 nX σμ-~N (0,1) (2/ασz n X ±) μ σ2未知 nS X μ-~ t (n-1) )1((2/-±n t n S X α σ2 μ未知 22)1(σS n -~ χ2(n-1) ))1()1(,)1()1((22/1222/2-----n Sn n S n ααχχ 3.两个正态总体 (1)均值差μ 1-μ 2其它参数 W 及其分布 置信区间已知2221,σσ22212121)(n n Y X σσμμ+--- ~ N(0,1) )(2221212n n z Y X σσα+±-未知22221σσσ== 212111)(n n S Y X w +---μμ~t(n 1+n 2-2) )11)2((21212n n S n n t Y X w+-+±-α 其中S w 等符号的意义见第六章二. 3 (2)③.(2) μ 1,μ 2未知, W=22212221σσS S ~ F(n 1-1,n 2-1),方差比σ12/σ22的置信区间为))1,1(1,)1,1(1(212/12221212/2221----⋅-n n F S S n n F S S αα注意:对于单侧置信区间,只需将以上所列的双侧置信区间中的上(下)限中的下标α/2改为α,另外的下(上)限取为-∞ (∞)即可.。
应用数理统计重点
第一章:
1.三大分布必考
密度函数不考,但其性质要考,数字特征的性质要考(期望、方差)2.特征函数不要求背,会给出特征函数求方差和期望
重点是:性质4,5,8
第二章:
1.频率、矩估计、极大似然,必考一个
2.估计量的评优准则
3.一致最小方差无偏估计的求法要熟练掌握
完全统计量法求一致最小方差无偏估计
4.信息不等式求方差下界 P86-35
5.区间估计定义,二阶不用看
第三章:
1.正太总体下参数的检验
2.犯第一、二类错误的概率
3.u、t检验方法
4.假设检验,非参数的不要看
有可能考两个正太总体的
5.单正态总体的假设检验的5个步骤
6.似然比检验考熟悉的正态总体均值的似然比检验
第四章:
1.谈谈做大作业的体会
2.多元回归分析的性质5
3.样本的线性组合求参数
第五章:
1.单因素方差分析
2.双因素方差分析公式不记;直接求自由度的方法要熟练掌握
3.Sa、Se的期望
4.正交试验的极差分析、正交表头的设计
5.正规检验、检验方法不考
第六章:
1.不需记公式,能从一元直观合理的推广到多元
2.不考
第七章:
1.主成分析累计贡献率
第八章:。
常用的6个分布的期望、方差背下来
极大似然估计要步骤完整,考试是按照步骤算分。
第72页的公式要背下来,第106页的也要背。
第51、52页的推导要熟练掌握,后面其他证明可以同理导之。
允许带计算器,考试肯定会考第72页的计算。
考试一般没有证明题。
假设检验,问题的命题放在备择假设,等于号一定在原假设。
考试中如果碰到问题是合格不合格,则应该把合格放在原假设。
其余的情况都是把容易做到的放在原假设。
两个总体参数的检验,U检验,考试只给分布,不给拒绝域,拒绝域需要自己推导。
考试给分位数,有时候可以直接用,有时候还需要进行换算。
如果题目问的是是否有差异,则既要检验两均值是否相等,又要检验两方差是否相等,并且先检验方差。
第109页开始有考试大题,案例分析题。
皮尔逊卡方检验法的公式要背。
方差分析&回归分析是很大的理论,要求围绕一个例子把它的来龙去脉彻底搞清楚。
考试就考方差分析表4-4,给出第一列要求填写后面的,单因素方差分析表,计算过程都在方差分析表中体现出来了。
第131页各离差平方和的简化计算,考试可能给出四个相关的求和,后面的自己求。
回归分析也是考试重点。
第179页公式1-8和公式1-9要背。
一定要写出回归方程y=α+βx,y、α、β都要加上^表示估计值,x是自变量,不是随机的,不用加。
回归分析这一章也是考案例题。
要从头到尾算一次,要求能从excel输出结果中找到答案,读结果。
多因素方差分析和多元线性回归不在计算题中。
区间估计和假设检验会给一些参照的公式,特别是区间估计,完全就是带公式。
第72页的公式只给左边那一页,给72页的分布,不给73页的,自己记住或者推到。
假设检验一定要有完整步骤。
多元回归不用计算,读excel计算结果。
双因素方差分析表,出分析题(要求是完成表,另外加上判断)。
分布的检验(第3章),大题,第109页,单独考一个计算题。
请务必复习例2、例3,第113页的公式5.3,皮尔逊卡方检验的检验统计量。
整个试卷计算量都很大,计算题4、5、6都要做完整的例子。
结果、步骤均算分,都要写对才能得到全分。