06参数估计基础
- 格式:ppt
- 大小:3.09 MB
- 文档页数:66
一、选择题1.当样本含量增大时,以下说法正确的是()A. 标准差会变小B. 样均数标准误会变小C. 均数标准误会变大D.标准差会变大E. 以上都不对2.区间X 2.58S的含义是()xA.99%的总体均数在此范围内B.样本均数的99%可信区间C.99%的样本均数在此范围内D.总体均数的99%可信区间E. 以上都不对3.通常可采用以下那种方法来减小抽样误差()A.减小样本标准差B.减小样本量C.扩大样本量 D. 增大样本标准差E.以上都不对4.一项雌激素与子宫内膜癌关系的配对病例对照研究,共63对。
病例组与对照组两组均有雌激素暴露史者27对,两组均无暴露史者4对,病例组有暴露史而对照组无暴露史者29对,其余为对照组有暴露史而病例组无暴露史者。
暴露于雌激素的相对危险度为()A.10.67 B.9.67 C.2.24 D.1.24 E. 以上都不对二、计算分析题1.测得某地10名正常人和10名病毒性肝炎患者血清转铁蛋白(g/L)的含量,结果如下,试估计:①该地正常人和病毒性肝炎患者血清转铁蛋白总体均数的95%可信区间;②该地正常人和病毒性肝炎患者血清转铁蛋白总体均数之差的95%可信区间。
正常人 2.65 2.72 2.85 2.91 2.55 2.76 2.82 2.69 2.64 2.73 病毒性肝炎患者 2.36 2.15 2.52 2.25 2.28 2.31 2.53 2.19 2.34 2.312.为了解阴道分娩与剖腹产产后出血率的高低,某产院抽查了阴道分娩318人,剖腹产169人,资料如下。
试估计该产院阴道分娩与剖腹产产后出血率之差的95%可信区间。
不同生产方式的出血情况生产方式 总例数 出血例数 出血率(%)阴道分娩 318 68 21.38 剖腹产1692414.203.某项关于孕妇孕期风疹病毒感染与新生儿先天性畸形关系的队列研究结果如下。
试估计暴露者的相对危险度并推断总体相对危险度的95%可信区间。
113第六章 参数估计一、 知识点1. 点估计的基本概念2. 点估计的常用方法(1) 矩估计法① 基本思想:以样本矩作为相应的总体矩的估计,以样本矩的函数作为相应的总体矩的同一函数的估计。
(2) 极大似然估计法设总体X 的分布形式已知,其中),,,(21k θθθθΛ=为未知参数,),,(21n X X X Λ为简单随机样本,相应的),,,(21n x x x Λ为它的一组观测值.极大似然估计法的步骤如下:① 按总体X 的分布律或概率密度写出似然函数∏==ni i n x p x x x L 121);();,,,(θθΛ (离散型)∏==ni i n x f x x x L 121);();,,,(θθΛ (连续型)若有),,,(ˆ21nx x x Λθ使得);,,,(max )ˆ;,,,(2121θθθn n x x x L x x x L ΛΛΘ∈=,则称这个θˆ为参数θ的极大似然估计值。
称统计量),,,(ˆ21nX X X Λθ为参数θ的极大似然估计量。
② 通常似然函数是l θ的可微函数,利用高等数学知识在k θθθ,,,21Λ可能的取值范围内求出参数的极大似然估计k l x x x nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 将i x 换成i X 得到相应的极大似然估计量k l X X X nl l ,,2,1),,,,(ˆˆ21ΛΛ==θθ 注:当);,,,(21θn x x x L Λ不可微时,求似然函数的最大值要从定义出发。
3. 估计量的评选标准(1) 无偏性:设),,(ˆˆ21nX X X Λθθ=是参数θ的估计量,如果θθ=)ˆ(E ,则称θˆ为θ的无偏估计量。
(2) 有效性:设1ˆθ,2ˆθ是θ的两个无偏估计,如果)ˆ()ˆ(21θθD D ≤,则称1ˆθ较2ˆθ更有效。
4. 区间估计114 (1) 定义 设总体X 的分布函数族为{}Θ∈θθ),;(x F .对于给定值)10(<<αα,如果有两个统计量),,(ˆˆ111n X X Λθθ=和),,(ˆˆ122n X X Λθθ=,使得{}αθθθ-≥<<1ˆˆ21P 对一切Θ∈θ成立,则称随机区间)ˆ,ˆ(21θθ是θ的双侧α-1置信区间,称α-1为置信度;分别称1ˆθ和2ˆθ为双侧置信下限和双侧置信上限. (2) 单侧置信区间(3) 一个正态总体下未知参数的双侧置信区间(置信度为α-1)二、 习题 1. 选择题(1) 设n X X X ,,,21Λ是来自总体X 的一个样本,则以下统计量①)(211n X X + ②)2(14321n X X X X X n ++++-Λ ③)2332(101121n n X X X X +++-作为总体均值μ的估计量,其中是μ的无偏估计的个数是A.0B.1C.2D.3(2) 设321,,X X X 是来自正态总体)1,(μN 的样本,现有μ的三个无偏估计量321332123211216131ˆ;1254131ˆ;2110351ˆX X X X X X X X X ++=++=++=μμμ其中方差最小的估计量是A.1ˆμB.2ˆμC. 3ˆμD.以上都不是 (3) 设0,1,0,1,1为来自0-1分布总体B(1,p)的样本观察值,则p 的矩估计值为 。
【数理统计基础】06-相关分析和⽅差分析1. 相关分析1.1 相关系数 在⼀堆变量中,找到并分析它们之间的关系,是复杂环境和模型中的重要任务。
由于线性关系的特殊、常见和简单,数学上往往采⽤线性关系来逼近实际关系。
上篇的线性回归以及概率论中的线性回归,更关注的是线性函数的参数估计。
如果想单纯地度量随机变量的线性关系,直接讨论相关系数即可,请先复习斜⽅差的相关概念。
两个变量之间的线性关系,就是之前学过的协⽅差的概念\text{Cov}(X,Y)。
在得到n个样本(X_i,Y_i)后,容易得到式(1)的⽆偏估计,注意其中降低了⼀个⾃由度,继⽽还可以有式(2)的样本相关系数。
相关系数是线性关系的直接度量,它可以作为相关假设的检验条件,最常⽤的就是当|r|\leqslant C时认为X,Y是不相关的。
\dfrac{1}{n-1}\sum_{i=1}^n(X_i-\bar{X})(Y_i-\bar{Y})\approx\text{Cov}(X,Y)\tag{1}r=\dfrac{1}{S_XS_Y}\sum_{i=1}^n(X_i-\bar{X})(Y_i-\bar{Y}),\;\;S_X^2=\sum_{i=1}^n(X_i-\bar{X})^2\tag{2} 为了能找到关于r的枢轴变量,这⾥还是要做⼀些假设,即(X,Y)是⼀个⼆元正态分布。
回顾⼆元正态分布的知识(《初等概率论》第5篇公式(27)),可知X,Y完全符合⼀元线性回归的模型。
为此这⾥暂且取定X_i,⽽把Y_i看成随机变量,并对它们进⾏⼀元回归分析。
⽐较发现系数估计满⾜\alpha_1=r\cdot\dfrac{S_Y}{S_X},在假设\rho=0(即系数a_1=0)的情况下,把这个等式代⼊上篇公式(12)右的枢轴变量,整理后得到式(3)。
由于该结论与X_i的取值⽆关,因此它对于变量X_i也成⽴,它就是我们要找的枢轴变量。
\dfrac{r\sqrt{n-2}}{\sqrt{1-r^2}}\sim t_{n-2}\tag{3}1.2 复相关系数 相关系数度量了两个随机变量之间的线性关系,当系统中的变量很多时,关系也会变得复杂,这时需要引⼊更多的关系分析。
第六章参数估计6.1以每天每千克体重52 μmol 5-羟色胺处理家兔14天后,对血液中血清素含量的影响如下表[9]:y/(μg · L-1)s/(μg · L-1)n对照组 4.20 0.35 125-羟色胺处理组8.49 0.37 9建立对照组和5-羟色胺处理组平均数差的0.95置信限。
答:程序如下:options nodate;data common;alpha=0.05;input n1 m1 s1 n2 m2 s2;dfa=n1-1; dfb=n2-1;vara=s1**2; varb=s2**2;if vara>varb then F=vara/varb;else F=varb/vara;if vara>varb then Futailp=1-probf(F,dfa,dfb);else Futailp=1-probf(F,dfb,dfa);df=n1+n2-2;t=tinv(1-alpha/2,df);d=abs(m1-m2);lcldmseq=d-t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2));ucldmseq=d+t*sqrt(((dfa*vara+dfb*varb)/(dfa+dfb))*(1/n1+1/n2));k=vara/n1/(vara/n1+varb/n2);df0=1/(k**2/dfa+(1-K)**2/dfb);t0=tinv(1-alpha/2,df0);lcldmsun=d-t0*sqrt(vara/n1+varb/n2);ucldmsun=d+t0*sqrt(vara/n1+varb/n2);cards;12 4.20 0.35 9 8.49 0.37;proc print;id f;var Futailp alpha lcldmseq ucldmseq lcldmsun ucldmsun;title1 'Confidence Limits on the Difference of Means';title2 'for Non-Primal Data';run;结果见下表:Confidence Limits on the Difference of Meansfor Non-Primal DataF FUTAILP ALPHA LCLDMSEQ UCLDMSEQ LCLDMSUN UCLDMSUN1.11755 0.42066 0.05 3.95907 4.62093 3.95336 4.62664首先,方差是具齐性的。