抽样技术课后习题参考答案金勇进
- 格式:docx
- 大小:410.44 KB
- 文档页数:27
抽样技术课后习题答案第⼆章习题2.1判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11∑==ni iy n y 11性质1.期望()()()()Y C P E NN C N C ===∑∑==n n1i n i 1i i i 1y y y2.⽅差()()()[]()iiP y E y y V n N21∑=-==()()[]n NC i iiC y E y n N121∑=- ()21S nf -=1.期望()??=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]µµ==n n12.⽅差()[]2µ-=i y E y V211-=∑=n i i y n E µ()ny n 122i σµ=-=E2.3为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y 9.5(千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
第2章2.1 M: (I)这种抽样方法是等機率的・在毎次抽取川本敢尤时.冊未被抽中的编号为1〜64的这兰单元中毎一个m兀被抽刮的槪率都足亠.100(2)这种抽杆方法不艮等嵐略的.利用这种方法.任每次抽収样本恥尤时.尚未被抽中的編号为1-35 U及编号为64的这36个嘏元中毎个敏元的入—.而尚木被捕中的编号为36~63的毎100个唯元的入样執丰祁足丄•100(3)这艸抽样方法是零怨率的.在邰次抽取样木单元时.尚未被抽中的编号为20 000〜21 000中的毎个服元的入样駅率都是詁亦・所以这种抽祥是等槪率的・2.2 W:2.3解:许先(Ail i^iUKKH用电凰的95%的KWK何.根撫中心极RI定理可知.在大样本的条件卜.[升和讣卩药]=[升1・96 皿灯+ 1・96风可•向叫亍)=上上$2中总体的方差S ,是未知的.用样本方差 /来代fh ?¥(SkM 为由聽盘知道.y = 9.5,52= 206 •而且样木址为“ = 300,N = 50 000・代入对以求刁严6)= 乎/二上驾铲°°°x206 = 0.682 5 •将它幻代入上面的式「町能该山居民日用电虽的95%置信区何为[7.880 8,11.119 2].下一步汁舒样木址.绝対谋船Bid和郴対的关系为d = Fp ・ 根区何的求解方注町卸把y = 9.5,s 2= 206.r = 10%,AT = 50 000 代入上式町阳.H = 861.75 ^862 .所以杆木 18至少为2.4 解:总体中套加培训班的比例为P.强么这次简眾閤机抽样紂到的P 的估计ffip 的方溢 1-f N “、 n-PP(l-P)・利用中心极国迷理可得+—在人杆木的条件F 近似眼从标准正念分布.V 的l-a=95%的B!怙区何为v-r> 1 —a根据正念分布的分位数町以知适P庄和g中.样木盘足够大.从m何typ的1-0=95%的置伉区何为]卩・讣卩莎P+Z^JF⑹卜丽这眼的叫P)是未妹的.我们便用它的估计(ftr(p)=v(p)=^p(l-p)=9.652xl0-\所以总体比例P的l-a = 95%的置仃区何可以写为["-二呻庶门“ +兀喘応孑}将p = O.35^ = 2OO.y = IOOOO代入町得K信区何为〔0.284 4.0.4156].2.5解:利用衍到的样木.计ma样本均值为歹=2 890/20 = 144.5.从ifiH占计小区的平均文化支出为144.5 7U.总体均(ftV的l-a = 95%的迓仃区何为卩-二皿灰冰歹匕曲丁^药]用二乎,来估计样本均值的方筮卩@)・计算斜到F =826.025 6,则卩(刃=匕上T =匕巴丄只826・025 6 = 37」72 •n20£/:丿卩(刃=1 %xj37.172 71.95 •代入数W可紂总体肉值的95%的置佰区何为[132.55J 56.45].2.6M:根据样木位息估计对衍毎个乡的平均产诫为1120吨.该地区今年的粮伐总产虽丫的佔计值为X = 350> = 350xl 120 =3.92xl05(吨)•)S2.总体总(ft 的I・a = 95%的盘伉区何为总体总(ft估计值的方差为rM= W•把y = 3.92X10\S2 = 25 600,n = 50,^ = 350,= 1.96代入.可須粮伏总产虽的l-a=95%的置信区何为[377 629.406 371]./ = ^.za/:解:泞先计外简腋皈机抽样条什下所需耍的祥本虽・把N = l 000,d = 2」-a = 95%S'=68 帯入公式%如果彩电到仃效河猝率的问題・亦仃效冋??率为70%时・样本虽应该加终确定为/70% = 88.57 *89./i = no2.8 M:去年的化肥总产虽和今邻的总产量Z何存在较強的WXfte iliifl这种相关关系较为楼定.所以引入去年的化肥产址作为辅助变虽・「•建我的采用比申估计址的形式*估计今年的化肥总产虽•去年化肥总广虽为X = 2I35・利用£年的化肥总严虽・今年的化肥总产虽的估计(ft为y/?X=^X = 2 426.14< =■X2.9駢:木JS中.简險估计址的方羞的估计(ft为v(y)=^L S2 =37.17.n利用比率估itfit进行估计时.我们引入了家庭的总支出作为辅助变fit.记为X・文化支出届F总支岀的一部分.这个上箜变st与辅助变st之何存在较強的相关关系.面11它m之何的关系是比较住定的.11全部家庭的总支出是已知的虽・文化支出的比率估计就为y^RX^X.通过if■算彻到y = 2 890/20 = 144.5・ifijx = l 580.則' V 144 5 ・/? = 1 = 2_£O,O915.文化支岀的比率佔计址的值为儿= 146.3 (元人=•I现在考Jg比率佔计fit的方差.在样木足牧大的条件几卩(耳片MSE(耳片乎(S j2RpS・S,+用S:)・通过计件吋以得到两个变fit的样本方羞为A?=826,.<=9.958xl0\『和X之何的相关系数的佔计值为p = 0.974.代入上面的公式.可U得到比半估计虽的方差的佔计備为v耳=1.94・这个数值比简的方羌佔计值耍小很个部家庭的平均文化支出的l-a = 95%的盘估X何为[斤・%应订•齐+ %応「卜“96^面•齐+1 %応J]・把具体的敌值代入可得置仃区何为[143.57.149.03].y[yA彳元)接下来比较比佔汁和简腋佔计的效札亠亠2 = :^ = 0・052・这是比佔计的设计效应v(y)呛)37.17值,从这里可以看岀比佔计駅比简乐佔计虽的效率史高.2.10 利用简爪佔计址町紂戸=》比/” = 1 630/10二163・样本方澄为? =212.222, AT = 120・样本均值的方左佔计值为v(y)=52 = ^1^120 x212.222 = 19.453 7.利用回贮估计的方注.在这里选取肉牛的KiRfi为辅助变址.迭擇原電虽为緬助矢St是合理的.因为肉牛的很大程皮上彩响荷肉牛的现任的車虽・二折Z何“庄牧冬的相关性.郴关系数的估计血为2 = 0.971 •临II 这种相关关瑕是稳定的.这觇肉牛的原載虽的8(值已经衍到.所以选好肉牛的廉載ft为辅助妞.* * |4 CAQ何粉估计SMM度加高的冋•垠敌“的伕计ffi为/7 = p—= 0.971x^^- = 1.368.现在何以衍到$. 10.341肉牛fltiF.fi 的回归佔计fit 为无=戸+ 0 X^x .代入数值町以月到畀=159.44.囚为恋在肉牛股秋fit 这个牧好的辅助变足,所以冋$1佔计虽的箱度耍好「简冋归估计fit 入的方差为打兀)=MSE (人方差的佔计位为仏卜•代入柿应的敷值・单估计就・。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf 又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
5个黑球,3个白球,大小相同,一次随机地摸取4个球,其中恰有3个白球的概率为A .83B .485C C .81)83(5D .81)83(348C2. 任何一个连续型随机变量的概率密度)(x f 一定满足A .1)(0≤≤x fB .在定义域内单调不减C .()1f x dx +∞-∞=⎰D .0)(>x f3. 设随机变量X 、Y 相互独立,分布函数分别是)(x F 、)(x G ,min{,}Z X Y =,则Z 的分布函数()Z F z =A .()()F z G zB .()()()()F z G z F z G z +-C .[]2()F z D .1(1())(1())F z G z ---4. 设人的体重为随机变量X ,且()E X a =,()D X b =,10个人的平均体重为Y ,则下面成立的是A .()E Y a =B .()0.1E Y a =C .()D Y b = D .b Y D 2.0)(= 5. 设A n 为n 次独立重复试验中A 出现的次数,p 是事件A 在每次试验中的出现概率,ε为大于零的数,则lim A n n P p n ε→∞⎧⎫-<=⎨⎬⎩⎭A .0B . 1C .12 D.21⎛Φ- ⎝6. 设)(~),(~22221221n n χχχχ,2221,χχ独立,则 A .)(~22221n χχχ+ B .~2221χχ+)1(2-n χ C .~2221χχ+()t n D .~2221χχ+212()n n χ+7. 由来自正态总体2~(,2)X N μ容量为400的简单随机样本,样本均值为45,则未知参数μ的置信度为0.95的置信区间是0.025( 1.96,Z =其中 0.05 1.645)Z =A .(44.8355,45.1645)B .(44,46)C .(44.804,45.196)D .(44.9,45.1) 8. 在假设检验中,设1H 为备择假设,那么犯第一类错误的概率为A. 1H 真,接受1HB. 1H 不真,接受1HC. 1H 真,拒绝1HD. 1H 不真,拒绝1H有两批零件,其合格率分别为0.9和0.8,在每批零件中随机地任取一件,则至少有一件是合格品的概率为__________________.2. 设)2.0,2(~2N X ,若9938.0)5.2(=Φ,5.0)0(=Φ,则=<<}5.22{X P ___.3. 设X 的概率密度为23,02()80,x x f x ⎧<<⎪=⎨⎪⎩其它,则2)1(-=X Y 的概率密度函数为 .4. 设随机变量X 与Y 相互独立,且~(0,2),X U Y 服从参数为3的指数分布,则()E XY = .5. 设从总体2(52,6.3)N 中随机抽取容量为36的样本,X 表示样本均值,则X 服从的分布为 . 6. 设是来自正态总体2(,)N μσ的样本, 其中参数μ和2σ未知,若计算出162120,()60,i i x x x ==-=∑则假设0:15H μ=的t 检验选用的T统计量的值t = .7. 设总体),(~2σμN X ,其中2σ未知,容量为n 的样本均值和方差分别为X 、2S ,则参数μ的置信度为α-1)10(<<α的双侧置信区间为 .8. 单因素方差分析中,各个水平(1,2,,)j A j s = 下的样本12,,,j j j n j X X X 均来自2(,),j j N μσμ与2σ未知,,T E A S S S =+称T S 为总偏差平方和,E S 和A S 分别为 .设总体N=4,其变量值分别为(2,5,6,9)。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+20199作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
抽样技术课后习题答案第⼆章习题2.1判断下列抽样⽅法是否是等概的:(1)总体编号1~64,在0~99中产⽣随机数r ,若0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产⽣随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产⽣随机数r 。
然后⽤19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有⼀些⼏个特点:第⼀,按照⼀定的概率以随机原则抽取样本。
第⼆,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当⽤样本对总体⽬标进⾏估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?解析:抽样理论和数理统计中关于样本均值的定义和性质的不同抽样理论概率统计定义 ∑==ni i y n y 11∑==ni iy n y 11性质1.期望()()()()Y C P E NN C N C ===∑∑==n n1i n i 1i i i 1y y y2.⽅差()()()[]()iiP y E y y V n N21∑=-==()()[]n NC i iiC y E y n N121∑=- ()21S nf -=1.期望()??=∑=n i i y n E y E 11()∑==ni y E 1i n 1[]µµ==n n12.⽅差()[]2µ-=i y E y V211-=∑=n i i y n E µ()ny n 122i σµ=-=E2.3为了合理调配电⼒资源,某市欲了解50000户居民的⽇⽤电量,从中简单随机抽取了300户进⾏,现得到其⽇⽤电平均值=y 9.5(千⽡时),=2s 206.试估计该市居民⽤电量的95%置信区间。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?2.3为了合理调配电力资源,某市欲了解50000户居民的日用电量,从中简单随机抽取了300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s1706366666206*300500003001500001)()ˆ(222=-=-==s nf N y N v YV 19.413081706366666(==)y v 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
《抽样技术(第二版)金勇进等编著》习题解答第二章2.22.3 解:已知2ˆ9.5,206,50000,300500009.5475000y s N n Y Ny ====∴==⨯=, 222211300/50000ˆ()50000206500000.6825170636666730041308.19128,80964.05491f v YN s n --∴==⨯⨯=⨯===所以居民日用电量的95%的置信区间为 ˆˆ[[47500080964.05491,47500080964.05491] [394035.9451,555964.0549]YY -+=-+=相对误差为ˆd Y Y r Y-=2.4 解:ˆ0.35Pp == , 11200/1000010000()(1)0.35(10.35)0.0011512009999f N V p P P n N --=-=⨯⨯⨯-=-0.03339=∴P 的95%置信区间为:[[0.35 1.960.03339,0.35 1.960.03339][0.2846,0.4154]p p -+=-⨯+⨯=2.5 解:已知200,20N n ==,根据已知数据计算得:2144.5,826.0526,() 6.096915y s v y ==∴== ∴Y 的95%置信区间为:[[144.5 1.96 6.096915,144.5 1.96 6.096915][132.55,156.45]y y -+=-⨯+⨯=2.6 解:已知2ˆ1120,25600,350,503501120392000y S N n Y Ny ====∴==⨯=,2221150/350ˆ()350256003840000506196.773,12145.68f V YN S n --∴==⨯⨯===∴ˆY的95%置信区间为:ˆˆ[[379854.3,404145.7]Y Y -+= 2.7 解:已知21000,2,68,10.95N d S α===-=,222022221000 1.966861.3010002 1.9668Nt S n Nd t S ⨯⨯∴===+⨯+⨯0161.387.571430.7n n r === 样本量最终为88个家庭。
第二章习题2.1判断下列抽样方法是否是等概的:(1)总体编号1~64,在0~99中产生随机数r ,若r=0或r>64则舍弃重抽。
(2)总体编号1~64,在0~99中产生随机数r ,r 处以64的余数作为抽中的数,若余数为0则抽中64.(3)总体20000~21000,从1~1000中产生随机数r 。
然后用r+19999作为被抽选的数。
解析:等概抽样属于概率抽样,概率抽样具有一些几个特点:第一,按照一定的概率以随机原则抽取样本。
第二,每个单元被抽中的概率是已知的,或者是可以计算的。
第三,当用样本对总体目标进行估计时,要考虑到该样本被抽中的概率。
因此(1)中只有1~64是可能被抽中的,故不是等概的。
(2)不是等概的【原因】(3)是等概的。
2.2抽样理论和数理统计中关于样本均值y 的定义和性质有哪些不同?300户进行,现得到其日用电平均值=y 9.5(千瓦时),=2s 206.试估计该市居民用电量的95%置信区间。
如果希望相对误差限不超过10%,则样本量至少应为多少?解:由已知可得,N=50000,n=300,5.9y =,2062=s 该市居民用电量的95%置信区间为[])(y [2y V z N α±=[475000±1.96*41308.19]即为(394035.95,555964.05) 由相对误差公式y)(v u 2y α≤10%可得%10*5.9206*n50000n 1*96.1≤- 即n ≥862欲使相对误差限不超过10%,则样本量至少应为8622.4某大学10000名本科生,现欲估计爱暑假期间参加了各类英语培训的学生所占的比例。
随机抽取了两百名学生进行调查,得到P=0.35,是估计该大学所有本科生中暑假参加培训班的比例的95%置信区间。
解析:由已知得:10000=N 200=n 35.0=p 02.0==Nnf又有:35.0)()(===∧p p E p E 0012.0)1(11)(=---=∧p p n fp V该大学所有本科学生中暑假参加培训班的比例95%的置信区间为:])()([2∧∧±P V Z P E α代入数据计算得:该区间为[0.2843,0.4157]2.5研究某小区家庭用于文化方面(报刊、电视、网络、书籍等)的支出,N=200,现抽取一个容量为20的样本,调查结果列于下表:编号 文化支出 编号 文化支出 1 200 11 150 2 150 12 160 3 170 13 180 4 150 14 130 5 160 15 100 6 130 16 180 7 140 17 100 8 100 18 180 9 110 19 170 1024020120估计该小区平均的文化支出Y ,并给出置信水平95%的置信区间。
解析:由已知得:200=N 20=n根据表中数据计算得:5.144201201==∑=i i y y∴ 该小区平均文化支出Y 的95%置信区间为:])(y [2y V zα±即是:[132.544,156.456] 故估计该小区平均的文化支出Y =144.5,置信水平95%的置信区间为[132.544 ,156.456]。
2.6某地区350个乡为了获得粮食总产量的估计,调查了50个乡当年的粮食产量,得到y =1120(吨),225600S =,据此估计该地区今年的粮食总产量,并给出置信水平95%的置信区间。
解析:由题意知:y =1120 1429.035050n ===N f 225600S =⇒160=s置信水平95%的置信区间为:]1y [2s nfz -±α代入数据得: 置信水平95%的置信区间为:[1079.872,1160.872]*350 2.7某次关于1000个家庭人均住房面积的调查中,委托方要求绝对误差限为2平方千米,置信水平95%,现根据以前的调查结果,认为总体方差682=S ,是确定简单随机抽样所需的样本量。
若预计有效回答率为70%,则样本量最终为多少?解析:简单随机抽样所需的样本量22222122S Z Nd S NZ n αα+=%7012n n =由题意知:1000=N 2=d 682=S 96.12=αZ代入并计算得:613036.611≈=n87142.87%7012≈==n n故知:简单随机抽样所需的样本量为61,若预计有效回答率为70%,则样本量最终为872.8某地区对本地100家化肥生产企业的尿素产量进行调查,一直去年的总产量为2135吨,抽取10个企业调查今年的产量,得到25=y ,这些企业去年的平均产量为22=x 。
试估计今年该地区化肥总产量。
解析:由题可知22x =,35.211002135===N X X ,25y =则,该地区化肥产量均值Y 的比率估计量为26.24242535.21===∧x y XY该地区化肥产量总值Y 的比率估计量为 242626.24*100ˆˆ===R Y N Y 所以,今年该地区化肥总产量的估计值为2426吨。
2.9如果在解决习题2.5的问题时可以得到这些家庭月总支出,得到如下表:全部家庭的总支出平均为1600元,利用比估计的方法估计平均文化支出,给出置信水平95%的置信区间,并比较比估计和简单估计的效率。
解析:由题可知1580130017002300201x n 1x n 1i i =+++==∑=)(Λ又329.14615805.144*1600x y y ===XR故平均文化支出的95%的置信区间为代入数据得(146.329±1.96*1.892) 即为[142.621,150.037]2.10某养牛场购进了120头肉牛,购进时平均体重100千克。
现从中抽取10头,记录重量,3个月后再次测量,结果如下:进行比较。
解:由题可知,6.10210595101x n 1x n 1i i =++==∑=)(Λ 故有368.1933.106333.14620===xxy S S β所以总体均值Y 的回归估计量为 其方差估计为:)2(1)(ˆ02202xyx lr S S S n f y V ββ-+-==)333.146*368.1*2933.106*368.1222.212(101201012-+-=1.097 而21y (ˆS nf V -=)=222.212*10120101- =19.454显然)(ˆ)(ˆy V y V lr< 所以,回归估计的结果要优于简单估第三单元习题答案(仅供参考) 1解:(1)不合适(2)不合适 (3)合适 (4)不合适2.将800名同学平均分成8组,在每一组中抽取一名“幸运星”。
∴Y ̅st =1N∑N h y ̅h 3h=1=20.1V (y ̅̂st )=∑W h 2s h 2n hL h=1-∑W h s h 2NL h=1=9.7681-0.2962=9.4719∴√V (y ̅̂st )=3.0777 (2)置信区间为95%相对误差为10%,则有按比例分配的总量:n=∑W h s h2L h=1V+N V ∑W h sh2L h=1=185.4407≈185∴n 1=n W 1=56,n 2=92,n 3=37按内曼分配:n=(∑W h s h 2)2L h=1V+1N∑W h s h h=1=175∴n 1=33,n 2=99,n 3=43P st =∑W h P h L h=1=0.924根据各层层权W h 及抽样比f h 的结果,可得V ̂(P st )=1N∑N h2(1−f h )p n q n n h −14h=1=0.000396981 ∴√V̂(P st )=1.99% ∴估计量的标准差为1.99%,比例为9.24%按比例分配:n=2663∴n 1=479,n 2=559,n 3=373,n 4=240,n 5=426,n 6=586内曼分配:n=2565∴n 1=536,n 2=520,n 3=417,n 4=304,n 5=396,n 6=3925.解:由题意,有Y ̅=∑y̅W n L h=1=75.79 ∴购买冷冻食品的平均支出为75.79元又由V (y ̅)=1−f n∑W h s h 2L h=1+1n 2∑(1−W h )s h 2L h=1又n=∑n h /W h L h=1∴V (y ̅)=53.8086 √V (y ̅)=7.3354∴95%的置信区间为[60.63,90.95]。
7.解:(1)对(2)错 (3)错 (4)错 (5)对8.解:(1)差错率的估计值y ̅=143×70%+257×30%=0.027估计的方差v (y ̅)=∑W h2L h=11−f h n h s h2=3.1967×10−4标准差为S(y ̅)=0.0179。
(2)用事后分层的公式计算差错率为y ̅=∑W h (1m h∑y hi )m hi=1L h=1=0.03估计的方差为;v (y ̅)=∑W h 2S h 2m hh-1N∑W h S h 2h =2.5726×10−4(2)用分别比估计,有r 1=0.4,r 2=0.65,所以用分别比估计可计算得Y ̅=6.4。
用联合比估计,有r 1=0.5,r 2=0.625,所以用联合比估计可计算得Y ̅=6.5。
第四章习题4.1 邮局欲估计每个家庭的平均订报份数,该辖区共有4000户,划分为400个群,每群解:由题意得到400=N ,4=n ,10=M ,01.04004===N n f 故875.1410201620191ˆ1=⨯+++===∑=ni i y Mny Y (份)75.18875.110=⨯=⋅=y M y (份) 750040010ˆ=⨯=⋅⋅=y N M Y(份) 于是由以上的计算结果得到平均每户的订报份数为 1.875,估计量方差为0.00391875。
该辖区总的订阅份数为7500,估计量方差为62700。
4.2 某工业系统准备实行一项改革措施。
该系统共有87个单位,现采用整群抽样,用简单随机抽样抽取15个单位做样本,征求入选单位中每个工人对政策改革措施的意(2) 在调查的基础上对方案作了修改,拟再一次征求意见,要求估计比例的允许误差不超过8%,则应抽取多少个单位做样本?解:题目已知87=N ,15=n ,8715==N n f 1)由已知估计同意改革的比例 此估计量的标准差为4.3 某集团的财务处共有48个抽屉,里面装有各种费用支出的票据。
财务人员欲估计办公费用支出的数额,随机抽取了其中的10个抽屉,经过清点,整理出办公费用的票)。
解:已知N=48, n=10, f=4810=N n , 由题意得7361=∑=n i i y ,3651=∑=ni i M ,则办公费用的总支出的估计为8.35327361048ˆ1=⨯==∑=ni i y nN Y(元) 群总和均值6.7373610111=⨯==∑=n i i y n y (元)=9)6.7380(...)6.7362()6.7383(10)48101(482222-++-+-⨯-⨯ = 182.4⨯91⨯3590.4= 72765.44 )ˆ(Yv =269.7507 则Yˆ的置信度为95%的置信区间为3532.8±1.96⨯269.7507,即[3004.089,4061.511].4.4 为了便于管理,将某林区划分为386个小区域。