第一套试卷及参考答案
一、选择题(40 分)
1、根据某医院对急性白血病患者构成调查所获得的资料应绘制(B)
A 条图
B 百分条图或圆图
C 线图
D 直方图
2、均数和标准差可全面描述D资料的特征
A所有分布形式B负偏态分布C正偏态分布D正态分布
和近似正态分布
3、要评价某市一名5 岁男孩的身高是否偏高或偏矮,其统计方法是( A )
A 用该市五岁男孩的身高的95%或 99%正常值范围来评价
B用身高差别的假设检验来评价
C用身高均数的 95%或 99%的可信区间来评价
D不能作评价
4、比较身高与体重两组数据变异大小宜采用(A)
A变异系数B方差 C 标准差 D 四分位间距
5、产生均数有抽样误差的根本原因是(A)
A. 个体差异
B. 群体差异
C. 样本均数不同
D. 总体均数不同
6.男性吸烟率是女性的 10 倍,该指标为( A )
(A)相对比(B)构成比(C)定基比(D)率
7、统计推断的内容为( D )
A.用样本指标估计相应的总体指标
B.检验统计上的“检验假设”
C. A 和 B 均不是
D. A 和 B 均是
8、两样本均数比较用 t 检验,其目的是检验( C )
A 两样本均数是否不同
B 两总体均数是否不同
、C 两个总体均数是否相同 D 两个样本均数是否相同有两个独立随机的样本,样本含量分别为 1 和n2,在进行成组设计
9 n
资料的 t 检验时,自由度是( D )
( A) n + n
2 (B ) n + n
2
–1
1 1
( C) n1 + n2 +1 ( D) n1 + n2 -2
10、标准误反映( A )
A 抽样误差的大小
B 总体参数的波动大小
C 重复实验准确度的高低
D 数据的离散程度
11、最小二乘法是指各实测点到回归直线的(C)
A垂直距离的平方和最小B垂直距离最小
C纵向距离的平方和最小D纵向距离最小
12、对含有两个随机变量的同一批资料, 既作直线回归分析 , 又作直线相关
分析。令对相关系数检验的t 值为 t r,对回归系数检验的t 值为 t b,二者之间具有什么关系?(C)
A t r >t b
B t r C t r = t b D 二者大小关系不能肯定 13、设配对资料的变量值为x1和 x2,则配对资料的秩和检验(D) A 分别按 x1 和 x2 从小到大编秩 B 把 x1 和 x2 综合从小到大编秩 C 把 x1 和 x2 综合按绝对值从小到大编秩 D 把 x1 和 x2 的差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20.05,ν可认为( A ) A 各总体率不同或不全相同 B 各总体率均不相同 C 各样本率均不相同 D 各样本率不同或不全相同 15、某学院抽样调查两个年级学生的乙型肝炎表面抗原,其中甲年级调查 35 人,阳性人数 4 人;乙年级调查40 人,阳性人数 8 人。该资料宜 选用的统计方法为(A) A.四格表检验 B.四格表校正检验 C. t检 验 D. U检验 16、为调查我国城市女婴出生体重:北方 n1=5385,均数为 3.08kg ,标准 差为 0.53kg ;南方 n2=4896,均数为 3.10kg ,标准差为 0.34kg ,经统计学检验, p=0.0034<0.01 ,这意味着( D) A南方和北方女婴出生体重的差别无统计学意义 B南方和北方女婴出生体重差别很大 C由于 P 值太小,南方和北方女婴出生体重差别无意义 D南方和北方女婴出生体重差别有统计学意义但无实际意义。 17、两个样本率比较的四格表检验,差别有统计学意义,这个差别是指(A ) A 两个样本率的差别 B 两个样本率的标准误 C 两个总体率的差别 D 两个总体率的 标准差 18.下列指标不属于相对数的是( D ) A 率 B 构成比 C 比 D 百分位数 19、利用盐酸左西替利嗪片治疗慢性特发性荨麻疹临床试验,以西替利嗪片组作为对照组,治疗 28 天后结果如下表,现要比较两种药物的疗效,何种方法为优:( D ) 表 1 盐酸左西替利嗪片治疗慢性特发性荨麻疹临床疗效组别治愈显效进步无效合计 左西替利嗪片组49 8 5 2 64 西替利嗪片组44 10 9 3 66 A. 检验B. 成组 t 检验C. u 检验D. 秩和检验 20、下列哪种说法是错误的( B ) A计算相对数尤其是率时应有足够的观察单位或观察次数 B分析大样本数据时可以构成比代替率 C应分别将分子和分母合计求合计率或平均率 D样本率或构成比的比较应作假设检验 二、填空题( 20 分) 1、现有若干名儿童健康检查一览表的部分检测指标,见表 2 表 2 某年某地儿童健康检查部分检测结果 编性年龄 ( 周身高( cm)坐高(cm)血型表面抗肝 号别岁)原大 1 男7 116.7 66.3 A + ++ 2 女8 120.0 68. 3 AB - - 3 女10 126.8 71.5 O - + 4 男9 123.7 70.0 A - - .. . . . . . . .. . . . . . . 问:①上述变量中能形成计数资料的指标有性别、血型、表抗 ②计量资料的指标有年龄、身高、体重 ③等级资料的指标有肝大 ④对于身高或坐高指标,在进行统计描述时宜计算均数和标 准差表示其集中趋势和离散趋势。 ⑤对于血型指标宜计算构成比表示各种血型的构成 ⑥若要分析不同性别身高有无不同,宜选用的统计方法有两样本均数 比较的 t 检验 ⑦若要分析不同性别血型构成有无不同,宜选用的统计方法有卡方 检验 2、某年某地年龄在60岁及以上的人口数为9371人,死亡数为342人, 其中恶性肿瘤死亡数为 32 人,则该地 60 岁及以上人口的恶性肿瘤死亡 率( 1/10 万)为 341.48/10 万 3、临床上安排试验设计时,应考虑的三个基本原则是对照随机重 复 三、简答题( 20 分) 1、描述集中趋势的指标有哪些?其适用范围有何异同?( 5 分) 均数:正态或近似正态分布 几何均数:等比数列或对数正态分布资料 中位数:资料是偏态分布的;分布不规则;一端或两端有不确定数据(开 口资料)时。 2、何谓假设检验?可以举例说明。( 5 分) 首先建立检验假设,然后在该假设下进行随机抽样,计算得到该统计量及 其极端情形的概率,如果概率较小,则拒绝该假设,如果概率不是小概率, 则接受该假设,这个过程称为假设检验。 3、请你谈谈对假设检验结论的认识。( 5 分) 由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理 进行的,因此当拒绝检验假设时可能犯I 型错误,当接受检验假设时可能 犯 II 型错误。 4、请你谈谈标准差和标准误的异同点。( 5 分) 区别点标准差标准误 意义个体差异大小抽样误差大小计算公式 与 n 的关系n↑ S →σn↑→ 0 用途与均数结合可制定参考与均数结合可计算总体 值范围均数的可信区间 四、计算分析题 10 分 *2=20 1、请将下列数据编制成合格的统计分析表。 试验组对照组 庆大霉素 (8 万新洁尔灭生理盐水冲洗服生理盐水 单位 /10 毫升 ) (0.1%)四环素 3 天冲洗总例数30 30 30 30 感染例数 1 3 5 8 百分比 3.3% 10% 16.7% 26.7% 表 1 四种脐带消毒方法效果比较 组别总例数感染例数百分比 ,% 庆大霉素 (8 万单位 /10 毫 30 1 3.3 升 ) 新洁尔灭( 0.1% )30 3 10 生理盐水冲洗服四环素 3 30 5 16.7 天 生理盐水冲洗30 8 26.7 2、某文章作者根据下表资料,认为沙眼在20- 岁组患沙眼最多 ,10- 岁组、 30- 岁组次之 ,40 岁以后剧降 ,10 岁以下儿童较 50 岁以上老年人高,由 此可见沙眼对幼年及成年人侵害最多。 某医院门诊沙眼病人年龄构成比 年 50 6070 0-10-20-30-40-计 沙 47 198 330 198 128 80 38 81027 沙 4.19.32.19.12.7. 3.0.100. 问以上结论是否合理 ?说明理由。要达到作者的目的,应计算什么相对数 指标 ? 答:不合理。沙眼百分比大小受该年龄段患病率与就诊对象年龄分布(即该地年龄结构)有关,因此百分比高并不意味患病率就高。应计算患病率,即患者数与该年龄段总人口数之比。 第二套试卷及参考答案 一、最佳选择题( 40 分) 1.均数是表示变量值 _A_水平的指标。 (A) 平均(B)变化范围(C) 频数分布(D) 相互间差别大小 2.原始数据同乘以一个不等于0 的常数后 _D_。 (A) 均数不变、标准差变(B)均数、标准差 均不变 (C)均数变、标准差不变(D) 均数、标准差 均变 3.描述正态或近似正态分布资料特征的是__B____。 (A)中位数、四分位间距(B)均数、标准差 (C)中位数、标准差(D)几何均数、全距 4.描述偏态分布资料特征的是_A__。 (A) 中位数、四分位间距(B)均数、标准差 (C)中位数、标准差(D) 几何均数、全距 5.均数与标准差计算的数值A。 (A)均数可以是负数 ,标准差不可以 (B) 均数不可以是负数,标准差可以 (C) 两者都可以是负数(D) 两者都不可以 是负数 6、比较身高和体重两组资料的变异度大小宜采用___C___。 (A) 极差(B)标准差(C) 变异系数(D) 四分位间距 7.说明某事物内部各组成部分所占比例应选_B___。 (A) 率(B)构成比(C) 相对 比(D)标准差 8.来自同一总体的两个样本中, _D_小的那个样本均数估计总体均数时 更精确。 (A)S(B)R(C)CV(D ) 9.已知正常人某定量指标的总体均值μ0=5,今随机测得某地一组特殊人 群中的 30 人该指标的数值,为推断这组人群该指标的总体均值μ与μ0之间的差别是否有显著性意义,若用t检验,则自由度应该是 C (A)5(B)28(C)29 (D)4 10.正态分布曲线下,横轴上,从μ-1.96σ到μ+1.96σ的面积为 A (A)95%(B)49.5%(C)99%(D)97% 11.两样本均数间的差别的假设检验时,查t 界值表的自由度 为C (A) n-1(B)(r-1)(c-1)(C)n1+n2-2(D)1 12.从一个数值变量资料的总体中抽样,产生抽样误差的原因是A (A)总体中个体值存在差别(B) 样本中个体值存在差 别 (C)样本只含总体的一部分(D) 总体均数不等于0 13.两样本均数比较时,分别取以下检验水准时,哪一个水准第二类错误最小 B (A)α=0.05(B) α=0.20(C) α=0.01(D) α =0.10 14.比较某地 10 年间结核与白喉两病死亡率的下降速度,宜绘 制C。 ( A)线图(B)条图(C)半对数线图(D)圆图 15.构成比用来 C (A) 反映某现象发生的强度 (B) 表示两个同类指标的比 (C) 反映某事物内部各部分占全部的比重 (D) 表示某一现象在时间顺序的排列 16.某医院的资料计算各种疾病所占的比例,该指标为 D (A)发病率 (B) 患病率 (C) 相对 比 (D )构成比 17.等级资料的比较宜用 C (A) t 检验 (B) 检验 (C) 秩和检验 (D) 方差 分析 18.四格表中,当 a=20,b=60,c=15,d=5 时,最小的理论频数等于 C (A ) T (B )T (C) T 21 ( D ) T 11 12 22 19.四格表校正 x 2 检验公式适用于 D ( A ) n<40, T>5 (B ) n<40, 1 ( C ) n>40, T<5 (D ) n>40, 1 20.同一双变量资料,进行直线相关与回归分析,有 B (A) r>0 , b<0 (B) r>0 , b>0 (C) r<0 , b>0 (D) r=b 二、填空 题 12 分 1、 统计资料按其性质不同, 通常将资料分为 (计量、计数、等级 ) 三 种类型。 2、统计工作步骤通常为统计设计、 搜集资料、整理资料和分析资料四步, 其中统计分析常分为 ( 统计描述 )与(统计推断 )两个阶段。 3、 计量资料,随着样本例数的增大, S 逐渐趋向于 ( σ ), 逐渐趋向 于 ( 0 )。 4、变异系数常用于比较 (单位不同 )或 (均数相差较大 )情况下两组资料的变异度。 5、( 相关分析 )侧重于考察变量之间相关关系密切程度,(回归分析)则侧 重于考察变量之间数量变化规律。 6、对某地一年级 12 名女大学生体重( x :单位 kg)与肺活量 (y:单位 L) 的数据作相关分析,经检验两者间有直线相关关系,作回归分析得回 归方程为: ?=0.000419+0.058826X,这意味着体重每增加1kg ,肺活量 平均增加 (0.058826L );且两者之间为 ( 正 )相关。 三、名词解释13 分 1.参数和统计量 2.概率 3.计数资料 4.回归系数答案见书本相应的位置 四、简答题15 分 1.抽样研究中如何才能控制或减小抽样误差? 答:合理的抽样设计,增大样本含量。 2、何谓抽样误差?为什么说抽样误差在抽样研究中是不可避免的? 答:由抽样造成的样本统计量与样本统计量,样本统计量与总体参数间的 差异因为个体差异是客观存在的,研究对象又是总体的一部分,因此这部分的结果与总体的结果存在差异彩是不可避免的 3.能否说假设检验的 p 值越小,比较的两个总体指标间差异越大?为什 么?答:不能,因为 P 值的大小与总体指标间差异大小不完全等 同。P 值的大小除与总体差异大小有关,更与抽样误差大小有关,同样的 总体差异,抽样误差大小不同,所得的P 也会不一样,抽样误差大小实 际工作中主要反映在样本量大小上。 五、计算分析题 1、根据列表原则,对下表进行改进,要求绘出合格的统计分析表。 年份病例存活住院期急性住院期急性期 数数死亡总期死总病死病死率 数亡数率( %)( %)1964 17 9 8 7 47.1 41.2 1965 13 8 5 4 38.5 30.8 1966 15 8 7 6 46.7 40.0 1967 15 9 6 6 40.0 40.0 1968 12 8 4 4 33.3 33.3 合计72 42 30 27 41.7 37.5 修改表:某年某地 1964-1968 年份病例数住院期急性期 死亡总总病死率( %)死亡数病死率( %) 数 1964 17 8 47.1 7 41.2 1965 13 5 38.5 4 30.8 1966 15 7 46.7 6 40.0 1967 15 6 40.0 6 40.0 1968 12 4 33.3 4 33.3 合计72 30 41.7 27 37.5 2、现有一临床试验数据,有 5 家医院参加,分为试验组( g=1)和对照组(g=0) ,见表 1,请对该资料进行分析(只要写出具体的分析内容和统计 分析方法名称即可) 表 1 某新药临床试验部分指标 医院性 身高体重疗组 代码别效别 1 1 175.00 63.00 3 0 1 2 157.00 54.00 2 0 1 1 178.00 67.00 2 1 1 2 165.00 50.00 3 0 . 2 162.00 51.00 4 0 . 2 156.00 48.00 2 1 . 1 176.00 62.00 2 1 . 1 184.00 72.00 2 0 5 1 168.00 65.00 2 0 5 2 166.00 46.00 2 1 分析:两组入组条件的均衡性比较,两组性别是否可比,可用卡方检验; 两组入组的身高与体重是否可比可用两样本的t 检验或 u 检验。两组疗效比较可用秩和检验。 第三套试卷及参考答案 一、选择题20 分 1.7 人血清滴度分别为1:2,1:4,1:8,1:16,1:32, 1:64,1:128,则平均滴度为 __C__ A.1:12.4 B . 1:8C.1:16D.1:8 ~1:16 2.比较身高和体重两组数据变异度大小宜采用___A___ A.变异系数B.方差C.极 差D.标准差 3.下列关于个体变异说法不正确的是__C__ A.个体变异是生物体固有的。 B .个体变异是 有规律的。 C.增加样本含量,可以减小个体变异。 D.指标的分布类型反映的是个体的分布规律。 4.实验设计的原则是 __C___ A.对照、随机、均衡 B .随机、重复、均衡 C.对照、重复、随机D.随机、重复、齐同 5.说明某现象发生强度的指标为__B____ A.平均数 B .率C.构成比 D .相对比 6.要研究四种不同血型的人糖尿病的患病率是否不同,采用多个率比较 的卡方检验,构建一个 4 行 2 列的 R*C 表后,其卡方值的自由度为__C_ A.8 B .1C. 3 D.跟样本含量有关 7.假设检验中的第一类错误是指_A__所犯的错误。 A.拒绝了实际上成立的H0B.不拒绝实际上成立的H0 C.拒绝了实际上不成立的H0 D .不拒绝实际上不成立的H0 8.样本含量固定时,选择下列哪个检验水准得到的检验效能(1- β)最高__D___ A. B . C . D. 9.两样本均数的 t 检验对资料的要求是 _D___ A.正态性、独立性、方差齐性 B .资料具有代表性 C.为定量资料D.以上均 对 10.四个率的比较的卡方检验,P 值小于 0.01 ,则结论为 _D__ A.四个总体率均不相等; B .四个样本 率均不相等; C.四个总体率之间肯定不等或不全相等;D.四个总体率之间不等或不 全相等。 二、名词解释10 分 1.相关系数; 2.抽样误差; 3.变异系数; 4.总体参数; 5.率; 答案:上相的地方 三、填空 10 分 1、常用的四种概率抽方法有:随机抽,机械抽(系抽), 分抽,整群抽 2、推断的内容主要包括参数估和假。 3、床察 7 名某病患者,其潜伏期(天)各:3, 7, 9, 5, 6, 9, 16,其全距13 天。 4、20 名察象皮下注射某菌苗,一段后行抗体滴度定,其果:⑴有效⑵ 无效⑶有效 (4)有效??⒇无效,种料属于何种型 料数料。 5、研究的基本要素是:理因素、受象、效 四、答 20 分 1.在秩和中,什么在不同出相同数据要予“平均秩次”, 而在同一的相同数据不必算平均秩次? 答:秩不影响两秩和的算,或两秩和的算不生偏性。 2 某医生用某治 10 例小儿支气管哮喘,治愈 8 例,“ 小儿支气管哮喘的 治愈率 80%,得推广”。 答:一是没有照,二是本例数太少,抽差大,可信区。 3.某地1儿平均血蛋白 95%可信区 116.2~130.1(g/L) ,表示什么意?地 1 正常儿血蛋白 95%的参考范 111.2~135.1(g/L),又明了什么含? 答:表示地1儿血蛋白体平均数在116.2 ~130.1(g/L) ,估正 确的概率 95% 表示地有 95 %1 正常儿的血蛋白在111.2 ~135.1(g/L) 4.同一料,如果相关分析算出的r 越大,回分析算出的 b 也越大。什么? 答:没有这个规律。相关分析r 值大小仅说明变量间联系紧密,而回归分 析 b 的大小说明两者数量关系。 五、分析计算题 40 分 1.为考察出生时男婴是否比女婴重,研究者从加州大学伯克利分校的儿童 健康与发展研究中心随机抽取了 12 例白种男婴和 12 例白种女婴的出生资 料(单位:磅)。 男婴7.3 7.9 7.9 8.0 9.3 7.8 6.5 7.6 6.6 8.4 6.7 7.5 x1 女婴7.1 7.9 6.4 6.6 8.0 6.0 7.2 6.8 7.8 5.3 6.6 7.3 x2 (1)该资料是数值变量资料还是分类资料?数值变量资料 (2)要比较白种人男性与女性的出生体重是否不同,应当选用成组 t 检验还是配对 t 检验?成组 t 检验 (3)经过计算 t 值为 2.16 ,已知自由度 22 时,双侧面积 0.05 对应的 t 界值为 2.07 ,自由度 11 时,双侧面积 0.05 对应的 t 界值为 2.20 。试写出假设检验的全过程并下结论。 答: H0:白种人男婴与女婴的出生体重是相同的即μ 1=μ2 H1:μ 1≠μ2α =0.05 t=2.16 ν =22 t>t0.05/2,22=2.07 p<0.05 在α =0.05水平上拒绝 H0,认为白种人男婴与女婴的出生体重是不同的, 男婴重于女婴。 2.某医院用甲、乙两种疗法治疗单纯性消化不良,结果下表。 疗法治疗人数治愈人数未愈人数治愈率( %) 甲33 26 7 78.79 乙38 36 2 94.74 合计71 62 9 87.32 (1)请计算最小的理论数。 T min=9*33/71=4.18 (2)若要比较两疗法治愈率是否相等,请问用何种检验方法?四格表校正 卡方检验(3)已知检验统计量为 2.92 ,请下结论。 2 因χ=2.92<3.84, P>0.05结论:在α=0.05水平上接受检验假设,可认为两种治疗方法的治愈率差异无统计学意义。 3比较缺氧条件下猫和兔的生存时间(时间:分) 猫兔 生存时间秩次生存时间秩次 25 5.5 14 1 34 10 15 2 38 11 16 3 40 12 18 4 41 13 25 5.5 42 14 26 7 45 15 28 8 30 9 (1)该资料属于什么试验设计方式?完全随机设计两样本资料的比较 (2)对资料进行编秩;见表 (3)该资料总秩和为多少?各组的实际秩和各为多少? 总秩和: 120 ,猫组: 80.5 兔组 39.5 (4)写出对该资料进行假设检验的假设。 H0:两组生存时间的总体分布是相同的。 ---------------------------------------- 说明:本试卷总计100分,全试卷共 5 页,完成答卷时间2小时。 ---------------------------------------- 一、填空题(本大题共8小题,每题4分,共32分) 1、随机事件A 、B 互不相容,且A =B ;则()P A = 2、已知,10/1)/(,5/1)(,5/2)(===B A P B P A P 则=+)(B A P 3、同时掷三枚均匀硬币,则恰有两枚正面向上的概率为 。 4、若随机变量)2.0,20(~B X ,则X 的最可能值是 。 5、若n X X X ,...,,21为来自泊松分布)(λP 的一个样本,2,S X 分别为样本均值和样本方差,则 =)(X E ,=)(2S E 。 6、样本0,5,10,-3样本均数为 ,样本方差为 。 7、2σ已知时检验假设0100:;:μμμμ≠=H H ,应构造统计量为 ,拒绝域为 。 8、考查4个3水平的因子A,B,C,D 及其交互作用A ×B 与A ×C ,则做正交实验设计时,可选用的行数最少的正交表为 。 二、单项选择题(本大题共8小题,每题4分,共32分) 1、设随机事件A 、B 互不相容,且()0,()0,P A P B >>则下列结论只有( ) 成立。 A 、A 、 B 是对立事件; B 、A 、B 互不相容; C 、A 、B 不独立; D 、 A 、 B 相互独立。 2、射击三次,事件i A 表示第i 次命中目标(i =1,2,3),下列说法正确的是( )。 A 、321A A A 表示三次都没击中目标; B 、313221A A A A A A ++表示恰有两次击中目标; C 、313221A A A A A A ++表示至多一次没击中目标;D 、321A A A 表示至少有一次没击中目标。 3、随机变量),(~2σμN X ,则随着σ的减小,)|(|σμ<-X P 应( )。 A 、单调增大; B 、单调减少; C 、保持不变; D 、增减不能确定 第一套试卷及参考答案 一、选择题(40分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图C线图D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用(A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6. 男性吸烟率是女性的10倍,该指标为(A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C两个总体均数是否相同D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t检验时,自由度是(D ) (A)n1+ n2(B)n1+ n2–1 (C)n1+ n2 +1(D)n1+ n2 -2 10、标准误反映(A ) A 抽样误差的大小 B总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的 (C) A垂直距离的平方和最小B垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料,既作直线回归分析,又作直线相关 分析。令对相关系数检验的t值为t r ,对回归系数检验的t值为t b , 二者之间具有什么关系?(C) 数理统计考试试卷 一、填空题(本题15分,每题3分) 1、总体得容量分别为10,15得两独立样本均值差________; 2、设为取自总体得一个样本,若已知,则=________; 3、设总体,若与均未知,为样本容量,总体均值得置信水平为得置信区间为,则得值为________; 4、设为取自总体得一个样本,对于给定得显著性水平,已知关于检验得拒绝域为2≤,则相应得 备择假设为________; 5、设总体,已知,在显著性水平0、05下,检验假设,,拒绝域就是________。 1、; 2、0、01; 3、; 4、; 5、。 二、选择题(本题15分,每题3分) 1、设就是取自总体得一个样本,就是未知参数,以下函数就是统计量得为( )。 (A) (B) (C) (D) 2、设为取自总体得样本,为样本均值,,则服从自由度为得分布得统计量为( )。 (A) (B) (C) (D) 3、设就是来自总体得样本,存在, , 则( )。 (A)就是得矩估计(B)就是得极大似然估计 (C)就是得无偏估计与相合估计(D)作为得估计其优良性与分布有关 4、设总体相互独立,样本容量分别为,样本方差分别为,在显著性水平下,检验得拒绝域为( )。 (A) (B) (C) (D) 5、设总体,已知,未知,就是来自总体得样本观察值,已知得置信水平为0、95得置信区间为(4、71,5、69),则取显著性水平时,检验假设得结果就是( )。 (A)不能确定(B)接受(C)拒绝(D)条件不足无法检验 1、B; 2、D; 3、C; 4、A; 5、B、 三、(本题14分) 设随机变量X得概率密度为:,其中未知 参数,就是来自得样本,求(1)得矩估计;(2)得极大似然估计。 解:(1) , 令,得为参数得矩估计量。 (2)似然函数为:, 而就是得单调减少函数,所以得极大似然估计量为。 四、(本题14分)设总体,且就是样本观察值,样本方差, 模拟训练题及参考答案 模拟训练题: 一、选择题: 1.下列事件中属于随机事件范畴的是( ) A. {人的的寿命可达500岁} B. {物体会热胀冷缩} C. {从一批针剂中抽取一支检验} D. {X2+1=0 有实数解} 2.依次对三个人体检算一次试验,令A={第一人体检合格},B={第二人体检合格},C={第三人体检合格},则{只有一人体检合格}可以表示为( ) A. A+B+C B. ABC C. C B A D. C B A C B A C B A ++ 3.一批针剂共100支,其中有10支次品,则这批针剂的次品率是( ) A. 0.1 B. 0.01 C. 0.2 D. 0.4 4.所谓概率是指随机事件发生的( )大小的数值表示。 A. 频率 B. 可能性 C. 次数 D. 波动性 5.若X~N (μ,σ2),则EX 的值为( ) A. μ B. μ2 C. σ2 D. σ 6.若X~B (K ;n ,p ),则DX 的值为( ) A. np B. μ C. σ2 D. np(1-p) 7.求一组数据(5,-3,2,0,8,6)的总体均数μ的无偏估计( ) A.2.4 B.3.1 C.3 D.4 8.作参数的区间估计时,给定的α越大,置信度1-α越小,置信区间处于( )变化。 A 变窄 B.变宽 C.没有 D.不确定 9.对于一组服从正态分布的试验数据,描述试验数据波动程度的特征统计量是( ). A. 样本算术平均数 B.中位数 C. 样本标准差 D.样本频数 10.伯努利概率模型具有的两个特点:( ) A.每次试验的结果具有对立性;重复试验时,每次试验具有独立性 创作编号: GB8878185555334563BT9125XW 创作者: 凤呜大王* 模拟试题一 一、 填空题(每空3分,共45分) 1、已知P(A) = 0.92, P(B) = 0.93, P(B|A ) = 0.85, 则P(A|B ) = 。 P( A ∪B) = 。 3、一间宿舍内住有6个同学,求他们之中恰好有4个人的生日在同一个月份的概率: ;没有任何人的生日在同一个月份的概率 ; 4、已知随机变量X 的密度函数为:, ()1/4, 020,2 x Ae x x x x ?? =≤?≥? , 则常数A= , 分布函数F (x )= , 概率 {0.51}P X -<<= ; 5、设随机变量X~ B(2,p)、Y~ B(1,p),若{1}5/9P X ≥=,则p = ,若X 与Y 独立,则Z=max(X,Y)的分布律: ; 6、设~(200,0.01),~(4),X B Y P 且X 与 Y 相互独立,则 D(2X-3Y)= , COV(2X-3Y , X)= ; 7、设125,,,X X X 是总体~(0,1)X N 的简单随机样本,则当k = 时, ~(3)Y t = ; 8、设总体~(0,)0X U θθ>为未知参数,12,,,n X X X 为其样本, 1 1n i i X X n ==∑为样本均值,则θ的矩估计量为: 。 9、设样本129,, ,X X X 来自正态总体(,1.44)N a ,计算得样本观察值10x =, 求参数a 的置信度为95%的置信区间: ; 二、 计算题(35分) 1、 (12分)设连续型随机变量X 的密度函数为: 1, 02()2 0, x x x ??≤≤?=???其它 求:1){|21|2}P X -<;2)2 Y X =的密度函数()Y y ?;3)(21)E X -; 2、(12分)设随机变量(X,Y)的密度函数为 1/4, ||,02,(,)0, y x x x y ?<<=? ?其他 1) 求边缘密度函数(),()X Y x y ??; 2) 问X 与Y 是否独立?是否相关? 3) 计算Z = X + Y 的密度函数()Z z ?; 3、(11分)设总体X 的概率密度函数为: 1, 0(),000 x e x x x θ?θθ -?≥?=>?? X 1,X 2,…,X n 是取自总体X 的简单随机样本。 1)求参数θ的极大似然估计量?θ ; 2)验证估计量?θ 是否是参数θ的无偏估计量。 2.(10分)环境保护条例,在排放的工业废水中,某有害物质不得超过0.5‰,假定有害物质含量X 服从正态分布。现在取5份水样,测定该有害物质含量,得如下数据: 0.530‰,0.542‰,0.510‰,0.495‰,0.515‰ 能否据此抽样结果说明有害物质含量超过了规定(0.05α=)? 学习好资料 第一套试卷及参考答案 一、选择题 ( 40 分) 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制 ( B ) A 条图B 百分 条图或圆图C 线图D 直方图 2、均数和标准差可全面描述D 资料的特征 A 所有分布形式E负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检 验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A. 个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同 6、男性吸烟率是女性的10 倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D )率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t 检验,其目的是检验( C ) A两样本均数是否不同B两总体均数是否不同 C 两个总体均数是否相同 D 两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n i和住,在进行成组设计资料的t 检 验时,自由度是( D ) (A) n i+ n2 (B) n i+ n2 - C) n1+ n2 +1 D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B 总体参数的波动大小 C 重复实验准确度的高低 D 数据的离散程度 11、最小二乘法是指各实测点到回归直线的(C) A垂直距离的平方和最小E垂直距离最小 C纵向距离的平方和最小D纵向距离最小 12、对含有两个随机变量的同一批资料, 既作直线回归分析, 又作直线相关分析。 令对相关系数检验的t值为t r,对回归系数检验的t值为t b, 二者之间具有什么关系?( C) A t r >t b B t r 第四章抽样误差与假设检验 练习题 一、单项选择题 1. 样本均数的标准误越小说明 A. 观察个体的变异越小 B. 观察个体的变异越大 C. 抽样误差越大 D. 由样本均数估计总体均数的可靠性越小 E. 由样本均数估计总体均数的可靠性越大 2. 抽样误差产生的原因是 A. 样本不是随机抽取 B. 测量不准确 C. 资料不是正态分布 D. 个体差异 E. 统计指标选择不当 3. 对于正偏态分布的的总体, 当样本含量足够大时, 样本均数的分布近似为 A. 正偏态分布 B. 负偏态分布 C. 正态分布 D. t分布 E. 标准正态分布 4. 假设检验的目的是 A. 检验参数估计的准确度 B. 检验样本统计量是否不同 C. 检验样本统计量与总体参数是否不同 D. 检验总体参数是否不同 E. 检验样本的P值是否为小概率 5. 根据样本资料算得健康成人白细胞计数的95%可信区间为7.2×109/L~ 9.1×109/L,其含义是 A. 估计总体中有95%的观察值在此范围内 B. 总体均数在该区间的概率为95% C. 样本中有95%的观察值在此范围内 D. 该区间包含样本均数的可能性为95% E. 该区间包含总体均数的可能性为95% 答案:E D C D E 二、计算与分析 1.为了解某地区小学生血红蛋白含量的平均水平,现随机抽取该地小学生450人,算得其血红蛋白平均数为101.4g/L,标准差为1.5g/L,试计算该地小学生血红蛋白平均数的95%可信区间。 [参考答案] 样本含量为450,属于大样本,可采用正态近似的方法计算可信区间。 101.4 X=, 1.5 S=,450 n=,0.07 X S=== 95%可信区间为 下限: /2.101.4 1.960.07101.26 X X u S α=-?= -(g/L) 上限: /2.101.4 1.960.07101.54 X X u S α +=+?=(g/L) 即该地成年男子红细胞总体均数的95%可信区间为101.26g/L~101.54g/L。 2.研究高胆固醇是否有家庭聚集性,已知正常儿童的总胆固醇平均水平是175mg/dl,现测得100名曾患心脏病且胆固醇高的子代儿童的胆固醇平均水平为207.5mg/dl,标准差为30mg/dl。问题: ①如何衡量这100名儿童总胆固醇样本平均数的抽样误差? ②估计100名儿童的胆固醇平均水平的95%可信区间; ③根据可信区间判断高胆固醇是否有家庭聚集性,并说明理由。 [参考答案] ①均数的标准误可以用来衡量样本均数的抽样误差大小,即 30 S=mg/dl,100 n= 3.0 X S=== ②样本含量为100,属于大样本,可采用正态近似的方法计算可信区间。 207.5 X=,30 S=,100 n=,3 X S=,则95%可信区间为 下限: /2.207.5 1.963201.62 X X u S α=-?= -(mg/dl) 概率论与数理统计试题 与答案 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】《数理统计》试卷及答案
医药数理统计习题和答案
数理统计试题及答案
(完整word版)医药数理统计大纲_试题及答案(1)
概率论与数理统计期末考试题及答案
医药数理统计习题及答案汇编
医药数理统计第六章习题集(检验假设和t检验)
概率论与数理统计试题与答案