试验设计与数据分析试题
- 格式:doc
- 大小:96.00 KB
- 文档页数:3
1、正常人的脉搏平均72次/分,现测得10例某病患者的脉搏(次/分):54,67,68,78,70,66,67,70,65,69,试问此病患者与正常人有无明显差异?解答:(1)定义变量:脉搏跳动次数。
然后在变量视图和数据视图中分别输入数据,具体如下图:(2)本题研究的是此病患者脉搏跳动次数与正常人有无差异,因而应用单因素t 检验。
故假设72=μ,即此病患者脉搏跳动次数与正常人无显著差异。
(3)步骤:分析—比较均值—单因素t 检验得到输出结果:Sig=0.037<0.05,故拒绝原假设,接受备择假设,即此病患者脉搏跳动次数与正常人由于.有显著差异。
2、比较两种茶多糖提取工艺的试验,分别从两种工艺中各取1个随机样本来测定其粗提取物中茶多糖的含量,问两种工艺的粗提物中茶多糖含量(单位:%)有无显著差异?醇沉淀法(x1)27.5227.7828.0328.8828.7527.94超滤法(x2)29.3228.1528.0028.5829.0029.32解答:(1)分别定义变量:工艺方法、茶多酚含量。
然后在变量视图和数据视图中分别输入数据,具体如下图:(2)本题研究的是醇沉淀法和超滤法这两种工艺的粗提物中茶多糖含量(单位:%)有无显著差异,因而应用独立样本t 检验。
故假设21μμ=,即这两种工艺的粗提物中茶多糖含量无显著性差异。
(3)步骤:分析—比较均值—独立样本t 检验。
得到输出结果:由于F检验.Sig=0.766>0.05,故方差相等,即Equal variances assumed,选择第一行的数据。
对于t检验.Sig=0.104大于0.05,故接受原假设,即这两种工艺的粗提物中茶多糖含量无显著性差异。
3、用四种不同型号的仪器对某种机器零件的七级光洁表面进行检查,每种仪器分别在同一表面上反复测四次,得数据如下,试从这些数据推断四种型号的仪器对测量结果有无显著差异?仪器号数据1 2 3 4-0.21-0.06-0.17-0.14 0.160.080.030.11 0.10-0.070.15-0.02 0.12-0.04-0.020.11解答:(1)分别定义变量:仪器号、光滑度。
临床科研设计与分析试卷(带答案) 适用范围:__________ 出题教师:____________ 题型得分单选题名词解释简答题论述题总分1.资料整理的基础工作和资料分析的首要工作是对资料进行:( ) A. 审核B. 演绎分析C. 归纳分析D. 分类2. 查得资料比较杂乱,没有时代特点,属于哪种文献检索的特点:( ) A. 引文查找法B. 顺差法C. 综合查找法D. 逆差法3. 某医生用针刺疗法治疗三种不同的疾病,目的在于弄清:针刺治疗对哪种病疗效最好,三种病人分别在甲、乙、丙三组接受相同的辅助治疗。
该医生每天依次给甲、乙、丙三组病人(每组30 人) 一一扎针,这样做人为产生了:( ) A. 重复误差B. 随机误差C. 条件误差D. 抽样误差4. 实验研究变量的三个组成部分是:( ) A. 实验变量、过程变量和无关变量B. 实验变量、效果变量和无关变量C. 效果变量、过程变量和无关变量D. 效果变量、目标变量和有关变量5. 为了避免重复劳动,提高科学研究的效益,必要的工作是:( ) A. 文献检索B. 选定课题C. 课题论证D. 历史分析6. 根据访谈过程是否有严格设计的访谈提纲,可以把访谈调查分为:( ) A. 结构性访谈调查和非结构性访谈调查B. 个别访谈调查和集体访谈调查C. 电话访谈调查和网络访谈调查D. 一次性访谈调查和重复性访谈调查7. 研究生没有公开发表的学位论文属于类文献:( ) A. 教育档案B. 书籍C. 其他D. 报刊8. 书目属于文献等级中的:( ) A. 一次文献B. 四次文献C. 二次文献D. 三次文献9. 反映实验自变量与因变量的因果关系的真实性,决定实验结果解释的是:( ) A. 内在效度B. 生态效度C. 外在效度D. 总体效度10. 许多人习惯用单因素设计取代多因素设计,这样做在什么情况下易得出错误的结论:( ) A. 因素之间独立时B. 样本含量较小时C. 因素之间有交互作用时D. 实验者操作不太熟练时11. 开展一项科学研究,何时开始运用统计学知识:( ) A. 从最初的试验设计开始B. 有了试验数据之后C. 从计算机算出结果开始D. 有了试验设计之后12. 以下属于三次文献的是:( ) A. 索引B. 手册C. 论文D. 文摘13. 为了研究一组因素X1,X2,,Xg 对一组肺癌患者生存时间长短的影响,对病人进行追踪随访观察,观察结果分为两档,,即病人生存时间?2年和?2年,考察的危险因素有治疗方法( 4 种) 、治疗前病人的状态( 6种) 、病人的年龄、癌细胞的类型( 3 种)等。
水平号12345678序号AB112478224857336336448715551284663663775142887521y5.86.34.95.444.533.6SUMMARY OUTPU回归统计Multiple R 0.99970596265R Square 0.99941201175Adjusted R Sq 0.99917681646标准误差0.03240370349190230180220170210137.5138138138.5139139.5140底水量(x 1)/g 2202302404.0,4.5,3.0,3.6。
已知试验指标与两因素之间成二元线性关系,试用回归分析法139.5140吸氨时间(x 2)/min 136.5137吸氨时间(x 2)/min 选用均匀表U 8*(85)安排实验,8个试验结果(吸氨量/g)依次为:5.8,6.3,4.9,5.4,出较好工艺条件,并预测该条件下相应的吸氨量。
138.5139170180190200210137240第七章 均匀设计1、在啤酒生产的某项工艺实验中,选取了底水量(A)和吸氨时间(B)两个因素都取了8个水平,进行试验设计,因素水平如下。
试验指标为吸氨量,越大越好。
137.5回归方程模型为y =a+b 1x 1+b 2x 2136.5200底水量(x 1)/g观测值8方差分析dfSS MS F Significance F 回归分析28.9235 4.461754249.285714288.38342726421残差50.005250000000.00105总计78.92875Coefficients 标准误差t Stat P-value Lower 95%Intercept 96.52583333331.4768020536165.36138888561.5871169308092.7295928008底水量(x1)/-0.69666666660.010********-66.7626010421.42755955001-0.7234906467吸氨时间(x2)0.021*********.0005217491941.84641500741.470141026900.020********RESIDUAL OUTP 观测值预测 y 残差15.797500000000.0024999999926.32250000000-0.022******** 4.88250.017499999994 5.4075-0.00750000005 3.967500000000.032499999996 4.49250.007500000007 3.0525-0.052500000083.577500000000.022********观测值预测 y15.7975000000026.322500000003 4.88254 5.40755 3.967500000006 4.49257 3.052583.57750000000R=0.99 和Significance F=8.38342726421806E-09<0.01,说明该回归方程非常显y=96.5-0.70X 1+0.02X 2个因素,越好。
习题答案1.设用三种方法测定某溶液时,得到三组数据,其平均值如下:x1̅=(1.54±0.01)mol/Lx2̅=(1.7±0.2)mol/Lx3̅=(1.537±0.005)mol/L试求它们的加权平均值。
解:根据数据的绝对误差计算权重:w1=10.012,w2=10.22,w3=10.0052因为w1:w2:w3=400:1:1600所以w̅̅̅=1.54×400+1.7×1+1.537×1600400+1+1600=1.5376812.试解释为什么不宜用量程较大的仪表来测量数值较小的物理量。
答:因为用量程较大的仪表来测量数值较小的物理量时,所产生的相对误差较大。
如3.测得某种奶制品中蛋白质的含量为(25.3±0.2)g/L,试求其相对误差。
解:E w=∆ww =0.225.3=0.79%4.在测定菠萝中维生素C含量的测试中,测得每100g菠萝中含有18.2mg维生素C,已知测量的相对误差为0.1%,试求每100g菠萝中含有维生素C的质量范围。
解:E w=∆ww=0.1%,所以∆m=m×E w=18.2×0.1%=0.0182ww所以m的范围为18.1818mg<m<18.2182ww或依据公式w w=w×(1±|w w|)=18.2×(1±0.1%)mg5.今欲测量大约8kPa(表压)的空气压力,试验仪表用1)1.5级,量程0.2MPa 的弹簧管式压力表;2)标尺分度为1mm的U型管水银柱压差计;3)标尺分度为1mm的U形管水柱压差计。
求最大绝对误差和相对误差。
解:1)压力表的精度为1.5级,量程为0.2MPa,则|∆w|www=0.2×1.5%=0.003www=3wwww w=∆ww×100%=38×100%=3.75×10−1=37.5%2)1mm汞柱代表的大气压为0.133KPa,所以|∆w|www=0.133wwww w=∆ww×100%=0.1338×100%=1.6625×10−2=1.6625%3)1mm水柱代表的大气压:ρgh,其中g=9.80665m/s2,通常取g=9.8m/s2则|∆w|www=9.8×10−3wwww w=∆ww×100%=9.8×10−38×100%=1.225×10−36.在用发酵法生产赖氨酸的过程中,对产酸率(%)作6次评定。
试验设计与数据分析(考题)上海应⽤技术学院2009-2010 学年第1 学期《试验设计与数据处理》期(末)试卷班级:研究⽣学号:姓名:我已阅读了有关考试规定和纪律要求,愿意在考试中遵守《考场规则》,如有违反将愿接受相应的处理。
⼀、在⽤原⼦吸收分光光度法测定镍电解液中微量杂质铜时,研究了⼄炔和空⽓流量变化对铜在某波长上吸光度的影响,得到下表所⽰的吸光度数据。
试根据⼆、根据下表中的试验数据,画出散点图,求某物质在溶液中的浓度c(%)与其沸点温度T之间的函数关系,并检验所建⽴的函数⽅程式是否有意义。
(本题15三、某⼚在制作某种饮料时,需要加⼊⽩砂糖,为了⼯⼈操作和投料的⽅便,⽩砂糖的加⼊以桶为单位,经初步摸索,加⼊量在3~8桶范围中优选。
由于桶数只宜取整数,采⽤分数法进⾏单因素优选,优选结果为6桶,试问优选过程是如何进⾏的。
假设在试验范围内试验指标是⽩砂糖桶数的单峰函数。
(本题10分)(1)利⽤正交表L8(27)进⾏试验⽅案设计;(2)若试验结果(得率)依次为86,95,91,94,91,96,83,88,试⽤直观分析法分析试验结果;(3)确定最佳⽔平组合。
(本题20分)五、在啤酒⽣产的某项⼯艺试验中,选取了底⽔量x1和吸氨时间x2两个因素,因素 1 2 3 4 5 6 7 8 136.5 137.0 137.5 138.0 138.5 139.0 139.5 140.0底⽔量x1170 180 190 200 210 220 230 240 吸氨时间x2六、某产品的产量取决于3个因素x1(60~80),x2(1.2~1.5), x3(0.2~0.3),还要考虑因素x1,x2的交互作⽤。
选⽤正交表L8(27)进⾏⼀次回归正交试验设计,给出相应的试验⽅案。
(本题10分)七、已知某合成剂由3种组分组成,它们的实际百分含量分别为x1,x2,x3,且受下界约束x1≥0.2, x2≥0.4,x3≥0.2,运⽤单纯形重⼼配⽅设计寻找最优配⽅,试给出相应的试验⽅案。
硕士研究生《试验设计与数据处理》试题试分别用拉格朗日插值法(可仅采用20~50℃的4个点)和差商插值多项式求出35℃时水的表面张力,并确定合适的数学模型。
(10分)2. 已知某一化工过程符合下列模型:试用最小二乘法确定该模型的系数,使所得数学表达式能够拟合下表中的数据,并计3.现有一熟练工人,用3种不同的机器在4种不同的运转速度下生产同一种零件。
在相同的时间内生产的零件数如下表:试通过方差分析确定机器、运转速度对产量有无显著影响(取α=0.05)。
(10分)4.某种矿石含有两种有用的矿物X 和Y ,现将8个不同地域的该类矿石样品的分析结果列于下表。
请利用回归分析方法确定组分X 与组分Y 含量之间的关系,并分别进行5. 有3种不同的导弹系统、4种不同类型的推进器,对某种燃料进行发射试验,每一种组合水平做两次试验,测定导弹飞行速度如下表。
试分析导弹系统、推进器类型以及它们的交互作用对飞行速度有无显著影响(取α=0.05)? (10分)Xba Y6. 病毒学家在研究一种特殊病毒时发现:不同培养媒质、不同培养时间对病毒生长情况有影响。
现取两种媒质、两个培养时间,每一种组合下重复观察6次,病毒生长情况列在下表。
试用22设计分析法分析这些数据,考察媒质、时间对病毒生长的影响(取α=0.05、0.01)。
(10分)7.在研究显影剂浓度(A )和显影时间(B )对胶卷不透明度的影响时,采用3种浓度和3个时间,每一种组合下做4次重复试验。
得出不透明度的数据如下表。
试用32设计分析法分析这些数据,并得出结论(取α=0.05、0.01)。
(10分)8.为提高某种药品的合成率,对生产工艺进行了试验。
各因素及其水平如下表。
根据经验,采用液态醛有助于提高药品的合成率,用拟水平法、选L 9(34)正交表安排试验,将各因素放在正交表的1-4列上,9次试验所得合成率(%)依次为69.2、71.8、78.0、74.1、77.6、66.5、69.2、69.7、78.8。
中国石油和化学工业优秀教材奖一等奖试验设计与数据处理第三版课后答案一、单选题1.从互联网产生大数据的角度来看,大数据具有的特征是() [单选题] *A.“4V”特征:大量(Volume)、多样(Variety)、低价值密度(Value)、高速(Velocity)(正确答案)B.样本渐趋于总体,精确让位于模糊,相关性重于因果C.分布式存储,分布式并行计算D.没有特征2.下列可以用于分析数据趋势的是() [单选题] *A.饼图B.折线图(正确答案)C.动态热力图D.词云图3.数据分析的方法不包括() [单选题] *A线性分析(正确答案)B.关联分析C.聚类分析D.数据分类4.下列关于大数据的特征,说法正确的是()。
[单选题] *A.数据价值密度高B.数据类型少C.数据基本无变化D.数据体量巨大(正确答案)5.数据特征探索的主要任务是对数据进行预处理,以下不属于该过程的是()。
[单选题] *A.数据清洗B.异常数据处理C.数据缺失处理D.数据分类处理(正确答案)6.海军军官通过对前人航海日志的分析,绘制了新的航海路线图,标明了大风与洋流可能发生的地点。
这体现了大数据分析理念中的() [单选题] *A.在数据基础上倾向于全体数据而不是抽样数据B.在分析方法上更注重相关分析而不是因果分析(正确答案)C.在分析效果上更追究效率而不是绝对精确D.在数据规模上强调相对数据而不是绝对数据7.大数据时代已经在悄悄地改变我们的日常生活,也使人们日常生活更为便捷,如移动支付、网络约车出行、网络购物、网络预约挂号等。
以下不属于大数据分析的是()。
[单选题] *A.特征探索B.关联分析C.聚类与分类D.建模分析(正确答案)8.电子警察采用拍照的方式来约束车辆的行为,其拍照的过程属于()。
[单选题] *A.数据分析B.数据采集(正确答案)C.数据分类D.数据可视化表达9.某超市曾经研究销售数据,发现买商品A的人购买商品B的概率很大,这种属于数据的()。
一、单选题(题数:50,共 50.0 分)1在正交实验设计中,定量因素各水平的间距是( )(1.0分)1.0分正确答案:C 我的答案:C答案解析:2*随机单位设计要求( )。
(1.0分)0.0分单位组内没有个体差异,单位组间差异大正确答案:A 我的答案:3当组数等于2时,对于同一资料,方差分析结果与t检验结果( ) 。
(1.0分)0.0分t检验结果更准确完全等价且正确答案:D 我的答案:B答案解析:方差分析与t检验的区别与联系。
对于同一资料,当处理组数为2时,t检验和方差分析的结果一致且,因此,正确答案为D。
4下列结论正确的是( )①函数关系是一种确定性关系;②相关关系是一种非确定性关系;③回归分析是对具有函数关系的两个变量进行统计分析的一种方法;④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法.(1.0分)0.0分正确答案:C 我的答案:5在对两个变量,进行线性回归分析时,有下列步骤:①对所求出的回归直线方程作出解释;②收集数据、),,…,;③求线性回归方程;④求未知参数; ⑤根据所搜集的数据绘制散点图。
如果根据可行性要求能够作出变量具有线性相关结论,则在下列操作中正确的是( ) (1.0分)0.0分正确答案:D 我的答案:6*方差分析中变量变换的目的是( )。
(1.0分)0.0分正确答案:D 我的答案:7两个变量与的回归模型中,通常用来刻画回归的效果,则正确的叙述是( ) (1.0分)0.0分越小,残差平方和越小越大,残差平方和越大与残差平方和无关越小,残差平方和越大正确答案:D 我的答案:答案解析:8在一个正交实验中,因素A和B的水平数都为3,那么A和B的交互作用的自由度为( )(1.0分)0.0分正确答案:C 我的答案:答案解析:9单因素方差分析中,当P<0.05时,可认为( )。
(1.0分)0.0分正确答案:B 我的答案:答案解析:方差分析的检验假设及统计推断。
方差分析用于多个样本均数的比较,它的备择假设(H1)是各总体均数不等或不全相等,当P<0.05时,接受h1,即认为总体均数不等或不全相等。
一、填空题(共25分)1.根据误差产生的原因,误差可分为 随机 误差、 系统 误差和 过失 误差三大类。
其中 过失 误差是一种显然与事实不符的误差2.秩和检验法是用来检验A 、B 两组数据是否存在显著性差异的一种方法。
假设A 组数据无系统误差,如果A 与B 有显著性差异,则认为B 有 系统误差;如果A 与B 无显著性差异,则认为B 无 系统误差。
3.列出三种常用的数据图: 线图 、 条形图 、 圆形图 。
4.在回归分析中,设i y 、y 、i y 分别为试验值、算术平均值和回归值,则21()ni i i y y =-∑称为 残差 平方和,21()ni i y y =-∑称为 回归 平方和。
5.在试验设计中,黄金分割法是在试验区间内取两个试验点,这两个试验点分别是该试验区间的 0.618 倍和 0.382 倍。
6.L 8(41×24)是一个 正交设计(或混合水平正交设计) 试验表,其中8是 试验次数 (或横行数) ,它可以安排4水平的因素 1 个, 2 水平的因素 4 个,共 5 个因素的试验。
二、简答题(共20分)1.回归分析的用途是什么?写出用Excel 软件进行回归分析时的操作步骤。
(10分) 答:(1)回归分析是一种变量之间相关关系最常用的统计方法,用它可以寻找隐藏在随机性后面的统计规律。
通过回归分析可以确定回归方程,检验回归方程的可靠性等。
(2)用Excel 软件进行回归分析时的操作步骤是:① 从工具菜单中选择数据分析,则会弹出数据分析对话框,然后在分析工具库中选择回归选项,单击确定之后,弹出回归对话框。
② 填写回归对话框。
③ 填好回归对话框后,点击确定,即可得到回归分析的结果。
2.正交试验设计的基本步骤有哪些? (10分)答:(1)明确试验目的,确定评价指标; (2)挑选因素,确定水平(3)选正交表,进行表头设计; (4)明确试验方案,进行试验,得到结果; (5)对试验结果进行统计分析; (6)进行验证试验,作进一步分析。
1.正交表的基本性质是什么?三者之间的关系是怎样的?答:正交表的三个基本性质是正交性,代表性和综合可比性。
其中,正交表是核心,是基础,代表性和综合可比性是正交性的必然结果。
2.什么是统计假设检验?为什么统计推断的结论可能发生错误?有哪两个错误?答:统计假设检验又叫显著性检验,是一种由样本的差异去推断样本所在总体是否存在差异的统计方法。
显著性检验是根据小概率事件实际不可能性原理来否定或接受无效假设,所以不论是接受还是否定无效假说,都没有100%的把握,也就是说,在检验无效假说H0时可能犯两种错误,其中当无效假说本身正确,但是通过假设检验后却否定了它,也就是将非真实差异错判为真实差异,这样的错误统计上称为第一错误,反之,当无效假设本身错误时,通过假设检验后接受了它,也即把真实差异错判为非真实差异,这样的错误叫做第二类错误。
3.直线回归与相关分析是对两个变量间的关系进行描述,所以回归预测不受自变量x的取值区间的限制,这种说法对吗?为什么?答:不对,直线回归与相关分析一般是在一定取值区间内对两个变量间的关系进行描述,超出这个区间,变量间关系类型可能会发生改变,所以回归预测必须限制在自变量x的取值区间以内,外推要谨慎,否则会得出错误的结果。
4.对一元线性回归方程的显著性检验有哪些方法?这些方法的检验效果是否等价?答:对一元线性回归方程的显著性检验,通常采用3种方法,即相关系数检验法,F-检验法和t检验法,三种方法检验效果相同,是等价的。
5.试验设计的基本原则是什么?答:试验设计的基本原则是重复化原则,随机化原则,局部控制原则。
1.用最小二乘法确定直线回归方程的原则是各观察点与直线的纵向距离的平方和最小。
(√)2.试验数据的精密度高意味着正确度也高(×)3.各观察值均加(或减)同一数后,均数和标准差均改变(×)4.正态分布有两个参数μ和δ,δ越大相应的正态曲线的形态约扁平。
(√)5.比较身高和体重两组数据变异度大小宜采用变异系数。
试验设计与数据分析第一次作业习题答案习题答案1.设用三种方法测定某溶液时,得到三组数据,其平均值如下:x 1̅=(1.54±0.01)mol/Lx2̅̅̅=(1.7±0.2)mol/Lx3̅̅̅=(1.537±0.005)mol/L试求它们的加权平均值。
解:根据数据的绝对误差计算权重:w1=10.012,w2=10.22,w3=10.0052因为w1:w2:w3=400:1:1600所以X̅=1.54×400+1.7×1+1.537×1600400+1+1600= 1.5376812.试解释为什么不宜用量程较大的仪表来测量数值较小的物理量。
答:因为用量程较大的仪表来测量数值较小的物理量时,所产生的相对误差较大。
如3.测得某种奶制品中蛋白质的含量为(25.3±0.2)g/L,试求其相对误差。
解:E R=∆mm =0.225.3=0.79%4.在测定菠萝中维生素C含量的测试中,测得每100g菠萝中含有18.2mg维生素C,已知测量的相对误差为0.1%,试求每100g菠萝中含有维生素C的质量范围。
解:E R=∆mm=0.1%,所以∆m=m×E R= 18.2×0.1%=0.0182mg所以m的范围为18.1818mg<m<18.2182mg 或依据公式m t=m×(1±|E R|)=18.2×(1±0.1%)mg5.今欲测量大约8kPa(表压)的空气压力,试验仪表用1)1.5级,量程0.2MPa 的弹簧管式压力表;2)标尺分度为1mm的U型管水银柱压差计;3)标尺分度为1mm的U形管水柱压差计。
求最大绝对误差和相对误差。
解:1)压力表的精度为1.5级,量程为0.2MPa,则|∆x|max=0.2×1.5%=0.003MPa= 3KPaE R=∆x×100%=3×100%=3.75×10−1 =37.5%2)1mm汞柱代表的大气压为0.133KPa,所以|∆x|max=0.133KPaE R=∆x×100%=0.133×100% =1.6625×10−2=1.6625%3)1mm水柱代表的大气压:ρgh,其中g= 9.80665m/s2,通常取g=9.8m/s2则|∆x|max=9.8×10−3KPaE R=∆xx×100%=9.8×10−38×100% =1.225×10−36.在用发酵法生产赖氨酸的过程中,对产酸率(%)作6次评定。
试验设计与分析 第二章 习题1 在金属加工车间中有几种炉用来加热金属样品。
假设所有的炉都在同一温度上运行,尽管推测这一假设不一定为真。
随机选取三只炉并测量其加热温度,收集到的数据如下: 炉 温度1 491.50 498.30 498.10 493.50 493.602 488.50 484.65 479.90 477.353490.10 484.80 488.25 463.00 471.85 478.65(a )、炉间的温度有显著性差异吗? (b )、估计这一模型的方差分量。
解、经计算,得到如下方差分析表:(a )、由表知,炉间的温度有显著性差异。
若取05.0=α,检验P-值=0.005<05.0=α,故因拒绝原假设,有95%的把握认为炉间的温度有显著性差异。
(b )方差分量的估计结果已经展示在表中:SS A =594.530,SS E =413.812,SS T =1008.342;2 纺织厂有很多织布机,设每台织布机每分钟织出同样多的布,为了研究这一假设,随机选取5台织布机并测定它们在不同时间的产量,得出下述数据: 织布机 产量(lb/min) 1 14 14.1 14.2 14 14.1 2 13.9 13.8 13.9 14 143 14.1 14.2 14.1 14 13.9 4 13.6 13.8 14 13.9 13.75 13.813.613.913.814(a )说明为什么这是一种随机效应实验。
这些织布机的产量相等吗?(b )估计织布机间的变异性。
(c )估计实验的误差方差。
(d )给)222σσσττ+(找一个95%的置信区间。
解、(a )因为5台织布机是随机选取的,所以是一种随机效应实验; 经计算,得如下方差分析表:①原假设:H0:织布机不影响产量;H1:织布机影响产量; ②构造统计量:77.5==EMS MS F 处理; ③选定显著性水平:05.0=α;④决策:对于05.0=α,P-值为0.003<05.0=α,故拒绝原假设H0,接受备择假设H1,有95%的把握认为织布机影响产量。
食品试验设计与统计分析基础一、名词解释1.总体:具有共同性质的个体所组成的集团。
2.样本:从总体中随机抽取一定数量,并且能代表总体的单元组成的这类资料称为样本。
3.参数:由总体里所有观察值算得用以说明总体的数据特征,常用希腊字母表示。
一般有总体平均数μ,总体方差δ2,总体标准差δ等几种参数恒定不变。
4.统计数:有样本里全部观察值算得说明样本特征的数据。
包括样本平局数,标准差S,样本方差S2.5.准确性:试验结果真是结果相接近的程序。
6.精确性:在相对相同的条件下,重复进行同一试验,其结果相接近的程度。
7.系统误差:认为因素造成的差异。
8.随机误差:各种偶然的或人为无法控制的因素造成的差异。
9.数量性状的资料:能够称量、测量和计数的方法所表示出来的资料。
可分连续性.数量性状的资料和间断.数量性状的资料。
10.连续性资料:用计量的方法得到的数据性资料。
11.间断性资料:用计数的方法得到的数据性资料。
12.质量性状的资料:只能观察、分类或用文字表述而不能测量的一类资料。
13.两尾检验:具有两个否定域的假设试验。
14.一尾检验:具有单个否定域的月统计假设试验。
15.参数估计:又叫抽样估计,是样本统计数估计总体参数的一种方法。
16.点估计:用样本统计数直接估计相应总体参数的方法。
17.区间估计:在一定的概率保证下,用样本统计参数去估计相应总体参数所在范围。
18.置信区间:估计出参数可能出现的一个区间,使绝大多数该参数的点估计值都包含在这个区间内,所给出的这个区间称为置信区间。
19.α错误:把试验误差判断为真实差异,否定了正确的H0(措施:降低显著水平)。
20.β错误:把真实差异判断为试验误差,接受了错误的H0(措施:科学的试验设计,提高样本容量)。
21.置信度:保证参数出现在置信区间内的概率称为置信度。
22.直线回归:研究x、y变量间因果依存的方法。
23.直线相关:研究两个变量间直线关系的相关分析。
24.试验指标:根据研究的目的而选定的用来衡量或考核试验效果的质量特性。
田间试验与统计分析-习题集及解答1.在种田间试验设计方法中,属于顺序排列的试验设计方法为:对比法设计、间比法2.若要控制来自两个方面的系统误差,在试验处理少的情况下,可采用:拉丁方设计3.如果处理内数据的标准差或全距与其平均数大体成比例,或者效应为相乘性,则在进行方差分析之前,须作数据转换。
其数据转换的方法宜采用:对数转换。
4.对于百分数资料,如果资料的百分数有小于30%或大于70%的,则在进行方差分析之前,须作数据转换。
其数据转换的方法宜采用:反正弦转换(角度转换)。
5.样本平均数显著性测验接受或否定假设的根据是:小概率事件实际不可能性原理。
6.对于同一资料来说,线性回归的显著性和线性相关的显著性:一定等价。
7.为了由样本推论总体,样本应该是:从总体中随机地抽取的一部分8.测验回归和相关显著性的最简便的方法为:直接按自由度查相关系数显著表。
9.选择多重比较的方法时,如果试验是几个处理都只与一个对照相比较,则应选择:LSD法。
10.如要更精细地测定土壤差异程度,并为试验设计提供参考资料,则宜采用:空白试验11.当总体方差为末知,且样本容量小于30,但可假设==(两样本所属的总体方差同质)时,作平均数的假设测验宜用的方法为:t测验12.因素内不同水平使得试验指标如作物性状、特性发生的变化,称为:效应13.若算出简单相差系数大于1时,说明:计算中出现了差错。
14.田间试验要求各处理小区作随机排列的主要作用是:获得无偏的误差估计值15.正态分布曲线与轴之间的总面积为:等于1。
16.描述总体的特征数叫:参数,用希腊字母表示;描述样本的特征数叫:统计数,用拉丁字母表示。
17.确定分布偏斜度的参数为:自由度18.用最小显著差数法作多重比较时,当两处理平均数的差数大于LSD0.01时,推断两处理间差异为:极显著19.要比较不同单位,或者单位相同但平均数大小相差较大的两个样本资料的变异度宜采用:变异系数20.选择多重比较方法时,对于试验结论事关重大或有严格要求的试验,宜用:q测验。
09印刷工程5班方桂森 01、某饮料生产企业研制出一种新型饮料。
饮料的颜射共有四种,分别为橘黄色、粉色、绿色和物色透明。
随机从超市市场收集了前一期该种饮料的销售量(万元),如下表所示,试问饮料的颜色是否对销售产生影响。
:答:实验数据处理如下表SUMMARY组观测数方差求和平均橘黄色5粉色5绿色55无色实验分析:其中F-crit是显着性水平为时F的临界值,也就从F分布表中查到的(3,16),在本次试验中,F=>F-crit=,所以颜色因素对实验指标销售有显着影响,而 P-value=<,说明颜色因素对销售有显着影响,因为P-value表示的是因素对实验结果无显着影响的概率。
2、在用原子吸收分光光度法测定镍电解液中微量杂质铜时,研究了乙炔和空气流量变化对铜在某波长上吸光度的影响,得到下表所示的吸光度数据。
试根据表中数据分.析乙炔和空气流量的变化对铜吸光度的影响。
答:实验数据分析如下表:行 255行 35行 44列 14列 24 3列4 4列54列实验分析:表中行代表的是乙炔流量,列代表的是空气流量。
在乙炔流量因素中,我们可以看到,F=> F-crit=且P-value=<,所以乙炔流量这个因素对铜吸光度的影响非常显着,而在空气流量中F< F-crit且P-value>,所以空气因素对铜吸光度的影响不大。
3、为了研究铝材材质的差异对于它们在高温水中的腐蚀性能的影响,用三种不同的铝材在去离子水和自来水中于170°C进行了一个月的腐蚀试验,测得的深蚀率(μm)如下表所示。
试由下表所述结果考察铝材材质和水质对铝材腐蚀的影响。
.铝材材质去离子水自来水123试验数据处理结果:SUMMARY去离子自来水总计水 14观测数2215求和平均方差242观测数23求和平均方差03422观测数求和试验数据分析:表中样本表示铝材材质,列表示去不同液体,交互表示的是两个因素的交互作用,从表中可以看到,样本的和列的以及交F> F-crit=F> F-crit=互的F > F-crit=,同时样本的P-value和列的P-value以及交互的P-value都远远小于,所以我们可以读出结论,铝材材质和不同液体对实验结果铝材腐蚀的影响较大,同时铝材材质和不同液体的交互作用对铝材腐蚀有显着影响。
一、名词解释:(20分)1.准确度和精确度:同一处理观察值彼此的接近程度同一处理的观察值与其真值的接近程度2.重复和区组:试验中同一处理的试验单元数将试验空间按照变异大小分成若干个相对均匀的局部,每个局部就叫一个区组3回归分析和相关分析:对能够明确区分自变数和因变数的两变数的相关关系的统计方法:对不能够明确区分自变数和因变数的两变数的相关关系的统计方法4.总体和样本:具有共同性质的个体组成的集合从总体中随机抽取的若干个个体做成的总体5.试验单元和试验空间:试验中能够实施不同处理的最小试验单元所有试验单元构成的空间二、填空:(20分)1.资料常见的特征数有:(3空)算术平均数方差变异系数2.划分数量性状因子的水平时,常用的方法:等差法等比法随机法(3空)3.方差分析的三个基本假定是(3空)可加性正态性同质性4.要使试验方案具有严密的可比性,必须(2空)遵循“单一差异”原则设置对照5.减小难控误差的原则是(3空)设置重复随机排列局部控制6.在顺序排列法中,为了避免同一处理排列在同一列的可能,不同重复内各处理的排列方式常采用(2空)逆向式阶梯式7.正确的取样技术主要包括:()确定合适的样本容量采用正确的取样方法8.在直线相关分析中,用(相关系数)表示相关的性质,用(决定系数)表示相关的程度。
三、选择:(20分)1试验因素对试验指标所引起的增加或者减少的作用,称作(C)A、主要效应B、交互效应C、试验效应D、简单效应2.统计推断的目的是用(A)A、样本推总体B、总体推样本C、样本推样本D、总体推总体3.变异系数的计算方法是(B)4.样本平均数分布的的方差分布等于(A)5.t检验法最多可检验(C)个平均数间的差异显著性。
6.对成数或者百分数资料进行方差分析之前,须先对数据进行(B)A、对数B、反正弦C、平方根D、立方根7.进行回归分析时,一组变量同时可用多个数学模型进行模拟,型的数据统计学标准是(B)A、相关系数B、决定性系数C、回归系数D、变异系数8.进行两尾测验时,u0.10=1.64,u0.05=1.96,u0.01=2.58,那么进行单尾检验,u0.05=(A)9.进行多重比较时,几种方法的严格程度(LSD\SSR\Q)B10.自变量X与因变量Y之间的相关系数为0.9054,则Y的总变异中可由X与Y的回归关系解释的比例为(C)A、0.9054B、0.0946C、0.8197D、0.0089四、简答题:(15分)1.回归分析和相关分析的基本内容是什么?(6分)配置回归方程,对回归方程进行检验,分析多个自变量的主次效益,利用回归方程进行预测预报:计算相关系数,对相关系数进行检验2.一个品种比较试验,4个新品种外加1个对照品种,拟安排在一块具有纵向肥力差异的地块中,3次重复(区组),各重复内均随机排列。