中医药统计学.
- 格式:ppt
- 大小:288.00 KB
- 文档页数:17
中医药统计学与软件应用笔记重点绪论统计学家C.R.劳先生在《统计与真理——怎样运用偶然性》中指出:在终极的分析中,一切知识都是历史;在抽象的意义下,一切科学都是数学;在理性的基础上,所有的判断都是统计学。
一、统计学的概念、发展简史及主要内容1.统计学:是以概率论和数理统计为基础,对研究对象的数据进行搜集、整理和分析,揭示事物总体特征和规律的方法论科学。
2.中医统计学:是以概率论和数理统计的原理和方法为基础,以中医理论与实践为主体,通过对数据的搜集、整理和分析,达到探讨中医理论与方法内在规律的目的。
3.统计学的发展趋势:①依赖数学。
②与计算机技术结合。
③与实质性学科、统计软件、现代信息相结合,所发挥的功效日益增强。
④从描述事物现状、反映事物规律,向抽样推断、预测未来变化方向发展。
4.统计学的主要内容⑴研究设计:专业设计、统计学设计⑵统计学的基本概念、原理和思维方法⑶统计描述:统计指标、统计图表⑷统计推断:参数估计、假设检验二、统计工作的基本步骤和特点1.统计工作的基本步骤(1)统计学设计(2)搜集资料:①常规保存的记录;②现场调查记录;③实验/试验记录;④医学文献/网络信息。
(3)整理资料:①检查;②审核;③计算机检查;④分组。
(4)分析资料2.统计学认识现象的特点(1)数量性:(2)群体性:(3)具体性:(4)概率性:三、统计学中常用的概念1.总体(population):是根据研究目的确定的同质观察单位的集合。
例①河北省18岁男性的身高和体重分布②某性红地2005年健康成年男细胞数③河北省18岁身高在170-175cm男性的体重分布⑴有限总体:指总体限定于特定的空间、时间范围内有限个观察单位。
⑵无限总体:指没有空间和时间范围限制的总体。
2.样本(sample):从总体中随机抽取的有代表性的一部分观察单位的集合。
样本的可靠性:指总体确定后,样本中的每一个观察单位确属预先规定的同质总体。
样本的代表性:即样本能够充分反映总体的真实情况。
1.统计学:处理数据中变异性和复杂性的科学和艺术。
2.统计工作:搜集、整理、分析和研究统计数据的工作过程,是统计数据和统计理论的基础和源泉。
3.中医统计学:处理中医理论和时间中的同质性和变异性的科学和艺术。
4.假设检验:利用样本信息,根据一定的概率水准,推断指标间的差别有无意义的统计分析方法。
5.总体:根据研究目的确定的同质性的观测单位的集合。
6.样本:从统计单位中随机抽取的具有代表性的部分观测单位的集合.7.同质:构成总体的各个观测单位在某一方面或某几个方面的性质相同。
8.概率:某种现象发生的次数9.误差:实际观测值与真值之差或样本指标与总体指标之差。
10.系统误差:仪器、方法、试剂、条件、顺序、人为的差异,感官,理论和实验方法的差异。
11.研究设计:以尽可能少的人力、物力、财力完成预期的研究目的。
12.搜集资料:是指根据研究目的和射击要求,采用特定的方法和手段从交流传播的大量信息中分析,鉴别,选择和获取对中医药科研有利用价值信息的过程。
13.计量资料:是由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数值大小所获得的资料。
14.名义资料:又称无序资料。
按不同的类别加以分类的资料,其取值通常具有某种属性或特征的个数,特点是可在非数字中取值,各类之间具有性质上的差异。
15.等级资料:又称有序资料,或半定量资料,按不同的类别加以分类的资料。
特点是其各等级间有程度或量的差异,即可按数量的相对大小或程度的高低排出顺序。
16.频数分布:指观测值按大小分组,各个组段内观测值个数的分布,它是了解数据分布形态特征与规律的基础。
17.泊松分布:常见的离散型分布,用来描述单位面积体积时间人群内等有或罕见时间发生数的分布规律18.相对比:描述两个有关指标的比例关系19.极差R:最大值与最小值之差20.中位数M:将一组观测值按大小顺序排列,位次剧中的数值为中位数21.变异系数CV:是一组观测值的标准差与均数的百分比22.集中趋势:指一组变量值的集中倾向或中心位置23.区间估计:即结合样本统计量和标准误确定一个具有较大可信度的包含总体参数的区间。
中医药统计学十四五课后题答案练习题答案第一章医学统计中的基本概念练习题一、单向选择题1. 医学统计学研究的对象是A. 医学中的小概率事件B. 各种类型的数据C. 动物和人的本质D. 疾病的预防与治疗E.有变异的医学事件2. 用样本推论总体,具有代表性的样本指的是A.总体中最容易获得的部分个体B.在总体中随意抽取任意个体C.挑选总体中的有代表性的部分个体D.用配对方法抽取的部分个体E.依照随机原则抽取总体中的部分个体3. 下列观测结果属于等级资料的是A.收缩压测量值B.脉搏数C.住院天数D.病情程度E.四种血型4. 随机误差指的是A. 测量不准引起的误差B. 由操作失误引起的误差C. 选择样本不当引起的误差D. 选择总体不当引起的误差E. 由偶然因素引起的误差5. 收集资料不可避免的误差是A. 随机误差B. 系统误差C. 过失误差D. 记录误差E.仪器故障误差答案: E E D E A二、简答题1.常见的三类误差是什么?应采取什么措施和方法加以控制?[参考答案]常见的三类误差是:(1)系统误差:在收集资料过程中,由于仪器初始状态未调整到零、标准试剂未经校正、医生掌握疗效标准偏高或偏低等原因,可造成观察结果倾向性的偏大或偏小,这叫系统误差。
要尽量查明其原因,必须克服。
(2)随机测量误差:在收集原始资料过程中,即使仪器初始状态及标准试剂已经校正,但是,由于各种偶然因素的影响也会造成同一对象多次测定的结果不完全一致。
譬如,实验操作员操作技术不稳定,不同实验操作员之间的操作差异,电压不稳及环境温度差异等因素造成测量结果的误差。
对于这种误差应采取相应的措施加以控制,至少应控制在一定的允许范围内。
一般可以用技术培训、指定固定实验操作员、加强责任感教育及购置一定精度的稳压器、恒温装置等措施,从而达到控制的目的。
(3)抽样误差:即使在消除了系统误差,并把随机测量误差控制在允许范围内,样本均数(或其它统计量)与总体均数(或其它参数)之间仍可能有差异。
2 计量资料分析题解习题2.1解答1. 从同一批号的阿斯匹林片随机抽取5片,测得溶解50%的时间(min )为:5.3、6.6、5.2、3.7、4.9,做总体均数和总体方差的无偏点估计,求样本标准差及变异系数。
解 分别计算样本均数、样本方差,得到X =(5.3+6.6+5.2+3.7+4.9)/5=5.1400S 2=[(5.3-5.14)2+(6.6-5.14)2+(5.2-5.14)2+(3.7-5.14)2+(4.9-5.14)2]=1.0730S =0730.1=1.0359 CV =1.0359/5.1400=0.2015故μ及σ2的无偏点估计分别为μˆ=5.1400,2ˆσ=1.0730 2. 某药的某种成分含量服从正态分布,方差σ2=0.1082。
现测定9个样品,含量的均数X =4.484,根据α=0.05求含量总体均数的置信区间。
解 σ已知,用u 估计,μ的置信度0.95的置信区间为)5546.4,4134.4(9/108.0960.1484.4=⨯μ3. 从一批药丸随机抽取35丸,测得平均丸重为1.5 g 、标准差为0.08 g ,求该批药丸平均丸重总体均数置信度为95%的置信区间。
解 小样本,用t 估计,μ的置信度0.95的置信区间为)5275.1,4725.1(35/08.00322.25.1=⨯μ4. 检查某市12岁健康女学生144人的血红蛋白含量,求得其样本均数为119.62L g ,样本标准差为9.98L g ,试求该市12岁健康女学生学血红蛋白含量总体均数置信度为95%的置信区间。
解 大样本,用u 估计,μ的置信度0.95的置信区间为)2639.121,9761.117(35/08.0960.15.1=⨯μ5. 用1题的样本,求总体方差置信度为95%的置信区间。
解 σ 2的置信度0.95的置信区间为)8608.8,3852.0(1.0359 42484.015 ,.03591· 3143.111522=⎪⎪⎭⎫ ⎝⎛⋅--习题2.2解答1. 某批大黄流浸膏5个样品中的固体含量(%)测定为:32.5、32.7、32.4、32.6、32.4。
表1-1 ××病感染按性别、年龄整理表(问题表) 性别 年龄(岁) 合计 男 女 0~ 5~ 10~ 15~ 调查人数感染人数表1-2 ××病感染按性别、年龄整理表(正确表) 年龄组 男 女 调查人数 感染人数 调查人数 感染人数0~ 5~ 10~ 15~ 合计 第一节 中医药统计学的意义和内容中医药统计学(Statistics for Traditional Chinese Medicine )是将数理统计的原理和方法应用于生物医药特别是中医中药科研,收集、整理和分析资料,推断和表达不确定现象客观数量规律的一门应用学科。
中医药统计学的主要内容包括统计学基本理论和统计分析方法,统计分析方法包括统计设计(statistical design )、统计描述(statistical description )和统计推断(statistical inference ),表达因素间的关系、生存分析、多元分析等。
例如,表1-1,由于将性别与年龄这两个有联系的项目分割开来,计算不出不同性别、年龄的感染率,丧失了有价值的信息,为了克服上述缺点,应采用表1-2的整理表。
又如,第六章例6-1表6-2两种疗法的疗效资料,治愈率按治愈数/治疗数计算,从病情重、中、轻三种情形来看,都是甲疗法治愈率低于乙疗法。
但是,合计起来却是乙疗法治愈率低于甲疗法。
不作统计处理,就不能得到正确的疗效结论。
再如,第九章例9- 表9- 资料,怎样判断降压宁的疗效,需要一定的理论和方法,才能从表9- 的观测数据推理到任何高血压患者服用降压宁后的疗效。
因此,国家中医药管理局规定,未经统计处理的数据是无效数据。
中医药科研的基本步骤包括立题,设计,实施试验,收集整理分析试验所得信息和资料,均需用到中医药统计学的思维和方法。
我国的《药品注册管理办法》规定,新药临床试验必须自始至终有统计学人员参与;生物医药实验室研究、临床研究和医药公共事业管理都要寻求统计学家的帮助。
某市12岁男童110人的身高〔cm 〕如下:身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164频数〔f 〕1 2 9 20 35 24 13 3 2 1〔1∑∑=f fx x =140.9cm 1/)(1)(222--=--=∑∑∑∑∑∑f ffx fx f x x f s =5.99cm〔2〕该市男童身高95%的参考值围:百分位数法:〔5..2P ,5.97P 〕=(128,156)cm正态分布法:〔s x 96.1-,s x 96.1+〕=〔140.9-1.96×5.99,140.9+1.96×5.99〕=〔129.2,152.6〕cm某市12岁男童110人的身高〔cm 〕如下:身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164频数〔f 〕1 2 9 20 35 24 13 3 2 11、对该资料作正态性检验;2、求这110名男童身高的均数、标准差、变异系数;3、写出该市男童身高95%的参考值围;1、 用SAS/INSIGHT 建立如下形式的数据集:AB124 1128 2…………156 2160 12、 SAS 处理主要步骤:鼠标点击Edit →Variables →Other →将变量A 移到Y 框下,选a+b*Y 后在a:出键入2,点击OK ,形成组中值变量A-A 。
鼠标点击Analyze →Distribution(Y),将变量A-A 移到Y 框下,将B 移到Freq 框下→点击Output,选Tests for Normality →OK.3、 SAS 输出结果:正态性检验:p=0.0007,均数Mean :140.8727cm ,标准差Std. Deviation :5.99405cm该市男童身高95%的参考值围〔p2.5,p97.5〕=〔128.5455,154.8000〕cm某市12岁男童110人的身高〔cm 〕如下:身高组段 124— 128— 132— 136— 140— 144— 148— 152— 156— 160—164频数〔f 〕1 2 9 20 35 24 13 3 2 1)99.596.187.144,99.596.187.144()96.1,96.1(⨯+⨯-=+-s x s xcm )61.156,13.133(=或用百分位数法〔5.2p ,5.97p 〕=〔131.50,156.50〕cm三、按随机设计,对功能性子宫出血的实热型患者12例与虚寒型患者10例的血液皮质醇含量进展测定,数据如下: 实热组1x :25.5 24.5 26.5 26.0 25.0 23.5 24.5 24.0 23.0 25.527.0 26.5虚寒组2x :12.5 10.5 14.5 15.0 13.5 13.0 12.5 11.5 12.0 13.5试比拟两种类型患者的血液皮质醇含量有无差异?〔假定资料满足正态性〕(1) 根本计算如下: =1n 12 =1x 25.125 =1s 1.2636=2n 10 =2x 12.85 =2s 1.355(2) 方差齐性检验假设210:σσ=H 211:σσ≠H 05.0=α15.12636.1355.1222122===s s F 查F 界值表得)11,9(05.0F =3.59因为 F>)11,9(05.0F 所以05.0>p 按05.0=α水准,不拒绝0H ,两总体方差相等。
中医药统计学教学体会一、实践与体会(一)强调教学内容,扩大学习范围中医药统计学的统计量众多,由于使用统计方法不同产生的差异也很大。
扎实把握各类适用条件,合理地选择统计量成为高等医学院校学生在学习中医药统计学过程中的关键环节。
在这种软件统计教学中,我们是根据类型进展分块处理的,假如以此作为根本依据来组织教学过程能够很明白地将统计量系统完整地呈现在学生面前,能够突出教学的内容,到达提纲挈领的目的。
在讲授各类数据的分布特征的同时,可以运用其他的对话框,作为依据,来进展趋势的集中统计或者是离散型的趋势统计指标的内容来进展具体地讲解。
假如通过单因素方差在进展分析讲解的过程中,通常选用两两进展比拟的方法。
这样做的目的,是为了通过对话框的形式让学生能够比拟直观地感受到可选方案的多样性,然后通过教师的讲解使得学生能够更加深入地思索问题,有更加深刻的体会。
从而学会解决问题的方式方法和根本条件,从而打算了统计量的产生极其最终的选择。
这样的教学方法不仅能够使学生轻松把握统计量和比拟方法,还能为进一步对其他统计量的学习引导了方向,最终到达了激发学生的兴趣,拓展学生力量的目的。
(二)强化规律思维,简化检验方法统计分析方法在选择过程中,不仅要考虑到设计的方案,资料的类型和讨论目的等等,还要全方位地考虑适用的条件,这也是重点因素之一。
在两种定量资料总体的均数差异比拟分析的过程中,假如资料能够满意独立和正态而且是方差齐性,我们就可以选择成组进展试验,假如不能满意就不能进展。
假如不满意方差齐性和正态性,可以进展的是变量变换或者是选择非参数进展试验。
因此,在定量比拟教学中,先进展方差齐性检验和正态性检验,然后再从选择统计分析方法的角度进展讲解和选择。
假如完全根据这种传统的就模式进展授课,不仅因其简单冗长降低了学生的兴趣,干扰了学生的思索更是影响了教学的有效成果,因此借助于软件教学的方法非常有效地缓解了这种冲突。
为中医药统计学的教育教学供应了全新的模式和有效的手段。
第一节频数分布表和频数分布图计量资料的统计描述,主要了解数据的集中趋势、离散趋势、分布的形态和范围等特征。
将各观察值及其相应的频数排列成表,称为频数分布表(frequency distribution table)。
将频数分布表绘制成图,称为频数分布图(frequency graph)。
对于大样本数据,需要编制频数分布表,通过频数分布表和频数分布图,可以直观提示数据资料的分布特征。
1.定量资料频数分布表和频数分布图的编制方法【例3-1】随机测得某地148名正常人血糖(mmol/L)结果如下,编制频数分布表,绘制频数分布图。
493 488 483 490 454 435 412 437 334 495 519 549 525 553 585 541 395 415 451 453 485 481 490 497 503 436 547 524 551 598 400 418 441 451 487 481 492 497 505 512 537 522 554 385 402 411 439 448 490 466 467 498 507 517 546 532 575 593 404 431 446 441 480 465 482 498 505 515 542 536 573 429 443 449 485 468 481 500 510 505 544 534 578 524 449 451 470 470 478 502 512 503 544 525 568 415 458 458 487 471 476 502 517 507 549 524 564 569 632 534 498 515 497 473 475 480 456 456 490 410 461 454 470 473 478 493 514 512 541 544 558 554 378 531 500 509 495 483 470 485 417 500 517 503 534 546 416 520先将全部观察值的极差R(R=观察值中最大值-最小值)分为若干组段,观察单位较少时组段可相对少些,观察单位较多时,组段数可酌情多些。
《中医药统计学》习题解答1 总体分布题解习题1.1解答1. 对三人做舌诊算一次试验。
设A ={3人正常}、B ={至少1人不正常}、C ={只有1人正常}、D ={只有1人不正常}。
分析这四个事件中的互斥事件、对立事件,描述事件A +D 、BD 各表示什么意思?解 设A i ={第i 人正常},用A i 表示A 、B 、C 、D 得到A ={三人正常}=321A A AB ={至少一人不正常}=321321321321321321321A A A A A A A A A A A A A A A A A A A A A ++++++ C ={只有一人正常}=321321321A A A A A A A A A ++ D ={只有一人不正常}=321321321A A A A A A A A A ++可以看出,互斥事件有A 与B ,A 与C ,A 与D ,C 与D ,A 与C 、D ;对立事件有A 与B 。
A +D =321A A A +321321321A A A A A A A A A ++={至少2人正常}={至多1人不正常}BD =321321321A A A A A A A A A ++={只有1人不正常}={只有2人正常}=D2. 我国四个地区一年的生育情况如表1-2所示,求生男孩的概率。
解 设A ={生男孩},计算得到)()(A f A P n ≈9645731022811994101990993496986528072514765513654++++++==0.51693. 在40个药丸中有3丸失效,任取5丸,求其中有2丸失效的概率。
解 这是古典概率模型。
在40个药丸中任取5丸,每一个药丸均可能被取到,且被取到表1-2 四个地区生育情况 地区编号生育总数 生男孩数 1 990 993 513 654 2 994 101 514 765 3 1 022 811 528 072 4964 573496 986的可能性相等,可能结果有540C 个基本事件。
1.中医统计学:处理中医理论与实践中的同质性和变异性的科学与艺术.以概率论和数理统计原理为基础,以中医理论与实践为主体,通过对数据的搜集、整理、分析和推断,从而达到探讨中医理论与方法内在规律的目的.2.总体:根据研究目的确定的同质观测单位的集合. (无限总体和有限总体)3.样本:从统计总体中随机抽取的、具有代表性的部分观测单位的集合.4.同质:构成总体的各个观测单位在某一方面或某几方面的性质相同或基本相同.5.变异:在同质基础上各观察单位(或个体)之间的差异.6.事件:泛指事物发生的某种情况或在调查、观察和实验中获得的某种结果.(确定性事件和随机事件)8.频率:某种现象在重复随机试验中发生的比例.9.概率:某随机事件A发生的可能性大小,记为P(A).10.频数:指研究对象安某属性进行分组后,各组中观测值的个数.11.众数:一群数据中出现次数(频数)最多的值.12.随机:在抽样、分组、实验/试验顺序安排过程中,每个观测单位都不受研究者主观意愿驱使,具有同等的机会被抽中、分配或安排,目的是保证样本具有代表性.13.随机变量:随机事件各种不同的结果.(离散型变量和连续型变量)14.量值:随机事件各种具体的观测值.15.误差:实际观测值与真值之差个差或样本指标与总体指标之差.(非随机误差(粗差、系统误差)和随机误差(测量误差、抽样误差))16.分布:随机变量取值的变化及相应的频率变化的规律性.17.频数分布:指观测值按大小分组,各个组段内观测值个数(频数)的分布,是了解数据分布形态特征和规律的基础.18.正态分布:(高斯分布)一种常见的、最重要的连续型对称分布标准正态分布:期望值μ=0,标准差σ=1的正态分布19.医学参考值范围:为了减小变异的影响,提高参考值作为为判断正常或异常的可靠性所确定的绝大多数正常人医学参考值的波动范围.20.构成比:事物内部各组成部分所占整体的比重或分布,常用百分数表示.构成比=(某现象内部某一部分的个体数/某现象内部个体数之和)×100%21.相对比:描述两个有关指标的比例关系(通常以倍数或百分数表示).率:表示某现象发生的频率或强度,是频率指标.22.抽样误差:由个体差异和随机抽样造成的样本和总体、样本与样本相应统计指标之间的差异.23.区间估计:结合样本统计量和标准误确定一个具有较大可信度的包含总体参数的区间,该区间称为总体参数的1-α可信区间(CI)24.无效假设:记为 H0,表示差别由抽样误差引起,无统计学意义.备择假设: 记为 H1,表示差别为处理因素所致,有统计学意义.分为单侧和双侧两种形式25.检验水准:(显著性水准)符号为α,事先规定的对假设成立与否作出判断的依据,常取0.05或0.0126.P值:在检验假设所规定的总体中作随机抽样,获得等于及大于/小于现有样本统计量的概率,即各样本统计量的差异来自抽样误差的概率,是判断H0成立与否的依据.确定P值的方法有查表法和计算法27.I型错误:统计推断结果拒绝了实际上成立的H0,犯了”弃真”的错误.指组间差异实际上不存在,统计推断结果却错误地认为存在组间差异,故称为以假为真的错误为阳性错误,其概率用α表示II性错误:统计推断结果不拒绝实际上是不成立的H0,犯了”存伪”的错误. 指组间确实存在差异,统计推断结果却未检查出该差异,故称为以真为假的错误为阴性错误,其概率用β表示28.检验效能:(把握度)符号为1−β,当组间确实存在差异时,按所规定的α水平能发现组间差异的能力,或当H0不成立时拒绝H0的概率29.秩次:全部观测值按顺序排列的位序. 秩和:同组秩次之和秩和检验:用于总体为非正态或不易确定的分布资料、不能或未加精确测量资料等效率较高的非参数检验方法30.相关:指一个变量增大,另一个变量也随之增大或减少的共变现象相关关系:两个变量有共变现象直线相关:判断两个变量之间有无直线相关关系并回答相关的方向和相关程度如何的统计分析方法相关系数:符号为r,说明具有相关关系的两个变量间相关关系的密切程度与相关方向的指标.31.直线回归:用直线回归方程或数学模型描述两个变量间线性依存关系的一种统计分析方法回归系数:回归方程中表示自变量x对因变量y影响大小的参数,在直线回归方程中ŷ=a+bx中x每改变一个单位,y变动b个单位.32.无序资料:(名义资料)取值通常是具有某种特征或属性的个数,特点是可在非数字中取值,各类之间具有性质上的差异;有序资料:(等级资料或半定量资料),特点是各等级间有程度或量的差异,即可按数量的相对大小或程度的高低排出顺序.1.统计学的主要内容:研究设计(专业设计和统计学设计)、统计描述、统计推断(参数估计和假设检验)2.假设检验的步骤:1)建立检验假设、确定检验水准2)选择检验方法、计算统计量3)确定P值、做出推论3.专业设计的基本要素:受试对象、处理因素和试验效应4.统计设计的基本原则:对照(空白、实验、安慰剂、标准、历史、自身、相互和复合处理对照)、随机(单纯、系统、整群和分层随机抽样)、均衡、重复5.受试对象的选择需满足:对处理因素有较强的敏感性和特异性、对处理因素有较稳定的反应性、可行性6.数值变量的统计描述:1)集中趋势描述:描述一组观测值集中趋势的指标,是对同质基础上的样本或总体一般特征的指标.主要作用是①作为一组观测值的代表,表明该组观测值集中趋势的特征②便与同类研究对象进行对比分析.常用的平均数有算数平均数(总体均数μ、样本均数)、几何平均数G 和中位数M;2)离散趋势描述:及变异性指标,描述一组同质观测值变异程度大小(即数据的均匀性)的综合指标.常用的变异性指标有极差Q、标准差s、变异系数CV、标准误SE.R7.中医统计资料类型:1)计量资料:由数值变量产生的资料,即对每个观察单位用计量方法测得某项标志数,其具体取值通常是正实数(零、正实数和小数); 2)计数资料:由分类变量产生的资料,即对每个观察单位按某种属性分组计数而得的资料.特点是变量值表现为互不相容的属性或类别,无度量衡单位.分为二分类资料(按互不相容的属性分类)和多分类资料(按不同类别分类(无序资料和有序资料))8.直线相关的注意事项:1)线性相关表示两个变量间的关系是双向的,当散点图出现直线趋势时再做分析2)相关系数的计算只适用于两个变量都服从正态分布的资料3)样本相关系数r是总体相关系数ρ的一个估计值,r与ρ间存在抽样误差,必须作假设检验4)相关分析是用相关系数来描述两个变量间相互关系的密切程度和方向,相关关系不一定是因果关系9.应用相对数的注意事项:1)计算时分母不宜太小,若观察单位数较小,宜直接用绝对数表示;2)观察单位数不等的几个率不能直接相加求其合计率;3)资料对比时应注意可比性;4)资料分析时不能已构成比代替10.直线回归注意的问题:1)作回归分析要有实际意义,不能把毫无关联的两种现象做回归分析.2)在进行直线回归分析前应先绘制散点图,观察点的分布有直线趋势时才适宜作直线回归分析,若呈曲线趋势宜直线化后再分析3)适用范围一般以自变量的取值范围为限,在此范围内求出的估计值称为内插,超过此范围的值称为外延,应避免外延.11.应用检验假设注意事项:1)事先进行严密的统计学设计:除对比的主要因素外,其他可能影响结果的因素在对比的组间应相同或相近2)单侧检验和双侧检验的选择:双侧检验的检验思路比单侧宽且无限制条件,较为常用,适用于对预试验结果分析,双侧的接受域位于某一特定分布的中部,拒绝域分布在两侧,而单侧检验的接受域和拒绝域各占某一特定分布的一侧,同一检验水准下单侧比双侧界值小、拒绝域大、更易得出拒绝H03)灵活确定α水准:根据实际工作中对不同分析目的和要求,选用的α往往有一定的灵活性4)选择正确地统计方法:应根据分析目的、不同的资料类型及分布、设计方案的种类、样本量的大小等选用适当的检验方法5)正确理解统计推断的意义:统计推断结论是依据现有的设计、研究方法与条件、资料及分析目的和要求所取的水准,采用的统计分析方法等做出具有相应概率的解释,不宜将结论的意义扩大或缩小6)假设检验的结论不能绝对化:统计学结论是具有概率性质的推论,不能使用”肯定”、”证明”、”一定”、”说明”等词,此外有统计学意义时不一定有专业意义.(假设检验是否具有统计学意义取决于被研究事物有无本质差异、抽样误差的大小、所选用的α高低及死单侧还是双侧)7)结合专业知识作出推论:假设检验可帮助研究者作出合理的推断,不能代替研究者做出专业结论8)CI与假设检验的区别与联系:CI推断参考值的范围(量的大小),假设检验判断各参数间有无质的不同12.统计表的结构:1)表号:位于顶线上方、标题的左侧,与标题之间的空2个字符,以阿拉伯数字表示2)标题:位于顶线上方、标号之后,简明扼要地说明表的内容;3)标目:横标目是统计表的主语,表示被说明事物的主要标志, 纵标目是统计表的谓语,说明主语的各项指标.对标目的要求是文字简明、层次清楚,一张表内不要安排过多标目;4)线条:一般只出现顶线、标目线和底线3条等长线;5)数字:一律采用阿拉伯数字,同一指标的小数位数应一致,位次对齐;6)备注:一般不列入表中,必要时可用’*’表示SPSS电脑实验1.单样本t检验:1)用Explore正态性检验:选择Alnalyze→Descriptive statistics→Explore(Dependent:测量值, plots按钮:Normality plots with test)2)用One-Sample T Test单样本检测:选择Alnalyze→Compare Means→One-Sample T Test(右侧上面的Test框:测量值, 修改下面的Test框默认值(总体均数))2.配对t检验1)计算差值d: 选择Transform→Compute Variable(Target Variable:d,Numeric expession:方法一,单击运算键“-”,Numeric expession:法二) 2)对差值d用Explore正态性检验: (Dependent:d,同上)3)配对t检验: 选择Alnalyze→Compare Means→Paired-Sample T Test(Paired Variable:方法一、方法二)3.方差齐性检验1)用Explore正态性检验,Spread vs.level with levene test→Untransformed4.独立样本t检验1)选择Alnalyze→Compare Means→Independent-Samples T Test(Test框:测量值d,grouping:组别,Define groups:1、2等)1.完全随机设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :组别,Option视窗中Estimated Marginal Means→Display Means for:组别,Display: Descriptive statistics和Homogeneity tests→Continue→OK) 2.随机区组设计F检验:1)选择Alnalyze→General Linear Model→Univariate(Dependent:测量值,Fixed Factor(s) :方法、药物;Model视窗中选择Custom→Model:方法、药物,Sum of Squares:Type III, →Include intercept in model→Continue;Post Hoc视窗中,Post Hoc Test for:方法,S-N-K →Continue ;Option视窗中Display Means for:组别,Display:Descriptive statistics→Continue→OK)1.成组设计四格表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”对话框→statistics→Chi-square→Continue→OK2.配对设计四格表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”新法→Row(s)”以及”旧法→Column(s)”→statistics→McNemar→Continue→OK3.R×C表χ2检验:1)加权频数:Data→Weihgt cases→Weihgt case by(将频数变量选入框中返回)2) χ2检验: 选择Alnalyze→Descriptive statistics→Crosstabs→”组别→Row(s)”以及”结果→Column(s)”→statistics→Chi-square→Continue→OK1.直线相关分析:1)选择Alnalyze→Correlate→Bivariate→在Bivariate Correlations的视窗中,将进食量、增重量两变量同时选中,从左边源变量框中移置到由框中→OK2.直线回归分析:1)选择Alnalyze→Regession→Linear→在Linear Regession的视窗中,将左边“收缩压“变量送入右1.率的标准化法: 采用统一标准计算各率的标准化率,使率具有可比性,目的是在比较总率时消除混杂因素的影响.2.相对数:两个有联系的绝对数、相对数或平均数之比.(常用的相对数有率、构成比和相对比3.非参数检验:在统计推断中,不依赖于总体的分布形式, 直接对总体分布位置是否相同进行检验的方法,称非参数检验.4.等级资料: 将观察单位按某种属性的不同程度分组,所得各组的观察单位数,称为等级资料5.参数统计:在统计推断中 ,假定样本所来自的总体分布为已知的函数形式,但其中有的参数为未知, 统计推断的目的就是对这些未知参数进行估计或检验.6.参数估计:用样本统计量来估计总体参数,包括点值估计和区间估计.7.可信区间:在参数估计时,按一定可信度估计所得的总体参数所在的范围.8.假设检验:根据研究目的, 对样本所属总体特征提出一个假设, 然后用适当方法根据样本提供的信息,推断此假设应当拒绝或不拒绝, 以使研究者了解在假设条件下,差异由抽样误差引起的可能性大小,便于比较分析.9.中位数:将一组观察值按从小到大的顺序排列后, 位次居中的观察值.10.影响1−β的因素是:1) 1−β与样本量成正比:n越大,标准误越小, β减小,发现组间差异的能力越强2) 1−β与参数的差值成正比:参数间的差值越大,样本指标间的差值就越大,越易获得拒绝H0的结论3) 1−β与个体差异成反比:标准差越小,标准误就越小,统计量就越大, 1−β越高4) 1−β与设计类型有关:配对设计和配伍设计比完全设计的1−β高5) 1−β与检验方法有关:①参数检验所含的信息量比非参数检验多, 1−β高;②与检验方法要求的条件的多少成正比: 参数检验比非参数检验的1−β高;③检验水准α的大小成正比: α与β呈反比11.假设检验的目的和意义是什么?答: 在实际研究中,一般都是抽样研究,则所得的样本统计量(均数、率)往往不相等,这种差异有两种原因造成: 其一是抽样误差所致,其二是由于样本来自不同总体。