第七章 体育统计学
- 格式:doc
- 大小:631.00 KB
- 文档页数:30
体育统计所有加粗字体都就是重点内容1.进行统计学得目得就是研究大量事物,现象数量方面(包括数量多少,现象之间得数量关系,数量得分布特征以及质与量互变得数量界限等)得某些规律。
2.体育统计概念:体育统计就是运用数理统计得原理与方法对体育领域里各种随机现象规律性进行研究得一种基础应用学科,属方法论学科范畴。
3.统计从性质上瞧分为两类:描述性统计与推断类统计。
4.体育统计得基本过程:收集整理分析5.体育统计得研究对象主要就是体育领域里得各种可量化得随机现象,还包括非体育领域但对体育得发展有关得各种随机现象。
6.体育统计所研究得数量方面特征:运动性特征综合性特征客观性特征研究对象得特点:数量性总体性差异性7.体育统计在体育活动中得应用:○1就是体育科研活动得基础○2有助于训练工作得科学化○3能帮助研究者制定研究实际○4能帮助研究者有效地获取文献资料8.总体:根据统计研究目得而确定得同质研究对象得全体称为总体。
总体分为假象总体与现存总体;现存总体分为有限总体与无限总体样本:根据需要与可能从总体抽取得研究对象所形成得子集为样本。
样本分为随机样本与非随机样本9.随机事件得数量表现称为随机变量;反映总体得一些数量特征称为总体参数;有样本所获得得一些数量特征称为样本统计量。
10.概率得主要性质:○1概率P为非负值,因m≥n,故任何随机事件得概率P≥0;○2当M=N时,P(A)=1,事件A为必然事件;当M=N时,P(A)=0,则事件A为不可能发生得事件;○3若A B两事件互相排斥,则有:P(A)+P(B)=P(A+B)、11.收集资料可直接收集,也可间接收集;收集资料得基本要求:1、资料得准确性2、资料得齐同性 3、资料得随机性。
收集资料得方法:日常累积全面普查专题研究。
几种简单得随机抽样:简单随机抽样分层抽样整群抽样12.资料得审核1初审2逻辑检查3复核频数分布表制作步骤1、求极差或全距2、确定分组数3、确定组距与组限值4、列频数分布图频数分布可用直方图与多边形图表示。
体育统计学1.体育统计学:是运用数理统计的原理或方法队体育领域中的随机现象的规律性进行研究的一门基础性应用学科2.统计资料的搜集:根据研究设计的要求,获取有关资料的过程,这是基础环节3.统计资料的整理:指按照分析的要求对数据进行审核和分类的过程4.资料的分析:指按照研究目的对整理后数据进行统计学处理的过程。
5.总体:根据研究目的所确定的研究对象的全体6.个体:总体中的每一个研究对象7.样本:总体中的一部分个体组成的集合8.样本含量:样本内含有的个体数9.总体参数:反映着总体的一些数量特征10.随机实验:为了某种研究目的而进行的一次观察力测试或实验统称为一次试验,若试验结果在试验前不能确定?则称试验为随机试验11.简单随机抽样:在不对总体进行划分,排队情况下按随机原则抽取样本单位的方法。
12.特征数:能够描述原始数据的总体或样本分布特征的统计量13.集中位置数:反映一群性质相同的观察值的平均水平或集中趋势的统计指标14.中位数:是将由一组观察值按大小顺序排列,处于中间位置的那个数值15.众数:是样本观测值在频数分布表中频数最多的那一组的组中值16.几何平均数:是样本观测值的连乘积,并以样本观测值的总数为次数,开方求得17.算数平均数:简称均数,描述一组数据在数量上的平均水平。
18.离中位置量数:描述一群性质相同的观测值的离散程度的统计指标19.全距:两极差20.绝对差:所有样本观测值与平均数绝对差之和21.平均差:样本中所有观测值与平均数绝对差距的平均数22.方差:样本数据与它们平均数之差的平方和的平均数23.变异系数:用于观察指标单位不同或均数相差较大时24.平均数的合成计算:将多个样本均数合并成一个大样本的均数计算25.相对数:是两个有联系的指标的比率,它可以从数量上反映两个相互联系的事物之间的对比关系26.有名数:是由两个性质不同但又有联系的绝对数或平均数指标对计算所得的相对数27.无名数:可以根据不同的情况分别采用倍数,百分数或千分数等来表示28.结构相对数:是在分组基础上,以各个分组合计数值与总数值对比的相对数,可以反映某事物各部分在总体中所占的比重29.比较相对数:是指不同地区(部门,单位,事物)的同期,同类指标进行比较的相对数他可以反映被比较的事物的差异情况及不平衡程度30.强度相对数:是两个性质不同但有密切联系,又属于同一时期或时点的绝对数或平均数指标的对比,它表明事物相对的发展水平,也表明两个对比事物之间的实际比例关系。
《体育统计学》课程教学大纲1998年制订,2003年修订课程名称:体育统计学课程类别:专业基础课开课单位:体育系体育理论教研室开课对象:体育教育专业三年级课时:28学时,其中讲授24学时、实践4学时选定教材:体育统计学,高松,北京,高等教育出版社,2002。
参考书:《体育统计学》北京人民体育出版社1991;《体育统计方法及程序》北京人民体育出版1990。
课程概述:《体育统计》是师范体育教育专业的一门必修专业基础理论课。
主要介绍体育统计一般原理,常用的统计方法,应用体育统计的方法分析和解决学校体育中的具体问题,为今后从事学校体育、卫生、科研工作打下基础。
教学目的:使学生掌握常用的体育统计一般原理,学习和掌握常用的统计方法,并应用体育统计的方法分析和解决学校体育中的具体问题,并为今后从事学校体育、卫生、科研工作打下基础。
学时分配:各章教学要求及教学要点第一章绪言【目的要求】了解体育统计研究对象与作用明确体育统计中的若干基本概念【讲授内容】体育统计研究的对象与作用体育统计中的若干基本概念:总体、个体、样本、随机事件、随机变量、随机抽样、总体参数和样本统计量、概率第二章资料的收集与整理【目的要求】了解统计资料的来源、途径掌握制作频数分布表和频数分布图的方法【讲授内容】统计资料的收集,收集资料的基本要求,收集资料的方法,几咱常用的抽样方法,简单随机抽样,分居抽样,整群抽样统计资料的整理,资料的审核,频数整理,直方图和多边形图第三章样本特征数【目的要求】了解平均数与标准差的意义掌握平均数与标准差的计算方法及在体育中的应用【讲授内容】集中位置量数,概念,种类,算术平均数的计算离中位置数,概念,种类,标准差的计算X和S在体育中的应用,在选择竞赛参赛运动员中应用,变异系数在稳定性研究中的应用,X±3S法在原始数据逻辑审核中的应用。
第四章相对数与动态分析【目的要求】了解常用的几个相对数的意义掌握计算方法和应用【讲授内容】相对数的概念,意义,种类,计算动态分析的概念,意义,动态数列,动态分析的步骤与计算,定基比,环比,增长值和增长率。
体育统计学简答简答单选判断1 事件包括:随机事件必然事件不可能事件2 概率的近似计算: P(A)=M/N3 如何在实际问题中确定总体和样本?总体和样本的关系?如果提高代表性?答:1 据概念(5名词解释) 2 包含,缩影,样本不完全等同于总体.样本对总体有一定代表性3 a严格按照随机抽样的原则进行抽样b 尽可能增大样本含量.样本数越多统计越准确4 常用的抽样方法:简单随机抽样机械随机抽样整群随机抽样分层随机抽样5 体育统计工作步骤:收集---整理-----分析6 样本统计量和统计参数之间的差异是由抽样误差造成的.7 平均数标准差及变异系数在体育研究中有哪些意义?(区别)答:样本平均数反映样本数据的整体水平,但是要结合标准差.标准差和变异系数反映样本数据的离散程度,对于运动成绩,表现为成绩的稳定性8 相对数在体育中的意义?(区别)答: 1可使原来不能直接相比的数量指标有可比性.2 是进行动态分析的重要依据9 动态分析在体育研究的意义?(应用)答:1 考察某些指标(如身体形态,素质等)发展变化的速度和规律2 预测事物发展的水平10 整台分布曲线的特点:1 为钟形曲线,在X轴上方 2 最高点在X=u 处(u是总体标准差)3 以x=u为对称轴,两边逐渐接近X轴4 随机变量X所有取值的概率之和为1.;即曲线下的面积为1. 5 总体的离散程度越大曲线越平缓.11 标准差百分,累进积分法,百分位数发的用途和优点是什么?答:1 标准百分用于正态分布及近似正态分布的资料上,能使不同计量单位的测量数据标准化,所以它适用于各种测量指标的比较和综合评价 2 累进积分法用于正态分布及近似正态分布的资料上,优点是运动水平越高,成绩上升一个单位的难度就越大,因此相应的得分也就越多 3 百分位数法可用于任何分布状态的资料上,(以分数反应某个运动成绩在集中的位置),优点通过位置,能了解某个成绩在集体中所处的位置,也能了解他的水平与集体水平的比较情况12 假设检验的目的:区分差异是由抽样误差引起的.(差异没有本质的区别.样本来自同一个总体)13 假设检验的基本原理:小概率事件 a=0.05显著水平a=0.01非常显著水平14 单侧检验与双侧检验:单侧检验只看差别不看方向.双侧不仅看差别还判断方向15 u检验与t检验的实用条件:主要看样本含量n>30 u检验 n<30为t检验16 t分布的特点:a 平均数位于中央曲线两侧关于y轴对称,曲线下总面积为1b t分布的曲线随自由度(根据n得出)的变化而变化c 当样本数n趋向于无穷大时,t分布曲线接近正态分布17 标准正态分布曲线的特点:a 最高点在x=0处b 以y轴为对称轴,两边逐渐接近x轴 c 其他特点都与正态分布曲线相同18 因素:试验所要考查的对象水平:因素在试验时所分的等级19 方差的意义: 方差和标准差一样,是描述数据离散程度的统计指标.20 方差的分析的基本思想(基本依据): a 如果u1 u2 u3之间没有差异,则三个样本之间的差异是抽样误差引起的,组内个体之间差异的大小和各组间个体差异的大小相近,即S间2/S内2≈1(无显著差异)b 如果u1 u2 u3之间有差异,则组间个体差异要比组内个体差异大的多,即 u不=u2不=u3 ,即 S间2/S内2>1(显著差异)21 变量之间的关系有两种,(函数关系和相关关系)有什么区别与联系?答区别:函数关系,对于某一变量的数值,都有另一个变量的确定值与之对应;相关关系,变量之间存在一定的关系,但不是确定的函数关系,变量之间这种有联系而又不确定的关系。
体育统计学复习资料1、体育统计学是统计学的原理和方法在体育中的应用,是统计学的一个分支学科。
体育统计学是一门收集、整理和分析体育中的统计数据的方法科学,其目的在于从量的侧面揭示体育现象的特征和规律性。
2、体育统计分析的过程:(1)根据研究的问题做出研究设计 (2)根据上述设计收集样本数据 (3)整理数据资料统计描述 (4)统计推断 (5)作出统计结论(6)结合专业分析讨论3、总体:根据研究目的所确定的研究对象全体,它是由同质的个体所构成。
样本:从总体中抽取的一部分个体成为样本。
样本中所包含的个体数称为样本含量,通常用符号n 表示。
参数:表示总体分布某种特征的量数。
常用的总体参数有:总体的平均数、标准差、相关系数等。
统计量:表示样本分布某种特征的量数,它是由样本数据计算出来的。
如样本平均数 ,样本标准差统计误差:统计分析不可能避免误差,只可能减少误差。
统计误差归纳起来可分为两类。
第一类是实际测试值与真值之差(测量误差);第二类是样本指标与总体指标之差(抽样误差)。
4、有效数字:通常将仅保留末一位估计数字其余数字为准确数的数字称为有效数字,我们从左起非零数字开始,清点有效数字的位数,命名它是几位有效数字。
5、由于观测数据具有变异性,因而统计学中把它称为变量。
变量按取值情况可分为离散型变量和连续型变量,按性质(层次)可分为定类变量、定序变量、定距变量和定比定量。
定类变量是最低层次的变量,它的取值只有类别属性之分,而无大小、程度之分。
根据变量值,只能知道研究对象是相同还是不相同,定序变量的测度水平高于定类变量,它的取值除了类别属性之外,还有等级、次序的差别,例如学生体育成绩可分为优、良、中、差,这是一种由高到低的等级排列,它可对应为1、2、3、4等级,定距变量是定义变量在某个点值上为零点,以固定间距对变量进行的测度。
如运动时对体温的测定先定义出零度和一百度,然后以固定的间距“度”对某人的体温进行测度。
体育统计学试题及答案一、选择题1. 体育统计学是运用统计学原理和方法进行体育研究和分析的学科。
以下哪个不是体育统计学的应用领域?a. 运动员表现评估b. 战术分析与预测c. 运动项目选材d. 体育休闲旅游答案:d2. 体育统计学中的“场均得分”是指运动员或球队平均每场比赛的得分数。
下列哪种统计方法可以计算“场均得分”?a. 算术平均b. 中位数c. 众数d. 方差答案:a3. 在体育比赛中,常用的得分统计方法有哪些?a. 助攻b. 投篮命中率c. 三分球命中率d. 上场时间答案:a、b、c4. 体育统计学中的“胜率”是指球队或运动员在一定时间内所获得的胜利数与总比赛数之比。
以下哪个是计算胜率的公式?a. 胜利次数 / 失败次数b. 胜利次数 / 总比赛数c. 总比赛数 / 失败次数d. 胜利次数 + 总比赛数答案:b5. 体育统计学中的“效率值”是综合评价运动员比赛表现的指标。
以下哪个不是计算效率值的方法?a. 得分 + 助攻 + 篮板 - 失误b. 得分 + 助攻 + 篮板 + 抢断 + 盖帽c. 得分 + 助攻 + 篮板 + 抢断 + 盖帽 - 失误d. 得分 + 投篮命中率 + 三分球命中率 + 罚球命中率答案:d二、解答题1. 请简要说明体育统计学在职业篮球中的应用,并列举一个具体的例子。
答案:体育统计学在职业篮球中起到至关重要的作用。
通过对比赛数据的统计和分析,我们可以评估球队的整体表现、战术效果和球员个人能力。
例如,在一场篮球比赛中,我们可以使用体育统计学的方法来分析球队的得分、篮板、助攻等数据,进而评估球队的进攻和防守水平。
同时,通过对球员个人数据的统计分析,我们可以评估球员的得分效率、篮板能力、组织能力等,为球队的选秀和人员调整提供参考依据。
2. 假设你是一名篮球教练,请列举至少三种体育统计学方法,以帮助你进行战术分析和指导球队训练。
答案:作为一名篮球教练,可以利用以下体育统计学方法进行战术分析和训练指导:a. 视频分析:通过观看比赛录像,分析球队在不同战术下的表现,包括进攻时的传球配合、位置调整等,以及防守时的盯人和篮板表现等。
体育统计学第一章绪论第一节体育统计学及其研究对象一、统计学的概念:运用数理统计的原理和方法对体育领域里各种随机现象规律性进行研究的一门基础应用学科,属于方法学科范畴。
二、体育统计学的分类:从性质上来分为:描述性统计:对事物的某些特征及状态进行实际的数量描述推断性统计:通过样本的数量特征以一定方式估计、推断总体的特征三、体育统计工作的基本过程:统计资料的收集—统计资料的整理—统计资料的分析第二节育统计在体育活动中的作用1、体育统计是体育教育科研活动的基础2、体育统计有助于训练工作的科学化3、体育统计能够帮助研究者制定研究设计4、体育统计能帮助研究者有效地获取文献资料第三节体育统计中的若干基本概念一、总体:根据统计研究的具体研究目的而确定的同质对象的全体二、样本:根据需要与能从总体抽取的部分研究对象所形成的子集三、随机事件四、随机变量:分为连续型变量和离散型变量五、概率古典概率:P(A)=m/n概率:统计概率:P(A)=m/n第二章统计资料繁荣收集和整理第一节统计资料的收集一、收集的基本要求:1.资料的准确性2.资料的齐同性3.资料的随机性二、收集资料的方法1.日常积累2.全面普查3.专题研究三、几种常见的抽样方法1.简单随机抽样:抽签法和随机数表法抽签法的操作过程是将总体中的每个个体进行编号,逐个写在签条或卡片上,将签条或卡片完全混乱放置后,不加任何选择地在全部签条或卡片中完全随机抽出所需含量,然后逐个测试并登记其指标数据,形成研究样本。
随机数表法2.分层抽样3.整体抽样四、统计资料的整理(一)资料的审核1.初审2.逻辑检查3.复核(二)频数分布表的制作步骤1. 求极差(或全距R)R=最大值()—最小值()2 .确定组数3.确定组距(I)和组限值(L)I=极差/分组数=R/K第一组下限(L1)=X最大—1/2*I4.列频数分布表本组下限<=X<次组下限组中值=(该组下限+该组上限)/2第三章样本特征数一、样本特征数的两种形式:集中位置量数和离中位置量数二、集中位置量数的概念:反映一群性质相同的观察值的平均水平或集中水平趋势的统计指标。
体育统计学参考公式体育统计学是一门研究体育运动数据的学科,它通过分析和统计数据来研究和预测比赛结果、比赛规律、运动员能力等问题。
在体育统计学中,有一些常用的参考公式可以帮助研究者进行数据分析和预测。
下面是一些常见的体育统计学参考公式:1. 进攻指数(Offensive Efficiency,OE):OE=(得分/(投篮出手次数-前场篮板+失误+罚球出手次数*罚球命中率))*1002. 防守指数(Defensive Efficiency,DE):DE=(对手得分/(对手投篮出手次数-对手前场篮板+对手失误+对手罚球出手次数*对手罚球命中率))*1003. 有效命中率(Effective Field Goal Percentage,eFG%):eFG%=(投篮命中数+0.5*三分球命中数)/投篮出手次数4. 真实命中率(True Shooting Percentage,TS%):TS%=(得分/(2*(投篮出手次数+犯规次数*0.44))*1005. 抢断率(Steal Percentage,STL%):STL%=(抢断数/(对手进攻回合*对手失误))*1006. 盖帽数(Block Percentage,BLK%):BLK%=(盖帽数/(对手进攻回合*对手投篮出手次数))*1007. 篮板率(Rebound Percentage,REB%):REB%=(篮板数/(篮板数+对手篮板数))*1008. 速度比(Speed RatioSR=(总距离/速度*比赛时间)*1009. 效率值(Efficiency Value,EV):EV=(得分+篮板数+助攻数+抢断数+盖帽数-犯规数-失误数)/比赛时间10. 每投命中率(Points per Shot,PPS):PPS=得分/投篮出手次数以上是一些常见的体育统计学参考公式,可以帮助研究者进行比赛数据分析和评估运动员能力。
在实际应用中,运用这些公式进行数据分析可以从各个方面深入研究和评估运动员、团队以及比赛的表现,并作为制定训练计划、制定战术策略的参考依据。
1 第七章 假 设 检 验 在前面的章节中阐明了第一类统计推断方法 —— 估计,在本章中将论述第二类统计推断方法,即假设检验。从中可看到假设检验和区间估计之间的某些相似点和相异点。在这两章中,让人感兴趣的都是同一些参数,不过在七章中将从下述的角度去分析样本数据,即看看这些数据是否支持对某些参数的大小所做的假设。而在上一章中,却并未涉及对参数的假设进行后分析,相反,倒是利用样本数据来帮助人们形成对参数值的看法。 假设检验的目的同估计一样,在于帮助研究人员通过考察对来自某总体的样本数据做出有关该总体的统计决策。
第一节 基 本 概 念 一、假设检验的意义 在统计研究工作中常常要对一些统计量进行分析比较。人们经常会遇到两个统计量的差异问题,如两个平均数的差异、两个率的差异等待。两个样本统计量之间的差异,可能由两种原因造成:一是由于抽样误差而造成,抽样误差而造成的差异是不可避免的,但样本仍来自同质的总体,所以这种差异没有本质的区别。二是由于实验因素或观察条件的改变而造成的差异,这种误差叫做条件误差,此时样本可能会来自不同质的总体,其差别是本质性的差别。人们当然希望能正确地区分出样本统计量之间的差异是由哪种原因造成的。假设检验就是帮助人们去区分差异是由抽样误差还是由条件误差造成的一种科学方法。
二、假设检验的基本原理 2
在实际工作中,无论假设多么复杂,进行检验的基本思想却很简单,就是某种带来有概率性质的反证法,即按“小概率事件在一次观察中实际上不可能发生的”的统计原则,拒绝在一次具体实践中竟然发生了小概率事件的不合理的假设。但是如果实践所导致的结果没有发现小概率事件的不合理现象,则不能拒绝原假设H0 ,因而接受它。 什么算是“小概率事件”?通常人们把概率不超过5% 的事件称为小概率事件,其概率记作 。在假设检验中,称 为显著性水平。如经过检验,在 = 0.05 水平拒绝无效假设H0 ,则称差异有显著性意义;如在 = 0.01水平拒绝H0 ,则称差异有非常显著性意义。
三、假设检验中的两类错误 在假设检验中,并不能证明一个统计假设是否正确。当检验结果已经得出,就有两种可能采取的行动;(1)否定H0 ;(2)不否定H0 。一个未被否定的假设可能的真实的,也可能是不真实的。同样,一个被否定的假设也可能是真实的或不真实的。于是,在检验一个假设时将出现四种可能的结果: (一)不否定真实的无效假设; (二)不否定不真实的无效假设; (三)否定真实的无效假设; (四)否定不真实的无效假设。 以上,(一)和(四)的正确的行动,而(三)犯了“弃真”的错误,称这为第Ⅰ类错误;(二)犯了“取伪”的错误,称这为第Ⅱ类错误。 表7 — 1 双向分类表
可能的行动 假设的可能状态 真 非 真 不 否 定 对 错(Ⅱ) 否 定 错(Ⅰ) 对 3
在统计分析时,是以显著性水平 检验假设,若当H0 为真时否定H0 ,则犯第Ⅰ类错误的概率明显正是 。通常把犯第Ⅱ类错误的概率记作 。当然,人们总希望这两类错误的概率都尽可能的小。但不理想的是,在样本含量n 不变时,减小 将引起 增大,减小 将引起 增大。同时减小犯两类错误的概率的唯一途径是增加样本含量,但要注意这样会增大工作量,会多耗费人力物力。所以在实际工作中,要全面考虑,选定适当的n、、。 必须强调指出,在研究工作中必须及早选定 。要是等到算出检验统计量的数值之后再选 ,则选择就可能受到计算结果的影响,从而会在相当程度上损害研究的客观性。
四、单侧检验与双侧检验 (一)双侧检验问题 双侧检验的目的在于检验两个参数是否相等,如总体均数=
0 还是 ≠ 0,这时,研究人员关心两均数之间的绝对差别,
而不关心差别的方向。
/2
/2
0X1X
2
X
00:H
图7 — 1 双侧检验示意图 如(图7—1)所示:是把 X 的临界值 X1,X2分配在0的两侧。由于要求(X1,X2)间的概率是置信度1-,这相当于把 分配在H0 分布两侧的尾部,每一侧占 的二分之一。“双侧检验”这个名称就是这样来的。 4
(二)单侧检验问题 在许多情况下,研究人员根据理论分析或实践经验可预知某一均数不大于(或不小于)另一均数,这时可作无效假设H0 :1≤2(或H0 :1≥2)。因此在拒绝接受H0 时,就只接受1>2(或1<2,这时要把 全部放在分布的一侧。即所谓“单侧检验”
( 左侧 )( 右侧 )
图 7 — 2 单侧检验示意图 单侧检验比双侧检验容易得出差别有显著意义的结论,所以对于同一批资料,有时双侧检验无显著意义,而单侧检验却有显著意义。但要采用单侧检验还是双侧检验必须在作研究设计时根据客观实际及专业知识事先选定。
五、假设检验的一般步骤 (一)建立无效假设H0 ; (二)识别选择检验统计量; (三)选定显著性水平 ; (四)收集数据、完成计算; (五)按决策规则作出统计决策。 如果检验统计量的计量值落在否定域之内,则否定无效假设;如其值落在接受域之内,则接受无效假设;当检验统计量的计算值等于临界值或接近临界值时,则一般也否定无效的假设,但此时下结论要慎重,最好扩大样本含量重新再作检验。 5
0得出 可能真实的结论H1得出 可能真实的结论H
作统计决策拒绝0H接受
0H
计算检验统计量
选择检验统计量无效假设0H
选定显著性水平
图 7 — 3 假设检验一般步骤框图 第二节 一个正态总体均数的假设检验 一、总体方差2
已知时,总体均数与某指定数之间差别的
假设检验
已知被研究的总体服从正态分布N(, 2),且参数2已知,但未知,现要对进行统计检验。 从第六章中知道,当被抽样总体服从正态分布时,X的抽样分布
服从平均值为、方差为n2斩正态分布。为了检验是否等于已知 数 0 ,建立无效假设H0 :=0 ,从而能从样本数据算出的检验统计量应为
nXU0 (7 — 1) 6
这个统计量服从标准正态分布。 对于选定的显著性水平,有
P{ |U|≥ 2u } =
所以选择 |U|≥ 2u 为否定域;即当该不等式成立时,就否定H0 。 类似地,有 P{|U|< 2u== 1-
即 |U|< 2u ,为接受域。 换句话说,规定了之后,也就取定了接受域和否定域的分界线。如取 =0.05 ,与标准正态分布曲线下两尾侧面积 2=0.025 相对应的 u 值分别为 -1.96 和 1.96 。 否定域由大于或等于 1.96 和小于或等于 -1.96 的所有 u 值构成。如(图7 — 4)所示。
0-1.961.96
025.02/025.02/
95.01
否定域否定域接受域 图7-4 标准正态分布下=0.05时的接受域和否定域 7
例 7 — 1 根据医学统计,我国健康成年男子在安静时的平均心率为72次/分,标准差为6.4次/分。今对某体育系男生随机抽测36人,其安静时平均心率为69.5次/分,试问该体育系男生的心率是否与国内一般健康成年男子不同?(=0.05) 解:(1)建立无效假设H0 :=72(即假设该体育系男生心率与一般健康男子相同,其差别是由抽样误差造成的。) (2)计算统计量U值:
364.6|725.69|n|x||U|0≈2.34
(3)取=0.05,查表可知临界值 2u (4)判断结果:因为|U|=2.34>2u=1.96,所以拒绝无效假设H0 ,认为该体育系男生的心率和一般健康成年男子的心率有显著性差异。这种差异显然是因为体育系学生经常进行体育训练造成的。 在上面例子中,取 = 0.05。在有些实际问题中,还应当把显著性水平取得更小些。同一问题采用不同的显著性水平处理,常可能得到不同的结论。如在上例中,若取= 0.01 ,则临界值2u=2.58,
此时,|U|=2.34<2.58,应接受H 0 。 二、总体方差 2
未知,且为大样本时,总体均数与某指定
数之间差别的假设检验。
在很多情况下,感兴趣的总体可能并非正态分布,这时若把分析建立在正态分布的基础之上,就会得出错误的结论。因此,当被抽样 8
总体不服从正态分布时,就必须知道样本平均值的抽样分布的性质。当从非正态分布总体进行抽样时,关于 X 的抽样分布的知识将来自一条重要的数学定理,即“中心极限定理”。这条定理的内容陈述如下:
给出一个具有任意函数形式的总体,其平均值为,方差2有限。如从这一总体抽出容量为n的样本,则当样本容量很大时,由这
些样本算出的 X 的抽样分布将近似服从平均值为、方差为n2的正态分布。 在取大样本的情形下,中心极限定理既能从非正态分布总体抽样,又能保证得到与正态分布总体抽样时近似相同的结果。这结果对于统计推断方法的应用来说十分有用。 在实际问题中,常需要在总体方差未知的条件下对总体均数进行假设。对于这种情形,不好采用统计量
nXU0
因为未知。这时,通常用S代替,这将会有误差,但对大样本来说,误差不大,由中心极限定理可知X分布近似正态分布。所以,此时检验统计量为
nSXU0 ~ N(0 , 1) (7 — 2)
取定后,|U|≥ 2u为H0 :=0的否定域; |U|<2u 为H0 :=0的接受域。 例7 — 2 由全国青少儿体质调查资料知:全国城市7岁男生