第3章 统计描述
- 格式:ppt
- 大小:512.50 KB
- 文档页数:27
补充材料:累计求和运算规则求和算子定义:对于T 个观测值,x 1, x 2, …, x T ,求和可以简化地表示为x 1 + x 2 + …+ x T =∑=Tt t x 1其中∑⋅)(称作求和算子。
求和算子的运算规则如下: ① 变量观测值倍数的和等于变量观测值和的倍数。
∑=T t t kx 1= k ∑=Tt t x 1② 两个变量观测值和的总和等于它们分别求总和后再求和。
∑=+Tt t t y x 1)(= ∑=Tt t x 1+∑=Tt t y 1③ T 个常数求和等于该常数的T 倍。
∑=Tt k 1= kT其中k 是常数。
④ 定义双重求和为∑∑==T j ij T i x 11= ∑=Ti 1(x i 1 + x i 2 + …+ x iT )= (x 11 + x 12 + …+ x 1T ) +(x 21 + x 22 + …+ x 2T ) + … +(x T 1 + x T 2 + …+ x TT )⑤ 两个变量和的双重求和等于它们各自双重求和的和。
∑∑==+T j ij ij T i y x 11)(= ∑∑==T j ij T i x 11+∑∑==Tj ij T i y 11⑥ 两个不同单下标变量积的双重求和等于它们各自求和的乘积。
∑∑==Tj j i Ti y x 11= (∑=T i i x 1) (∑=Tj j y 1)证:∑∑==Tj j i T i y x 11= ∑=+++Ti T i y y y x 121)...(= (∑=T i i x 1) (∑=Tj j y 1)第3章 统计资料的综合(Data Summarization )用频数分布表与统计图可以展示数据分布的大概特征。
为更准确的描述数据的特征,有必要用一些数值描述一组数据的特征,称这些数值为特征数。
特征数分三类:(1)表示集中位置;(2)表示分散程度;(3)表示偏斜程度;(4)相关程度。
3.1 表示集中位置的特征数: (1)平均数;(算术平均数,几何平均数,调和平均数) (2)中位数; (3)众数; (4)百分位数; 3.1.1 平均数(1)算术平均数(Arithmetic mean ) 对于不分组数据算术平均数定义:一组数据,(x 1, x 2, …, x n ),容量为n ,则算术平均数x 表示为x = n x x x n +++ (21)=n1∑=ni i x 1(1)例1:5个学生的英语考试分数是80, 70, 85, 90, 82。
概率与数理统计第3章数据分布特征的描述概率与数理统计是一门关于随机现象的描述和分析的学科。
在实际问题中,我们经常需要对数据进行分析和描述,以便更好地理解数据的特征和规律。
第三章主要介绍了数据分布的特征描述,包括中心位置度量、离散程度度量和分布形状度量。
首先是中心位置度量,它用来描述数据集的平均水平。
一般来说,我们关心的是数据集的平均值和中位数。
平均值是数据的加权平均,它能够反映数据集的集中趋势。
平均值的计算公式是:```平均值=总和/观测数```中位数是按照数据的大小顺序排列后,处于中间位置的观测值。
中位数的计算方法是:```如果数据集的观测数为奇数,中位数为第(n+1)/2个观测值如果数据集的观测数为偶数,中位数为第n/2和(n/2+1)个观测值的平均值```其次是离散程度度量,它用来描述数据集的变异程度。
我们常用的度量指标有极差、方差和标准差。
极差是数据集中最大观测值与最小观测值之间的差距,它反映了数据的全局离散程度。
方差是每个观测值与数据集平均值的差的平方的平均值,它度量了数据的局部离散程度。
标准差是方差的平方根,它与方差具有相同的单位,能够更好地反映数据的离散程度。
最后是分布形状度量,它用来描述数据分布的偏度和峰度。
偏度是描述数据分布对称性的度量,正偏表示数据集的右尾较重,负偏表示数据集的左尾较重。
峰度是描述数据分布峰态的度量,正峰表示数据集的峰部较陡,负峰表示数据集的峰部较平。
偏度和峰度能够帮助我们了解数据分布的形态特征,从而判断数据集是否服从其中一种特定的分布。
在实际应用中,我们可以通过对数据集进行描述统计分析来了解数据的特征。
通过计算平均值、中位数、方差、标准差、偏度和峰度等指标,我们能够更好地理解数据的分布情况。
此外,我们还可以通过绘制直方图、箱线图、概率密度函数等图形来展示数据的分布特征,进一步加深对数据的认识。
总之,数据分布特征的描述是概率与数理统计中重要的内容之一、通过中心位置度量、离散程度度量和分布形状度量,我们能够充分了解数据的平均水平、变异程度和形态特征,为进一步的数据分析和决策提供有力的支持。
《医学统计学》部分习题参考答案颜虹主编第二版第三章统计描述一、最佳选择题1.C2.A3.D4.B5.E6.E7.C8.D9.C10.C11.A12.D三、计算分析题P53-1素食前X1素食后X2X1-X2平均187.75平均168.25平均19.5中位数179中位数165中位数19标准差33.18885标准差26.79593标准差16.80838方差1101.5方差718.0217方差282.5217 4)第四章常见的概率分布一、最佳选择题1.D2.D3.B4.D5.B6.E7.E8.C9.D10.C11.C三、计算分析题P73-41120124.4 1.15793.8u -==-2125124.40.1578953.8u -==查标准正态分布表得1()( 1.1579)( 1.16)0.123u Φ=Φ-≅Φ-=2()(0.15795)(0.16)1(0.16)10.43640.5636u Φ=Φ≅Φ=-Φ-=-=21()()0.56360.1230.4406u u Φ-Φ=-=该地身高界于120cm 到125cm 范围内的8岁男童比例为44.06%。
20044.06%89()⨯≈人200名8岁男童中身高界于120~125cm 范围的人数约为89人。
P73-5Poisson 0.99967Binominal 0.9998P73-6解:(1)由题意可知,随机误差变量X 服从正态分布,其中μ=2,σ=4。
要求测量误差的绝对值不超过3的概率,即求P P ≤≤≤(X 3)=(-3X 3),作标准化变化132 1.254u --==-2320.254u -==1()( 1.25)0.1056u Φ=Φ-=2()(0.25)1(0.25)10.40130.5987u Φ=Φ-Φ-=-=21()()0.59870.10560.4931u u Φ-Φ=-=即测量误差的绝对值不超过3的概率为0.4931。
(2)根据题意,以Y 表示测量误差的绝对值不超过3,则Y 服从二项分布,其中n=3,0.4931π=,根据题意,至少有1次误差的绝对值不超过3的概率为003033(1)1(0)1(1)10.50690.86975P Y P Y C ππ-≥=-==--=-=P73-7解:根据医学知识可知健康成人血清总胆固醇值过高或过低为异常,故应制定双侧医学参考值范围因为已经假定血清总胆固醇值服从正态分布,故可用正态分布法求该指标的95%医学参考值范围,即 1.96μσ±。