第四章 数据特征与统计描述

  • 格式:doc
  • 大小:57.50 KB
  • 文档页数:105

下载文档原格式

  / 105
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 第四章数据特征与统计描述

第四章数据特征与统计描述

1/ 105

本章结构? ???第一节第二节第三节第四节频数分布表与频数分布图计量资料的常用统计指标计数资料的常用统计指标统计图表

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 第一节频数分布表与频数分布图

3/ 105

一、频数分布表 (frequency table)用途:用于描述资料的分布特征频数:在一批样本中,相同情形出现的次数称为该情形的频数。

资料类型计数和等级计量组段观察结果的所有分类根据观察结果重新划分频数相同类别出现的次数分组统计P44 表4-1,4-2,4-3

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 表4-3 某地150名正常成年男子红细胞数(1012/L)编号红细胞数12 3 4 5 6 73.984.54 4.74 5.13 4.43 4.81 4.98编号… 143 144 145 146 147 148红细胞数… 4.67 5.40 5.29 4.77 5.38 5.158 …3.79 …1491504.645.19

5/ 105

1. 频数表的编制步骤(1)求极差(range):即最大值与最小值之差,又称为全距。

本例极差: R=5.88-3.79=2.09(1012/L)(2)决定组数、组段和组距:根据研究目的和样本含量n确定。

组距=极差/组数,通常分10-15 个组,为方便计,组距参考极差的十分之一, 再略加调整。

本例i= R /10=2.09/10=0.209≈0.2。

---------------------------------------------------------------最新资料推荐------------------------------------------------------ (3)列出组段:第一组段的下限略小于最小值,最后一个组段上限必须包含最大值,其它组段上限值忽略。

(4)划记计数:用划记法将所有数据归纳到各组段,得到各组段的频数。

7/ 105

组段(1)3.7~频数,f (2)1组中值,X (3)3.8fX (4)= (2)×(3)3.83.9~4.1~ 4.3~411 174.04.2 4.416.046.2 74.84.5~4.7~ 4.9~ 5.1~ 5.3~ 5.5~ 5.7~5.9 合计2632 26 18 10 4 1 1504.64.8 5.0 5.2 5.4 5.6 5.8119.6153.6 130.0 93.6 54.0 22.4 5.8 719.8

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 三、频数分布图P47

9/ 105

二、频数表和频数分布图用途1.描述频数分布的类型* (1)对称分布:若各组段频数的分布以频数最多的组段为中心左右两侧大体对称(总体则完全对称),就认为该资料是对称分布 (图4-2) (2)偏态分布:

---------------------------------------------------------------最新资料推荐------------------------------------------------------ ?右偏态分布(正偏态分布):频数最多组段右侧的组段数多于左侧的组段数,高峰向左偏移,频数向右侧拖尾。

表4- 115名正常成年女子血清转氨酶(mmol/L)含量分布人 2 9 14 23 19 14 11 9 7 4 3 数转氨酶含量 12~ 15~ 18~ 21~ 24~27~ 30~ 33~ 36~ 39~ 42~45

11/ 105

252015人数105013.519.525.531.537.543.5.血清转氨酶(mmol/L)图2-2 115名正常成年女子血清转氨酶的频数分布

---------------------------------------------------------------最新资料推荐------------------------------------------------------ ?左偏态分布(负偏态分布):左侧的组段数多于右侧的组段数,频数向左侧拖尾。

表4- 101名正常人的血清肌红蛋白( ?g/mL )含量分布肌红蛋白含量 0~ 5~ 10~ 15~ 20~ 25~ 30~ 35~ 40~ 45~50 人 2 3 7 9 10 22 23 14 9 2 数

13/ 105

25 20人数15 10 5 0 2.5 12.5 22.5 32.5 42.5 52.5 血清肌红蛋白(μ g / m L)图 2-3 101 名正常人血清肌红蛋白的频数分布

---------------------------------------------------------------最新资料推荐------------------------------------------------------ 2. 描述计量资料分布的集中趋势和离散趋势①集中趋势(central tendency):变量值集中位置。

本例在组段“4.7~”。

——平均水平指标②离散趋势(tendency of dispersion):变量值围绕集中位置的分布情况。

离“中心”位置越远,频数越小;且围绕“中心”左右对称。

——变异水平指标

15/ 105

相关主题