第五章_正态分布、常用统计分布和
- 格式:ppt
- 大小:571.00 KB
- 文档页数:42
社会统计学教学大纲课程名称:社会统计学英文名称:social statistics课程编号:12600722j使用专业:社会工作专业总学时数:48学时总学分:3学分大纲撰写人:文法学院社工系马永方内容简介社会统计学是社会学主干课之一,与社会学调查研究方法结合起来,完整地介绍了当代社会调查研究的科学方法和资料处理技术。
社会统计学则侧重介绍资料的收集、整理、分析和推论的处理技术。
从事社会工作研究理论和实践的人都有必要掌握社会统计学这门有用的工具。
本课程共7章。
第一章导论,介绍社会统计学和相关概念,第二章统计资料的搜集,第三章统计资料的整理,第四章到第七章是统计分析。
第四章和第五章是描述统计,第六到第七章是统计推断,第六章概率论是统计推断的基础,统计推断有两个基本内容:假设检验第七章。
一、讲授的主要内容第一章社会学研究和统计分析(2学时)第一节社会学研究的科学性第二节社会调查资料的特点和统计学的运用第二章单变量统计描述分析第一节分布统计表统计图第二节集中趋势测量法第三节离散趋势测量法第三章概率(3学时)第一节基础概率第二节概率分布、均值和方差第四章二项分布及其他离散型随机变量的分布(3学时)第一节二点分布第二节排列与组合第三节二项分布第四节多项分布第五节超几何分布第六节泊松分布第五章正态分布、常用统计分布和极限定理(3学时)第一节什么是正态分布第二节标准正态分布第三节标准正态分布表的使用第四节常用统计分布第五节大数定理和中心极限定理第六章参数估计(4学时)第一节名词解释第二节参数的点估计第四节正态总体的区间估计第五节大样本区间估计第七章假设检验(4学时)第一节统计假设第二节统计检验的基本步骤一、建立假设二、求抽样分布三、选择显著性水平和否定域四、计算检验统计量五、判定第八章单总体假设检验(4学时)第一节大样本假设检验第二节小样本假设检验第九章二总体假设检验第一节引言第二节大样本二总体假设检验第三节小样本二总体假设检验第十章列联表(4学时)第一节什么是列联表第二节列联表的检验第三节列联强度第十一章等级相关(定序变量之间)(4学时)第一节斯皮尔曼等级相关系数第二节Gamma等级相关第三节其他等级相关系数第十二章回归与相关(6学时)第一节回归研究的对象第二节回归直线方程的建立与最小二乘法第三节回归方程的假定与检验第四节相关第五节用回归方程进行预测第十三章方差分析(3学时)第一节引言第二节一元方差分析第三节二元方差分析第四节多元方差分析第十四章非参数检验(4学时)第一节非参数检验第二节符号检验第三节符号秩检验第四节累计频次检验第十五章抽样(4学时)第一节引言第二节抽样调查方法第四节样本容量的确定二、参考书目1. 社会统计学,卢淑华,北京大学出版社,2005年第三版.2.社会统计学,张彦,高等教育出版社,2005年第一版.3.社会统计学导论,周德民、贺翠微,中南大学出版社,2004年第一版.教学大纲说明一、教学目的与课程性质任务本课程属于专业限选课,是社会工作专业课程体系的重要组成部分。
常见统计分布及其特点统计分布是描述数据集合中数据分布情况的一种方法。
统计学中存在着很多常见的统计分布,每个分布都具有其独特的特点和应用领域。
以下是一些常见的统计分布及其特点的介绍。
1. 正态分布(Normal Distribution)正态分布是最常见的分布之一,也被称为高斯分布。
它的特点是呈钟形曲线,对称分布,均值和标准差完全决定了其形状。
正态分布有广泛的应用,尤其在自然科学和社会科学中。
2. 二项分布(Binomial Distribution)二项分布是指在一系列独立的试验中,每次试验只有两个可能的结果:成功或失败。
每次试验的成功概率由固定的参数p确定。
二项分布的特点是具有两个参数n和p,其中n为试验的次数,p为每次试验的成功概率。
二项分布在生物学、医学、工程等领域中经常被使用。
3. 泊松分布(Poisson Distribution)泊松分布用于描述单位时间内事件发生的次数的概率分布。
这个分布有一个参数λ,表示单位时间内事件的平均发生率。
泊松分布的特点是时间间隔内事件的数量是不确定的,但平均发生率λ是已知的。
泊松分布在物理学、生物学、通信技术等领域中被广泛应用。
4. 均匀分布(Uniform Distribution)均匀分布是指在一个有限的区间内,每个数出现的概率相等。
均匀分布的特点是概率密度函数在区间内是常数。
均匀分布在模拟、随机数生成等领域中经常被使用。
5. 指数分布(Exponential Distribution)指数分布用于描述一个事件发生之间的时间间隔的概率分布。
指数分布的特点是具有一个参数λ,表示事件的平均发生率。
指数分布在可靠性工程、生物学、等领域中被广泛应用。
6. t分布(t Distribution)t分布是用于小样本情况下的假设检验和置信区间估计的重要分布。
与正态分布相比,t分布的尾部更厚,更适合于小样本情况的推断。
t分布在统计学中常用于处理样本容量较小的情况。
7. F分布(F Distribution)F分布是用于分组之间方差的比较的一种分布。
统计学常用分布一、引言在统计学中,分布是描述数据变化规律和概率的重要工具。
不同的数据类型和问题背景需要采用不同的分布来描述。
本篇文章将介绍统计学中常用的几种分布,包括正态分布、二项分布与泊松分布、指数分布与对数正态分布、卡方分布与t分布等。
二、正态分布正态分布是最常见的连续概率分布之一,它在自然现象、工程技术和社会科学等领域都有广泛的应用。
正态分布的曲线呈钟形,数据值集中在均值附近,随着远离均值,概率逐渐减小。
正态分布在统计学中具有重要地位,许多统计方法和模型都以正态分布为基础。
三、二项分布与泊松分布1.二项分布:二项分布是用来描述伯努利试验中的随机事件的概率分布,其中每次试验只有两种可能的结果,并且每次试验都是独立的。
二项分布适用于计数数据,尤其在生物实验和可靠性工程等领域有广泛应用。
2.泊松分布:泊松分布是二项分布在伯努利试验次数趋于无穷时的极限形式,常用于描述单位时间内随机事件的次数。
泊松分布在概率论和统计学中具有重要地位,广泛应用于保险、通信和生物医学等领域。
四、指数分布与对数正态分布1.指数分布:指数分布描述的是随机事件之间的独立间隔时间或者随机变量的概率分布。
指数分布常用于描述寿命测试和等待时间等问题,例如电话呼叫的间隔时间和电子元件的寿命等。
2.对数正态分布:对数正态分布在统计学中用于描述那些其自然对数呈正态分布的随机变量。
许多生物学、经济学和社会科学中的数据都服从对数正态分布,例如人的身高、体重以及股票价格等。
五、卡方分布与t分布1.卡方分布:卡方分布在统计学中主要用于描述离散型概率分布。
卡方分布是通过对两个独立的随机变量进行平方和运算得到的,常用于拟合检验和置信区间的计算。
2.t分布:t分布在统计学中广泛应用于样本数据的参数估计和假设检验。
相比于正态分布,t分布在数据量较小或参数偏离正态性时具有更好的稳定性。
t分布在金融、生物医学和可靠性工程等领域有广泛应用。
六、结论在统计学中,不同的数据类型和问题背景需要采用不同的分布来描述。
常见统计分布及其特点常见的统计分布有:正态分布、均匀分布、二项分布、泊松分布、指数分布等。
1.正态分布:正态分布又称为高斯分布或钟形曲线分布,是最为常见的一种分布。
正态分布具有以下特点:-均值和中位数相等,分布的对称轴对称;-在均值处取得最大值,随着离均值的距离增大,分布的概率逐渐减小;-标准差决定了曲线的宽窄,标准差越大,曲线越宽;-68%的数据落在均值的一个标准差范围内,95%的数据落在均值的两个标准差范围内,99.7%的数据落在均值的三个标准差范围内。
2.均匀分布:均匀分布又称为矩形分布,是最简单的分布之一、均匀分布具有以下特点:-在一个有限的区间内,所有取值的概率相等;-分布曲线呈矩形,具有等宽;-在整个区间上积分等于13.二项分布:二项分布描述了在n次独立的重复实验中,成功的次数的分布情况。
二项分布具有以下特点:-每次实验只有两个可能的结果,成功或失败;-实验之间是独立的;-成功的概率和失败的概率保持不变;-成功的次数符合二项分布。
4.泊松分布:泊松分布描述了一个时间段或区域内随机事件发生的次数的分布情况。
泊松分布具有以下特点:-事件在一个固定时间段或区域内按独立的随机过程发生;-事件在一个极短时间段内发生的概率极低,即发生频率很低;-事件的平均发生次数相对较低。
5.指数分布:指数分布描述了连续发生独立随机事件的时间间隔的分布情况。
指数分布具有以下特点:-事件的发生时间间隔是独立的,事件间的时间间隔符合指数分布;-时间间隔的概率密度递减;-指数分布在实际应用中常用于描述等待时间、生命周期等。
这些统计分布常用于描述和分析随机事件的分布情况。
在实际应用中,我们可以根据样本数据的特点,选择合适的统计分布进行建模和分析。
在统计学中,概率分布函数可以帮助我们理解随机事件的分布规律,有助于对数据进行建模、预测和推断。
第五章 正态分布与z 分数、T 分数第一节 正态分布与z 分数一、正态分布正态分布曲线(Normal distribution carve )是一个单峰曲线,中间高,两边逐渐下降,在正负一个标准差的地方有拐点,两端永远不与横轴相交,两侧完全对称的钟形曲线(图5-1)。
它的数学模型公式如下: 正态分布的公式:一般正态分布的公式:222/)(21σμπσ--=x e y (5.1)标准正态分布的公式:2/221x e y -=π (5.2)式中,y :次数或纵线的高度;X :原始分数;μ:总体平均数;σ:总体标准差;π和e :常数(3.14,2.718)从公式看出,决定曲线位置和形态的关键数值是分布的平均数μ和标准差σ。
μ值决定曲线的最高点在横轴上的位置。
μ值越大曲线在横轴上的位置越向右。
σ值决定曲线的形状,是高耸还是矮平。
凡是符合以上条件的曲线就是正态曲线,因此有多少对μ值和σ值的组合就有多少条正态分布曲线。
换句话说,任何特定的正态分布的确定的性质是由公式中的μ和σ值决定的。
在为数众多的正态曲线中,有一条正态曲线,平均数μ等于0,标准差 σ等于 1,统计中规定它为标准正态曲线,任何一条正态分布曲线都可以转化为标准正态曲线,方法就是将原始分数转变为z 分数。
z 分数图5-1 标准正态分布曲线二、z 分数z 分数也叫标准分数(Standard score ),它是以标准差为尺子去度量某一原始分数偏离平均数的距离,这段距离含有几个标准差,z 分数就是几。
从而确定这一数据在全体数据中的位置。
称这一过程为标准化。
转化的公式为5.3即:计算z 分数的公式SX X z -= ( 5.3) 式中,X :原始数据;X :平均数;S :标准差z 分数是以标准差为单位的离均差。
从z 分数的计算可以看出,由于在运算过程中保留了原数据与平均数的差的关系)(X X -,平均数的z 分数等于0, 其它数值的z 分数比平均数大的为正值,比平均数小的为负值。