社会统计学讲义
- 格式:doc
- 大小:812.50 KB
- 文档页数:53
社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
社会统计学讲义(卢淑华)第一章社会学研究与统计分析一、社会调查资料的特点(随时掌握)随机性、统计规律性;二、统计学的作用:为社会研究提供数据分析和推论的方法三、统计分析的作用及其前提。
四、统计分析方法的选择1 、全面调查和抽样调查的分析方法2 、单变量和多变量的统计分析方法五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等第二章单变量统计描述分析一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。
尤其是直方图的意义。
二、标明组限与真实组限的换算,重要。
三、集中趋势测量法1 、定义、优缺点、注意事项;2 、众值:定义、计算公式、解释、运用,注意事项;3 、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;4 、均值:定义、计算公式(分组与加权)、解释、运用,注意事项;5 、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;四、离散趋势测量法1 、定义、优缺点、注意事项,与集中趋势的关系;2 、异众比例:定义、计算公式、解释、运用,注意事项;3 、质异指数:定义、计算公式、解释、运用,注意事项;4 、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。
5 、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项;第三章概率一、概率:就是指随机现象发生的可能性大小。
随机现象具有不确定性和随机性。
二、概率的性质:1 、不可能事件的概率为O ;2 、必然事件的概率为1 ;3 、随机事件的概率在O 一1 之间;三、概率的计算方法:1 、古典法:计算等概率事件,P 一有效样本点数/样本空间数;2 、频率法:求随机事件在多次试验后的极限频率。
3 、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。
四、概率的运算:会画文氏图1 、加法公式:两个或多个随机事件的求和概率‘2 、乘法公式:两个或多个随机时间共同发生的概率。
《社会统计学》PPT课件(110页)一、引言社会统计学是研究社会现象数量特征及其规律的学科,是社会学的重要组成部分。
本课件将带领大家深入了解社会统计学的定义、研究方法、数据来源以及在社会各个领域的应用。
二、社会统计学的定义社会统计学是一门应用统计学原理和方法,对社会现象进行数量分析和描述的学科。
它通过收集、整理、分析和解释社会数据,揭示社会现象的数量特征、变化规律和相互关系,为社会决策提供科学依据。
三、社会统计学的研究方法1. 调查研究法:通过问卷调查、访谈等方式,收集社会数据,了解社会现象的实际情况。
2. 实验研究法:在控制条件下,对研究对象进行实验,观察和记录实验结果,分析社会现象的因果关系。
3. 文献研究法:通过查阅相关文献,了解社会现象的历史、现状和发展趋势。
4. 案例研究法:选取具有代表性的社会现象,进行深入分析,揭示其内在规律。
5. 统计模型法:运用统计模型,对社会现象进行定量分析,预测社会现象的未来发展趋势。
四、社会统计学数据来源1. 政府统计部门:提供国家、地区和行业的社会经济数据。
2. 学术研究机构:发布学术研究报告,提供社会现象的定量分析结果。
3. 社会调查机构:开展社会调查,收集社会数据,为政府、企业和社会组织提供决策依据。
4. 新闻媒体:报道社会现象,提供社会数据的实时更新。
5. 公共图书馆和档案馆:保存历史文献,为研究社会现象提供数据支持。
五、社会统计学在社会领域的应用1. 社会经济领域:分析经济增长、就业、收入分配等社会经济现象,为国家制定经济发展政策提供依据。
3. 社会问题领域:分析社会问题,如贫困、犯罪、环境污染等,为解决社会问题提供科学依据。
4. 社会发展领域:研究社会发展规律,为推动社会进步提供理论支持。
5. 社会管理领域:分析社会管理现状,为提高社会管理水平提供数据支持。
社会统计学作为一门研究社会现象数量特征及其规律的学科,具有广泛的应用价值。
通过掌握社会统计学的定义、研究方法、数据来源及其在社会领域的应用,我们可以更好地了解社会现象,为政府、企业和社会组织提供决策依据,推动社会进步。
《社会统计学》讲义教学目的和要求:通过本课程的学习,使学生熟悉常用的统计方法,并且学会如何将统计分析知识应用于社会调查研究之中,掌握统计方法的灵活运用。
本课程偏重统计方法的实际应用,而非其数理基础。
在教学过程中,注重对于不同统计分析方法适用条件的说明,统计公式的讲解,以及对于统计值意义的说明。
教学重点和难点:本课程的教学重点是不同统计分析方法所适用的条件以及统计值意义的解释。
难点是统计公式的讲解以及不同统计分析方法在实际社会调查研究中的应用。
教法特点说明:课堂讲授为主,注重对实例的讲解。
教材和参考书目:1、卢淑华著:《社会统计学(第三版)》,北京大学出版社,2007年。
2、李沛良著:《社会研究的统计应用》,社会科学文献出版社,2002年。
3、柯惠新等著:《调查研究中的统计分析法》,北京广播学院出版社,1992年。
4、风笑天著:《现代社会调查方法》,华中科技大学出版社,2001年。
5、袁方主编:《社会研究方法教程》,北京大学出版社,1997年。
第一章统计学简史教学目的和要求:通过本章的学习使学生了解统计学的产生、发展历程有初步的认识。
教学重点和难点:重点是国势学派与政治算数学派的差异,难点是文字记述与数字记述各自的特点。
教学方法:课堂讲授教学内容:一、统计学的起源统计技术:古埃及、古中国(大禹治水)统计学:17世纪中叶Status(拉丁词汇,国家、状态)——Statistics 研究国家的宏观状态①国势学②政治算术二、国势学(17世纪的德国)德国大学学派:H·Coring 用文字记录一个国家的状况和制度G·Achenwall 第一个定义——把国家的显著事项全部记录下来的学科三、政治算术(17世纪的英国)英国的经验主义者:用数量或数字的方法说明国家的特征J·Graunt 《关于伦敦死亡表的观察》用数量分析社会、政治问题William Petty 《政治算术》四、概率论(数理特征更加明显)1.J Bernoulli(贝努里)瑞士大数法则借助大数法则可以从社会现象复杂不定的偶然性中寻找规律,它说明了社会现象的稳定性2.Gauss(高斯)德国正态分布(中心极限定理的基础)五、数理统计学Adolphe Quetelet(阿道夫·凯特勒)法籍比利时人数理统计学派的创始人“经验社会学之父”《社会物理学》“平均人”六、描述统计高尔顿(F Galton)回归现象根据对1078对父、子身高的散布图发现,虽然身材高的父母比身材矮的父母倾向于有高的孩子。
但平均而言,身材高大的其子要矮些,而身材矮小的其子要高些。
或者说,无论高个子或矮个子的后代,都有向均值方向拉回的倾向。
这种遗传上身高趋于一般,“退化到平庸”的现象,即是回归现象。
卡·皮尔逊(K Pearson)分布、相关、频数、皮尔逊系数七、推论统计部分→整体T检验、F检验第二章社会调查研究与统计分析教学目的和要求:通过本章的学习使学生了解社会调查研究的历程,明确统计分析在社会调查研究中所处的位置和作用。
熟悉统计分析的具体内容,牢记统计分析方法的选择标准,能够熟练地判断应用。
教学重点和难点:重点是社会调查研究的历程,难点是统计分析方法的选择标准,尤其是变量的测量层次。
教学方法:课堂讲授,结合实例讲解教学内容:第一节社会调查研究历程一、概念二、社会调查研究的历程1.确定课题课题的选择应具有一定的理论意义或应用价值,应当是社会迫切解决理论问题或实际问题就要有一定的迫切性,另外还要注意课题的可行性,以及研究者的主客观条件是否具备等。
2.初步探索通过查阅文献和向有经验的,有知识的人请教或者自己进行探索性调查,搜集获取第一手资料。
3.建立假设差异式(如果A越高,则B也(如果A越高,则B 也越高)函数式(A不同则B不同)4.理论解释和澄清概念概念的操作化:把那些通常只存在于我们头脑中的抽象概念,转化为我们看得见、摸得着,可以观察的具体指标社会地位——个人在社会中的位置——收入、职业、受教育程度5.设计问卷封闭式问题、开放式问题6.试填问卷7.调查实施8.资料整理:问卷的核对、登录9.统计分析与命题检验二、社会学研究的两个层次1.抽象层:包括概念命题理论2.经验层:包括观察量度测定分析等两者的关系紧密相联系遵循着:理论来源于实践,而又必须受到实践的检验第二节社会调查资料的特点和统计分析的内容一、社会调查资料的特点1.随机性大部分社会现象都具有非确定性,即在某种条件下可能发生也可能不发生。
2.统计规律性在表面上是偶然性在起作用的地方,这种偶然性始终是受内部的隐蔽着的规律支配的,而问题就在于发现这些规律。
二、统计分析的内容描述性统计:主要介绍资料的整理,分类和简化或特征研究推论性统计:主要介绍参数估计、假设检验、回归、列联、方差、等级相关等统计技术。
第三节怎样选用统计分析方法一、调查的方式全面调查——描述性统计抽样调查——推论性统计二、变量因素1.变量个数单变量双变量多变量2.变量层次定类:最低的变量层次,取值只有类别属性之分,而无大小程度之分。
数学运算符表示(=、≠)定序:取值除了有类别属性之外,还有登记次序的差别。
数学运算符表示(=、≠、>、<)定距:取值除了有类别、次序属性之外,取值之间的距离可用标准化的距离去测量。
数学运算符表示(=、≠、>、<、+、-)定比:除具有以上三种属性外,还可构成一个有意义的比率。
数学运算符表示(=、≠、>、<、+、-、*、/)(在社会学研究中,只满足定距而不满足定比的变量很少,因而研究中不再区分定比定距,而合为一类,称作定距变量)①高层次变量具有低层次变量的特性,反之不成立②一个变量他的层次并不是唯一的,③变量的层次与社会实际衡量之间存在着差距或不一致④变量类型的划分也不是唯一的,可根据自己领域的需要来划分。
第三章单变量描述性统计分析教学目的和要求:通过本章的学习使学生能够根据变量的测量层次,选择适当的表格、图形对数据资料进行初步简化,熟练地应用集中趋势和离散趋势测量法,对调查资料进行简化分析。
教学重点和难点:重点是集中趋势测量法、离散趋势测量法,难点是不同类型的统计图,尤其是直方图。
教学方法:课堂讲授,辅之以实例讲解教学内容:第一节最基本的单变量描述统计技术一、定类变量1、频次分布文字法、集合法、统计表法、统计图法2、频率分布文字法、集合法、统计表法、统计图法3、统计图——条形图、圆瓣图二、定序变量累加频次、累加频率三、定距变量1、连续型变量的分组问题组数;等距分组or非等距分组;决定分点的精度(组限、组距、组中点);2、统计图矩形图or直方图;折线图3、曲线类型四、统计表的制作1、统计表必须具备的内容表号、表头、标识行、主体行、表尾 2、制表过程收集数据;找出极差R=最大值L-最小值S ;确定组数;计算组距;实际分组;取中心值;统计频次,制表第二节 集中趋势测量法一、定类变量——众值Mo ——出现次数最多的值某班男生15人,女生30人。
Mo=女生 二、定序变量——中位值Md ——在一个序列的中央位置之值。
高于此值的有50%的个案,低于此值的也有50%的个案。
(一)未分组数据 1、原始资料首先要对个案按照从低到高的顺序排列;其次计算中位值所在的位置Md 位置==n+1/2;最后查找对应的数值 2、频次分布(频次分布表必须是按照由低到高的顺序排列的,而且列出了向上累加频次)首先计算中位值所在的位置Md 位置==n+1/2;其次按照累加频次找出中位值。
(二)分组数据 Md 位置==n/2Md=L+ 2n cf w f ⎛⎫-↑ ⎪⎪ ⎪⎝⎭L=中位值组之真实下限 f=中位值组之次数 w=中位值组之组距 cf ↑=低于中位值组真实下限之累加次数 n=全部个案数目三、定距变量——均值X ——将变量的各个数值相加起来,求取一个平均的数值(一)未分组数据 1、原始资料x X n=∑ n 是全部个案数目x ∑表示各个个案数值之和2、频次分布fxX n∑= x 是变量的各个取值,f 是每个变量值对应的次数,n 个案数目(二)分组数据mfxX n=∑ x m 是组中心值 2m U Lx +=小结:①三值设计的共同目的,都是希望通过一个数值来描述整体特征,以便简化资料,它们都反映了变量的集中趋势。
一般说:众值:适用于定类、定序和定距变量; 中位值:适用于定序和定距变量; 均值:适用于定距变量。
它们三者的代表性决定了它们具有估计和预测的作用。
②众值仅使用了资料中最大频次这一信息,因而资料使用不完全。
中位值,考虑了变量的顺序和居中位置,因此和总体频次分布有关,但因为只考虑居中位置,因而其他变量值的变化很难影响中位值,它也是三个集中值中最不敏感的。
均值,既考虑频次又考虑变量值的大小,因而更灵敏。
它的解释力最强,具有较高的统计价值。
③均值虽然灵敏,但对严重偏态的分布容易失去代表性。
即存在非常极端的分布值时,代表性不足。
例如,一个国家会因某些少数富翁的存在,使平均收入变得很高。
且在分组资料中的极端组没有组限时,不能求出均值,只能用中位值。
④偏态图形和三值的关系。
对于正态分布的图形来说,三值是合一的。
当图形正偏或负偏时,均值变化最快,中位值次之,众值不变。
第三节 离散趋势测量法一、定类变量——异众比率γ——非众值的次数与全部个案数目的比率。
公式为:n fmonγ-=n 是全部个案数目 fmo 是众值的次数二、定序变量——极差、四分位差(一)极差 R=最大值-最小值 (二)四分位差1、未分组数据 (1)原始资料 114n Q +=位置 3314n Q +=位置。
Q =3Q —1Q (2)频次分布 2、分组资料14n Q =位置 334n Q =位置 111114n cf Q L w f ⎛⎫-↑ ⎪=+ ⎪ ⎪⎝⎭ 3333334n cf Q L w f ⎛⎫-↑ ⎪=+ ⎪ ⎪⎝⎭Q =3Q —1Q1L =1Q 属组之真实下限 3L =3Q 属组之真实下限 1f =1Q 属组之次数 3f =3Q 属组之次数1cf ↑=低于1Q 属组下限之累加次数 3cf ↑=低于3Q 属组下限之累加次数1w =1Q 属组之组距 3w =3Q 属组之组距 三、定距变量——标准差、方差 (一)标准差、方差离均差x x -→离均差之和()x x -∑→离均差绝对值之和x x-∑→()2x x -∑→()22x x S n-=∑/S ==频次分布S ==分组资料S ==(二)变异系数/离散系数 1、使用离散系数的原因 2、S CV x =四、小结异众比率最适合于分析定类变项,也可分析定序、定距变项。
它仅考虑频次 极差、四分位差(十分位差)最适合用来分析定序变项,也可分析定距变项。