社会统计学 第四章 相关测量法与变量层次
- 格式:ppt
- 大小:729.50 KB
- 文档页数:13
1·社会学研究:就是运用科学的方法来搜集和分析社会事实,以理解社会现象之间的关系。
2·科学研究:就是运用客观的、逻辑的和系统的方法来搜集事实及分析事实。
3·社会学研究的整个历程,大致上可以分为三个阶段:(1)筹划,(2)执行,(3)总结。
4·初步探索步骤:(1)收集有关的文献,(2)咨询那些对研究的题目有经验、有知识的人,进行了解,(3)观察个案。
5·假设:就是根据我们对问题的了解,假定现象与现象之间的关系。
就是假定某一现象的变化与另一种现象的变化具有某种关系。
假设的方式:函数式(要求变项之数值有高低之分)、差异式(不存在高低之分)6·较为常用的研究方式:实验法、社会调查法。
(皆可验证假设)①实验法的逻辑:有意的改变A变项,然后看看B变项是否随着变化;如果B变项显然是随着A变项的变化而变化,就说明A变项对B变项有影响。
②社会调查法特点:在研究过程中不改变社会现状,只求就地取材,然后以统计方法推算变项与变项之间的关系。
7·能够有效地验证假设的实验法称为典型或理想实验法8·社会调查法可以分为两大类:一是叙述性调查(重点是报道社会事实,较少分析社会事实(即变项)之间的因果关系),一是解释性调查(目的是要证明不同的变项之间是否有因果关系)。
9·全体调查:就是从所有研究对象中搜集资料。
抽样调查:就是从全体的研究对象中科学的抽出一个数目较少的样本,然后据此样本的资料推论全体的情况。
10·个案研究:就是选择一个或几个个案(即研究对象),作深入的接触和观察,目的是对所研究的问题作深入的了解。
11·横剖研究:指的是在同一时期搜集资料,目的是理解各种社会现象(即变项)在某时期的相关情况的研究。
纵贯研究:是指在不同时期搜集的,目的在了解社会现象(即变项)在不同时期中的变动情况的研究。
12·纵贯研究分为两种:趋势研究、同组研究(指的是在不同时期调查相同的样本)。
社会统计学教学大纲课程名称:社会统计学英文名称:social statistics课程编号:12600722j使用专业:社会工作专业总学时数:48学时总学分:3学分大纲撰写人:文法学院社工系马永方内容简介社会统计学是社会学主干课之一,与社会学调查研究方法结合起来,完整地介绍了当代社会调查研究的科学方法和资料处理技术。
社会统计学则侧重介绍资料的收集、整理、分析和推论的处理技术。
从事社会工作研究理论和实践的人都有必要掌握社会统计学这门有用的工具。
本课程共7章。
第一章导论,介绍社会统计学和相关概念,第二章统计资料的搜集,第三章统计资料的整理,第四章到第七章是统计分析。
第四章和第五章是描述统计,第六到第七章是统计推断,第六章概率论是统计推断的基础,统计推断有两个基本内容:假设检验第七章。
一、讲授的主要内容第一章社会学研究和统计分析(2学时)第一节社会学研究的科学性第二节社会调查资料的特点和统计学的运用第二章单变量统计描述分析第一节分布统计表统计图第二节集中趋势测量法第三节离散趋势测量法第三章概率(3学时)第一节基础概率第二节概率分布、均值和方差第四章二项分布及其他离散型随机变量的分布(3学时)第一节二点分布第二节排列与组合第三节二项分布第四节多项分布第五节超几何分布第六节泊松分布第五章正态分布、常用统计分布和极限定理(3学时)第一节什么是正态分布第二节标准正态分布第三节标准正态分布表的使用第四节常用统计分布第五节大数定理和中心极限定理第六章参数估计(4学时)第一节名词解释第二节参数的点估计第四节正态总体的区间估计第五节大样本区间估计第七章假设检验(4学时)第一节统计假设第二节统计检验的基本步骤一、建立假设二、求抽样分布三、选择显著性水平和否定域四、计算检验统计量五、判定第八章单总体假设检验(4学时)第一节大样本假设检验第二节小样本假设检验第九章二总体假设检验第一节引言第二节大样本二总体假设检验第三节小样本二总体假设检验第十章列联表(4学时)第一节什么是列联表第二节列联表的检验第三节列联强度第十一章等级相关(定序变量之间)(4学时)第一节斯皮尔曼等级相关系数第二节Gamma等级相关第三节其他等级相关系数第十二章回归与相关(6学时)第一节回归研究的对象第二节回归直线方程的建立与最小二乘法第三节回归方程的假定与检验第四节相关第五节用回归方程进行预测第十三章方差分析(3学时)第一节引言第二节一元方差分析第三节二元方差分析第四节多元方差分析第十四章非参数检验(4学时)第一节非参数检验第二节符号检验第三节符号秩检验第四节累计频次检验第十五章抽样(4学时)第一节引言第二节抽样调查方法第四节样本容量的确定二、参考书目1. 社会统计学,卢淑华,北京大学出版社,2005年第三版.2.社会统计学,张彦,高等教育出版社,2005年第一版.3.社会统计学导论,周德民、贺翠微,中南大学出版社,2004年第一版.教学大纲说明一、教学目的与课程性质任务本课程属于专业限选课,是社会工作专业课程体系的重要组成部分。
统计学小知识四种测量尺度与变量状态在统计分析实际运用上,变量决定于所使用测量方法或测量尺度(scale),对于同一个测量对象,可以利用不同的测量尺度来测量,得到不同的测量结果,也就是不同的测量变量。
从测量的层次来看,测量尺度可以区分为名义、顺序、等距、比率四种层次,因此变量又可以分为名义变量、顺序变量、等距变量和比率变量。
这四种变量分别由四种对应的量尺所测得。
相同的变量名称,可以用不同的量尺来测量,反映出不同的测量内容。
01四种尺度的性质四种测量尺度中,最粗略者称为名义尺度(nominal scale)。
名义尺度的测量方式是针对被观察者的某一现象或特质,评估所属类型种类,并赋予一个特定的数值。
由名义尺度所测量到的变数,称为名义变量。
如性别(男、女)、籍贯(北京市、长春市等等)、种族(本省、外省、原住民)、婚姻状态(未婚、已婚、离婚、丧偶等)、就读学校等等。
较高一个等级的测量尺度是顺序尺度(ordinal scale),它是指对于被观察者其某一现象的测量内容,除了具有分类意义外,各类别间存在特定大小顺序关系。
以顺序尺度测量到的变量称为顺序变量,如大学教授等级(教授、副教授、助理教授、讲师)、教育程度(大学以上、大学、高中、初中、初中及以下)、社经地位(高、中、低)等,皆为顺序尺度所测得之顺序变量。
第三,等距尺度(interval scale)(或称间距尺度)的测量,是针对被观察者的某一现象或特质,依某特定的标准化单位,测定程度上的特性。
等距尺度测量得到的数值,除了具有分类、顺序意义外,数值大小反应了两个被观察者的差距或相对距离。
以等距尺度测量得到的变量,称为等距变量,其数值兼具分类、次序和差距的意义。
如以温度计量出的'温度’、以考试决定的'成绩’、以智力测验测得的'智商’等。
等距尺度的一个重要特性,是其单位只有相对的零点,而无绝对的零点。
相对零点的使用,使得数值与数值的比值,仅具有数学的意义,而缺乏实务意义,研究者应避免直接取用两个等距变量的数值相乘除比较。
社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。
2.其次看变量的取值能否比较大小,不能这个变量只能是定类变量。
3.最后如果这个变量能够比较大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。
三、变量层次的比较定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。
四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次(或频率)分布的一种工具。
2.统计表必备的容:(1)表号、标题(2)标识行:变量名、对应数据说明(频次、频率)(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数(cf↑)和向下累加次数(cf↓)。
(2)累加频率:把各级的百分率逐渐相加。
也分为向下累加百分率和向下累加百分率。
2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。
3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。
➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。
2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组合适,分为等距分组和非等距分组。
(2)组限:包括上限(up)和下限(low)(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。
(6)组中值:真实上限与真实下限的平均值。
第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。
2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。
社会研究的统计应用常考内容社会研究的统计应用第一章科学方法与社会研究历程1、定类测量层次定类层次是指变项的值只能把研究对象分类,即只能决定研究对象是同类抑或不同类,具有=与≠的数学特质。
定类层次有两个原则,一是互斥性,即类与类之间要互相排斥,每个研究对象只能归入一类;另一个是无遗性,即所有研究对象均有归属,不可遗漏。
适用于简化一个定类变项资料的方法,有次数分布、比例、比率、图示和对比值等。
2、定序测量层次定序层次是指能确定值的次序,即变项的值能把研究对象排列高低或大小,具有>或<的数学特质。
定序层次包括了定类层次的特质。
3、定距测量层次定距层次是指能够确定值与值之间的距离,即变项之值与值间的距离是可以知道的,因为具有加与减的数学特质。
定距层次包括了定序与定类层次的特质。
4、定比测量层次定比测量层次是最高的测量层次,其数值中的零值是绝对的、固定的,因而除了具备分类、排序以及加减的特质外,还具有×与÷的数学特质。
第二章简化一个变项之分布第一节基本技术一、定类层次1、次数分布(f):变项内每一个值在原资料中出现的次数情况。
2、比例(p):就是将每类的次数(f)除以总数(N)。
3、比率:就是把计算比例时的所用的基数变大,使读者容易领会,如可转化为百分率、千分率、万分率等。
4、对比值:对比值就是将两类数值相除,得到一个比值。
二、定序层次1、累加次数(cf):就是把次数逐级相加起来。
分为两种,一种是向上累加,另一种是向下累加。
其作用是使我们容易知道某值以下或以上之次数总和。
2、累加百分率(c%):就是将各级的百分率逐级相加。
三、定距层次1、组限:就是每组的范围,包括上限和下限。
统计表上所标示的组限不是真实的组限。
真实下限=标示下限-0.5;真实上限=标示上限+0.5。
2、组距:就是每个组的宽度,即组的真实上限与真实下限之差。
3、组中点:就是真实上限与真实下限的平均数。
4、矩形图:以一个矩形的面积(长×宽)表示每组数值之次数或百分率的多少。
云南省考研社会学复习资料社会统计学重要概念梳理社会统计学是社会学研究的一项重要方法和工具,通过统计数据的采集、整理和分析,以及对社会现象的量化研究,帮助我们揭示社会规律和现象之间的关联。
在云南省考研的社会学复习中,社会统计学是一个重要的考点,下面将对社会统计学的核心概念进行梳理。
一、变量与测量在社会统计学中,变量是指可以被观察或测量的特征、属性或现象。
社会科学研究往往涉及到多个变量之间的关系。
因此,了解变量的类型以及如何进行测量是十分重要的。
1.1 变量的类型变量可以分为定量变量和定性变量两种类型。
定量变量是指在测量中能够表示数量或程度的变量,如年龄、收入等。
而定性变量是指在测量中只能表达品质或属性的变量,如性别、民族等。
1.2 测量尺度测量尺度是指用于测量变量的一种工具或方法。
常见的测量尺度包括名义尺度、顺序尺度、区间尺度和比例尺度。
- 名义尺度:仅适用于定性变量,用于分类和标记,如性别、宗教等。
- 顺序尺度:适用于定性变量,表达两个或多个属性间的排序关系,但不能确定差值大小,如教育程度的高低。
- 区间尺度:适用于定量变量,具有固定的单位间隔,但没有绝对零点,如温度。
- 比例尺度:适用于定量变量,具有固定的单位间隔和绝对零点,如年龄、收入等。
二、样本与总体在社会统计学中,样本和总体是进行统计推断和分析的重要概念。
2.1 样本样本是指从总体中选取出来的一部分个体或单位。
通过对样本的观察和测量,可以推论总体的特征和规律。
样本的选取应当具备随机性和代表性,以确保得到的结论具有普遍的可靠性。
2.2 总体总体是指研究对象的全部个体或单位的集合。
社会统计学的研究目标往往是推论总体特征和规律,因此必须对总体的构成和特征有所了解。
三、频数与频率频数和频率是社会统计学中描述变量分布情况的常用指标。
3.1 频数频数是指某个特定取值在样本或总体中出现的次数。
通过统计样本或总体中各个取值的频数,可以得到变量的分布情况。
社会统计学复习整理一、变量的测量层次二、判断变量层次的技巧1.首先所有的变量都是定类变量。
2.其次看变量的取值能否比拟大小,不能这个变量只能是定类变量。
3.最后如果这个变量能够比拟大小,那么就看变量取值加减乘除是否有意义,如果有意义就是定距变量,如果没有意义就只能是定序变量。
三、变量层次的比拟定类变量、定序变量和定比变量的数层次是从低到高排列的,高层次的变量同时具有低层次变量的功能。
四、相关分析方法第二节简化一个变项的分布一、定类变量1.统计表:用表格的形式来表示变量频次〔或频率〕分布的一种工具。
2.统计表必备的容:(1)表号、标题(2)标识行:变量名、对应数据说明〔频次、频率〕(3)主题行:变量取值的统计数据(4)表尾:如果是引用必须说明资料来源二、定序变量1.适合定序变量的简化资料的方法(1)累加次数:把次数逐渐相加起来,分为向上累加次数〔cf↑〕和向下累加次数(cf↓)。
(2)累加频率:把各级的百分率逐渐相加。
也分为向下累加百分率和向下累加百分率。
2.cf↑的计算方法就是按照变量取值的等级从低往高逐层相加。
3.cf↓计算方法就是按照变量取值的等级从高往低逐层相加。
➢cf↑表示低于某个等级的频数有多少➢cf↓表示高于某个等级的频数有多少三、定距变量1.定距变量的简化工具是:分组、直方图和折线图。
2.连续型定距变量的分组统计(1)组数:分组的数量,一般5到7组适宜,分为等距分组和非等距分组。
(2)组限:包括上限〔up〕和下限〔low〕(3)标识下限和标识上限,例500—699(4)真实下限:标识下限—0.5;真实上限:标识上限+0.5.(5)组距:真实上限与真实下限之差。
(6)组中值:真实上限与真实下限的平均值。
第三节集中趋势测量法1.集中趋势:用一个典型的变量值或特征值来代表全体变量的问题,用这个数值来代表变项的资料分布,以反映资料的集结情况。
2.集中趋势测量的意义就是可以根据这个代表值来估计或预测每个研究对象的数值。
社会统计与调查分析教学大纲课程名称:社会统计与调查分析英文名称:social statistics 课程编号:126404使用专业:社会工作专业总学时数:48+32=80学时总学分:4学分大纲撰写人:公共管理学院吕如敏内容简介社会统计与调查分析是社会学主干课之一,与社会学调查研究方法结合起来,完整地介绍了当代社会调查研究的科学方法和资料处理技术。
社会统计与调查分析则侧重介绍资料的收集、整理、分析和推论的处理技术。
从事社会工作研究理论和实践的人都有必要掌握社会调查与社会统计这门有用的工具。
一、课程性质与任务1.课程性质:本课程是工商管理系劳动与社会保障专业的专业基础课。
本课程教学的目的在于使学生系统地掌握社会统计的基本知识、基本理论以及相关操作技能,能够比较熟练的运用常用的社会统计技术与方法解决社会研究中的具体统计问题。
2.课程任务:本课程的主要任务是让学生掌握基本的社会统计知识与分析方法,熟练地运用社会统计技术解决实际问题,并能够使用Excel进行统计数据的处理,同时培养学生严密的逻辑推理思维和良好的学习习惯。
二、课程教学内容及要求教学要求:通过该门课程的学习,要求学生明确理解统计这种认识工具的特点、内容和方法;要弄懂各种概念、范畴等基本知识;要求掌握抽样调查、参数估计、假设检验、指数分析等经典的统计方法,并联系实际应用各统计分析方法。
统计学是一门实践性很强的课程,在教学中要善于联系当前社会经济实际和其他学科知识,并要求学生初步具备经济实验或调查的设计能力,对经济和管理及其他社会问题的统计模型构建能力,利用普通办公软件运行统计模型的能力以及对相关统计模型运行结果进行解释的能力。
本课程共7章。
第一章导论,介绍社会调查与社会统计和相关概念,第二章统计资料的搜集,第三章统计资料的整理,第四章到第七章是统计分析。
第四章和第五章是描述统计,第六到第七章是统计推断,第六章概率论是统计推断的基础,统计推断有两个基本内容:假设检验第七章。
社会测量名词解释社会测量是社会科学研究的重要方法之一,通过对社会现象的测量可以帮助我们理解社会的本质和变化。
在社会测量中,存在着许多重要的名词需要理解和解释。
本文将介绍一些常见的社会测量名词的含义和用途。
1. 观察观察是社会测量中常见的一种方法,指的是研究者通过直接观察和记录社会现象来获取数据。
观察可以分为两种形式:自然观察和人工观察。
自然观察是指研究者观察社会现象时不加干预或改变,纯粹记录现象的发生和变化;人工观察则是指在研究过程中,研究者根据研究目的的需要对现象进行干预和控制。
观察是社会测量的重要工具之一,通过观察可以获取到真实的社会数据。
2. 问卷调查问卷调查是社会测量中最常用的方法之一,它通过设计和分发问卷来搜集数据。
问卷调查可以以书面形式或在线形式进行,被调查者需要回答一系列问题,研究者可以根据问卷获得大量的数据。
问卷调查可以用于搜集个体的态度、意见、行为和经验等信息,结合统计分析方法可以对社会现象进行量化和比较。
3. 可信度可信度是社会测量中一个重要的概念,指的是测量工具(例如问卷)的稳定性和一致性。
一个可信度高的测量工具意味着它能够产生可靠的测量结果。
通常使用统计量来评估测量工具的可信度,例如重测相关系数和内部一致性系数。
高可信度的测量工具能够提供准确和稳定的测量结果,有助于保证研究的可靠性和有效性。
4. 效度效度是社会测量中另一个重要的概念,指的是测量工具测量所要衡量的概念或变量的准确性和适用性。
一个高效度的测量工具意味着它能够准确地反映出研究中所关注的概念或变量。
效度包括构效度、标准效度和预测效度等不同类型,可以通过实证研究和统计分析方法来评估。
高效度的测量工具有助于确保研究的结果准确和有说服力。
5. 相关性相关性是社会测量中常用的统计概念,用于衡量两个或多个变量之间的关系强度和方向。
相关性可以分为正相关和负相关,正相关表示两个变量随着一个变量的增加而增加,或随着一个变量的减少而减少;负相关表示两个变量随着一个变量的增加而减少,或随着一个变量的减少而增加。
社会研究的统计应用第一章科学方法与社会研究历程1、定类测量层次定类层次是指变项的值只能把研究对象分类,即只能决定研究对象是同类抑或不同类,具有=与≠的数学特质。
定类层次有两个原则,一是互斥性,即类与类之间要互相排斥,每个研究对象只能归入一类;另一个是无遗性,即所有研究对象均有归属,不可遗漏。
适用于简化一个定类变项资料的方法,有次数分布、比例、比率、图示和对比值等。
2、定序测量层次定序层次是指能确定值的次序,即变项的值能把研究对象排列高低或大小,具有>或<的数学特质。
定序层次包括了定类层次的特质。
3、定距测量层次定距层次是指能够确定值与值之间的距离,即变项之值与值间的距离是可以知道的,因为具有加与减的数学特质。
定距层次包括了定序与定类层次的特质。
4、定比测量层次定比测量层次是最高的测量层次,其数值中的零值是绝对的、固定的,因而除了具备分类、排序以及加减的特质外,还具有×与÷的数学特质。
第二章简化一个变项之分布第一节基本技术一、定类层次1、次数分布(f):变项内每一个值在原资料中出现的次数情况。
2、比例(p):就是将每类的次数(f)除以总数(N)。
3、比率:就是把计算比例时的所用的基数变大,使读者容易领会,如可转化为百分率、千分率、万分率等。
4、对比值:对比值就是将两类数值相除,得到一个比值。
二、定序层次1、累加次数(cf):就是把次数逐级相加起来。
分为两种,一种是向上累加,另一种是向下累加。
其作用是使我们容易知道某值以下或以上之次数总和。
2、累加百分率(c%):就是将各级的百分率逐级相加。
三、定距层次1、组限:就是每组的范围,包括上限和下限。
统计表上所标示的组限不是真实的组限。
真实下限=标示下限-0.5;真实上限=标示上限+0.5。
2、组距:就是每个组的宽度,即组的真实上限与真实下限之差。
3、组中点:就是真实上限与真实下限的平均数。
4、矩形图:以一个矩形的面积(长×宽)表示每组数值之次数或百分率的多少。
1、四种测量尺度:(1)定类尺度:按现象性质差异进行的辨别与区分。
测量结果形成定类变量或指标。
定类变量或指标确切的值是以文字表述的,可用数值标识,但仅起标签作用。
各类别间是平等的,没有高低、大小、优劣之分。
分类的原则:穷尽性或无遗性;互不重叠或互斥性属性:对称性;传递性(2)定序尺度:按现象顺序差异进行的辨别与区分。
测量结果形成定序变量或指标。
定类变量或指标确切的值是以文字表述的,可用数值标识,但仅起标签作用。
定序变量或指标各类别间有高低优劣之分,不能随意排列。
(3)定距尺度:按现象绝对数量差异进行的辨别与区分。
测量结果形成定距变量或指标。
定居变量或指标的值以数字表述,有计量单位可进行加减运算,不能进行乘除运算。
各类别间有大小之分,但没有绝对零点。
(4)定比尺度:按现象绝对差异与相对差异进行的辨别与区分。
测量结果形成定比变量或指标。
定比变量或指标确切的值以数字表述,有计量单位,可加减。
有绝对意义上的零点,可乘除。
2、测量尺度的作用:(1)决定数据的整理、显示方法。
(2)决定数据的分析方法。
(3)决定计算机的处理方法。
3、对测量尺度的判断:测量精度、计算方法、信息数量4、条形图和直方图的区别:条形图:是以长方形的长度(宽度相同)来表示次数或百分率的多少,为求清楚长方形之间可以分开(当然也可以不分),宽度没有意义。
直方图:又称矩形图,以一个矩形的面积(长宽)表示每组数值的次数或百分率的多少。
与条形图的不同。
条形图的宽度没有意义,直方图的长度与宽度均有意义;直方图各个矩形要相连排列,条形图可以分开。
5、累加次数:累加次数就是把次数逐级相加起来,分为两种;一种是向上累加(cf↑),一种是向下累加(cf ↓),其作用是使我们容易知道某值以下(或以上)之次数总和。
向上累积表示由低层向高层累加。
向下累积表示由高层向低层累加。
6、众值:众值(Mo)就是次数最多之值。
对于定类变项,以众值作预测所犯的错误是最小的。