卢淑华讲义全
- 格式:doc
- 大小:68.50 KB
- 文档页数:8
1、P58习题十五设一下是某区家庭人数的统计表:(1)试作频率统计表,直方图和折线图(2)试求均值和标准差2、P59习题十六设以下是七十二名离婚者的婚龄的统计(见下表)。
(1)试作频率统计表、直方图和折线图(2)试求众值、中位值和均值,并做简单讨论。
(3)试求四分互差和标准差。
3、P59习题十七设以下是1209名抽烟者年龄的统计(见下表)(1)试作频率统计表、直方图和折线图(2)试求四分互差。
4、P72例10某年级共有学生一百名,其中来自广东省的有二十五名,来自广西省的有十名,问任抽一名,来自两广的概率是多少?根据某市职业代际流动的统计,服务性行业代际向下流动的概率为0.07,静止不流动的概率为0.85,求服务性行业代际向上流动的概率是多少?6、P75例13为了呀牛父代文化程度对子代文化程度的影响,某大学统计出学生中父亲具有大学文化程度的占30%,母亲具有大学文化程度的占20%,而父母双方都具有大学文化程度的占10%,问学生中任抽一名,父代至少有一名具有大学文化程度的概率是多少?7、P75例14某地对外国旅游者旅游动机进行了调查,发现旅游者处于游览名胜的概率为0.219;处于异族文化的吸引占0.509;而两种动机兼而有之的占0.102.问旅游动机为游览名胜或为异族文化吸引的概率是多少?8、P76例16根据统计结果,在自然生育情况下,男婴出生的概率为22/43;女婴出生的概率为21/43.某单位有两名孕妇,问两名孕妇都生男婴的概率是多少?两名孕妇都生女婴的概率是多少?其中一名孕妇生男婴、一名孕妇生女婴的概率是多少?9、P77例17某居民楼共十二户,其中直系家庭为两户,问访问两户都是直系家庭的概率是多少?10、P78例18某居民楼共二十户,其中直系家庭为两户,问访问第二户才是直系家庭的概率是多少?11、P78例20设居民楼共有住户一千户,其中核心家庭占60%,问访谈中散户都是核心家庭的概率是多少?10人抓阄,其中共有2张球票,问第2个人抓到球票的概率?13、P85例23设出口商标为Made in China的产品,其中有50%为上海厂的产品;30%为北京厂得产品;20%为天津厂的产品。
社会统计学讲义第一章导论一、社会统计学1、社会统计学是运用统计的一般原理,对社会各种静态结构与动态趋势进行定量描述或推断的一种专门方法和技术。
研究对象:概括而言是指社会现象的数量方面。
2、选择统计分析方法的原则是根据研究目的和资料本身的特点选择。
3、统计分析的作用:(1)可对资料进行简化和描述;(2)可对变量间的关系进行描述和深入地分析(统计分析通过事后解释使得探讨变量间复杂的因果联系成为可能);(3)可通过样本资料推断总体(通过参数估计和假设检验,将样本推论到总体并指出这种推论的误差及做出这种推论的把握有多大)。
4、社会统计的基本程序(1)制定计划;(2)统计调查;(3)统计整理;(4)统计分析;(5)统计报告。
5、几个基本概念(1)总体与单位总体又称母体,是作为统计研究对象的、由许多具有共性的单位构成的整体。
构成总体的每一个个体称为总体单位,简称单位或个体。
3个基本特征:大量性、同质性和变异性。
(2)标志与变量总体的每个单位都具有许多属性和特性,说明总体单位属性或数量特征的名称在统计上称为标志,分为数量标志和品质标志。
可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。
(3)指标与指标体系统计指标是反映总体(或样本总体)的数量特征的概念或范畴。
一个完整的统计指标由两部分构成:指标名称和指标数值。
在社会统计中,如要全面把握对象总体情况,就不能单凭一个指标,而要靠一组相互联系的并与之相适应的指标来完整地反映对象总体。
指标体系就是一系列有内在联系的统计指标的集合体。
二、社会调查研究的程序社会学研究之阶段与步骤(1)确定课题:来源与社会学理论、当前社会现实和要解决的实际问题;具有强烈的时代感、为国家现代化服务;(2)了解情况:查阅文献和向有经验、有知识的人了解,运用个案调查、典型调查进行探索性研究;(3)提出一定的想法和建立假设:差异式、函数式;(4)建立概念和测量方法:采用适当的术语和概念;操作化定义;概念的表现形式往往具有多值性;(5)设计问卷:内容包括事实、态度与看法、行为趋向、理由;方式有固定答题式和自由答题式;(6)试填问卷:发现不周或遗漏之处在试填阶段予以纠正;(7)调查实施(抽样调查):从局部推论到全体(8)校核与登录(9)统计分析与命题的检验:检验最初研究阶段的命题或假设是否得到证实或部分证实,在此基础上对研究内容提出建议和确定进一步的研究方案。
2014年中山大学社会学与人类学学院(653社会学理论847社会研究方法和社会统计学)考研备考指南下载2014年中山大学653社会学理论和847社会研究方法和社会统计考研复习指南.pdf (下载次数: 340)指定/推荐参考书目648社会学理论①《社会学概论新修》,郑杭生编,中国人民大学出版社,1998②《社会学》,戴维•波普诺,中国人民大学出版社,2000年③《西方社会学理论教程》,侯钧生主编,南开大学出版社,2001年④《当代西方社会学理论》杨善华,北京大学出版社,1999844社会研究方法和社会统计学社会学(030301)专业:①《社会研究方法教程》,袁方编,北京大学出版社,1997②《社会研究的统计应用》,李沛良编,社会科学文献出版社,2001③《社会学研究方法》,风笑天著,中国人民出版社,2001④《社会研究方法》(第10版),艾尔□巴比,华夏出版社,2005拓展适用资料书目①《外国社会学史》,贾春增,中国人民大学出版社,2008②《当代国外社会学理论》,刘少杰,中国人民大学出版社,2009③《当代社会学理论:对古典理论的扩展》(第6版) 鲁思•华莱士、沃艾莉森•沃尔夫、刘少杰中国人民大学出版社,2008④《社会统计学》(第4版),卢淑华,北京大学出版社,2009考试情况分析参考书目很多,但内容无非分为四大块:社会学理论,社会学概论,研究方法,社会统计。
都是要求在理解的基础上识记并且会灵活运用阶段复习规划8月份之前完成参考书目的第一遍通读,9、10两个月分析整理真题,抓考点,11、12两月反复背诵,1月份查漏补缺653高分辅导讲义中山大学社会学理论高分考研笔记(2014版)系中山大学优秀社会学考研辅导团队集体编撰的“社会学考研精品考研辅导资料”之一。
不可否认,学校指定的考研参考教材——侯俊生教授编写的《西方社会学理论教程》(第三版)是一本非常优秀的教科书,学生肯定能从中学到丰富的知识,但由于此书并不能迎合广大考生“应试”的功利心情。
第一章社会体育与社会体育在我国的发展趋势第一节社会体育概述一、社会体育的涵义:社会体育是指社会公民自愿参加的,以增进身心健康为主要目的,内容丰富、形式灵活的大众普及性体育活动。
社会体育是我国体育事业的重要组成部分,是一种面向社会全体成员,普及于全体成员的社会文化现象。
它是社会发展的重要内容和社会进步的标志之一,其发展水平是衡量一个国家体育发展水平的重要标志。
社会体育的对象为社会全体公民,范围涉及整个社会的时间和空间。
二、社会体育的基本特点(一)对象的广泛性社会体育的参与对象和学校体育、竞技体育相比具有明显的广泛性特点。
它可以汇纳各个人种和民族,可以涵盖所有阶层、职业和人群,可以包括不同年龄和性别,凡是有人群的地方,都存在着不同发展程度和形态的社会体育活动。
(二)时空的广阔性从事社会体育活动的时间和空间范围没有限制。
社会体育涉及到社会方方面面,以及所有的领域。
我们可以说它是从企业到社区,从社区到家庭,从机关到企业,从企业到厂矿,从厂矿到农村,几乎全国所有地方都涵盖到的。
这是从空间上来说它的广延性。
另一个方面从参加者来看,既包括不同的职业、不同的年龄、不同的性别、不同的健康水平、不同的兴趣爱好等等。
也就是说社会体育是不同的人都会参加的体育活动。
从时间上来讲,可以是早晨或傍晚,也可以是中午和半夜;可以是春秋,也可以是冬夏;可以是一时的参与,更要求终身进行锻炼。
从空间范围来看,社会体育的活动范围可以是城市、社区,也可以是农村、乡镇;可以是崇山峻岭,也可以是林海雪原;可以是江河湖海,也可以是戈壁荒滩等。
(三)目的、内容的多样性由于社会体育参加的人群不一样,活动场所不一样,目标不一样,所以它在参加的内容方面,也表现出极大的差异性和极强的丰富性。
社会体育按目的划分,有健身体育、健美体育、娱乐体育、休闲体育、保健康复体育等。
社会体育的内容有民族、民间传统体育项目和健身方法,也有大量的现代健身手段和运动项目;有复杂或简单的;有正规的或非正规的。
社会统计学讲义(卢淑华)第一章社会学研究与统计分析一、社会调查资料的特点(随时掌握)随机性、统计规律性;二、统计学的作用:为社会研究提供数据分析和推论的方法三、统计分析的作用及其前提。
四、统计分析方法的选择1、全面调查和抽样调查的分析方法2、单变量和多变量的统计分析方法五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等第二章单变量统计描述分析一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。
尤其是直方图的意义。
二、标明组限与真实组限的换算,重要。
三、集中趋势测量法1、定义、优缺点、注意事项;2、众值:定义、计算公式、解释、运用,注意事项;3、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;4、均值:定义、计算公式(分组与加权)、解释、运用,注意事项;5、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;四、离散趋势测量法1、定义、优缺点、注意事项,与集中趋势的关系;2、异众比例:定义、计算公式、解释、运用,注意事项;3、质异指数:定义、计算公式、解释、运用,注意事项;4、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。
4、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项;第三章概率一、概率:就是指随机现象发生的可能性大小。
随机现象具有不确定性和随机性。
二、概率的性质:1、不可能事件的概率为0;2、必然事件的概率为1;3、随机事件的概率在0-1之间;三、概率的计算方法:1、古典法:计算等概率事件,P=有效样本点数/样本空间数;2、频率法:求随机事件在多次试验后的极限频率。
3、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。
四、概率的运算:会画文氏图1、加法公式:两个或多个随机事件的求和概率‘2、乘法公式:两个或多个随机时间共同发生的概率。
第十一章 等级相关练习题1.某市有12所大专院校,现组织一个评审委员会对各校校园及学生体质进行评价,结果如下,试求环境质量与学生体质的关系的斯皮尔曼相关系数和肯得尔等级相关系数。
2.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之Gamma 系数和肯德尔相关系数τc 。
3.以下为两位评判员对10名参赛人名次的打分。
试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。
4.青年歌手大奖赛评委会对10名决赛选手的演唱水平(X )和综合素质(Y )进行打分,评价结果如下表(表中已先将选手按演唱水平作了次序排列)所示,试计算选手的演唱水平和综合素质间的斯皮尔曼等级相关系数。
(10分)5.下面是对50名被调查者的英语成绩和法语成绩的抽样调查:求Gamma 系数。
解:41.0164390164390=+-=+-=d s d s n n n n G y x a=b 54.479y=a+bx=-54.479+0.659x n n -=-∑∑斯皮尔曼相关系数2s 26d r 1-0.94n(n -1)==∑【皮尔逊相关系数:0.889,斯皮尔曼相关系数:0.94,回归方程:Y=-54.48+0.66X 】1.赛马迷们会认为,在圆跑道上进行的赛马比赛中,某些起点位置上的马会特别有利。
在有八匹马的比赛中,位置1是内侧最靠近栏杆的跑道,位置8是外侧离栏杆最远的跑道。
请从赛马的结果中判断起点位置与赛马获胜是否有关。
(α=0.05)7. 甲、乙两位评酒员对10种品牌白酒的主观排序如下表,计算两个等级相关系数,问两位评酒员对白酒的评价意见具有一定的相关性吗?(α= 0.05)第十二章回归与相关一、填空1.在数量上表现为现象依存关系的两个变量,通常称为自变量和因变量。
自变量是作为(变化根据)的变量,因变量是随(自变量)的变化而发生相应变化的变量。
2.对于表现为因果关系的相关关系来说,自变量一般都是确定性变量,因变量则一般是(随机性)变量。
第十二课创新思维要多路探索[课标要求] 了解发散思维中所采取的推测方法。
概括发散思维的特点。
知道聚合思维和发散思维的功能。
了解什么是逆向思维。
了解逆向思维的依据和优势。
发挥正向思维和逆向思维的互补作用。
[素养目标] 克服思维的单向性,提高思维品质,树立创新意识,提高分析问题的能力。
通过对发散思维的了解,增强进行发散思维的自觉性。
理解聚合思维的特征和方法,加深对聚合思维和发散思维的认识,懂得思维的方式是多种多样的道理。
掌握如何进行逆向思维和如何做到正逆互补。
培养逆向思维或正逆互补解决问题的能力。
增强逆向思维的意识,克服逆反心理。
培养学生的科学精神,提高逆向思维能力。
探究点一发散思维的方法1.发散思维的含义:发散思维是根据已知的事物信息,从不同的角度、不同的方向思考,以寻求解决问题的多样性答案的思维方式。
提醒发散思维的客观基础是事物性质和关系的多样性。
2.思维发散的技法(1)检核表法:主要是通过对所设想问题的几个方面进行详细检查,从看似“毫无问题”的事物中找到思维创新的突破口,以求产生创新的思路。
(2)信息交合法:是利用已有的或引进的事物信息,通过列举的方法,将不同信息有目的地进行组合,以产生新的思路。
(3)头脑风暴法:是一种集思广益的群体思维发散技法。
想一想:下面做法运用了发散思维的什么技法?①医生引入微爆破技术消除肾结石。
②召集科技人员开会,研究新产品的开发。
提示①检核表法。
②头脑风暴法。
3.正确看待思维发散技法(1)发散思维不仅能够帮助人们发现新问题,而且能对所要解决的问题提供众多新设想。
思维发散技法有助于人们进行思维发散。
(2)仅仅依靠几种思维发散技法,难以产生理想的结果。
在思维发散的过程中,还需要其他思维因素的积极参与。
(3)思维发散的效果,与人们的知识和经验的多少、实践能力的高低等密切相关。
(1)检核表法、信息交合法和头脑风暴法都是自由思维发散的技法。
改错:检核表法、信息交合法和头脑风暴法都是强制思维发散的技法。
第12课 创新思维要多路探索目录考情分析网络构建【速记卡片】 考点一 发散思维与聚合思维的方法 【夯基·必备基础知识梳理】 知识点1 发散思维的方法 知识点2 聚合思维的方法与功能 【易混易错】 【知识拓展】【提升·必考考向归纳】考向1 发散思维的方法考向2 聚合思维的方法与功能考点二 逆向思维的含义与作用 【夯基·必备基础知识梳理】 知识点1 逆向思维的含义知识点2 发挥思维正逆互补的作用【易混易错】【知识拓展】【提升·必考考向归纳】考向1 逆向思维的含义考向2 发挥思维正逆互补的作用 时政探究 【命题预测】 真题感悟【速记卡片】明确3个含义:发散思维、聚合思维和逆向思维的含义掌握1个关系:发散思维与聚合思维的关系明确3个作用:发散思维的作用、聚合思维的功能、思维正逆互补的作用掌握3个方法:发散思维、聚合思维和逆向思维的方法考点一发散思维与聚合思维的方法知识点1 发散思维的方法1.发散思维的含义根据已知的事物信息,从不同的角度、不同的方向思考,以寻求解决问题的多样性答案的思维方式。
2.必要性为了揭示事物可能存在的其他性质和关系,寻求事物可能具有的其他功能和作用,人们常常需要运用发散思维。
3.特征从一个出发点向四面八方想,向新奇、独特之处想,是扩散、辐射。
4.思维发散的技法(1)检核表法①含义:主要是通过对所设想问题的几个方面进行详细检查,从看似“毫无问题”的事物中找到思维创新的突破口,以求产生创新的思路。
②具体方法:检核表法主要从他用、借用、改变、扩大、缩小、代替、调整、颠倒、组合等九个方面进行思维发散。
(2)信息交合法:是利用已有的或引进的事物信息,通过列举的方法,将不同信息有目的地进行组合,以产生新的思路。
(3)头脑风暴法:是一种集思广益的群体思维发散技法。
它以会议的形式开展,要求有人主持会议,会议有讨论的主题。
这种会议的原则是“延迟评判”“以量求质”。
社会统计学讲义(卢淑华)第一章社会学研究与统计分析一、社会调查资料的特点(随时掌握)随机性、统计规律性;二、统计学的作用:为社会研究提供数据分析和推论的方法三、统计分析的作用及其前提。
四、统计分析方法的选择1、全面调查和抽样调查的分析方法2、单变量和多变量的统计分析方法五、不同变量层次的比较;定类、定序、定距、定比定义、数学特征、运算特性、涵盖关系、等第二章单变量统计描述分析一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。
尤其是直方图的意义。
二、标明组限与真实组限的换算,重要。
三、集中趋势测量法1、定义、优缺点、注意事项;2、众值:定义、计算公式、解释、运用,注意事项;3、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;4、均值:定义、计算公式(分组与加权)、解释、运用,注意事项;5、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值;四、离散趋势测量法1、定义、优缺点、注意事项,与集中趋势的关系;2、异众比例:定义、计算公式、解释、运用,注意事项;3、质异指数:定义、计算公式、解释、运用,注意事项;4、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。
4、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项;第三章概率一、概率:就是指随机现象发生的可能性大小。
随机现象具有不确定性和随机性。
二、概率的性质:1、不可能事件的概率为0;2、必然事件的概率为1;3、随机事件的概率在0-1之间;三、概率的计算方法:1、古典法:计算等概率事件,P=有效样本点数/样本空间数;2、频率法:求随机事件在多次试验后的极限频率。
3、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。
四、概率的运算:会画文氏图1、加法公式:两个或多个随机事件的求和概率‘2、乘法公式:两个或多个随机时间共同发生的概率。
分为独立事件的乘法和条件概率的乘法公式。
(1)独立:P(AB)=P(A)*P(B)(2)条件:PAB)=P(A)*P(A/B)=P(B)*P(B/A)3、条件概率:将(2)反过来即可。
P(B/A)是指在A发生的条件下B发生的概率。
4、全概公式:互不相容的完备事件组,求任意一个事件的发生5、逆概公式:与4相反。
五、离散型随机变量和连续型随机变量的概率分布及密度函数。
六、数学期望:1、离散型变量数学期望的计算2、连续型变量数学期望的计算,可以忽略3、数学期望的性质,6点,重要七、方差:1、简化公式,一个变量的方差等于变量平方的期望减去变量期望的平方。
2、方差的性质,4点,重要,经常在参数估计和假设检验中用到。
第四章二项分布及其离散型随机变量的分布一、二点分布,0-1分布,1、定义,2、概率分布、期望、方差二、二项分布,贝努里分布:1、定义,2、概率分布公式3、期望、方差4、会求不同条件下的概率,如至多、至少出项多少次?5、二项分布的讨论三、多项分布,重点是三项分布,了解。
1、三项分布的公式2、每个变量的期望和方差,注意n项分布,分别有n-1个期望和方差。
四、超几何分布:1、定义,跟二项分布的区别2、概率分布、期望、方差。
五、泊松分布1、定义、分布形式2、期望、方差,与二项分布的关系。
3、应用围及条件。
第五章正态分布、常用统计分布和极限定理一、正态分布,常态分布:1、定义、密度分布、性质2、均值、方差,正态曲线下方面积的意义。
3、正态分布标准化及实际意义。
4、正态分布表的查法(注意对称性)。
二、常用统计分布1、卡方分布:定义,自由度,均值、方差,性质,换算。
2、t分布,定义,自由度,均值、方差,性质,换算。
3、F分布,定义,自由度,均值、方差,性质,换算。
4、三种常用分布适用围的比较。
三、大数定理1、大数定理的含义2、切贝夫不等式:用于保守估计某事件发生的概率3、贝努里大数定理。
4、切贝夫大数定理。
四、中心极限定理:重点1、极限定理的含义。
2、中心极限定理的含义,在何种情况下,何种变量趋向于正态分布。
3、中心极限定理的4个推论,灵活运用。
五、二项分布、泊松分布、正态分布三者的近似关系第六章参数估计一、统计推论1、统计推论的定义2、统计推论的特点(优缺点),考题3、统计推论的理论基础及容。
二、参数的点估计:(定义)1、什么是点估计(样本中称统计值,总体中称为参数)2、点估计的评价标准:3点或4点。
3、总体均值的点估计4、总体方差(或标准差)的点估计5、总体成数的点估计。
三、抽样分布:统计量的抽样分布,如均值、方差的抽样分布1、样本均值的抽样分布:不同的抽样,其均值是不一样的,在具体抽样之前,均值是一个变量,抽样之后,均值就是一个具体的观察指(或统计值)。
2、总体分布为正态分布、总体方差已知情况下的均值分布:可以用中心极限定理推演出来。
(一般指小样本)3、总体分布为正态分布,总体方差未知、样本方差可知情况下的均值分布:(一般指小样本)。
4、大样本、总体未知(或已知都无所谓),总体方差未知(或已知无所谓)情况下的均值分布:凡是提到大样本,均可用正态分布计算,用样本方差替代总体方差5、样本成数的抽样分布:凡是提到样本成数p,都是特指大样本,小样本提成数没有意义。
在大样本情况下,无论其分布如何,成数的分布都可以确定。
6、样本方差的分布,这里特指总体是正态总体的情况。
这个运用很多,其分布形式以及卡方换算,重要。
四、区间估计:根据样本大小、总体情况、样本个数情况,待估参数,可以将需要计算的区间估计划分为9种类型,同假设检验。
1、小样本、正态总体、总体方差已知,总体均值的区间估计:Z分布2、小样本、正态总体、总体方差未知,总体均值的区间估计:t分布3、小样本(一般不包括大样本)、正态总体,总体方差的区间估计,卡方分布。
4、小样本、正态二总体,总体方差已知,总体均值差的区间估计,Z分布5、小样本,正态二总体,总体方差未知,总体均值差的区间估计,t分布6、大样本,分布未知(或已知无所谓),方差未知(或已知无所谓),总体均值的区间,Z分布。
7、大样本,分布未知(或已知无所谓),方差未知(或已知无所谓),二总体均值差的区间,Z 分布。
8、大样本,分布未知(或已知无所谓),总体成数的区间估计,Z分布9、大样本,分布未知(或已知无所谓),二总体成数差的区间估计,Z分布第七章假设检验的基本概念一、假设检验的思想:二、假设检验的原理:小概率原理和大数定理三、基本假定:总体、抽样等假定。
四、基本概念:原假设、备择假设、单边检验、双边检验、显著性水平、临界值、接受域、拒绝域、两类错误(是指针对原假设而言的弃真和纳伪错误)。
五、假设检验的基本步骤:4步。
做题时候,要严格按照步骤及作出解释。
六、纳伪错误的计算原理,熟悉,多年没有考,计算相对复杂。
第八章单总体假设检验一、跟参数估计类似,原则上有多少参数估计就会有多少对应的假设检验。
二、假设检验的类型:本章只讨论单总体,注意单边/双边及拒绝域1、大样本、总体均值检验,无论总体分布、方差已知与否:Z检验2、大样本,总体成数检验,不考虑分布,Z检验3、小样本、正态总体、总体方差已知,均值检验,Z检验4、小样本、正态总体、总体方差未知,样本方差已知,均值检验:Z检验。
5、小样本、正态总体,总体方差检验:卡方检验。
6、小样本、正态总体、总体标准差检验:同5,直接在5后开方即可。
三、纳伪错误的计算,见书上例题。
第九章二总体假设检验(二分vs.二分,二分vs.定距变量)一、二总体假设检验的类型:1、大样本、二总体分布未知(或已知无所谓)、二总体方差未知(或已知无所谓):二均值差检验:Z检验2、大样本、二总体成数差检验:Z检验3、小样本、正态总体、二总体方差已知,二总体均值差检验:Z检验4、小样本、正态总体,二总体方差未知,但相等,二总体均值差检验:t检验。
注意,在未知二总体方差相等时,要检验二总体方差是否相等?5、小样本、正态总体、二总体方差比检验:F检验二、配对样本的比较:t检验,重点。
第十章列联表(定类变量vs.定类变量)一、列联表的定义:二、列联表中的分布情况:(分频次,概率分布两种情况)1、联合分布:2、边缘分布:2个,自变量和因变量各一个。
3、条件分布:r+c个,通常只求因变量的条件分布,控制自变量。
三、列联表中变量的独立性:条件概率分布等于边缘概率分布,那么自变量和因变量相互独立。
四、对于列联表的检验:1、原假设:H0:p ij=p i*p*j2、选择统计量:卡方变量,注意公式,自由度。
3、计算样本统计值。
4、比较统计值和临界值的大小,决定原假设的取舍(即统计决策)。
五、关于列联表统计量的几点补充讨论说明:1、对于2×2的列联表,由于格数的限制,需要为减少作为离散观测值与作为连续型变量x值之间的偏差,需要对其进行连续性修正。
2、卡方检验适用于单变量二项总体或多总体的检验(重点,06考)3、列联表格值的取值围。
4、列联表就其检验的容来看是双边检验,就其形式而言是右侧单边检验。
5、列联表的检验只能通过频次来检验而不能通过频率(相对频次)来检验。
当相对频次不变时,样本容量增加K倍时,卡方X2值也增加K倍。
(也即相对频次的统计表必须注明调查总数的原因)六、列联强度的含义:表示变量间相关程度,程度越高,说明社会现象与社会现象间的关系越密切。
七、2×2表的列联强度计算:1、Φ系数:(费系数),公式,取值围[-1,+1],当bc=0,且bc相等时Φ=1,二变量完全相关;ad=0,且ad相等时,Φ=-1,二变量完全相关;ad=bc时,Φ=0,二变量相互独立。
说明:二定类变量的相关没有方向之分。
2、尤拉Q系数:公式,取值围,注意Q=1时候的情况。
3、如何选择Φ系数和Q系数?取决于研究对象,当自变量的不同取值都会影响因变量时,则用Φ系数。
八、r×c列联表的列联强度计算:1、以卡方值X2为基础的相关性测量:Φ2,C2,V系数等,注意公式,取值围的临界值,相互比较其优缺点。
2、以减少误差比例为基础的相关性测量:(1)何为减少误差比例?PRE(2)PRE的取值围:[0,1](3)PRE的优点及意义。
3、λ系数(1)根据PRE原理得出E1和E2的值,得出λ的公式。
可与沛良书对照。
(2)λ的取值围:[0,1],跟PRE的取值围一致。
注意取极端值时候列联表的情况。
(06年考)(3)λ的非对称性讨论。
默认情况下,用自变量预测因变量。
4、τ系数(由Goodman和Kruksal所创)(1)根据PRE原理得出E1和E2的值,得出τ的公式。
可与沛良书对照。
(2)τ值的取值围,[0,1],跟PRE的取值围一致。
注意取极端值时候列联表的情况。