参数统计与非参数统计、
- 格式:doc
- 大小:46.00 KB
- 文档页数:1
参数统计与非参数统计参数统计和非参数统计是统计学中两个重要的概念。
它们是用来描述和推断数据的统计特征的方法。
在统计学中,参数是用于描述总体特征的统计量,而非参数是不依赖于总体分布的统计方法。
本文将从定义、应用、优劣势等方面对参数统计和非参数统计进行详细分析。
首先,我们来了解一下参数统计。
参数统计是基于总体参数的估计和推断的统计方法。
总体参数是指对整个数据集进行总结的数量,如平均值、方差、标准差等。
参数统计的方法是通过从样本中获取数据来估计总体参数。
常见的参数估计方法包括样本均值估计总体均值、样本方差估计总体方差等。
参数统计的优点是可以提供关于总体的精确估计和推断结果。
然而,参数统计要求总体数据必须服从特定的概率分布,例如正态分布、二项分布等。
如果总体数据不符合这些分布,参数统计的结果可能会有偏差。
接下来,我们来介绍非参数统计。
非参数统计是不依赖于总体分布的统计方法。
这意味着非参数统计不对总体的概率分布做出任何假设。
相反,它使用基于排序和排名的方法进行统计推断。
常见的非参数统计方法包括Wilcoxon符号秩检验、Kruskal-Wallis检验等。
非参数统计的优点是可以在数据不符合特定分布情况下使用,并且对异常值不敏感。
然而,非参数统计通常需要更多的数据以获得稳健的结果,并且在处理大规模数据时的计算负担较重。
参数统计与非参数统计的应用领域不同。
参数统计主要应用于数据符合特定分布的情况下,例如医学研究中对患者的生存率进行分析、工业生产中对产品质量的控制等。
非参数统计则主要应用于数据分布不明确或数据不符合特定分布的情况下,例如社会科学中对调查结果的分析、财务领域中对公司经营绩效的评估等。
在参数统计和非参数统计的比较中,我们可以看到它们各自的优势和劣势。
参数统计的优势是可以提供精确的估计和推断,并且通常需要较少的数据。
然而,参数统计对总体数据的分布有严格的要求,如果分布假设不正确,结果可能产生误差。
非参数统计的优势是可以在数据分布不明确的情况下进行分析,并且对异常值不敏感。
非参数统计方法和参数统计方法的比较及其应用在统计学中,参数统计方法和非参数统计方法是两种经常被使用的数据分析工具。
这两种方法有各自的优缺点和适用范围。
在本文中,我们会深入探讨这两种统计方法的特点和应用前景。
一、参数统计方法参数统计方法是指基于数据分布的已知参数,为分析样本数据的总体分布和参数求解的方法。
通常,参数统计方法基于正态分布或其他特定类型的分布进行建立。
常见的参数统计方法包括假设检验、置信区间、回归分析等等。
这种方法在大样本数量,数据点分布已知的场景下效果比较好。
同时,参数估计方法速度快、精度高,对于人口统计学,生态学,全球气候变化等领域的研究有较大的应用前景。
但是,由于该方法对数据的分布和类型有要求,如果数据不符合要求,结果会出现误差。
此外,对于小样本和非正态分布的数据,该方法的结果不稳定。
正是因为这些问题,另一种统计方法逐渐发展起来。
二、非参数统计方法非参数统计方法则是不基于已知数据分布的方法,不需要假设数据来源于任何特定分布,但是需要遵守一定的规则来推断数据特征。
非参数统计方法基于样本数据推断总体分布,从而确定总体参数。
常见的非参数统计方法包括中位数、区间估计法、秩和检验等等。
非参数方法适用于小样本数量,没有分布假设限制的数据特征分析,例如生物学,医疗设备,财务审计领域中的数据挖掘。
这种方法对于非连续数据特征的分析打破了限制,同时也避免了数据偏移问题和样本误差。
但是,由于计算的复杂性,这种方法的时间和处理成本要高于参数统计方法。
三、应用前景无论是参数统计方法还是非参数统计方法,它们都有着广阔的应用前景。
我们可以发现,虽然这两种方法的思想不同,但它们的内涵都是为了更好地理解数据,支持更准确、可靠的决策。
在具体应用中,参数统计方法通常用于大型数据集、可靠性较高的研究领域;而非参数统计方法则更适合应用于小型数据集、低可靠性的领域,比如医疗、物理等等。
同时,这两种方法也可以联合应用起来。
对于数据分布未知且数量较小的情况,我们可以用非参数统计方法获取总体数据的初步特征,再使用参数统计方法进一步计算总体参数。
统计学中的非参数统计方法与参数统计方法的比较统计学是一门研究收集、整理、分析和解释数据的学科,广泛应用于各个领域。
在统计学中,有两种主要的方法用于数据分析,即非参数统计方法和参数统计方法。
本文将对这两种方法进行比较,探讨它们在不同情况下的优缺点和应用范围。
一、非参数统计方法非参数统计方法是一种不对总体的任何参数作出假设的统计方法。
这意味着在使用非参数方法进行分析时,我们不需要事先对总体的分布形式做出任何假设。
非参数统计方法的主要特点是灵活性强,适用于各种数据类型和分布形式。
非参数统计方法常用于以下情况:1. 数据类型不明确:非参数方法不要求数据服从特定的分布形式,因此适用于各种数据类型,如分类数据、顺序数据和定类数据等。
2. 数据分布特征不清楚:当我们对总体的分布形式或参数缺乏先验知识时,非参数方法可以提供一种可靠的分析手段。
3. 小样本量:非参数方法通常在小样本量的情况下表现良好,而参数方法可能会因样本量不足而产生偏差。
二、参数统计方法参数统计方法是一种基于总体参数假设的统计方法。
在使用参数方法进行分析时,我们需要对总体的分布形式和参数进行假设,并基于这些假设做出统计推断。
参数统计方法的主要特点是效率高,适用于大样本量和已知分布形式的数据。
参数统计方法常用于以下情况:1. 已知总体分布形式:当我们对总体的分布形式有一定的了解或具有先验知识时,参数方法可以提供更准确的推断结果。
2. 大样本量:参数方法在大样本量的情况下通常具有更高的效率和准确性,因为大样本可以更好地反映总体的特征。
3. 对参数感兴趣:当我们对总体的某个参数感兴趣时,参数方法可以提供直接的估计和推断。
三、比较与应用非参数统计方法和参数统计方法在不同的情况下具有各自的优缺点和适用范围。
在选择使用哪种方法时,应根据具体问题的要求和数据的特点进行判断。
对于数据类型不明确或数据分布特征不清楚的情况,非参数方法是一种更合适的选择。
例如,在医学研究中,疾病的分类数据常常不服从正态分布,这时非参数方法可以提供可靠的分析结果。
非参数统计方法非参数统计方法是一种统计学中的重要概念,它不依赖于总体的具体分布形式,而是利用样本数据进行推断和分析。
与参数统计方法相比,非参数统计方法更加灵活和广泛适用,并且不需要对总体进行特定的假设。
本文将介绍非参数统计方法的原理、常用的方法和应用领域。
一、非参数统计方法的原理非参数统计方法的核心思想是基于样本数据来进行推断,而不需要对总体的分布形式做出先验假设。
非参数统计方法主要利用统计排序和秩次来进行推断分析,因此非参数统计方法也常被称为秩次统计方法或分布自由方法。
非参数统计方法的基本原理包括以下几个方面:1. 统计排序:对样本数据进行排序,将每个观测值按照大小进行排列,得到一系列秩次。
2. 秩次:将每个观测值与排序后的位置相对应,得到每个观测值的秩次。
3. 检验统计量:通过计算秩次之间的差异来判断总体分布是否存在差异。
4. 非参数假设检验:通过计算检验统计量的概率分布,判断总体分布是否符合我们的假设。
二、常用的非参数统计方法1. 秩和检验(Mann-Whitney U检验):用于比较两个独立样本是否来自同一总体。
2. 秩和差检验(Wilcoxon符号秩检验):用于比较两个相关样本是否来自同一总体。
3. 克鲁斯卡尔-瓦里斯检验:用于比较三个或更多独立样本是否来自同一总体。
4. 费希尔精确检验:用于比较两个分类变量之间的关联性。
5. 秩和相关检验(Spearman等级相关系数):用于比较两个变量之间的相关性。
三、非参数统计方法的应用领域非参数统计方法在各个领域都有广泛的应用,以下列举几个常见的应用领域:1. 医学研究:非参数统计方法可以用于比较两种治疗方法的效果,判断是否存在显著差异。
2. 经济学研究:非参数统计方法可以用于分析收入差距、失业率等经济指标的差异。
3. 生态学研究:非参数统计方法可以用于比较不同区域的生物多样性指标,评估生态系统的稳定性。
4. 社会科学研究:非参数统计方法可以用于分析社会调查数据,比较不同群体的行为差异。
统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。
总体(population):大同小异的研究对象全体。
更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。
样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。
样本应该具有代表性,能反映总体的特征。
利用样本信息可以对总体特征进行推断。
抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。
表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。
可用标准误描述其大小。
标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。
样本均数的标准差称为均数的标准误。
均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。
参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常置信区间揭示的是按一定置信度估计总体参数所在的范围。
t分布法、正态分布法(标准误)、二项分布法。
置信区间估计总体参数所在范围参数统计(parametric statistics)非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。
变异(variation):对于同质的各观察单位,其某变量值之间的差异同质(homogeneity):研究对象具有的相同的状况或属性等共性。
回归系数有单位,而相关系数无单位β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。
非参数统计的理解非参数统计是一种统计学方法,其与参数统计相对。
参数统计是基于概率模型的,假设数据服从某种分布,并通过估计分布的参数来进行推断。
而非参数统计则不对数据的分布进行假设,直接利用数据本身进行推断。
在非参数统计中,我们不对数据的分布做任何假设,而是通过比较数据的顺序、秩次等非参数统计量来进行推断。
非参数统计的方法有很多,常见的包括秩和检验、Wilcoxon检验、Kruskal-Wallis检验等。
这些方法的共同特点是不依赖于数据的分布,而是利用数据中的排序信息来进行推断。
非参数统计方法的优点在于可以应用于各种数据类型,不受数据分布的限制,并且不需要对数据进行任何假设。
因此,非参数统计方法在实际应用中具有很大的灵活性和广泛性。
非参数统计方法的应用非常广泛。
在医学研究中,由于数据的分布通常不满足正态分布假设,非参数统计方法常常被用于比较不同治疗方法的疗效。
在社会科学研究中,非参数统计方法可以用于比较不同群体的差异,分析调查问卷数据等。
在工程领域,非参数统计方法可以用于分析故障数据,评估产品的可靠性等。
非参数统计方法的应用步骤通常包括以下几个方面。
首先,收集数据并进行整理。
然后,根据问题的需要选择合适的非参数统计方法。
接下来,计算相应的非参数统计量。
最后,根据统计量的结果进行推断,并给出相应的结论。
需要注意的是,非参数统计方法通常需要较大的样本量才能获得可靠的结果,因此在应用时需要注意样本的选择和数据的质量。
非参数统计方法的优点在于其灵活性和广泛性。
由于不需要对数据分布做任何假设,非参数统计方法可以适用于各种数据类型,并且不受数据分布的限制。
此外,非参数统计方法可以有效地处理异常值和缺失数据,具有较好的鲁棒性。
然而,非参数统计方法的缺点在于通常需要较大的样本量才能获得可靠的结果,并且计算复杂度较高。
因此,在实际应用中需要根据具体情况选择合适的方法,并进行适当的样本大小估计。
非参数统计是一种灵活且广泛应用的统计学方法。
统计学的方法当提到统计学的方法时,有许多不同的技术和工具可供选择。
以下是50条关于统计学方法的示例,并附有详细描述:1. 描述性统计:描述性统计是一种用于总结和描述数据集的方法。
它包括平均数、中位数、众数、标准差等指标。
2. 推论统计:推论统计是一种从样本数据中得出总体结论的方法。
通过采样方法和假设检验来进行推论。
3. 参数估计:使用统计方法估计总体参数的值,如总体均值、总体比例等。
4. 假设检验:用于检验总体参数假设的统计方法,包括单样本、双样本和多样本假设检验。
5. 方差分析:用于比较三个或三个以上组别的均值是否有显著差异的统计方法。
6. 相关分析:检验两个或多个变量之间关系的统计方法,包括皮尔逊相关系数、斯皮尔曼相关系数等。
7. 回归分析:用于探索和建立变量之间关系的统计方法,包括线性回归、逻辑回归、多元回归等。
8. 生存分析:用于分析时间至事件发生的统计方法,包括生存曲线、生存函数、危险比等。
9. 聚类分析:将数据集中的观测分为不同的群组的统计方法,如K均值聚类、层次聚类等。
10. 因子分析:用于识别数据集中潜在变量和构建变量之间关系的统计方法。
11. 主成分分析:用于减少数据维度和识别主要变量的统计方法。
12. 时间序列分析:用于分析时间序列数据的统计方法,如季节性调整、趋势分析等。
13. 贝叶斯统计:一种基于贝叶斯定理的统计推断方法,通过先验概率和样本信息来获得后验概率。
14. 非参数统计:一种不依赖于总体概率分布的统计方法,适用于数据分布未知或不满足正态分布假设的情况。
15. 实证贝叶斯方法:一种结合贝叶斯统计和计算机模拟的方法,用于复杂模型的推断。
16. Bootstrap方法:通过重复抽样构建总体的分布,从而进行参数估计和假设检验。
17. 蒙特卡洛模拟:一种使用随机抽样技术进行数值模拟的方法,通常用于计算复杂的积分或求解概率分布。
18. 马尔可夫链蒙特卡洛:一种用于从复杂分布中抽样的随机模拟方法。
第九章秩和检验一、教学大纲要求(一)掌握内容1.非参数统计基本概念和特点。
2.配对设计差值的符号秩检验。
3.成组设计资料两样本比较的秩和检验。
(二)熟悉内容1.成组设计多样本比较的秩和检验步骤。
2.随机区组设计资料的秩和检验。
(三)了解内容1.成组设计多样本两两比较的秩和检验。
2.随机区组设计资料两两比较的秩和检验。
二、教学内容精要(一)参数统计与非参数统计1.参数统计样本所来自的总体分布具有某个已知的函数形式,而其中有的参数是未知的,统计分析的目的就是对这些未知的参数进行估计或检验。
此类方法称为参数统计。
2.非参数统计样本所来自的总体分布难以用某种函数式来表达,还有一些资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,解决这类问题的一种不依赖总体分布的具体形式的统计方法。
由于这类方法不受总体参数的限制,故称非参数统计法(non-parametric statistics),或称为不拘分布(distribution-free statistics)的统计分析方法,又称为无分布型式假定(assumption free statistics)的统计分析方法。
它检验的是分布,而不是参数。
非参数统计不需对总体分布(总体参数)作出特殊假设。
(二)非参数统计的特点和适用范围1.特点(1)样本所来自的总体的分布形式为任何形式,甚至是未知的,都能适用。
(2)收集资料方便,可用“等级”或“符号”来评定观察结果。
(3)多数非参数方法比较简便,易于理解和掌握。
(4)缺点是损失信息量,适用于参数统计法的资料用非参数统计方法进行检验将降低检验效能。
2.适用范围(1)等级资料。
(2)偏态分布资料。
当观察资料呈偏态或极度偏态分布而又未作变量变换,或虽经变量变换仍未达到正态或近似正态分布时,宜用非参数检验。
(3)各组离散程度相差悬殊,即方差明显不齐,且不能变换达到齐性。
(4)个别数据偏离过大,或资料为单侧或双侧没有上限或下限值。
非参数统计(nonparametric statistics)复习:参数(parameter)参数统计:假定被检验的总体分布类型为已知的一类统计方法。
例如t检验、ANOV A要求总体:正态性和方差齐性等。
非参数统计(nonparametric statistics)不依赖总体分布的类型,不对总体参数作估计或推断,只是检验分布(具体说是分布的位置)是否相同的一类统计方法。
非参数统计的优缺点优点: 对资料无前提要求,应用范围广;资料的收集和统计分析简便。
缺点: 对符合参数检验资料用非参数检验时,因没有充分利用信息,使检验效能 ;历史较短,复杂的设计无对应方法;③无概括性的数字说明总体。
非参数统计应用范围不符合参数统计分析要求或不能通过数据变换使资料满足参数检验要求的资料可用非参数检验来分析。
偏态分布或未知分布资料或例数过少(难定分布); 分布一端或两端无界:如10以下或10以上;●不能或未加精确测量的资料:如等级资料;❍个别数值偏离过大;⏹各组离散程度相差悬殊(即方差不齐);☐不能满足参数检验要求的资料等。
综上所述:资料符合参数检验时,首选参数检验常用的秩和检验(rank sum test)配对设计Wilcoxon signed rank test成组设计(两组)Wilcoxon rank sum test 成组设计(多组)Kruskal –Wallis test多个样本两两比较Nemenyi test随机区组设计资料Friedman’s M test(一) 配对设计的符号秩和检验( wilcoxon signed rank test )由Wilcoxon 于1945 年提出。
检验配对资料的差值是否来自中位数为0 的总体。
亦可用于单样本资料(样本中位数与总体中位数的比较)。
建立假设H 0:M d = 0 , H 1:M d ≠0, α=0.05计算检验统计量T①求差值d 。
②编秩:d = 0 者舍去,按|d|从小到大编秩并标记d 的正负号。
非参数统计方法与参数统计方法的比较统计学是一种用于收集、分析和解释数据的科学方法。
在统计学中,有两种主要的数据分析方法,即非参数统计方法和参数统计方法。
本文将比较这两种方法的特点、应用场景以及各自的优缺点,以帮助读者更好地理解它们并根据实际需求选择适合的方法。
1. 非参数统计方法非参数统计方法是一种直接利用观测数据进行推断的方法,不对总体分布的形状和参数做出任何假设。
这种方法主要使用分布自由的统计量,如中位数、百分位数和秩次,以及基于秩次的统计检验方法,如Wilcoxon秩和检验和Mann-Whitney U检验。
非参数统计方法的优点在于对数据分布的假设较少,适用性较广。
它可以应用于任何类型的数据,包括连续型变量和分类变量。
此外,非参数方法对异常值和偏离正态分布的数据具有较好的鲁棒性,能够有效地处理一些实际问题,如医学研究中的生存分析和质量控制中的稳健性分析。
然而,非参数方法通常需要更大的样本量以获得相同的统计效力,并且计算复杂度较高。
此外,在某些情况下,非参数方法可能会失去一些统计效力,因为它们不利用总体分布的假设信息。
2. 参数统计方法参数统计方法是一种基于总体分布参数假设的数据分析方法。
它们通常假设数据来自一个特定的分布,如正态分布、泊松分布或二项分布。
参数方法主要使用均值、方差和协方差等参数来进行推断,并使用t检验、方差分析、回归分析等方法进行假设检验和参数估计。
参数统计方法的优点在于提供了更加精确和高效的估计和推断。
由于对总体分布的假设,参数方法通常具有较小的样本量要求,并且计算过程较为简单。
此外,参数方法还能够通过模型拟合、假设检验和参数估计等方法提供更加详细和全面的数据分析结果。
然而,参数方法对数据分布的假设较严格,要求数据近似具有特定分布。
当数据不符合假设的分布时,参数方法可能会导致估计偏差和统计推断的不准确性。
此外,参数方法对异常值和非正态数据较为敏感,需要进行数据转换或使用鲁棒性方法来处理。
样本统计方法一般分为两个大的分支—参数统计和非参数统计。
非参数统计方法主要有:一是卡方拟合度检验(大众媒介研究者经常比较某一现象所观察到的发生频次和其期望值或假设的发生频次,卡方(X的平方)是一个表示期望值和观察值之间关系的值)。
其局限性在于变量必须是定类或者定序测量的。
二是交叉表分析,可以同时检验两个或者更多的变量。
参数统计常用于定距或定比数据。
一是t检验,二是方差分析;三是相关性统计分析。
T分布在抽样分布和样本分布之间架起了一座桥梁,是借助于颐和总显著性检验来实现的,成为“t检验”。
t检验又称“均值检验”,用以计算样本均值是否不同于总体均值、零或另一样本均值。
可分为三种类型:一是检验样本均值是否不同于其总体均值。
二是检验一个样本均值是否与另一个样本均值不同(独立样本t检验)。
三是重复测量的t检验—当相比较的两组样本以某种相联系的方式重复(相同的被试在不同时间段的结果检验)。
方差分析(ANOV A)——当实验涉及机组的比较时适用的统计方法。
它是均值检验的一种自然延伸,更强调样本组内与组间的变化而不是样本组均值。
ANOV A将发生在因变量上的变化分为由自变量作用的方差(称为被假设方差)和不被解释的方差(称为误差或剩余方差)。
“被解释”方差成为“主效应”。
ANOV A应用F分布而非t分布。
多因子方差分析——任何有两个或更多个自变量的ANOV A可以是多因子ANOV A,测量其“交互效应”。
相关检验——不同于t检验的均值检验,相关是一种“关联性”测量。
相关测量一个变量值的改变与另一个变量值改变的关联程度。
相关的显著性是指,系统性变化是否又非偶然因素引起的;换言之,相关系数是否显著大于零。
最常见的相关检验是皮尔逊积矩相关系数。
例3:在某次的新闻节目收视情况调查中,总体为某市12岁以上的居民。
有效样本男性为240人,平均每天收视时间31.5分钟,标准差12分钟;样本中女性180人,平均每天收视时间26.3分钟,标准差19分钟,请问总体中男女居民的新闻节目收视时间有无差异?原假设H0:总体中没有差异:H0:u1=u2;H1:u1>u2, u1<u2,涉及两侧2倍概率案例8:人际印象效果测量。
样本统计方法一般分为两个大的分支—参数统计和非参数统计。
非参数统计方法主要有:一是卡方拟合度检验(大众媒介研究者经常比较某一现象所观察到的发生频次和其期望值或假设的发生频次,卡方(X的平方)是一个表示期望值和观察值之间关系的值)。
其局限性在于变量必须是定类或者定序测量的。
二是交叉表分析,可以同时检验两个或者更多的变量。
参数统计常用于定距或定比数据。
一是t检验,二是方差分析;三是相关性统计分析。
T分布在抽样分布和样本分布之间架起了一座桥梁,是借助于颐和总显著性检验来实现的,成为“t检验”。
t检验又称“均值检验”,用以计算样本均值是否不同于总体均值、零或另一样本均值。
可分为三种类型:一是检验样本均值是否不同于其总体均值。
二是检验一个样本均值是否与另一个样本均值不同(独立样本t检验)。
三是重复测量的t检验—当相比较的两组样本以某种相联系的方式重复(相同的被试在不同时间段的结果检验)。
方差分析(ANOV A)——当实验涉及机组的比较时适用的统计方法。
它是均值检验的一种自然延伸,更强调样本组内与组间的变化而不是样本组均值。
ANOV A将发生在因变量上的变化分为由自变量作用的方差(称为被假设方差)和不被解释的方差(称为误差或剩余方差)。
“被解释”方差成为“主效应”。
ANOV A应用F分布而非t分布。
多因子方差分析——任何有两个或更多个自变量的ANOV A可以是多因子ANOV A,测量其“交互效应”。
相关检验——不同于t检验的均值检验,相关是一种“关联性”测量。
相关测量一个变量值的改变与另一个变量值改变的关联程度。
相关的显著性是指,系统性变化是否又非偶然因素引起的;换言之,相关系数是否显著大于零。
最常见的相关检验是皮尔逊积矩相关系数。
例3:在某次的新闻节目收视情况调查中,总体为某市12岁以上的居民。
有效样本男性为240人,平均每天收视时间31.5分钟,标准差12分钟;样本中女性180人,平均每天收视时间26.3分钟,标准差19分钟,请问总体中男女居民的新闻节目收视时间有无差异?原假设H0:总体中没有差异:H0:u1=u2;H1:u1>u2, u1<u2,涉及两侧2倍概率案例8:人际印象效果测量。
概念的操作化:1目标:将概念转化为变量2概念:对事物的抽象定义3变量:概念所对应的具有操作定义的量4过程:操作定义的步骤—步骤1:将变量分解为多个维度(dimension),步骤2:每个维度选择一组指标(indicator)来衡量。
人际印象效果可以划分为哪些维度:维度1:印象的鲜明度;维度2:印象的全面度;维度3:印象的好感度;维度4:印象的失真度。
变量的测量工具—量表(scale)、问卷(questionnaire)(量表能将变量的层次提升到定比和定距层面,而问卷只能局限于定类和定序层面)常见成熟量表:人格量表、智力量表、职业倾向量表。
量表的分类:自陈式量表:被试对自身情况作出判断并填写;评定式量表:被试对目标他人作出判断并填写;里克特量表(Likert Scale);语义差异量表(Semantic Differential Scale)。
量表的选择:保证效度信度(成熟量表)一定程度上保证效度信度(改编量表)基本无法保证效度信度(自编量表)案例9:NEO五因素人格量表Neuroticism(情绪性)Extraversion(外向性)Openness(开明性)Agreeableness(宜人性)Conscientiousness(严谨性)NEO各维度的测量指标情绪性(N):焦虑度、抑郁度、自信度;外向性(E):乐群度、热情度、交际反应性;开明性(O):想象力、行动力、观念开放度;宜人性(A):温和度、信任度、利他性;严谨性(C):条理性、审慎度、自律性严格的量表编制流程:清楚地决定你要测量什么;选择量表的形式(里克特、语义差异等);建立一个题项库;征求专家评价及建议;考虑是否加入某些特殊测试题项;小样本试测;评估题项的适合度并筛选题项;优化量表长度质性资料收集方法一:访谈(一)访谈计划的制订1访谈的分类:结构式访谈(structural interview)无结构式访谈(non-structural interview)2、在制订访谈计划的过程中,通常研究者需要明确这样几个问题:为什么通过访谈来收集资料?怎样进行访谈?访谈的对象是谁?什么时间以及在何处进行访谈?3、为什么通过访谈来收集资料?把握内心:企图对个人动机、态度、价值观念、思想等无法直接观察的问题进行把握。
挖掘细节:对整个研究对象的故事细节缺乏了解。
集中焦点:需要搜寻和集中一些问题的焦点以便为量化研究做准备。
4、怎样进行访谈?三轮访谈序列(the series of three interviews)第一轮:再现生活经历:探寻被访者获得的生活经历及其背景;第二轮:挖掘经历细节:让被访者在其所处背景中还原(重构)经历的细节;第三轮:反思经历意义:鼓励和引导被访者反思其经历对其自身的意义。
5、访谈的对象是谁?“找熟人”的问题:问题1:熟人之间可能存在利害相关性,以致损害研究者与被访者之间的平等关系,从而使得被访者在谈论话题的时候产生种种顾忌,导致研究者获取的信息可靠性受到影响。
问题2:熟人之间(尤其是朋友之间)有可能认为自己能够很好地理解对方的想法,以致于削弱对经历的挖掘和意义的反思。
6、目的性抽样(purposive sampling):典型案例抽样(typical case sampling)极端/异常案例抽样(extreme/deviant sampling)关键案例抽样(critical case sampling)最大变异性抽样(maximum variation sampling)7、被访者筛选过程中可能出现的问题:不愿意参与访谈的人—通常还是不宜勉强选为被访者,因为这样的人即便被说服后参与了访谈,可能在访谈中仍然处于一种对抗和抵触的状态,造成对整个研究的不利影响。
别有企图而特别想要参与访谈的人—研究者也必须谨慎。
特别想要对研究者进行表达的被访者很可能不能给予研究者自然状态下的信息。
8、被访者的数量:两个判断标准:对象涵盖面:已选取的被访者是否足以涵盖研究所需要考察的人群中不同特征的人。
信息饱和度:通过访谈,研究者是否已经听到了大量重复信息,或者说已几乎不再可能获取9、什么时间以及在何处进行访谈?访谈时间:有学者提出了90分钟的访谈长度。
建议根据具体情况而定。
访谈间隔:3天——1周。
既有利于被访者获得一定的时间来反思前一次访谈,又不至于造成两次访谈之间时间间隔过久而使得被访者的前后两次访谈的关系变得淡化。
访谈地点:被访者居所或办公室、约定的公共场合(如水吧、茶馆、咖啡厅等)以及研究者居所或办公室。
(尽量尊重被访者意见)(二)访谈的准备工作(三)访谈关系的建立与维持(四)访谈技巧(五)访谈记录关联性检验(measures of association)是统计学最重要的方法之一。
关联性取决于测量的水平与检验的类型。
例如,定类数据测量需要一种关联性测量,而定序数据则需要另外一种,关联性检验的种类包括独立性检验(即检验一个变量是否依赖另一个变量)和相关性检验(即检验一个变量是否随另一个变量的变化而增减)。
T检验——是定序变量的关联性测量方法。
当一个自变量为定类或定序而另一个变量为定距时,用T检验。
卡方检验是一种检验变量变异性的测量。
适用于进行变量间的独立性检验。
如果把一个变量对另一个变量的可能的影响归结为仅仅由偶然因素引起,那么这两个变量可视为独立变量,即一个变量的变化不依赖于另一个变量。
相关性是一种关联性测量,是一种动态测量;描述两个变量联系的紧密程度,当一个变量变化时,另一个变量也随之而变化。
如果变化的轨迹相近,则两者高度相关。
另一方面,独立性是一种静态测量,它是检验交互表中观察值的分布是否超出了可以归结为偶然发生的范围,与变量间的动态关系无关,卡方作独立性检验,T检验适用于两组间比较,多组比较适用于方差分析,ANOV A更强调样本组内与组间的变化而不是样本均值。
ANOV A将发生在因变量上的变化分为由自变量作用的方差(称为被解释方差——主效应)和不被解释的方差(称为误差或剩余方差)。
T检验、ANOV A和相关检验是主要的参数统计假设检验。
任何有两个或者更多个自变量的ANOV A可以是“多因子”ANOV A。
一个自变量单独对因变量的影响不同于第二个或后面自变量的影响,A因子、B因子、C因子对因变量的共同作用成为交互效应。
交互效应可以看成是两个变量共同的贡献,但两变量如果分开,则观察不到这种贡献。
假如因变量的差异对一个变量和另一个变量来说是相同的,那么所分析的交互效应会趋于零。
相关检验—T检验是均值检验,相关则是一种“关联性”检验。
相关测量一个变量值的改变与另一个变量值改变的关联程度。
相关的显著性是指,系统性变化是否由非偶然因素引起;换言之,相关系数是否显著大于零。
最常见的相关检验是皮尔逊积矩相关系数。
当分析这有某一连续变量和另一定序变量时,适合的相关系数是斯皮尔曼级序相关系数。
非参数检验中最常见的是卡方检验。
卡方的一项使用是“拟合优度”检验,测量观察时间相对于期望事件的频数。
如果观察结果与期望的结果相适合,则不拒绝零假设。
内容分析法的步骤:1、选择主题2决定样本或普查3、定义要计算的概念或单位4、建构类别5、制作编码表6、训练编码员7、收集资料8、测量编码员之间的信度9、分析数据10、报告结果.研究过程:选择研究课题@确定课题价值@回溯研究文献@陈述理论假设@数据分析与阐释@呈报结果@何时使用众数、中位数和均值?如果数据属性是分类的,而且数值只属于一种类型,例如头发颜色、政治背景、邻里位置和宗教,就是用众数。
在这种情况下各个分类之间是互斥的。
如果数据中包含极值而且你不想扭曲平均数就是用中位数,例如收入。
最后,如果数据不包括极值也不是分类数据就是用均值,例如考试得分或游50码需要的时间。
在多因素实验研究中,主效应就是在考察一个变量是否会对因变量的变化发生影响的时候,不考虑其他研究变量的变化,或者说将其他变量的变化效应平均掉。
换句话说,就是其他研究变量都不变化的情况下,单独考察一个自变量对因变量的变化效应。
交互效应,则是反映两个或两个以上自变量相互依赖、相互制约,共同对因变量的变化发生影响。
换句话说,如果一个自变量对因变量的影响效应会因另一个自变量的水平不同而有所不同,则我们说这两个变量之间具有交互效应。
在分析多个自变量的效应时,要注意主效应与交互效应之间的关联性。
我在《应用实验心理学》的第二章末尾,专门就这一问题进行了讨论。
现录于此,仅供参考:在析因实验(多因素实验)中,数据收集、数据分析的主要目标是考察自变量的主效应和交互效应是否显著。