数据分析复习提纲
- 格式:doc
- 大小:63.00 KB
- 文档页数:4
数据分析培训提纲1.概论1.1数据分析的重要性(1)贯彻质量管理8项原则的需要QM的8项原则之一为:基于事实的决策方法。
要避免决策失误必须提供足够的信息,以及进行科学决策。
信息:有意义的数据。
数据:能客观反映事实的资料和数字。
要使数据提升为信息,才能将其增值。
为此,必须从数据收集和分析上运用科学的方法,使之便于利用。
(2)通过数据的收集和分析可证实QMS是否适宜和有效。
(3)帮助识别和评价QMS持续改进的机会。
(4)增强对各种意见和决策的分析、判断、评审、质疑能力因此,数据分析是保障QMS有效运行的重要手段。
1.2数据分析的一般过程1.2.1数据收集(1)收集范围产品、体系和过程的数据,如:产品检测中的不合格,QMS质量目标完成情况、持续改进情况、过程监视和测量情况等。
事实上在QMS的各个过程中,都会产生一些数据,在管理中必须根据当前及长远目标的需要,确定应收集那些数据,重点如何。
(2)收集方法1)各种报表和原始记录(注意分类)2)区域网中的数据库3)注意明确收集人、收集时间、收集方式、传递方式。
(3)收集的要求1)及时2)准确数据的质量,“进来的是垃圾,出去的还是垃圾”3)完整数据项目齐全,数量符合要求。
1.2.2数据分析、处理(1)数据的审查和筛选剔除奇异点,确定数据是否充分(2)数据排序按其重要度进行排序,以确定分析处理的对象和顺序(3)确定分析内容,进行统计分析(4)分析判断在统计分析的基础上,以目标值或标准为依据,对统计分析结果(绘图或计算)作进一步分析,以获得指导过程改进的明确信息,找出主要问题和薄弱环节,并提出相应的改进建议。
(5)编写报告对分析判断得出的规律、趋势整理成报告(附有直观的图表)-1-1.2.3数据的利用不能为分析而分析,要有“的”放矢,数据分析应指导管理。
数据分析是为了科学决策,决策的结果,可通过前后对比来分析判断其有效性。
数据分析应对其全过程做到闭环管理。
为此,应将数据分析信息有效地传递,做到信息共享。
1、线性判别函数的正负和数值大小的几何意义正(负)表示样本点位于判别界面法向量指向的正(负)半空间中;绝对值正比于样本点到判别界面的距离。
2、感知器算法特点收敛性:经过算法的有限次迭代运算后,求出了一个使所有样本都能正确分类的W,则称算法是收敛的。
感知器算法是在模式类别线性可分条件下才是收敛的。
感知器算法只对线性可分样本有收敛的解,对非线性可分样本集会造成训练过程的震荡,这也是它的缺点。
3、聂曼-皮尔逊判决准则、最小最大判决准则等区别聂曼-皮尔逊判决准则主要用于某一种判决错误较另一种判决错误更为重要情况;最小最大判别准则主要用于先验概率未知的情况。
4、马式距离较之于欧式距离的优点优点:马氏距离不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关。
由标准化数据和中心化数据 (即原始数据与均值之差)计算出的二点之间的马氏距离相同。
马氏距离还可以排除变量之间的相关性的干扰。
缺点:夸大了变化微小的变量的作用。
受协方差矩阵不稳定的影响,马氏距离并不总是能顺利计算出。
尺度不变性;考虑了模式的分布5、关联规则的经典算法有哪些Apriori 算法;FP-tree;基于划分的算法Apriori 算法、GRI算法、Carma6、分类的过程或步骤答案一:ppt上的1、模型构建(归纳)通过对训练集合的归纳,建立分类模型。
2、预测应用(推论)根据建立的分类模型,对测试集合进行测试。
答案二:老师版本的训练样本的收集训练集的预处理、模型的选择、模型的训练(问老师后理解整理)7、分类评价标准第1页共16页1)正确率(accuracy)就是被分对的样本数除以所有的样本数,通常来说,正确率越高,分类器越好;2)错误率(errorrate)错误率则与正确率相反,描述被分类器错分的比例,errorrate=(FP+FN)/(P+N) ,对某一个实例来说,分对与分错是互斥事件,所以accuracy=1- errorrate ;3)灵敏度(sensitive )sensitive=TP/P ,表示的是所有正例中被分对的比例,衡量了分类器对正例的识别能力;4)特效度(specificity)specificity=TN/N ,表示的是所有负例中被分对的比例,衡量了分类器对负例的识别能力;5)精度(precision )精度是精确性的度量,表示被分为正例的示例中实际为正例的比例,precision=TP/ (TP+FP);6)召回率(recall )召回率是覆盖面的度量,度量有多个正例被分为正例,recall=TP/(TP+FN)=TP/P= sensitive ,可以看到召回率与灵敏度是一样的。
数据分析培训提纲数据分析培训提纲随着数据成为企业决策的重要依据,数据分析的能力已成为现代企业成功的关键。
数据分析可以帮助企业了解其业务运作情况和市场趋势,以及发现新机会和提高效率。
因此,数据分析的能力也被越来越多的企业重视。
本文将提供一个数据分析培训提纲,以帮助企业或个人提升数据分析能力。
一、数据分析基础1.数据的种类和来源:介绍数据的种类和来源,如结构化数据和非结构化数据的定义和特点,以及企业内部和外部的数据来源。
2.数据采集和整理:讲解如何收集和整理数据,包括如何识别重要数据和如何保证数据的质量。
还应介绍数据清洗、数据转换和数据集成的相关概念和技术。
3.数据可视化:介绍数据可视化的重要性和方法,以及如何使用各种图表、图形和颜色来展示数据。
4.数据分析工具:介绍常见的数据分析工具,如Excel、Python和R等,并讲解它们的优点和限制,以及可用来处理不同类型数据的工具。
二、统计分析1.统计概念和基本公式:介绍统计分析的基本概念和公式,如均值、方差和标准差等,并讲解如何使用这些公式来分析数据。
2.描述性统计:详细讲解描述性统计,包括中心趋势、离散性、分布和偏态等概念。
还应介绍如何使用统计工具来计算这些指标。
3.推论性统计:讲解推论性统计的概念和方法,包括正态分布、置信度和假设检验等。
还应介绍如何使用各种统计工具来执行这些方法。
三、机器学习1.机器学习概念和应用场景:介绍机器学习的定义和各种应用场景,包括分类、回归、聚类等。
2.监督学习:讲解监督学习的概念和方法,包括回归和分类。
还应介绍如何使用Python和R来实现监督学习算法。
3.无监督学习:介绍无监督学习的概念和方法,包括聚类和关联规则。
还应讲解如何使用Python和R来实现无监督学习算法。
四、高级技术1.大数据:介绍大数据和Hadoop等相关的技术,讲解如何使用MapReduce和其他技术来处理大数据。
还应介绍如何使用Hive、Pig和HBase等工具来执行各种数据操作。
期末复习7--数据的分析一、基础知识1.平均数:一般地,假设有n 个数x 1,x 2,……,x n ,那么x =_____________________叫做这n 个数的平均数.2.加权平均数:假设n 个数中,x 1出现w 1次,x 2出现w 2次,……,x k 出现w k 次,(这里w 1+w 2+……+w k =n),那么,根据平均数的定义,这n 个数的平均数能够表示为x =____________________________________________,这样求得的平均数x 叫做加权平均数,其中w 1,w 2,……,w k 叫做________.3. 将一组数据由小到大(或由大到小)的顺序排列,假设数据的个数是奇数,则处于_______位置的数就是这个数据的中位数,假设数据的个数是偶数,则中间两个数的__________就是这组数据的中位数。
4.在一组数据中,出现次数最多的数据叫做这组数据的__________5.一组数据中的 数据与 数据的差叫做这组数据的极差. 6.方差公式:S 2= 。
二、基础训练: 一、选择题1、为理解我校八年级800名学生期中数学考试情况,从中抽取了200名学生的数学成绩实行统计.以下判断:①这种调查方式是抽样调查;②800名学生是总体;③每名学生的期中考试数学成绩是个体;④200名学生是总体的一个样本;⑤200名学生是样本容量.其中准确的判断有( ) A.1个 B.2个 C.3个 D.4个2、已知一组数据1、2、y 的平均数为4,那么( )A. y=7B.y=8C.y=9D.y=103、在样本方差公式S 2=n1[(x 21+x 22+…+x 2n )-n x 2],以下说法不准确的是( ) A 、n 是样本容量 B 、x n 是样本个体 C 、x 是样本的平均数 D 、S 是样本方差4、人数相同的八年级甲、乙两班学生在同一次数学单元测试,班级平均分和方差如下:80==乙甲x x ,2402=甲s ,1802=乙s ,则成绩较为稳定的班级是( )A.甲班B.乙班C.两班成绩一样稳定D.无法确定 5、某地连续9天的最高气温统计如下:这组数据的中位数和众数别是( )A.24,25B.24.5,25C.25,24D.23.5,246、在学校对学生实行的晨检体温测量中,学生甲连续10天的体温与36℃的上下波动数据为0.2,0.3,0.1,0.1,0,0.2,0.1,0.1,0, 0.1,则在这10天中该学生的体温波动数据中不准确的是( ) A.平均数为0.12 B.众数为0.1 C.中位数为0.1 D. 方差为0.027、以下几个常见统计量中能够反映一组数据波动范围的是( ) A.平均数 B.中位数 C.方差 D.极差8、甲、乙、丙、丁四人的数学测验成绩分别为90分、90分、x分、80分,若这组数据的众数与平均数恰好相等,则这组数据的中位数是()A.100分B.95分C.90分D.85分9、已知三年四班全班35人身高的算术平均数与中位数都是150厘米,但后来发现其中有一位同学的身高登记错误,误将160厘米写成166厘米,准确的平均数为a厘米,中位数为b厘米关于平均数a的表达,以下说法准确的是()A.大于158B.小于158C.等于158D.无法确定10、在上题中关于中位数b的表达。
数据分析期末复习一、基本概念(填空题)1.SPSS是(Statistical Product and Service Solutions)的缩写,其中文解释为统计产品和服务解决方案。
2.统计分析软件是基于数据库基础之上实现深层次定量分析并辅助决策的有效工具。
3.SPSS软件的两个最基本窗口是数据编辑窗口和结果输出窗口。
4.SPSS数据文件的扩展名为.sav ,输出文件的扩展名为.spo 。
5.数据分析一般经过收集数据、加工和整理数据、分析数据等三个主要阶段。
6.数据分析的出发点是明确数据分析目标。
7.正确收集数据是指应从分析目标出发,排除干扰因素,正确收集服务于即定分析目标的数据。
8.通过数据的加工整理,能够大致掌握数据的总体分布特征,这是进一步深入分析和建模的基础。
9.选择几种统计分析方法对数据进行探索性的反复分析是极为重要的,因为每一种统计分析方法都有自己的特点和局限性。
10.数据分析的直接结果是统计指标和统计参数。
11.方差分析的一个比较严格的前提要求是不同水平下的各总体应服从方差相同的正态分布。
因此,方差分析问题就转换成研究不同水平下的各总体的均值有无显著差异的问题。
其中对于方差相同的要求很严格。
12.SPSS单因素方差分析中的方差相等检验的方法是:Levene F方法。
13.SPSS独立样本t检验中的方差相等检验的方法是:Levene F方法。
14.使用《居民储蓄调查数据》分析城镇储户和农村储户的一次平均存(取)款金额是否有显著差异可以使用分类汇总进行初步分析。
操作时在下表Break Variable(s)中填入户口[a13] ,Summaries of Variable(s)中填入存(取)款金额[a5] 。
15.使用《居民储蓄调查数据》分析“城镇和农村储户对“储蓄是否合算”的认同是否一致?”可以采用交叉分组下的频数分析。
16.将学生的成绩按分数分成优、良、中、及格和不及格五个等级可以采用数据分组。
SPSS 数据分析软件复习提纲一、本课程的主要内容1,第一手资料或第二手资料转化为SPSS数据(1)变量设置和数据录入(A第一手资料B第二手资料)重点:变量的类型(2)数据的预处理(A审核/排序/ B选取/加权C计算和变换)2,单变量描述分析(1)频数分析(统计图和统计表)重点:变量分组的方法(2)描述统计量3,双变量描述分析(重点:不同类型变量的应用不同的相关系数)(1)参数估计的理论知识(2)交叉分组下的频数分析a)交叉列联表的主要内容b)等级相关的相关系数(3)T检验a)单样本T检验b)两独立样本T检验c)两配对样本T检验(4)相关分析4,多变量分析(注意:不同因变量类型的适用性)(1)线性回归注意:通过数据变换将非线性转化成线性(2)二项logistic回归练习:1、将教科书P26的表2-3居民储蓄调查问卷建成数据库2、对居民储蓄调查数据.sav 进行处理(1)统计没有缺失值的个案的数量(2)分析存取款金额的分布状态(3)分别分析城镇居民和农村居民的收入水平分布3、对1-2.sav进行处理(将结果data view用截屏方式保存在实验报告中)(1)现得知,被调查对象的基本工资均上涨了300元,请计算新变量实际月收入(包括基本工资和失业保险)(2)在工资的决定因素分析模型中,往往取工资的对数形式,请做出一个新变量4、对数据“买房.sav ”进行处理(1)对变量“从业状况”和“年龄”制图(2)计算变量“现居住面积”和“人均现住面积”的基本统计量,同时制作其分布图,并简要分析居民存取款金额的分布特征。
5、对买房.sav数据进行处理。
分析居民购房意愿的影响因素(包括年龄、文化程度、从业状况、家庭类型、家庭年收入、现居住面积、人均居住面积、住房满意度等),报告其相关程度并做显著性检验。
6、处理“买房”数据库,是否有理由认为人们的平均现居住面积为80平方米,而平均的人均居住面积为20平方米?7、1,利用“买房”数据,分析(1)35岁以下和35岁以上人口的现居住面积是否有显著差别(2)对现住房满意和不满意人群中收入在50000元以上的比例是否有显著差异8、利用“2006-2007居民消费水平”数据,分析(1)2007年的居民消费水平、农村居民消费水平、城镇居民消费水平等是否比2006年有显著提高?9、利用“大学生就业”数据进行一下分析:(1)对工作性质和就业行业的选择是否存在性别差异?并简要分析原因。
数据分析师考试大纲一、引言数据分析师近年来成为许多企业中不可或缺的角色,他们负责收集、整理和分析数据,为企业的决策提供有力支持。
为了确保数据分析师具备必要的专业知识和技能,许多公司和机构都设立了数据分析师考试。
本文档将详细介绍数据分析师考试的大纲,帮助考生准备并顺利通过考试。
二、考试目标1. 了解数据分析的基本概念和原则;2. 掌握数据采集和清洗的方法和技巧;3. 熟悉常见的数据分析工具和技术;4. 能够使用统计分析方法进行数据分析;5. 掌握可视化数据的方法和工具。
三、考试内容1. 数据分析基础知识a. 数据分析的定义和作用b. 数据分析的基本原则c. 数据分析过程的步骤和流程d. 数据分析师的角色和职责2. 数据采集和清洗a. 数据采集的方法和技巧b. 数据清洗的目的和步骤c. 常见的数据清洗问题和解决方法d. 数据采集和清洗的工具和软件3. 数据分析工具和技术a. 常见的数据分析软件和工具b. 数据处理和分析的技术和方法c. 数据仓库和数据集成的概念和应用d. 数据挖掘和机器学习算法的基本原理4. 统计分析方法a. 常见的统计分析方法和技术b. 数据分布和变量关系的统计分析c. 统计假设检验和置信区间的应用d. 实验设计和因素分析的统计方法5. 数据可视化a. 数据可视化的目的和重要性b. 常见的数据可视化工具和方法c. 数据可视化设计的原则和技巧d. 数据可视化在决策分析中的应用四、考试要求1. 熟悉数据分析的基本概念和原则;2. 熟练掌握数据采集和清洗的方法和技巧;3. 熟悉常见的数据分析工具和技术,并能灵活应用;4. 能够使用统计分析方法进行数据分析,并解释结果;5. 能够设计并创建有效的数据可视化;6. 具备良好的沟通和报告能力,能将数据分析结果有效传达给决策者。
五、备考建议1. 建议参考专业的数据分析师培训课程,系统学习相关知识和技能;2. 多进行实际的数据分析和处理练习,掌握实践技巧;3. 关注数据分析领域的最新发展和趋势,提高行业敏感度;4. 制定备考计划,合理安排学习时间,保持持续的学习和复习;5. 找到合适的学习方法和技巧,避免盲目死记硬背。
数据的分析小结与复习引言概述:数据分析是一项重要的技能,它使我们能够从大量的数据中提取有用的信息和洞察力。
在这篇文章中,我们将对数据分析的一些关键概念和技巧进行小结和复习。
我们将从数据的收集和整理开始,然后讨论数据的探索和可视化,接着介绍数据的分析和建模,最后探讨数据的解释和应用。
一、数据的收集和整理:1.1 数据源的选择:在进行数据分析之前,我们需要确定数据的来源。
这可能包括从数据库、API、文件或调查问卷中收集数据。
我们应该选择最适合我们研究目的的数据源。
1.2 数据清洗:在进行数据分析之前,我们需要对数据进行清洗,以确保数据的准确性和完整性。
这可能包括删除重复数据、处理缺失值和异常值,以及统一数据格式等。
1.3 数据整理:在数据清洗之后,我们需要对数据进行整理,以便更好地理解和分析。
这可能包括数据的重塑、合并和转换等操作,以满足我们的分析需求。
二、数据的探索和可视化:2.1 描述性统计分析:在进行数据分析之前,我们应该对数据进行描述性统计分析,以了解数据的基本特征。
这可能包括计算均值、中位数、标准差和百分位数等统计指标。
2.2 数据可视化:为了更好地理解和传达数据,我们可以使用各种图表和图形进行数据可视化。
这可能包括柱状图、折线图、散点图和箱线图等,以展示数据的分布、趋势和关系。
2.3 探索性数据分析:通过对数据进行探索性数据分析,我们可以发现数据中的模式和趋势,以及可能存在的异常值和离群点。
这可能包括使用统计方法和可视化工具来探索数据的关系和变化。
三、数据的分析和建模:3.1 统计分析方法:在进行数据分析时,我们可以使用各种统计分析方法来推断总体特征和进行假设检验。
这可能包括 t 检验、方差分析、回归分析和聚类分析等。
3.2 机器学习算法:除了传统的统计分析方法,我们还可以使用机器学习算法来进行数据分析和建模。
这可能包括决策树、随机森林、支持向量机和神经网络等算法。
3.3 模型评估和选择:在使用数据进行建模之后,我们需要对模型进行评估和选择。
数据的分析知识点总结一、数据分析的基础知识1. 数据分析的定义:数据分析是指通过对数据进行收集、整理、清洗、转换和解释,以及应用统计和机器学习等方法,从中提取有用的信息、发现规律、做出决策的过程。
2. 数据分析的重要性:数据分析可以帮助我们了解现象背后的规律和趋势,发现问题并提供解决方案,支持决策制定和业务优化,提高效率和竞争力。
3. 数据分析的步骤:数据收集、数据清洗、数据转换、数据分析、数据可视化、结果解释和决策支持。
二、数据收集与清洗1. 数据收集方法:包括问卷调查、实地观察、实验研究、网络爬虫、日志记录等多种方式。
2. 数据清洗的目的:去除重复数据、处理缺失值、处理异常值、去除噪声数据、转换数据格式等,以保证数据的质量和准确性。
3. 数据清洗的技术:数据去重、缺失值处理(删除、插补、回归等)、异常值检测和处理、数据格式转换等。
三、数据转换与预处理1. 数据转换的目的:将原始数据转换为适合分析的形式,包括数据格式转换、数据归一化、数据离散化等。
2. 数据归一化的方法:包括最大-最小归一化、Z-Score归一化、小数定标标准化等,用于将不同量纲的数据转换为统一的尺度。
3. 数据离散化的方法:包括等宽离散化、等频离散化、基于聚类的离散化等,用于将连续型数据转换为离散型数据。
四、数据分析与建模1. 数据分析的方法:包括统计分析、机器学习、数据挖掘等多种方法。
2. 统计分析方法:包括描述统计、推断统计、假设检验、相关分析、回归分析等,用于描述数据的特征、分析变量之间的关系和进行推断。
3. 机器学习方法:包括监督学习、无监督学习、半监督学习、强化学习等,用于构建模型、预测和分类等任务。
4. 数据挖掘方法:包括关联规则挖掘、聚类分析、分类与预测、异常检测等,用于发现隐藏在数据中的模式和规律。
五、数据可视化与结果解释1. 数据可视化的目的:通过图表、图像等形式将数据转化为可视化的图形,以便更直观地展示数据的特征和趋势。
复习提纲
1、第一章统计学和SPSS统计分析软件简介
(1)统计分析的基本概念
●统计分析的基本概念和有关术语
●统计数据的分类及各类型特点
●统计分析的步骤
●抽样方法的分类,及其各分类所包含的具体方法、特点和适用条件
题型:选择填空判断,问答题
2、第二章数据文件的建立和管理
(1)掌握SPSS数据集的数据结构的建立和编辑;
●数据的存储格式
●SPSS的数据存储形式和数据结构
●SPSS包含哪些类型数据,各有什么特点,变量名命名规则
(2)掌握SPSS软件读入和存储电子表格、数据库、文本文件等各类格式的数据文件方法;
●SPSS可以读取哪些格式的文件
●SPSS可以保存哪些格式的文件
(3)学习合并两个数据文件的方法;
●数据合并分类,及其各类数据合并方法的用途和使用前提要求
(4)学习查找重复个案,数据文件的拆分,变量计算,数据分组,数据选取
●重复个案,数据文件的拆分,变量计算,数据分组,数据选取等方法的用途和使用
前提要求
题型:选择填空判断
3、第三章基本统计分析
(1)描述性统计和推断性统计的相关基本概念(ppt中章节的所有内容)
●统计学的分类,及其各类的概念和特点(中心趋势描述、离散趋势描述、分布
的形状)
●统计量的概念和分类,及其各类统计量的名称,特点和用途
(2)对数据进行描述的图形化方法
●统计图表分几类,各有什么用途
(3)数据计数
●目的和思路
(4)分类汇总
●目的和思路
(5)频率分析
●目的和思路
(6)交叉分组下的频度分析
●目的和思路
(7)分析和解释
●目的和思路
(8)多选项分析
●目的和思路
(9)比率分析
●目的和思路
题型:选择填空判断
4、第四章参数检验
(1)推断统计的概念及方法
(2)假设检验概述(原因,原理,方法,思想,步骤)
(3)单样本t检验的目的,方法,使用条件,原假设,步骤
(4)两独立样本t检验
●什么是两独立样本,有什么要求
●两独立样本t检验的目的,方法(手段),使用条件,原假设,步骤和检验结果
解释
●对两独立样本t检验结果的解释
(5)两配对样本t检验
●什么是两配对样本,有什么要求
●两配对样本t检验的目的,方法(手段),使用条件,原假设,步骤
●对两独立样本t检验结果的解释
(6)各种方法的使用情境(各种方法适用于那些例子)
题型:选择填空判断问答题
5、第五章方差分析
(1)方差分析概述
●t检验与方差分析的区别
●方差分析的思想,相关术语(涉及的变量及其特点,g各变量间的关系),用途,
适用条件,分类
(2)单因素方差分析
●单因素方差分析的用途,适用条件,基本思路,原假设,检验统计量的构造,
检验步骤和结果解释
(3)多因素方差分析
●多因素方差分析与单因素方差分析的区别
●多因素方差分析的用途,适用条件,基本思路,原假设,检验统计量的构造,
检验步骤和结果解释
(4)协方差分析
●什么是协方差分析,何时使用,基本思路,原假设
(5)各种方法的使用情境(各种方法适用于那些例子)
题型:选择填空判断问答题
6、第六章非参数检验
(1)非参数检验简介
●非参数检验的用途和内容,非参数检验与参数检验的区别
●非参数检验方法的优点,非参数检验的应用范围
(2)单样本非参数检验方法
●单样本非参数检验方法包含几种方法
●卡方检验的用途,适用条件,基本思想,原假设,结果解释
●二项(分布)检验的用途,适用条件,基本思想,原假设,结果解释
●Kolmogorov-Smirnov检验的用途(可检验那些理论分布),适用条件,基本思想,
原假设,结果解释
●游程的计算,游程检验的用途,适用条件,基本思想,原假设,结果解释(3)两独立样本非参数检验方法
●独立样本非参数检验的用途
●曼-惠特尼(Mann-Whitney U)检验的用途,基本思想,原假设,检验步骤,结
果解释
●Kolmogorov-Smimov检验的用途,基本思想,原假设,检验步骤,结果解释
●Wald-Wolfowitz游程检验的用途,基本思想,原假设,检验步骤,结果解释
●极端反应检验的用途,基本思想,原假设,检验步骤,结果解释
(4)两配对样本非参数检验方法
●配对样本非参数检验的用途
●McNemar检验的用途,适用条件,基本思想,原假设,检验步骤,结果解释
●符号检验的用途,基本思想,原假设,检验步骤,结果解释,存在的不足
●Wilcoxon符号秩检验的用途,基本思想,原假设,检验步骤,结果解释
●符号检验与Wilcoxon符号秩检验的联系与区别
(5)各种方法的使用情境(各种方法适用于那些例子)
题型:选择填空判断问答题
7、第七章相关分析
(1)相关分析的基本概念
●客观事物之间关系的分类
●什么是相关分析
●相关关系的分类
●相关分析的作用
(2)各种散点图
●散点图的用途及绘制原理
●散点图的类别
(3)相关系数
●相关系数的用途,计算步骤,常用的线性相关系数有哪些
●Pearson相关系数的适用条件,特点和结果解读,Pearson相关系数检验的原假
设
●Spearman等级相关系数的适用条件,特点和结果解读,Spearman相关系数检
验的原假设
●Kendall tau系数的适用条件,特点和结果解读,Kendall tau相关系数检验的原假
设
●什么是偏相关分析,为什么需要偏相关分析
(4)各种方法的使用情境(各种方法适用于那些例子)
题型:选择填空判断
8、第八章回归分析
(1)回归分析的基本概念
●什么是回归分析,回归分析的分类有哪些,获得回归线的常用方法有哪些,回
归分析的步骤有哪几步
●回归分析与相关分析的关系是什么
(2)线性回归分析
●什么是线性回归,线性回归的分类,何时进行线性回归分析
●什么是一元线性回归,其模型如何表示,包含哪些变量,各变量有何意义
●什么是多元线性回归,其模型如何表示,包含哪些变量,各变量有何意义
●采用什么方法确定回归方程的参数,其原理是什么
(3)线性回归分析结果的检验
●对线性回归分析结果的测度指标包含哪些
●拟合优度检验的用途,原理和结果解读(包含一元线性和多元线性)
●回归方程的显著性检验的用途,原理和结果解读(包含一元线性和多元线性),
回归方程的显著性检验与拟合优度检验的关系
●回归系数的显著性检验的用途,原理和结果解读(包含一元线性和多元线性),
回归方程的显著性检验与回归系数的显著性检验的关系
●残差是什么,如何定义(含公式)
●残差分析的用途,其主要任务包含哪些
●如何实现对残差均值为零的分析,如何解读
●什么是残差独立性,如何实现对残差的独立性分析,如何解读
●什么是异方差,如何实现对异方差的分析,如何解读
●什么是异常值,如何实现对样本异常值的探测,如何解读
(4)线性回归分析的使用情境(适用于那些例子)
题型:选择填空判断问答题
9、第九章主成分分析
(1)主成分分析的目的和功能
●主成分分析的目的
●主成分分析的主要功能
●主成分分析的步骤
●主成分分析结果的解读(共同度,方差贡献率)
(2)主成分分析的应用条件
●主成分分析的适用条件是什么
●那些统计量可用于检验主成分分析的适用情况
●如何选择相关系数举证或协方差矩阵进行主成分分析
(3)各种方法的使用情境(各种方法适用于那些例子)
题型:选择填空判断。