距离相关分析通过计算广义距离 度量样品或变量间得相似程度。
2022/9/20
26
距离相关分析一般不单独使用, 而就是作为聚类分析、因子分析等得 预处理过程。
距离相关分析根据统计量得不同, 分为不相似性测度和相似性测度。对 于不相似性测度,通过计算距离来表 示,距离越大,相似性越弱;对于相似性 测度,通过计算 Pearson 相关系
数据得采集也就是建立回归模型 得重要一环。
大多数建模竞赛题目会提供相关 数据,但这些数据可能包含了一些无 用得信息,个别数据缺失甚至失真。
在建模前,需要对数据进行适当
2022/9/20
45
处理。比如标准化,剔除个别过大或 过小得“野值”,用插值方法补齐空 缺数据等。 (3) 回归模型形式得确定
收集、处理好数据后,首先要确 定适当得数学模型来描述这些变量间 得统计关系。
显然,样品间得相关系数都接近
于1,很难辨别出其相似程度。
2022/9/20
31
例4 5名考官给10名应聘者得面
试分数如下,请问各考官评分得一致
性如何?哪位考官得可信度较小?各
应聘者分数得差异就是否明显?
解 若第1问改为:请问不同考官
对应聘者面试分数得影响就是否显著,
则勉强可用方差分析。因为考官给10
相关分析与回归分析
一、引 言
2022/9/20
2
在很多研究领域中,往往需要研
究事物间得关系。如收入与受教育程
度,子女身高与父母身高,商品销售额
与广告费用支出,农作物产量与施肥
量,上述两者间有关系吗?如果有关
系,又就是怎么样得关系呢?如何来
度量这种关系得强弱?
解决上述问题得统计方法就是相