02 多重对应分析方法
- 格式:pdf
- 大小:243.39 KB
- 文档页数:8
对应分析方法与对应图解读方法——七种分析角度对应分析是一种多元统计分析技术,主要分析定性数据Category Data方法,也是强有力的数据图示化技术,当然也是强有力的市场研究分析技术。
这里主要介绍大家了解对应分析的基本方法,如何帮助探索数据,分析列联表和卡方的独立性检验,如何解释对应图,当然大家也可以看到如何用SPSS操作对应分析和对数据格式的要求!对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭示变量间的联系。
交互表的信息以图形的方式展示。
主要适用于有多个类别的定类变量,可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。
适用于两个或多个定类变量。
主要应用领域:概念发展(Concept Development)新产品开发 (New Product Development)市场细分 (Market Segmentation)竞争分析 (Competitive Analysis)广告研究 (Advertisement Research)主要回答以下问题:谁是我的用户?还有谁是我的用户?谁是我竞争对手的用户?相对于我的竞争对手的产品,我的产品的定位如何?与竞争对手有何差异?我还应该开发哪些新产品?对于我的新产品,我应该将目标指向哪些消费者?数据的格式要求对应分析数据的典型格式是列联表或交叉频数表。
常表示不同背景的消费者对若干产品或产品的属性的选择频率。
背景变量或属性变量可以并列使用或单独使用。
两个变量间——简单对应分析。
多个变量间——多元对应分析。
案例分析:自杀数据分析上面的交互分析表,主要收集了48961人的自杀方式以及自杀者的性别和年龄数据!POISON(毒药)GAS(煤气)HANG(上吊)DROWN(溺水)GUN(开枪)JUMP(跳楼)(我们就不翻译成中文了,读者可以把六个方式想象成品牌或别的什么)当然,我们拿到的最初原始数据可能是SPSS数据格式记录表,其中,性别取值1-male 2-female,年龄取值1-5,分别表示不同年龄段。
第二讲 多重对应分析方法前面的一篇博文介绍了对应分析方法的解读技巧,不少读者看了后非常想知道如何操作多重对应分析。
其实多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量,这时候就可以用简单对应分析了。
对应分析对数据的格式要求:•对应分析数据的典型格式是列联表或交叉频数表。
•常表示不同背景的消费者对若干产品或产品的属性的选择频率。
•背景变量或属性变量可以并列使用或单独使用。
两个变量间——简单对应分析。
多个变量间——多元对应分析。
现在,我们还是来看看如何操作多重对应分析并如何解读对应图;我们假定有个汽车数据集,包括:来源国(1-美国、2-欧洲、3-日本),尺寸(1-大型、2-中型、3-小型),类型(1-家庭、2-运动、3-工作),拥有(1-自有、2-租赁)性别(1-男、2-女),收入来源(1-1份工资来源、2-2份工资来源),婚姻状况(1-已婚、2-已婚有孩子、3-单身、4-单身有孩子);从数据集看,我们有7个定类变量,如果组合成简单的交叉表是困难的事情,此时采用多重对应分析是恰当的分析方法。
下面我还是采用SPSS18.0,现在叫PASW Statistics 18.0来操作!注意:不同版本在多重对应分析方法有一些不同,但大家基本上可以看出了,高版本只能是更好,但选择会复杂和不同!在进行多重对应分析之前,研究者应该能够记住各个变量大致有多少类别,个别变量如果变量取值太偏或异常值出现,都会影响对应分析的结果和对应图分析!在SPSS分析菜单下选择降维(Data Redaction-数据消减)后选择最优尺度算法,该选项下,根据数据集和数据测量尺度不同有三种不同的高级定类分析算法,主要包括:多重对应分析、分类(非线性)主成分分析、非线性典型相关分析;注意:随着版本的增高,研究人员在统计分析时就要各位主要变量的测量尺度,并且最好在进行数据清理和分析前,明确定义好测量尺度;当然也要做好Lable工作!接下来,我们就可以选择变量和条件了!大家可以把要分析的变量都放到分析变量内,补充变量的含义是如果有哪个变量你并不想作为对应分析的变量,而只是作为附属变量表现在对应图上可以加入!这一点其实在简单对应分析也有这种定义。
对应分析方法与对应图解读方法——七种分析角度对应分析是一种多元统计分析技术,主要分析定性数据Category Data方法,也是强有力的数据图示化技术,当然也是强有力的市场研究分析技术。
这里主要介绍大家了解对应分析的基本方法,如何帮助探索数据,分析列联表和卡方的独立性检验,如何解释对应图,当然大家也可以看到如何用SPSS操作对应分析和对数据格式的要求!对应分析是一种数据分析技术,它能够帮助我们研究由定性变量构成的交互汇总表来揭示变量间的联系。
交互表的信息以图形的方式展示。
主要适用于有多个类别的定类变量,可以揭示同一个变量的各个类别之间的差异,以及不同变量各个类别之间的对应关系。
适用于两个或多个定类变量。
主要应用领域:概念发展(Concept Development)新产品开发 (New Product Development)市场细分 (Market Segmentation)竞争分析 (Competitive Analysis)广告研究 (Advertisement Research)主要回答以下问题:谁是我的用户?还有谁是我的用户?谁是我竞争对手的用户?相对于我的竞争对手的产品,我的产品的定位如何?与竞争对手有何差异?我还应该开发哪些新产品?对于我的新产品,我应该将目标指向哪些消费者?数据的格式要求对应分析数据的典型格式是列联表或交叉频数表。
常表示不同背景的消费者对若干产品或产品的属性的选择频率。
背景变量或属性变量可以并列使用或单独使用。
两个变量间——简单对应分析。
多个变量间——多元对应分析。
案例分析:自杀数据分析上面的交互分析表,主要收集了48961人的自杀方式以及自杀者的性别和年龄数据!POISON(毒药)GAS(煤气)HANG(上吊)DROWN(溺水)GUN(开枪)JUMP(跳楼)(我们就不翻译成中文了,读者可以把六个方式想象成品牌或别的什么)当然,我们拿到的最初原始数据可能是SPSS数据格式记录表,其中,性别取值1-male 2-female,年龄取值1-5,分别表示不同年龄段。
第20卷第2期2020年4月交 通 工 程Vol.20No.2Apr.2020DOI:10.13986/ki.jote.2020.02.002驾驶分心行为驾驶人的多重对应分析弯美娜,李 洋,何 庆(北京警察学院,北京 102202)摘 要:对536名驾驶人的人口统计学特征(包括年龄㊁性别㊁受教育程度㊁职业和家庭月收入)以及基本的驾驶情况(驾龄㊁车型㊁周均驾驶里程㊁驾驶能力)进行调查.使用多重对应分析的方法对其中报告在驾驶行为中存在驾驶分心的363名驾驶人的年龄㊁性别㊁职业㊁驾龄㊁周均驾驶里程和驾驶能力等特征进行了分析.结果显示,男性㊁非固定职业㊁驾龄在3~5a 在同一方向出现聚集;18~35岁与驾龄在3a 以内㊁周均驾驶里程为中途(50~400km)与固定职业也存在一定的关联性.同时,不同性别㊁不同驾驶能力认知的驾驶人分布出现差异,相对而言,女性驾驶人可能更多地受到驾驶能力认知的影响.关键词:驾驶分心;多重对应分析;人口统计学变量中图分类号:U 491文献标志码:A文章编号:2096⁃3432(2020)02⁃06⁃06Multiple Correspondence Analysis of Driving Distracted DriversWAN Meina,LI Yang,HE Qing(Beijing Police College,Beijing 102202,China)Abstract :Demographic characteristics (age,gender,education,occupation,and monthly household income)and basic driving conditions (driving age,vehicle type,average driving mileage per week,driving ability)of 536drivers were investigated.The Multiple correspondence analysis was used to analyze the characteristics of age,gender,occupation,driving age,average driving mileage and driving ability of 363drivers who reported driving distraction.The results showed that the three characteristics of male,non⁃fixed occupation,and driving age ranged from 3-5years appeared in the same direction.There is also a certain correlation between 18-35years of age and driving age within 3years and an average driving mileage of 50-400km per week with fixed occupation.At the same time,there aredifferences in the distribution of drivers with different genders and different driving ability cognition.Relatively speaking,female drivers may be more affected by their own driving ability cognition.Key words :driving distraction;multiple correspondence analysis;demographic variables收稿日期:2019⁃11⁃20.基金项目:北京警察学院重点课题 分心驾驶对行车安全影响及对策研究”项目编号2018KZD08.作者简介:弯美娜(1985 ),女,硕士研究生,讲师,研究方向为交通心理学,E⁃mail:meina.wan@.0 引言驾驶人的驾驶分心是引发交通事故的重要原因之一.据美国国家公路安全管理局(NHTSA)统计,美国2006 2010年由于分心导致事故比例达到17%,2011 2013年事故比例达到16%.其中驾驶分心导致死亡事故占到总死亡事故的10%[1].2014年,全国简易交通事故656.3万起,其中因 驾驶分心”导致的309.9万起,占47.22%;一般以上交通事故中,因 驾驶分心”导致的共有74746起,占 第2期弯美娜,等:驾驶分心行为驾驶人的多重对应分析37.98%,造成21570人死亡,76984人受伤,直接财产损失4.58亿元.2019年以来,交警部门共查处 驾驶分心”违法行为40.3万起,与去年同期相比上升11.1%[2].国际标准化组织将驾驶分心初步定义为:注意力集中在驾驶无关的活动中,一般对驾驶行为有害[3].美国高速公路安全管理局(NHTSA)将驾驶分心分为以下3种类型:视觉分心:需要驾驶员离开路面注视来获取信息;操作分心:需要驾驶员单手离开方向盘并操作设备;认知分心:需要驾驶员从驾驶任务中转移精神注意力.目前驾驶分心的研究较多地集中在分心的认知机制探讨和分心行为分析等研究中.其中,认知机制的探讨一般通过视觉分心或认知分心任务㊁在驾驶模拟环境下㊁通过实验的方式考查分心任务对驾驶操作行为的影响.如罗毅等[4]通过驾驶模拟试验,考查驾驶分心对车辆变道行为的影响,结果显示,驾驶分心对变道过程中车辆的纵向速度㊁横向速度㊁横向加速度㊁方向盘转角㊁方向盘转速和油门开度等6项驾驶绩效参数有显著影响.李鹏辉等[5]通过驾驶模拟器对分心任务与交通冲突反应时之间的关系进行了分析,结果显示,认知分心会延长驾驶人应对侧向冲突的反应时,视觉分心同时延长驾驶人应对侧向及纵向冲突的反应时间;视觉分心对驾驶人反应时间的延长显著性高于认知分心.同时,伴随着移动电话的迅速普及,驾驶时使用电话的行为也变得越发普遍.越来越多的研究者在驾驶分心特性中开始关注如手动操作电子通讯设备㊁使用非手持电子设备通话㊁使用手持电话通话等的影响[6].如党珊[7]对驾驶中操作手机打车软件诱发的驾驶分心行为进行的驾驶模拟实验结果显示,正常驾驶与4类驾驶分心情况下驾驶行为表现出显著差异,非常规场景中,分心操作对危险刺激的反应时增长显著,驾驶分心操作时的事故率出现显著上升.彭丹丹等[8]使用眼动仪用模拟驾驶试验的方式对手机导航方式对驾驶行为的影响进行分析后指出,不同手机导航方式都会造成驾驶分心,但分心程度不同;手持手机导航使驾驶人对前方和左侧区域的关注下降最为显著.此外,通过自然观察和自我报告的方式对驾驶分心行为进行的研究也较为常见.如李晨[9]采用自然驾驶观察法对货运车辆驾驶人的视频录像和视频监控观察后指出,货车驾驶人在行驶过程中发生频率最高的分心任务分别为发信息㊁打电话㊁看或触摸手机屏幕㊁喝水和拿东西,同时,看或者触摸手机屏幕的行为具有相当大的个体差异性.郭羽熙等[10]通过问卷调查的方式分析了驾驶人在驾驶时使用手机的特点与风险感知水平之间的关系,研究结果显示,驾驶人使用手机频率和风险认知水平存在负相关,风险感知水平较高,使用手机的频率越低,同时更愿意接受驾驶时限制手机功能以提高驾驶安全性.在此基础上,对驾驶分心的监测系统以及人-机交互界面设计等领域的研究也是传统分心行为研究的热门领域[11⁃12].从上述研究中可看到,驾驶分心的研究目前主要集中在对驾驶分心行为的行为观察和认知机制探索等方面,包括对视觉分心㊁认知分心的神经生理机制分析㊁风险认知水平分析等认知过程的分析,以及由此衍生的驾驶分心行为检测系统和人机交互界面设计等领域中,而对于驾驶分心行为的驾驶人的社会特征和驾驶行为特征分析则较为少见.从交通管理工作实践角度出发,对于驾驶分心行为的驾驶人社会特征和行为特征进行分析,对于交通安全工作也具有不可忽视的作用.因此,本研究从驾驶人的人口统计学特征和驾驶行为特征出发,对驾驶分心行为进行了分析,并进一步总结分心驾驶的人群的常见特征,以期为交通管理工作提供可能的管理思路.1 研究方法1.1 研究工具本研究使用网上调查的形式,通过自我报告的问卷,对驾驶人日常出行驾驶行为中的社会经济状况㊁驾驶分心情况(驾驶行为中出现频率最高的分心行为㊁日常驾驶活动中使用手机的频率)和事故情况(过去3a发生的事故数量)进行了调查.最终有536名驾驶人接受了调查,其中男性338人,女性198人.1.2 统计方法本研究中涉及的分类变量包括驾驶分心情况㊁基本的人口统计学变量(年龄㊁性别㊁受教育程度㊁职业和家庭月收入)以及基本的驾驶情况(驾龄㊁驾驶人性质㊁车型㊁周均驾驶里程).使用传统的列联表分析不仅列联表层次复杂,且行与列之间的交叉信息也不易理解,针对这种情况,采用研究者们普遍推荐的多重对应分析的方式进行呈现.使用SPSS22.0统计软件进行数据整理和分析,以P<0.05为差异有统计学意义.7交 通 工 程2020年2 研究结果2.1 驾驶分心行为描述统计研究者列举了驾驶行为中常见的可能引起驾驶分心的行为,要求被试选择在驾驶行为中出现频率最高的两项行为,结果如表1所示.表1 常见的驾驶分心行为频率表分心行为响应频次占总选择人数百分比/%观察值百分比/%聊天36235.667.5玩手机878.516.2看视频605.911.2听广播36936.268.8吃东西807.914.9化妆121.22.2其他分心行为484.79.0总计1018100.0189.9 从表1中可看到,在驾驶分心行为中,驾驶人最常出现的行为频次最高的5项行为依次为听广播㊁聊天㊁玩手机㊁吃东西和看视频.进一步询问被试在驾驶行为中使用手机的频率,结果如图1所示.图1 驾驶行为中使用手机的频率分布图从图1中可看到,超过68%的驾驶人承认在驾驶行为中出现过使用手机的情况,其中14%的驾驶人频繁地在驾驶行为中使用手机.2.2 驾驶分心行为的多重对应分析研究者对自我报告中承认在驾驶行为中使用手机的驾驶人(n =363)样本进一步进行多重对应分析.2.2.1 基本情况描述363名驾驶人的年龄㊁受教育程度㊁家庭经济状况等人口统计学变量如表2所示.表2 人口统计学变量分布表项目类别频数百分比/%性别男25369.7女11030.318~35岁22862.8年龄36~59岁13136.160岁以上41.1高中及以下4913.5受教育程度大学26673.3研究生及以上4813.2职业非固定14740.5固定21659.5家庭月低(5000以下)7921.8收入/元中(5000~30000)24366.9高(30000以上)4111.3 从表2中可看到,男性驾驶人占比接近70%,大多数被调查者年龄在35岁以下,大多数受过高等教育,职业以固定职业为主,家庭月收入处于中等水平.363名驾驶人的驾龄㊁日常驾驶车型和周均驾驶里程等驾驶基本情况如表3所示.表3 被调查者人口统计学变量分布表项目类别频数百分比/%3a 以内13537.2驾龄3~5a7921.85~10a 6116.810a 以上8824.2驾驶车辆小型客车143.9类型大中型客车31987.9货车或其他专用作业车308.3周均驾驶短途(50以下)15041.3里程/km 中途(51~400)19252.9长途(400以上)215.8驾驶能力低17949.3(自评)高18450.7 从表3中可看到,大多数驾驶人的驾龄在5a 以下,驾驶车辆以小型客车为主,周均驾驶里程以中短8 第2期弯美娜,等:驾驶分心行为驾驶人的多重对应分析途为主.2.2.2 适应性检验适用性检验结果显示,不同人口特征的驾驶人在不同的驾驶特征上的表现如表4所示. 从表4中可看到,不同性别的驾驶人在职业㊁周均驾驶里程上的分布无差异;不同职业的驾驶人在驾驶能力分布上无差异;其余研究变量的分布上均表现出显著差异.表4 不同人口特征的驾驶人变量的两两适应性检测(χ2/P值)项目性别年龄职业驾龄周均驾驶里程年龄6.00/0.05职业0.35/0.55419.00/0.000驾龄8.65/0.034179.51/0.00015.04/0.004周均驾驶里程5.76/0.05614.84/0.0058.69/0.01338.09/0.000驾驶能力4.00/0.04520.73/0.0002.58/0.10834.55/0.00022.81/0.000 2.2.3 模型情况概要考虑到人口统计学变量中,受教育程度和家庭收入情况与年龄和职业之间存在较大的相关,因此,研究者最终选择对性别㊁年龄㊁职业㊁驾龄㊁车型㊁周均驾驶里程和驾驶能力7个变量间进行多重对应分析[13].在对这7个变量进行特征分析后,其在2个维度上的调整惯量贡献率如表5所示.表5 调整惯量贡献率表维度特征根调整惯量调整惯量贡献率/%累积调整惯量贡献率/%12.0970.34934.94734.947 21.3200.22022.00256.949 从表5中可看到,维度1可解释总体变异的34.95%,维度2可解释总体变异的22.00%;也就是说,两维坐标图可介绍原有数据的56.95%的信息.根据上述2个特征根得到2个辨识度量,并得到性别等维度在这2个辨识度量上的载荷,如表6所示.表6 辨识度量载荷表辨识度量12性别0.0030.373年龄0.6530.086职业0.1350.134驾龄0.7340.358周均驾驶里程0.2840.259驾驶能力0.2880.111 从表6中可看到,年龄㊁驾龄和驾驶能力主要分布在辨识度量1上,性别主要分布在辨识度2上,职业和周均驾驶里程在2个辨识度量上分布比较平均.它们之间的关系,如图2所示.图2 变量在两个辨识维度上的分布图3.2.4 多重对应分析的联合分布图为了更清晰地呈现这些变量之间的关系,研究将多重对应分析的结果以类别联合图的形式绘制出来,结果如图3所示.图3 驾驶分心人群的多重对应分析的类别联合图 从图3中可看到,男性㊁非固定职业㊁驾龄在3~5a在同一方向出现聚集,表明这些变量之间存在相关;同样,18~35岁与驾龄与在3a以内㊁周均驾驶里程为中途(50~400km)与固定职业㊁60岁以9交 通 工 程2020年上与周均驾驶里程为长途之间也存在一定的关联性.男性和女性在原点的不同方向,驾驶能力自评高㊁低的驾驶人的位置较远,说明不同性别㊁不同驾驶能力认知的驾驶人分布有所不同.研究者进一步对不同性别㊁不同驾驶自评能力的驾驶分心人群特征进行了多重对应对应分析,其类别联合图的结果如图4㊁图5所示.图4 男性驾驶分心人群的多重对应分析的类别联合图图5 女性驾驶分心人群的多重对应分析的类别联合图从图4中可看到,在男性的驾驶分心人群中,非固定职业㊁驾龄在3a 以内㊁周均驾驶里程在50km 以内,同时驾驶能力自评较低等特征出现了聚集;同时,固定职业㊁驾龄在5~10a,周均驾驶里程在50~400km 与高的驾驶能力自评等特征可能存在相关.图5中的信息显示,在女性的驾驶分心人群中,10a以上驾龄与较高的驾驶能力自评出现聚集;女性驾驶人非固定职业㊁驾龄3a 以内㊁周均驾驶里程较短等特征也表现出相关.从图6㊁7中我们发现,男性驾驶人18~35岁以及3~5a 驾龄均表现出较强的相关,但是在驾驶能力自评较低的群体中,女性与较长的里程出现相关;而在驾驶能力自评较高的群体中,相对而言,女性与中等程度的驾驶里程关系较为密切.图6 低驾驶能力驾驶分心人群的多重对应分析的类别联合图图7 高驾驶能力驾驶分心人群的多重对应分析的类别联合图3 讨论3.1 驾驶分心的群体特征:年龄和职业特征的影响综上所述,在不同条件多重对应分析中出现了一些稳定的特征聚集:如驾龄在3a 以内这一特征几乎总是与短途驾驶里程(周均驾驶里程在50km1 第2期弯美娜,等:驾驶分心行为驾驶人的多重对应分析以内)以及非固定职业这些特征联系在一起.这些特征共同构成了这样一幅驾驶人群体的描象:新手驾驶人.一般而言,国际惯例将取得驾驶执照在1a 以内的驾驶人称之为新手驾驶人.但是由于我国的国情,一部分驾驶人在取得驾驶执照后的一段时间内,并没有很多的上路实践机会,从周均驾驶里程在50km以内也能反映出这一点.同时,也意味着这一群体并非具有稳定上下班通勤需要的驾驶人群体.这3个特征放在一起,研究者猜测这一群体中相当大的人群可能是属于青年驾驶人群体.由于在本次研究中,我们使用在驾驶活动中对手机的使用频率作为驾驶分心的指标,因此,这一群体在驾驶分心上表现突出也就不难理解了.一方面,智能手机的使用频率本身就呈现出了极强的年龄效应,青年群体中对于智能手机的依赖本身就显著地高于其他年龄阶段;另一方面,在新手驾驶人阶段,对驾驶环境㊁驾驶操作等方面内容的不熟悉,也进一步加剧了对智能手机(如手机导航软件等)的依赖,从而使得驾驶分心在这一群体中更加常见.另一方面,在驾驶里程为中途(50~400km)与固定职业㊁5~10a驾龄等特征之间的密切相关,也似乎提示,在年龄更高的群体中,驾驶分心的群体似乎与朝九晚五的 上班族”存在一定的重合,周均50~400km的驾驶里程似乎也与上下班的通勤距离较为接近.同时,在部分类别联合图中出现的, 60岁以上的驾驶人群体与周均400km以上的驾驶里程之间的聚集,似乎也在提示研究者,对于不同年龄阶段的驾驶人而言,驾驶中对手机的使用这一驾驶分心行为可能存在的不同指向和功能,这一内容需要后续研究根据使用手机的内容和形式进行进一步挖掘.3.2 驾驶分心行为可能受到性别刻板印象的影响除了年龄和职业的影响之外,多重对应分析的结果还显示,驾驶分心行为在很大程度上表现出了性别和驾驶能力的差异.具体而言,驾驶自评能力几乎没有在男性驾驶人群体表现出差异性的相关,而女性驾驶人则表现出一定的驾驶能力自评结果与驾驶里程至今的负相关的倾向.也就是说,驾驶能力自评较低的群体中,女性与较长的里程出现相关;而在驾驶能力自评较高的群体中,女性则与中等程度的驾驶里程关系较为密切.研究者认为,出现这一现象的原因,可能与女性驾驶人所遭受的在驾驶行为中的刻板印象相关.由于这种刻板印象的存在,女性驾驶人可能对自身的驾驶技能评价相对较低,这种较低的评级可能进一步抑制了女性驾驶人在驾驶活动中的分心行为.因此,对自己驾驶能力评级较高的女性驾驶人与周均驾驶里程为中途表现出聚集,而对自己驾驶能力评价较低的女性驾驶人则与周均驾驶里程为长途表现出相关.周均驾驶里程在一定程度上可看做是驾驶人对驾驶技能的练习活动,从这个意义上讲,女性驾驶人伴随着对驾驶技能的熟练,从而导致对自我驾驶能力评价的提高,并进一步可能出现驾驶分心行为.参考文献:[1]National Highway Traffic Safety Administration.Overview of the National Highway Traffic Safety Administration’s Driver Distraction Program[J].Report No.DOT HS, 2010,811:299.[2]http:∥/news/shizheng/2015/ 1203/50661.html[3]Pettitt M,Burnett G E,Stevens A.Defining driver distraction[C]∥12th World Congress on Intelligent Transport Systems,2005.[4]罗毅,高岩,尤志栋.基于换道行为的驾驶分心识别方法[J].中国安全科学学报,2018,28(10):25⁃30. [5]李鹏辉,胡孟夏,张文会,等.分心对驾驶人交通冲突反应时间的影响[J].中国公路学报,2018,31(4): 36⁃42.[6]National Highway Traffic Safety Administration.MMUCC guideline:model minimum uniform crash criteria[EB⁃OL].[2011⁃12⁃19].http:∥www⁃/ Pubs/810957.pdf.http:∥/sites/ default/files/2008MMUCCGuideline.pdf,2008.[7]党珊.基于手机打车软件使用的驾驶分心行为研究[D].成都:西南交通大学,2017.[8]彭丹丹,田伟,石京.手机导航方式对驾驶行为的影响研究[J].中国安全科学学报,2017,27(9):39⁃44. [9]李晨.基于驾驶模拟试验的货车驾驶人驾驶分心识别研究[D].北京:北京交通大学,2019. [10]郭羽熙,吴昊,付锐,等.驾驶人智能手机使用行为与风险感知分析[J].长安大学学报(自然科学版),2018,38(5):123⁃130.[11]赵博,马钧.驾驶员分心监测方法探究[J].农业装备与车辆工程,2016,54(3):59⁃61+71. [12]王加.基于驾驶员操纵及车辆运动轨迹信息的驾驶分心辨识方法[C].中国汽车工程学会.面向未来的汽车与交通 2013中国汽车工程学会年会论文集精选.中国汽车工程学会:中国汽车工程学会,2013:195. [13]叶勒丹㊃马汉,孙勇,等.乌鲁木齐市体检人群高血压类型与其危险因素的多重对应分析[J].中国全科医学,2019,22(16):1966⁃1972.11。
第二讲 多重对应分析方法
前面的一篇博文介绍了对应分析方法的解读技巧,不少读者看了后非常想知道如何操作多重对应分析。
其实多重对应分析在超过两个以上定类变量时有时候非常有效,当然首先我们要理解并思考,如果只有三个或有限的几个变量完全可以通过数据变换和交互表变量重组可以转换成两个定类变量,这时候就可以用简单对应分析了。
对应分析对数据的格式要求:
•对应分析数据的典型格式是列联表或交叉频数表。
•常表示不同背景的消费者对若干产品或产品的属性的选择频率。
•背景变量或属性变量可以并列使用或单独使用。
两个变量间——简单对应分析。
多个变量间——多元对应分析。
现在,我们还是来看看如何操作多重对应分析并如何解读对应图;
我们假定有个汽车数据集,包括:来源国(1-美国、2-欧洲、3-日本),尺寸(1-大型、2-中型、3-小型),类型(1-家庭、2-运动、3-工作),拥有(1-自有、2-租赁)性别(1-男、2-女),收入来源(1-1份工资来源、2-2份工资来源),婚姻状况(1-已婚、2-已婚有孩子、3-单身、4-单身有孩子);
从数据集看,我们有7个定类变量,如果组合成简单的交叉表是困难的事情,此时采用多重对应分析是恰当的分析方法。
下面我还是采用SPSS18.0,现在叫PASW Statistics 18.0来操作!注意:不同版本在多重对应分析方法有一些不同,但大家基本上可以看出了,高版本只能是更好,但选择会复杂和不同!
在进行多重对应分析之前,研究者应该能够记住各个变量大致有多少类别,个别变量如果变量取值太偏或异常值出现,都会影响对应分析的结果和对应图分析!
在SPSS分析菜单下选择降维(Data Redaction-数据消减)后选择最优尺度算法,该选项下,根据数据集和数据测量尺度不同有
三种不同的高级定类分析算法,主要包括:多重对应分析、分类(非线性)主成分分析、非线性典型相关分析;注意:随着版本的增高,研究人员在统计分析时就要各位主要变量的测量尺度,并且最好在进行数据清理和分析前,明确定义好测量尺度;当然也要做好Lable工作!
接下来,我们就可以选择变量和条件了!
大家可以把要分析的变量都放到分析变量内,补充变量的含义是如果有哪个变量你并不想作为对应分析的变量,而只是作为附属变量表现在对应图上可以加入!这一点其实在简单对应分析也有这种定义。
(我们将在专门的简单对应分析方法中再讲!)
然后我们要选择“变量”选项,大家可以选择类别图:每一个变量的分类图,重点是选择联合类别图,我们把7个变量全部放入,执行!(其它选项大家可以测试,我还有一些没有搞清楚)
下面我们看结果:
从图中我们可以看出:美国车都比较大,家庭型,主要购买者是已婚带孩子的;日本和欧洲车主要是小型、运动的和已婚没有孩子的人购买;特别注意:单身和单身带孩子的往往是租赁汽车,收入单一来源,但这个地区没有车满足这个市场,或许是市场空白;
具体的解读大家可以根据自己的研究设计和假设去寻找答案!
主要统计指标可以看:
上图主要给我们了对应图维度的解释比率,最下面的图大家会看吗?
提示:夹角是锐角意味着相关,所以:定类变量的相关性是不是可以解释啦!总结:(同样适合简单对应分析)
对应分析的优点:
•定性变量划分的类别越多,这种方法的优势越明显。
•揭示行变量类别间与列变量类别间的联系。
•将类别联系直观地表现在二维图形中(对应图)。
•可以将名义变量或次序变量转变为间距变量。
对应分析的缺点:
•不能用于相关关系的假设检验。
•维度要由研究者决定。
•有时候对应图解释比较困难。
•对极端值比较敏感。