多维尺度分析-SPSS例析复习过程
- 格式:docx
- 大小:1.46 MB
- 文档页数:26
SPSS数据分析—多维尺度分析在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大。
而我们的分析目的也是想查看这些对象间的差异性或相似性情况,此时由于数据的组成形式不一样,因此不能使用对应分析,而需要使用一种专门分析此问题的方法——多维尺度分析(MDS模型)。
多维尺度分析和对应分析类似,也是通过可视化的图形阐述结果,并且也是一种描述性、探索性数据分析方法。
基于以上,我们可以得知,多维尺度分析经常使用在市场研究中:① 可以确定空间的维数(变量、指标),以反映消费者对不同品牌的认知,并且在由这些维构筑的空间中,标明某关注品牌和消费者心目中理想品牌的位置,选择的品牌不宜过少也不宜过多,一般7-9个。
② 可以比较消费者和非消费者对企业形象的感觉。
③ 在进行市场细分时,可以在同一空间对品牌和消费者定位,然后把具有相似感觉的消费者分组、归类。
④ 在新产品开发方面,通过在空间图上寻找间隙,可以发现由这些间隙为企业带来的潜在契机。
⑤ 在广告效果的评估方面,可以用空间图去判定一个广告是否成功地实现了期望的品牌定位。
⑥在价格策略方面,通过比较加入与不加入价格轴的空间图,可以推断价格的影响强度。
⑦ 在分销渠道策略方面,利用空间图可以判断品牌对不同零售渠道的适应性,从而为制定有效的分销渠道提供依据。
在市场研究中,我们要注意的是选择的品牌数量要适中,并且分析的问题要明确,每组数据只能分析一个问题,比如对一组饮料产品收集的数据不能既反映口感又反映价格。
多维尺度分析收集的数据值大小必须能够反应两个研究对象的相似性或差异性程度。
这种数据叫做邻近数据,所有研究对象的邻近数据可以用一个邻近矩阵表示。
反映邻近的测量方式有:相似性-数值越大对应着研究对象越相似。
差异性-数值越大对应着研究对象越不相似。
测量邻近性数据的类型有:①两个地点(位置)之间的实际距离。
多元统计分析SPSS操作步骤方差分析:Analyze—general linear model—univariate1、结果选入dependent variable,自变量选入fixed factors2、Options(display:descriptive statistics)主成分分析:Analyze→Dataredution---factor1、自变量:放入Variables2、Descriprives: (statistics默认)(correlation matrix:coefficients,KMO,)3、Extiaction :( method默认)(analyze:correlation)(display:全选)(extract:默认)4、Rotation:(method:none) (display:loading plot)5、Scores:(save as variables)(Display factor)因子分析Analyze→Dataredution---factor6、自变量:放入Variables7、Descriprives: (statistics默认)(correlation matrix:coefficients,KMO,anti-image)8、Extiaction :( method默认)(analyze:correlation)(display:全选)(extract:默认)9、Rotation:(method:quartimax) (display:rotated solution)10、Scores:(save as variables)(Display factor)11、Options:(默认)Logistic回归加权处理:data-weight cases-频数放入FVAnalyze—regression—binary logistic (二分类)1、因变量(y)放入dependent;自变量放入covariates;metord:forward(一般forward wald)2、Save:(predictde values:probabilities)3、Options:(statistics and plots: Hosmer;CI for exp(B))生存分析之life tables加权Analyze—survival—life table(未完成)1、生存时间选入time,Display time intervals:0 through(?)by(?),结局进入Status框,Define失效事件,变量进入Factor框,点击Define Range...钮,定义分组的范围,在Mininum 框中输入小的,在Maxinum框中输入大的2、 Options.(Plot:Survival)(Compare Levels of First Factor:Overall)生存分析之kaplan-meireAnalyze—survival—kaplan-meire1、生存时间选入time,结局入status,define 失效事件,2、Compare factor:(log rank)3、Save:(survival,standard)4、Options:(statistics:survival table;mean and median survival),(plot:survival)生存分析之COX生存时间处理transform—computeAnalyze—survival—cox1、生存时间入time,结局入status,define 失效事件,自变量选入covariaes,strate:对子数2、Plots(plot type:survival)3、Save(survival:function,standard error)4、Options(model statistics:CI for exp(B))。
第十三章数据的多维尺度分析1.形象测定比较组织的支持者与非支持者对组织形象的感知,并与组织自身的初衷相对照比较,如企业、社会机构、政府部门形象测定等。
2.细分对象分析不同对象在相同维度空间上的位置,确定他(它)们在感知方面相对同质的群体。
3.寻找业务空间图上的空档通常意味着潜在机会。
通过空间图的分析,可以对现有业务进行评估,了解人们对新业务概念的感觉和偏好,以便找到新业务并为其准确定位。
4.确定态度量表的结构可以用来确定态度空间的合适维度和结构。
在考虑产品研发和形象设计时,可通过调查获取描述自身产品与竞争对手产品的感知相似性数据,将这些近似性与自变量(如价格)相对接,可尝试确定哪些变量对于人们如何看待这些产品至关重要,从而对产品形象做出相应的调整。
第三节多维尺度分析结果解读 本节阐述导入问题用SPSS的ALSCAL、PROXSCAL方法分析后所得结果的解读。
一、ALSCAL的结果解读与分析第一节各选项设置完毕后,单击图13-3中的“确定”按钮,即得到ALSCAL的各项输出结果。
包括表13-3的文本及图13-16、图13-17、图13-18、图13-19。
表13-3由以下三部分构成。
第一部分说明降为二维空间时的迭代进程,经过4次迭代后,S-stress改变量为0.000 62,小于0.001的迭代标准,模型迭代停止。
第二部分说明模型的拟合效果,RSQ是不相似性在二维空间中能够解释部分占总变异的比例,而Stress是依据Kruskal’s应力公式1计算所得,显示了每个个体和样本整体的应力值,样本的应力平均值为0.398 94>0.2,且RSQ=0.376 64,表示用二维空间只能解释10个消费者评价饮料差异性的37.7%,模型拟合效果较差。
第三部分输出模型结果。
(1)10种品牌的饮料投影到二维空间上的坐标值,绘制在二维坐标系下的散点如图13-16所示。
它是评价对象(客体)在二维空间的直观呈现。
SPSS分析:多维尺度分析⼀、概念多维尺度尝试寻找对象间或个案间⼀组距离测量的结构。
该任务是通过将观察值分配到概念空间(通常为⼆维或三维)中的特定位置实现的,这样使空间中的点之间的距离尽可能与给定的不相似性相匹配。
在很多情况下,这个概念空间的维度可以解释并可以⽤来进⼀步分析数据。
多维尺度分析(MDS)是分析研究对象的相似性或差异性的⼀种多元统计分析⽅法。
采⽤MDS可以创建多维空间感知图,图中的点(对象)的距离反应了它们的相似性或差异性(不相似性)。
多维尺度分析和因⼦分析都是维度缩减技术,但是因⼦分析⼀般使⽤相关系数进⾏分析,使⽤的是相似性矩阵;⽽多维尺度分析采⽤的是不相似的评分数据或者说相异性数据来进⾏分析;与因⼦分析不同,多维尺度分析中维度或因素的含义不是分析的中⼼,各数据点在空间中的位置才是分析解释的核⼼内容;多维尺度分析与聚类分析也有相似之处,两者都可以检验样品或者变量之间的近似性或距离,但聚类分析中样品通常是按质分组的;多维尺度不是将分组或聚类作为最终结果,⽽是以⼀个多维尺度图作为最终结果,⽐较直观。
若你的⽬的是要把⼀组变量缩减成⼏个因素来代表,可考虑使⽤因素分析;若⽬的是变量缩减后以呈现在空间图上,则可以使⽤多维尺度分析。
如果你是想要却仍相似观测值得组别,请考虑以聚类分析来补充多维尺度分析,聚类分析虽可以确认组别,但⽆法在空间图中标⽰出观测。
⼆、距离(分析-度量-多维尺度)1、指定数据为距离数据:如果您的活动数据集代表⼀组对象中的距离或者代表两组对象之间的距离,则指定数据矩阵的形状才能得到正确的结果。
2、指定从数据创建距离:多维尺度使⽤不相似性数据创建尺度分析解。
如果您的数据为多变量数据(度量到的变量的值),就必须创建不相似性数据才能计算多维尺度解。
可以指定从数据创建⾮相似性测量的详细信息。
2.1度量。
允许您指定进⾏分析的⾮相似性测量。
从与您的数据类型相关的“度量”组选择⼀个选项,然后从与那⼀类度量相关的下拉列表选择⼀种度量。
多维尺度分析多维尺度分析(multid imens ional scalin g ,MD S)又称ALSCA LE(alterna tiv e l east-s qu are SCALing),还有人称之为多维量表分析;它是将一组个体间的相异数据经过MDS 转换成空间构图,且保留原始数据的相对关系. 1多维尺度分析的目的假设给你一张中国台湾省地图,要你算出基隆,台北,新竹,台中,台南,嘉义,高雄,花莲,台东,枋寮,苏澳,恒春等地间的距离,你可以用一把刻度尺根据比例测算出一个12x12de 距离矩阵;反之,如果给你一份12个城市间的距离矩阵,要你画出12个城市相对位置的二维台湾地图,且要他们与现实尽量保持一致,那就是一件不容易的工作了,多为尺度分析就为此工作提供了一个有效地分析手段。
2多为尺度分析与因子分析和聚类分析的异同多为尺度分析和因子分析都是维度缩减技术,但是因子分析一般使用相关系数进行分析,使用的是相似性矩阵;而多为尺度分析采用的是不相似的评分数据或者说相异性数据来进行分析;与因子分析不同,多为尺度分析中维度或因素的含义不是分析的中心,各数据点在空间中的位置才是分析解释的核心内容;多为尺度分析与聚类分析也有相似之处,两者都可以检验样品或者变量之间的近似性或距离,但聚类分析中样品通常是按质分组的;多维分析不是将分组或聚类作为最终结果,而是以一个多维尺度图作为最终结果,比较直观。
若你的目的是要把一组变量缩减成几个因素来代表,可考虑使用因素分析;若目的是变量缩减后以呈现在空间图上,则可以使用MDS.如果你是想要却仍相似观测值得组别,请考虑以聚类分析来补充多为尺度分析,聚类分析虽可以确认组别,但无法在空间图中标示出观测. 3。
定性的和定量的MDSM DS 分析测量的尺度不可以是nominal 的,但可以是顺序的ordin al,等距的i nterval,比率的ra tio 。
顺序量表只可以用于质的分析,又称为定性多维量表分析;它以个体间距离排序为主;而interv al 和ra tio量表称为定量多维量表分析(定量多维尺度分析)。
多维尺度分析-S P S S例析多维尺度分析多维尺度分析(multidimensional scaling ,MDS)又称ALSCALE(alternative least-square SCALing),还有人称之为多维量表分析;它是将一组个体间的相异数据经过MDS转换成空间构图,且保留原始数据的相对关系。
1多维尺度分析的目的假设给你一张中国台湾省地图,要你算出基隆,台北,新竹,台中,台南,嘉义,高雄,花莲,台东,枋寮,苏澳,恒春等地间的距离,你可以用一把刻度尺根据比例测算出一个12x12de 距离矩阵;反之,如果给你一份12个城市间的距离矩阵,要你画出12个城市相对位置的二维台湾地图,且要他们与现实尽量保持一致,那就是一件不容易的工作了,多为尺度分析就为此工作提供了一个有效地分析手段。
2多为尺度分析与因子分析和聚类分析的异同多为尺度分析和因子分析都是维度缩减技术,但是因子分析一般使用相关系数进行分析,使用的是相似性矩阵;而多为尺度分析采用的是不相似的评分数据或者说相异性数据来进行分析;与因子分析不同,多为尺度分析中维度或因素的含义不是分析的中心,各数据点在空间中的位置才是分析解释的核心内容;多为尺度分析与聚类分析也有相似之处,两者都可以检验样品或者变量之间的近似性或距离,但聚类分析中样品通常是按质分组的;多维分析不是将分组或聚类作为最终结果,而是以一个多维尺度图作为最终结果,比较直观。
若你的目的是要把一组变量缩减成几个因素来代表,可考虑使用因素分析;若目的是变量缩减后以呈现在空间图上,则可以使用MDS。
如果你是想要却仍相似观测值得组别,请考虑以聚类分析来补充多为尺度分析,聚类分析虽可以确认组别,但无法在空间图中标示出观测。
3.定性的和定量的MDSMDS分析测量的尺度不可以是nominal的,但可以是顺序的ordinal,等距的interval,比率的ratio。
顺序量表只可以用于质的分析,又称为定性多维量表分析;它以个体间距离排序为主;而interval和ratio量表称为定量多维量表分析(定量多维尺度分析)。
定性的多维量表分析是目前比较常用的MDS法,因为他可以使用使用量表要求比较宽的顺序量表,但可以得到量表比较严的数值空间图,也就是说,输入的是分类数据,输出的是数值结果。
4.MDS分析的各种类型定性MDS分析------------------------------------------------------------------------------------例1定量MDS分析------------------------------------------------------------------------------------例2不对称方阵MDS分析--------------------------------------------------------------------------例3从数据中创建距离对称矩阵MDS-----------------------------------------------------------例4个体差异模型MDS------------------------------------------------------------------------------例65多维量表分析的运算原理对定量MDS 而言,输入的距离矩阵()rs n n D d ⨯=是欧氏距离,如果能在某个P 维空间上找到坐标点,是其点间的距离2'()()rsr s r s d x x x x =--所形成的矩阵刚好等于D,即可求得MDS 的最佳解。
其求解是一个迭代过程,不在此细述。
6.拟合度的测量-------Stress拟合的好坏的指标称为压力系数(stress 应力),系数越小拟合越好;所绘图与原数据拟合越好。
假设N 个个体,将有(1)/2m n n =⨯-对两两间距,大小排序从大到小假设如下1122.............m m i k i k i k d d d >>>若在q 维空间上画出一个结构图,令qik d 代表转换后i 和k 这一对个体间的距离,如果拟合效果好则排序应该是1122.............m m q q q i k i k i k d d d ≥≥≥,如果排序一致那么真正距离的大小就不是那么重要了。
Kruskal 提出了一个测量q 维空间结构图拟合度的指标,应力系数。
原始应力系数raw stress:2ˆ()()q q i k ik ikq d d φ<=-∑∑ 标准化应力系数222ˆ()()()()()q q i k ik ikq q i kiki kikd d q S q ddφ<<<-==∑∑∑∑∑∑ˆq q q ik ik ik ikd d when d d =→与排序一致时; ˆq q ik ik ikd when d d →以平均值代替与排序不一致时; Kruskal 解释应力系数0.2以上(不好,poor ),0.1还好fair,0.05好,0.025非常好,0.00perfect.还有两个拟合度指标分别为Young ’s S-stress 与RSQ 。
Young ’s S-stress 与应力系数一样越小越好,RSQ 越大越好;7. 如果变量的量纲差异极大,就应该考虑将他们标准化。
(MDS 可自动执行)例1:利用中国台湾省12个城市的飞行距离排序来进行多维尺度分析。
数据如下由于是对称矩阵所以只需要输入下三角即可。
Analyze-→scale--→multidimensional scaling选定—数据是距离数据。
Shape选择正对称,所以原始数据只需输入一角。
本体数据是顺序数据,所以选定ordinal。
另外其下方的untie tied observations (打开结观察值)选项用于改变对相同顺序值得处理,勾选此项时,MDS会强迫给予相同顺序者以不同顺序。
区间interval用于定量MDS。
比率亦是。
矩阵metrix:勾选此项时,矩阵里的各个数据可以相互比较,如整个矩阵中所有数据单位或者意义相同。
位数可自由选择,本例最大最小2,所以只选择了2维的输出结果。
组图group plots:必选项,输出我们需要的结果图。
数据矩阵:输出MDS原始和标准化后的数据矩阵。
模型和选项摘要:输出下方方框里的内容。
程序执行的结果如下:以上只是说明你干了什么事情。
迭代的次数,及应力系数值等拟合评价指标。
应力系数0.011效果还好,RSQ=0.99937,也认为效果不错。
各地区在二维空间图中坐标值。
标准化后的距离矩阵。
根据坐标绘制的二维空间图,可对比下面台湾地图,顺序一致,位置相似,拟合效果与现实比较匹配。
当然除了方向以外,将上图旋转后可得到比较理想的结果。
例2:美国9大城市飞行距离矩阵见下表,进行多为尺度分析。
注意我们在这里选择的是区间interval。
例3:某教师想给班级编制一个完美的座次表,为此,他要求每个学生与其他之间相互评分,1----非常喜欢,5-------非常不喜欢进行评分,你有多不喜欢他?______。
20个学生,每个对其他19个评分,得到如下数据:行代表评分者,列代表被评分着;不对自己评分。
得到一个不对称的距离矩阵,两人相互之间评分不一定一样;显然这是一个不相似矩阵。
本例得到的距离矩阵是不对称的,因此shape选择正不对称square asymmetrix。
选择row项选项,行中所有单元格可以彼此进行比较,(社会关系图就是这样,每行代表一个评分者)。
不同于metrix矩阵选项,要明白问什么这样,metrix不一定适合每个案例。
应力系数0.259,效果不好。
完成以社会关系的距离矩阵为数据的分析。
例4:如果在根据上题社会关系排座一学期后,该老师又决定按5次测验成绩排座位。
由于测试成绩不是不相似数据,而我们需要不相似数据矩阵才能计算;因此我们需要根据数据,计算20X20的不相似矩阵。
根据5次成绩计算彼此间的距离矩阵。
每一行相当于一个多维数据,可以计算欧式距离。
选择 ----》从数据建立距离----》度量测试数据是interval的,且量纲一样,不必要进行-→标准化处理;我们创建的是学生间的距离矩阵,根据数据格式可知,选择--→个案间选择数据矩阵,可以看到创建的学生间距离矩阵。
(下图为部分矩阵)此图为根据测试成绩建立距离矩阵进行分析得到的空间位置图。
供此老师参考排座。
例5:大学相似度。
为探讨中国大陆知名学校的相似度,以了解各大学在学生调查了X位同学,得到X份问卷,我们必须先对这X份调查数据进行平均,然后才能进行MDS分析;由于我们得到的是相似性数据,还需要转化为不相似性质的数据,转换方式例如:可以通过spss的conpute来计算,所有数据都减去10,那么,就转化为学校间的不相似行调查数据了。
MDS分析的是不相似性质的距离矩阵数据。
例6:个体差异模型一位老师让学生每天看一小时电视,看过如,ER 60Mminutes The Simpsons 和seinfeld等一些节目后,这位老师让5名学生对每个节目与其他节目彼此间差异进行打分。
对这5个对称的不相似矩阵进行分析,可以判断对每个节目的感知程度。