关于使用spss软件制作完全随机分组数据处理的图文演示
- 格式:ppt
- 大小:671.50 KB
- 文档页数:20
[ 产品运营] 产品运营数据分析——SPSS数据分组案例2015-3-13 14:44| 发布者: 猫儿来自: 36大数据| 关键词:产品运营当我们的样本量过大,譬如以前讲过的,EXCEL2010最大只支持1048576行、16384列,尤其是当行数大于30万,一般的办公电脑处理都比较吃力,所以推荐做大数据量处理,还是用SPSS。
今天继续分享SPSS的数据分组,在SPSS里面,这个功能路径是:【转化——重新编码为相同变量】、【转化——重新编码为不同变量】,常用的是第二个,不会覆盖原有的变量数据。
第一步,数据录入继续沿用之前的EXCEL数据文档,把数据拷贝到SPSS软件,设定好变量名称,如下图:数据视图:变量视图这里注意将【PV】这个变量定义为【数值型】,选择了【逗号】表示用千分位区分;第二步,进入编码功能这里选择【页面PV】,点击红圈中的箭头,选入右边的变量框;第四步,定义输出变量这里定义的新变量名是【PV_G】,标签是【PV分组】;第五步,设定旧值和新值入口是上图中的【旧值和新值】,进入后,看到下面的界面,左右两大部分,左边是原有的旧值设定,右边是编码后产生的新值;开始编码,编码标准,按照昨天的分类,如下图:指定旧值范围第一组,是0-10万,大于等于0,小于10万,因此,旧值部分是:从最小值到99999;注意这里的输出变量名称是【0-10万】,下面有个勾选【输出变量为字符串】,并指定宽度,默认是8,我们定义为12,为何不是8,后面看下结果,就知道了。
定义好之后,点击【添加】,旧值和新值就定义好了,依次定义各个分组的数值。
最后一组,我们通常定义为【范围,从值到最高】,不至于遗漏数据,正如第一组,我们会定义为【范围,从最低值】。
定义好旧值新值,点击【继续】,返回设定页面,这时候,【确定】按钮激活,点击后,编码完成。
第六步,编码完成如图,数据分组后的界面,注意这里有两个分组变量,第一个是【PV_G】,这是字符串宽度为8的时候,第二个是【PV_GROUP】,字符串是宽度为12,区别和原因,大家自己想想就明白。
SPSS操作图解系列量表编制中的SPSS应用二、先对问卷中的反向题进行处理对话框三、计算量表的总分菜单选择对话框结果四、进行项目分析(一)题总相关的计算:使用皮尔逊积差相关(一般要求达0.4以上)(二)菜单选择对话框(二)计算题项区分度:使用高低分组T检验(独立样本),假设检验要达到显著水平!1、进行高低分组(1)对记录进行排序,找到高低分组的临界分数点。
(一般为27%或者33%)菜单选择结果(2)产生一个新的分组变量菜单选择对话框结果(3)独立样本T检验菜单选择对话框结果五、因素分析,构建量表结构效度!菜单选择对话框结果KMO和球形检验的结果表明原始数据适合进行因素分析!考虑到第五个因素中只有两个题项,因此可以删除这两个题项,并进行第二次的因素分析。
直到结果满意为止。
此处操作略~~另:因素分析仅仅为手段,重要的是要根据一定的理论进行因素命名。
只有命名的结果和一定的理论相符,我们才可以认为该量表具有良好的结构效度!五、信度分析:使用内部一致性系数(克隆巴赫)菜单选择对话框结果SPSS操作图解系列SPSS程序的基本操作流程一、数据定义(data definition)使计算机能够正确的辨认量化的数据,并对于数据赋予正确的意义。
变量名称指定(变量标签)、变量数值的标签、变量的格式类型、遗漏值的设定。
数据定义必需与编码表配合,将适当的变量名称与数据的意义加以标注,并设定适当的遗漏值,方能使后续的数据处理与分析能够正确有效的进行。
二、数据转换(data transformation)进行数据分析前的一些校正与转换的工作反向题的反向计分,出生年月变量转变成年龄的新变量的创造。
废卷处理、数据备份、遗漏值的补漏检查等作业,也是在此一阶段进行。
SPSS软件提供的观察值选择、重新编码或四则运算等指令,都能协助转换工作的进行。
一旦转换完成后,此一数据库已可称为干净的(clean and clear)的数据。
观察值的选择:四则混合运算(创造出新的变量)重新编码:在原来变量基础上直接替换数值(反向题的记分转换)三、资料分析(data analysis)依操作者的指令,进行各种的统计分析或统计图表的制作。
上机操作3:随机区组试验设计的spss 分析习题氮肥和磷肥对葡萄产量的影响试验,采用随机区组试验。
氮肥三个水平:对照,不施肥,每株施尿素1公斤,每株施尿素2公斤;磷肥三个水平:不施肥,每株过磷酸钙2.5公斤,每株过磷酸钙5公斤。
重复4次〔4个区组〕,试分析氮肥、磷肥和氮肥磷肥对葡萄产量的影响葡萄施肥实验结果解:1.假设H 01:施氮肥对葡萄产量无显著的影响;H A1:施氮肥对葡萄产量有显著的影响;H O2:施磷肥对葡萄产量无显著的影响;H A2:施磷肥对葡萄产量有显著的影响;H O3:施氮肥磷肥对葡萄产量无显著的影响。
H A3:施氮肥磷肥对葡萄产量有显著的影响。
2.定义变量,输入数据:在变量视图中写入变量名称“产量〞、“区组〞、“N 〞“P 〞“NP 〞,宽度均为8,小数均为0。
并在数据视图依次输入变量。
“a 1b 1”“a 1b 2”“a 1b 3”“a 2b 1”“a 2b 2”“a 2b 3”“a 3b 1”“a 3b 2”“a 3b 3”分别用“1”“2”“3”“4”“5”“6”“7”“8”“9”表示。
3.分析过程: 〔1〕正态分布检验:工具栏“图形〞——“P-P 图〞,在“变量〞中放入“产量〞,“检验分布〞为“正态〞,“确定〞。
〔2〕方差齐性检验:a.工具栏“分析〞——“比较均值〞——“单因素ANOVA 〞。
b.在“因变量〞中放入“产量〞,在“固定因子〞中分别放入“N 〞和“P 〞。
c.点击“选项〞,在“统计量〞中点击“方差同质性检验〞,“继续〞。
d.“确定〞。
e. 在“因变量〞中放入“产量〞,在“固定因子〞中放入“NP 〞。
f.点击“选项〞,在“统计量〞中点击“方差同质性检验〞何“描述性检验〞,“继续〞。
g.“确定〞。
〔3〕显著性差异检验:a.工具栏“分析〞——“常规线性模型〞——“单变量〞。
b.在“因变量〞中放入“产量〞,在“固定因子〞中分别放入“N〞和“P〞。
c.点击“模型〞,“定制〞,将“区组〞〞“N〞“P〞放入“模型〞下。
SPSS中利用Descriptives及Split file过程实现数据的分组标准化作者:yhsun在对复杂社会经济现象进行定量分析时,为消除不同变量之间量纲不同的影响,往往需要事先对数据进行标准化处理。
在SPSS系统中,数据标准化处理过程是被“隐藏”在【Descriptives】对话窗口中的,如果计算组内标准化值,还需要事先利用Split file过程对数据集进行分组。
下面笔者结合自己进行基础数据整理的体会,以住宅成交均价数据为例,具体介绍利用SPSS软件实现数据的标准化和分组标准化的方法。
1.数据标准化过程的实现首先打开【Descriptives】对话窗口,把PRICE(成交均价)变量移至“variable(s)”框中,然后选中“save standardized values as variables”,再点击“OK”按钮。
程序执行后,除了在输出窗口中会显示变量price的简单描述统计外,在数据集中还会生成一列新变量zprice,该变量即为标准化后的成交均价(见图2中最后一列)。
图12.数据分组标准化过程的实现其实在上例中,由于不同小区、不同建筑类别等的住宅,成交均价可能会差别很大,所以直接按照上述方法计算标准化值实有不妥。
比如,在图2所显示的百年汇小区中,成交均价为10652元的观测,其标准化值达到3.19614,如果按照判断异常值的一般标准--3σ准则,该观测应该作为异常值加以剔除。
但通过仔细比较发现,相对于其他小区,百年汇的住宅价格水平普遍偏高,均价10652元与该小区其他住宅价格相比,并没有特别突出之处。
因此,计算住宅交易价格的标准化值时,比较科学的处理方法是,先按照小区、建筑类别等进行交叉分组,然后再以组为单位逐一计算每组住宅交易价格的标准化值。
SPSS中,对变量进行分组标准化,需要综合运用split file和Descriptives过程来实现。
首先,打开菜单【Data】下的子菜单【Split File】对话框,选中“organize output by groups”,然后再把XQMC(小区名称)和FWLB(房屋类别)两个变量选进“groups based on:”框中,点击“OK”按钮,即实现了把数据按照小区名称和房屋类别的交叉分组,如图3所示。
利用SPSS进行随机化实验设计分组
林汉生;夏苏建
【期刊名称】《中国卫生统计》
【年(卷),期】2005(22)6
【摘要】随机化(randomization)分组是指将受试对象按照随机的原则进行分组,是实验设计中保证非处理因素均衡的一个重要手段。
只有通过随机分组,才能避免出现各种人为的客观因素和主观因素的偏性,提高统计检验效能。
随机化分组也是统计检验假设用于推论因果关系的基础。
然而,目前医学统计教科书一般只介绍用随机数字表或随机排列表进行分组。
随着计算机的广泛运用,医学科研人员对SPSS统计软件的使用不断增加。
为充分发挥统计软件的作用,本文介绍SPSS编程在随机分组中的应用。
【总页数】2页(P397-398)
【作者】林汉生;夏苏建
【作者单位】广州暨南大学医学院卫生统计教研室,510632;广州暨南大学医学院卫生统计教研室,510632
【正文语种】中文
【中图分类】TP3;C8
【相关文献】
1.运用Excel"随机数发生器"进行随机化分组
2.鱼类养殖实验设计中个体随机化分组的简单方法
3.利用SPSS软件对干法脱硫灰进行主成分分析评价
4.利用社科统计
软件包(SPSS)进行生物统计学教学改革及其实践效果5.利用社科统计软件包(SPSS)进行生物统计学教学改革及其实践效果
因版权原因,仅展示原文概要,查看原文内容请购买。