当前位置:文档之家› 社会统计学与SPSS软件应用考试重点(精)

社会统计学与SPSS软件应用考试重点(精)

《社会统计学与SPSS软件应用》考试重点

一、测量变项

P15-18页

二、第二章简化一个变项之分布

P39页;

P41-43;

集中趋势和离散趋势:P45-62;

三、第三章

P73-75;

四、第四章

Lambda系数、Gamma系数、回归系数和R系数(非常重要、Eta系数。

五、均值抽样分布的特征

P135;

六、间距估计的均值和百分率;

P139-144;

七、样本大小

P146-149;

八、第七章的第一和二节

否定域与显著度(P153-154;

单均值与均值差异(P160-173;

九、卡方检定

P179-182;

十、单因方差分析与F检定

P191-197;

十一、请大家一定要看《实验指导用书》,上述知识将会结合SPSS软件来考。不会考具体的操作,而是考应用和理解。

SPSS软件应用实例

The Research and Analysis of Xiao Mila School: International Business Major: International economy and trade class 1 Member: 李雪竹41002021 夏鸿曲41002022 黄丹妮41002062 丁桑妮41002064 鲜铤41002036 李凯41002002 梅琳41002003

Abstract Since the catering enterprises actively developed in china, our team chooses one of the catering restaurants, Xiao Mila, located in the Liu Lang bay, closed to the east gate of SWUFE. It looks crowded and not very comfortable for eating hot pot. However, it is still very popular and competitive outside the East Gate and has a lot of regular customers. We decided to find out reasons for this odd phenomenon. As it is a typical catering restaurant in that area, the research gives us in-depth knowledge of catering restaurant in college student living area. Our article uses systematic research towards the operating condition of Xiao Mila. Our aims are to understand the in dividual catering businesses? operating condition, and at the same time supplement economic research, respond to our national twelfth five-year development plan, provide guidance for other catering enterprises. The investigative manner of this article is through the issuance of the form of questionnaire survey to the crowd who ate in the Xiao Mila. After the investigation, we use the statistics we got to analyze the research questions. The methods of analysis are quantitative analysis and qualitative analysis, the Comparative Method Our conclusions of the reasons for Xiao Mila?s success are its unique flavor, locality, and low price and its awesome reputation among students; the shortages of this restaurant are its inefficient service and poor sanitation. Our team also gets the conclusion that different in gender groups have different attitude towards to Xiao Mila. This difference do not only indicate the difference in female?s and male?s thinking patterns, but also point out the way for Xiao Mila to attract customers of a certain gender. Then through discussion, we come up with a suggestion that it should overcome its shortages while holding on to its best position in flavor and price. Keywords Xiao Mila; College Students; Consumption; Analysis; SWOT 1. Introduction Along with the economy development and people's living standard improving, our tertiary industry especially catering industry is developing vigorously. Especially those young, good-tasted college students with appreciating ability,

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

张小山 《社会统计学与SPSS应用》课后答案

第二章 随机现象与基础概率 练习题: 1.从一副洗好的扑克牌(共52张,无大小王)中任意抽取3张,求以下事件的概率: (1) 三张K ; (2) 三张黑桃; (3) 一张黑桃、一张梅花和一张方块; (4) 至少有两张花色相同; (5) 至少一个K 。 解:(1)三张K 。 设:1A =“第一张为K ” 2A =“第二张为K ” 3A =“第三张为K ” 则()()()()123121312//P A A A P A P A A P A A A ==432525150 ??= 1 5525 若题目改为有回置地抽取三张,则答案为 ()123P A A A = 444525252?? 1 2197 = (2)三张黑桃。 设:1A =“第一张为黑桃” 2A =“第二张为黑桃” 3A =“第三张为黑桃” 则()()()()123121312//P A A A P A P A A P A A A == 131211525150??= 11 850 (3)一张黑桃、一张梅花和一张方块。 设:1A =“第一张为黑桃” 2A =“第二张为梅花” 3A =“第三张为方块” 则 ()()()()123121312//P A A A P A P A A P A A A == 131313 525150 ??=0.017

注意,上述结果只是一种排列顺序的结果,若考虑到符合题意的其他排列顺序,则最终的结果为:0.017×6=0.102 (4)至少有两张花色相同。 设:1A =“第一张为任意花色” 2A =“第二张的花色与第一张不同” 3A =“第三张的花色与第一、二张不同” 则()1P A = 5252=1 ()21/P A A =5213521--=39 51 312(/)P A A A =5226522--=26 50 () 123P A A A =1-123()P A A A =3926115150?? -?? ??? =0.602 (5)至少一个K 。 设:1A =第一张不为K 2A =第二张不为K 3A =第三张不为K 则()1P A = 52452- ()21 /P A A =51452- 312(/)P A A A =504 52 - () 123P A A A =1-123()P A A A =4847461525150?? -?? ??? =0.217 2.某地区3/10的婚姻以离婚而告终。问下面两种情况的概率各是多少: (1)某对新婚夫妇白头偕老,永不离异; (2)两对在集体婚礼上结婚的夫妻最终都离婚了。 解:(1)某对新婚夫妇白头偕老,永不离异。 ()1()P A P A =-=3 110 - =0.7 (2)两对在集体婚礼上结婚的夫妻最终都离婚了。 ()()()P AB P A P B == 33 1010 ?=0.09 3.某班级有45%的学生喜欢打羽毛球,80%学生喜欢打乒乓球;两种运动都喜欢的学生有30%。现从该班随机抽取一名学生,求以下事件的概率: (1)只喜欢打羽毛球; (2)至少喜欢以上一种运动;

spss作业15-17

CHAPTER 15 西北研究院蔡嘉驰131246 15.4 (i) What we choose is part of u t. Then gMIN t and u t are correlated, which causes OLS to be biased and inconsistent. (ii) I think it is uncorrelate because gGDP t controls for the overall performance of the U.S. economy. (iii) The change of U.S. minimum may someway change the state minimum and vice versa. If the state minimum is always the U.S. minimum, then gMIN t is exogenous in this equation and we would just use OLS. 15.7 (i) Because students that would do better anyway are also more likely to attend a choice school. (ii) Since u1 does not contain income, random assignment of grants within income class means that grant designation is not correlated with unobservables such as student ability, motivation, and family support. (iii) The reduced form is choice= π0 + π1faminc + π2grant + v2, and we need π2≠ 0. (iv) The reduced form for score is just a linear function of the exogenous variables: score= α0 + α1faminc + α2grant + v1. This equation allows us to directly estimate the effect of increasing the grant amount on the test score, holding family income fixed.So it is useful. C15.1 (i) The regression of log(wage) on sibs gives

统计分析软件SPSS详细教程

10.11统计分析软件&SPSS建立数据 目录 10.11统计分析软件&SPSS建立数据 (1) 10.25数据加工作图 (1) 11. 08绘图解答&描述性分析: (3) 2.描述性统计分析: (4) 四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7) 第七章非参数检验 (10) 1.单样本的非参数检验 (11) (1)卡方检验 (11) (2)二项分布检验 (12) 2.两独立样本的非参数检验 (13) 3.多独立样本的非参数检验 (16) 4.两相关样本的非参数检验 (16) 5.多相关样本的非参数检验 (18) 第五章均值检验与T检验 (20) 1.Means过程(均值检验)( (20) 4. 单样本T检验 (21) 5. 两独立样本T检验 (22) 6.两配对样本T检验 (23) 第六章方差分析 (25) 单因素方差分析: (25) 多因素方差分析: (29) 10.25数据加工作图 1.Excel中随机取值:=randbetween(55,99) 2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤: 3.排序:个案排秩

4.数据选取:数据-选择个案-如果条件满足: 计算新变量: 5.频次分析:分析-统计描述-频率

还原:个案-全部 6.加权: 还原 7.画图: 11. 08绘图解答&描述性分析:1.课后题:长条图

2.描述性统计分析: (1)频数分析:

(2)描述性分析: 描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。 操作: 分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态, (3)探索分析:(检验是否是正态分布:茎叶图、箱图) 实例:

张小山社会统计学与spss应用》课后答案

第二章随机现象与基础概率练习题: 1.从一副洗好的扑克牌(共52张,无大小王)中任意抽取3张,求以下事件的概率:(1)三张K; (2)三张黑桃; (3)一张黑桃、一张梅花和一张方块; 123121312525150850 (3)一张黑桃、一张梅花和一张方块。 A=“第一张为黑桃” 设: 1 A=“第二张为梅花” 2 A=“第三张为方块” 3

则 ()()()()123121312//P A A A P A P A A P A A A == 131313 525150 ??=0.017 注意,上述结果只是一种排列顺序的结果,若考虑到符合题意的其他排列顺序,则最终的结果为:0.017×6=0.102 (4)至少有两张花色相同。 设:1A =“第一张为任意花色” 2A =“第二张的花色与第一张不同” 3A =“第三张的花色与第一、二张不同” 2. ((2)两对在集体婚礼上结婚的夫妻最终都离婚了。 解:(1)某对新婚夫妇白头偕老,永不离异。 ()1()P A P A =-=3 110 - =0.7 (2)两对在集体婚礼上结婚的夫妻最终都离婚了。 ()()()P AB P A P B == 33 1010 ?=0.09 3.某班级有45%的学生喜欢打羽毛球,80%学生喜欢打乒乓球;两种运动都喜欢的学生有30%。现从该班随机抽取一名学生,求以下事件的概率:

(1)只喜欢打羽毛球; (2)至少喜欢以上一种运动; (3)只喜欢以上一种运动; (4)以上两种运动都不喜欢。 解: 设:A =“喜欢打羽毛球” B =“喜欢打乒乓球” (1)只喜欢打羽毛球: 4. ( ( 0.337= 5. 解:设: 6. 投掷5颗骰子,恰好获得4个面相同的概率是多少? 解:设: 445456C p q -?= 4511115 666666 C ??????=0.019 第四章 数据的组织与展示 练习题: 1.有240个贫困家庭接受调查,被问及对政府的廉租房政策是否满意,有180个家庭

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有 SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的 SAS 和 SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是 SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自 20 世纪 60 年代 SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的 SPSS for Windows 大同小异,在本试验课程中我们选择 PASW Statistics 作为统计分析应用试验活动的工具。 1. SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单易用。 (3)程序运行模式

这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握 SPSS 的语句或脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2. SPSS 的启动 (1)在 windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS for Windows”即可启动 SPSS 软件,进入 SPSS for Windows 对话框,如图,图所示。 图 SPSS 启动

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables — (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=,说明: A. 按照显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; 、 D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 % 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么 答:(1)、将数据输入SPSS,并保存; { (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data ) 14、指定数据按某个变量进行排序需要用到哪个菜单

SPSS操作实验作业1(附答案)

SPSS操作实验 (作业1) 作为华夏儿女都曾为有着五千年的文化历史而骄傲过,作为时代青年都曾为中国所饱受的欺压而愤慨过,因为我们多是炎黄子孙。然而,当代大学生对华夏文明究竟知道多少呢 某研究机构对大学电气、管理、电信、外语、人文几个学院的同学进行了调查,各个学院发放问卷数参照各个学院的人数比例,总共发放问卷250余份,回收有效问卷228份。调查问卷设置了调查大学生对传统文化了解程度的题目,如“佛教的来源是什么”、“儒家的思想核心是什么”、“《清明上河图》的作者是谁”等。调查问卷给出了每位调查者对传统文化了解程度的总得分,同时也列出了被调查者的性别、专业、年级等数据信息。请利用这些资料,分析以下问题。 问题一:分析大学生对中国传统文化的了解程度得分,并按了解程度对得分进行合理的分类。 问题二:研究获得文化来源对大学生了解传统文化的程度是否存在影响。 要求: 直接导出查看器文件为.doc后打印(导出后不得修改) 对分析结果进行说明,另附(手写、打印均可)。 于作业布置后,1周内上交 本次作业计入期末成绩

答案 问题一 操作过程 1.打开数据文件作业。同时单击数据浏览窗口的【变量视图】按钮,检查各个 变量的数据结构定义是否合理,是否需要修改调整。 2.选择菜单栏中的【分析】→【描述统计】→【频率】命令,弹出【频率】对 话框。在此对话框左侧的候选变量列表框中选择“X9”变量,将其添加至【变量】列表框中,表示它是进行频数分析的变量。 3.单击【统计量】按钮,在弹出的对话框的【割点相等组】文本框中键入数字 “5”,输出第20%、40%、60%和80%百分位数,即将数据按照题目要求分为等间隔的五类。接着,勾选【标准差】、【均值】等选项,表示输出了解程度得分的描述性统计量。再单击【继续】按钮,返回【频率】对话框。

社会统计学与spss应用练习题

应用练习题spss社会统计学与 2011—2012学年第二学期 《社会统计学与SPSS应用》练习题 一、单项选择题 1.只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与≠的数学属性,例如:性别,民族等变量,该类变量是(A) A.定类变量 B.定序变量 C.定距变量 D.定比变量 2.根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B)A.

B. C.

D. 左50%3.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这说明新生婴儿性别状况属于(D)。随机现象 D. A.非统计现象 B.统计现象 C.非随机现象左新生婴儿男女性别比一直在针对出生婴儿性别状况的多年调查发现,50%4.右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。这体现)。新生婴儿性别状况具有(D必然性 D.随机性 A.确定性 B.因果

性 C..为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少5 年、成年、中年、老年,那么,年龄划分违背了变量取值的原则。(B)差异D.整体C.互斥B.完备A. C)6.下列哪类变量能用折线图表示其分布状况?(虚拟变量定类变量 B.定序变量 C.定距变量 D.A. 。7.下列某变量取值状况的累积图,其中正确的表现形式是(B) .B A. .CD. 2相同,图1较之图2的密度曲线向左8.下两图是正态分布密度曲线,两图的σ移了一些,这说明(C)。

图图≥ D.μμ< C.μμ =μB.μμ>A.μ22112 112 2 1 )C(如下所示首先应该操作步骤的是对于多选项分析而言,软件中,SPSS 在.9. A. B.Freque

SPSS软件应用具体操作及结果分析

SPSS软件操作练习 参考书:《生物统计学》张勤主编(第2版) 一、均数差异显著性检验 (一)单个样本t测验 (二)独立样本测验(两个样本重组比较) (三)两个样本配对比较 二、方差分析 (一)单因素方差分析(样本量相等、样本量不等) 三、相关回归分析 相关分析:Analyze→Correlate→Bivariate(简单相关) 相关回归:Analyze→Regression→Linear 注意:Dependent:因变量y Independent:自变量x 四、卡方测验 (一)独立性:Date Weight→Cases→Frequency Variable(观察值)→ok Analyze→Descriptive Statistics→Crosstabs→Row(行)、Columns(列)→Statistics→Chi-Square (二)适合性测验:Date Weight→Cases→Frequency Variable(观察值)→ok Analyze→Nonparametric Tests→Chi-Squareic(注意比例的填写) 五、两因素方差分析 (一)两因素无重复值方差分析 (二)两因素有重复值方差分析 一、均数差异显著性检验 (一)单个样本t测验 P66 例5.1

One-Samp le Test -1.035 16 .316-1.00000 -3.0486 1.0486 Vit t df Sig. (2-tailed)Mean Dif f erence Lower Upper 95% Conf idence Interv al of the Dif f erence Test Value = 21 由结果可知:t=-1.035 sig=0.316>0.05 该批罐头的平均维生素C 与规定的21mg/g 无显著差异。 注:Sig.(2-tailed) 双侧检验概率 95% confidence.... 差值的95%置信下线和置信上线 (二)独立样本测验(两个样本重组比较) P70 例5.3

spss期末作业

吉林财经大学 《SPSS统计软件分析》作业(2010——2011学年第一学期) 学院信息学院 专业班级电子商务0806班 学生姓名王瑞霞 学号1403080616

1、对未分组资料频数分析 从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况,以该数据为例为例,进行频数分析。 首先输入数据: 选择Analyze中Descriptive Statistics——Frequencies,打开Frequencies对话框;将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标,选中所需要计算的指标: 单击Charts …按钮,选择需绘制的统计图: 单击OK按钮开始运行,运行结果为:

从上图中可以看出数据中缺失值为0,花生油的平均价格104.84是最高的,而巴氏牛奶的平均价格1.81最低,全部食品平均价格的平均数为16.5327,标准差为22.4668,各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标,其实质是一样的,从图中可以看出平均价格在0—22元之间的食品是最多的,20—40元之间的食品数次之,接下来是40—60元之间的食品,不存在平均价格在60—100之间的食品。 2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析: Transform —Recode—Into same V ariables ,将要分组的变量放入Numeric 栏中,单击Old and new V alues分组:

分组结果如下图所示: 回到数据编辑窗,定义变量的V alue labels : 再对食品平均价格进行频数分析,分析结果如下截图所示

SPSS软件应用第四讲

《SPSS软件应用》教案 ●复习一:数据库结构建立 ●复习二:数据合并 ●复习三:定距数据的分组 有两种方法:一是在transform下的visual bander(可视离散化)栏完成;一是在transform转换中的compute计算变量来完成。 由于Computer需要自己定义变量标签,Visual Bander直接选择显示变量标签,因此在分组的时候,通常采取Visual Bander来实现。 第四讲数据编码和计数 教学原因:由于录入好的数据,有时候并不能够直接用来分析,因此需要对变量进行重组或者称为转换,将数据重新编码、组合等; 教学目的:培养学生根据研究主题的需要,对变量数据进行转换。 教学内容:对数据进行重新编码和计数。 一、Recode的重新编码功能 功能:用于从原变量值按照某种对应关系生成新变量值,可以将新值赋给原变量,也可生成新变量。 如果是13.0,则实现路径:Transform——Recode——into the same variables(编码为相同变量)/into different variables(编码为不同变量);如果是16.0及以上,则直接是Transform——recode into different variable。我们一般要求重新编码为一个新变量,目的是为了保持原有变量数据。

[例题:对自己的受教育情况(a6.1)的变量值重新编码为高中低] 解释:原变量的取值是如下,因此,我们可以考虑将1-3设置为低教育程度,4-6设置为中等教育程度,7及以上设置为高等教育程度。 具体实现过程: 第一步,单击Transform——recode into different variables( SPSS 13.0使用)或Recode into different variable (重新编码为不同变量时,16.0及以上使用)时,出现下窗口: 第二步,将左边的变量(自己的受教育情况)选中,然后移入右边Input variable →output variable( 输入变量→输出变量) 空白栏中,具体如下图所示:

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级 姓名 学号 - 广 东 财 经 大 学 答 题 纸(格式二) 课程 数据处理技术与SPSS 20 15 -20 16 学年第 1 学期 成绩 评阅人 评语: ========================================== (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面,帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷,回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

SPSS期末大作业-完整版

第1题:基本统计分析1 分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。 1、基本思路: (1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。 (2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。 操作步骤: (1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。 存取款金额1 频率百分比有效百分比累积百分比 有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 (2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。

(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。 统计量 存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述: 频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。

spss应用

第二部分SPSS软件的应用指南 第一章数据文件 数据文件是统计分析的基础,它提供系统分析所需的数据。数据文件既可由SPSS系统数据文件编辑窗口产生,也可以以其他数据库文件或电子表格的数据文件转换生成。 第一节数据文件的建立命令 一、定义变量(Define Variable) 定义变量就是建立数据文件的结构,输入数据之前要定义变量。打开SPSS系统,进入SPSS的数据编辑窗口。在数据编辑窗口的左下方有两个工选择的按钮,分别是数据浏览和变量浏览。如图1~2: 图2 数据浏览和变量浏览 选定数据浏览(Data View),系统进入数据输入、编辑、修改状态;选定变量浏览(Variable View),系统进入变量定义、修改状态。 当选定变量浏览状态后,可看见在窗口上方有一行英文标记,即变量属性标记。

:变量名。在其下面的方格里输入变量名,英文、中文都可,系统默认值为V AR00001,如变量名都采取系统默认,则依次为V AR00002、V AR00003…。如不采用系统默认值。其变量名的命名有以下原则: ⑴变量名不能多于8个字符(一个汉字为两个字符); ⑵英文名,首字符必须是字母,其后可为除“?”、“!”、“*”的以外字符,不能以“-”、“.”作为变量名的最后一个字符; ⑶变量名不能与SPSS保留字相同。SPSS保留字有:ALL、AND、BY、EQ、GE、GT、LE、LT、NE、NOT、OR、TO、WTTH; ⑷变量名英文字母不区分大小写。 :变量类型。系统默认为数值型(Numeric)。如需重新定义,则点击,后面出现“…”,点击“…”,进入数据类型对话框,如图3 图中, :标准数值类型变量,默认长度为8位,小数位数2位。SPSS中多数变量都是数值型变量。 :带逗点的数值变量。从小数点向左右三位一小节,用逗点分节。 :带圆点的数值变量。从小数点向左右三位一小节,用圆点分节,小数点用逗点表示。 :科学计数法的数值变量。 :日期时间型变量。比较常用的是“mm/dd/yyyy”型,即月月/日日/年年年年,如08/15/2000表示2000年8月15日。 :带美元($)符号的变量。 :用户自定义型变量。可通过Edit Option Data实现。 :字符型变量。默认长度为8位。 :变量数据位数长度。默认为8位。 :变量数据的小数位数长度。默认为2位。 :变量标签。在此栏中可输入中、英文字符,用以对变量进行说明。例如:性别变量名用英文“sex”表示,则变量标签可用中文“性别”标识。变量标签的字符最多可达255个。 :变量数值标签。对某些用数值代码输入的数据,此项是对数值的说明。如:1表示

spss统计软件期末课程考试题

《SPSS统计软件》课程作业 要求:数据计算题要求注明选用的统计分析模块和输出结果;并解释结果的意义。完成后将作业电子稿发送至 1. 某单位对100名女生测定血清总蛋白含量,数据如下: 计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为95%的置信区间。 解: 描述 统计量标准误 血清总蛋白含量均值.39389 均值的95% 置信区间下限 上限 5% 修整均值 中值 方差

标准差 极小值 极大值 范围 四分位距 偏度.054.241 峰度.037.478 样本均值为:;中位数为:;方差为:;标准差为:;最大值为:;最小值为:;极差为:;偏度为:;峰度为:;均值的置信水平为95%的置信区间为:【,】。 2. 绘出习题1所给数据的直方图、盒形图和QQ图,并判断该数据是否服从正态分布。解:

正态性检验 Kolmogorov-Smirnov a Shapiro-Wilk 统计量 df Sig. 统计量 df Sig. 血清总蛋白含量 .073 100 .200* .990 100 .671 a. Lilliefors 显着水平修正 *. 这是真实显着水平的下限。 表中显示了正态性检验结果,包括统计量、自由度及显着性水平,以K-S 方法的自由度sig.=,明显大于,故应接受原假设,认为数据服从正态分布。 3. 正常男子血小板计数均值为9 22510/L , 今测得20名男性油漆工作者的血小板计数值(单位:9 10/L )如下: 220 188 162 230 145 160 238 188 247 113 126 245 164 231 256 183 190 158 224 175 问油漆工人的血小板计数与正常成年男子有无异常

相关主题
文本预览
相关文档 最新文档