社会统计学与spss应用练习题
- 格式:docx
- 大小:332.19 KB
- 文档页数:20
《统计分析与SPSS的应用》课后练习答案在学习《统计分析与 SPSS 的应用》这门课程后,通过课后练习能够帮助我们更好地掌握所学知识,并将其应用到实际的数据分析中。
以下是针对部分课后练习的答案及解析。
一、选择题1、在 SPSS 中,用于描述数据集中变量分布特征的统计量是()A 均值B 标准差C 中位数D 众数答案:ABCD解析:均值、标准差、中位数和众数都是描述数据分布特征的常用统计量。
均值反映了数据的集中趋势;标准差反映了数据的离散程度;中位数是将数据排序后位于中间位置的数值;众数则是数据集中出现次数最多的数值。
2、进行独立样本 t 检验时,需要满足的前提条件是()A 样本来自正态分布总体B 两样本方差相等C 两样本相互独立D 以上都是答案:D解析:独立样本 t 检验要求样本来自正态分布总体、两样本方差相等以及两样本相互独立。
只有在这些条件满足的情况下,t 检验的结果才是可靠的。
3、以下哪种方法适用于多组数据的比较()A 单因素方差分析B 配对样本 t 检验C 相关分析D 回归分析答案:A解析:单因素方差分析用于比较三个或三个以上组别的数据是否存在显著差异。
配对样本 t 检验适用于配对数据的比较;相关分析用于研究变量之间的线性关系;回归分析用于建立变量之间的预测模型。
二、简答题1、请简述 SPSS 中数据录入的基本步骤。
答:SPSS 中数据录入的基本步骤如下:(1)打开 SPSS 软件,选择“新建数据文件”。
(2)在变量视图中定义变量的名称、类型、宽度、小数位数等属性。
(3)切换到数据视图,按照定义好的变量逐行录入数据。
(4)录入完成后,保存数据文件。
2、解释相关分析和回归分析的区别。
答:相关分析主要用于研究两个或多个变量之间的线性关系程度和方向,但它并不确定变量之间的因果关系。
相关分析的结果通常用相关系数来表示,如皮尔逊相关系数。
回归分析则不仅可以确定变量之间的关系,还可以建立数学模型来预测因变量的值。
第二章 随机现象与基础概率练习题:1.从一副洗好的扑克牌(共52张,无大小王)中任意抽取3张,求以下事件的概率:(1) 三张K ; (2) 三张黑桃;(3) 一张黑桃、一张梅花和一张方块; (4) 至少有两张花色相同; (5) 至少一个K 。
解:(1)三张K 。
设:1A =“第一张为K ” 2A =“第二张为K ” 3A =“第三张为K ”则()()()()123121312//P A A A P A P A A P A A A ==432525150⨯⨯=15525若题目改为有回置地抽取三张,则答案为()123P A A A =444525252⨯⨯12197=(2)三张黑桃。
设:1A =“第一张为黑桃” 2A =“第二张为黑桃” 3A =“第三张为黑桃”则()()()()123121312//P A A A P A P A A P A A A ==131211525150⨯⨯=11850(3)一张黑桃、一张梅花和一张方块。
设:1A =“第一张为黑桃”2A =“第二张为梅花” 3A =“第三张为方块”则 ()()()()123121312//P A A A P A P A A P A A A ==131313525150⨯⨯=0.017 注意,上述结果只是一种排列顺序的结果,若考虑到符合题意的其他排列顺序,则最终的结果为:0.017×6=0.102(4)至少有两张花色相同。
设:1A =“第一张为任意花色”2A =“第二张的花色与第一张不同”3A =“第三张的花色与第一、二张不同”则()1P A =5252=1 ()21/P A A =5213521--=3951 312(/)P A A A =5226522--=2650()123P A A A =1-123()P A A A =3926115150⎛⎫-⨯⨯ ⎪⎝⎭=0.602(5)至少一个K 。
设:1A =第一张不为K2A =第二张不为K 3A =第三张不为K则()1P A =52452- ()21/P A A =51452- 312(/)P A A A =50452- ()123P A A A =1-123()P A A A =4847461525150⎛⎫-⨯⨯ ⎪⎝⎭=0.2172.某地区3/10的婚姻以离婚而告终。
2020级社会工作专业本科社会统计学与SPSS应用试卷( B )总分 2021 学年第一学期………………………………装……………………订…………………………线……………………一、名词解释(每题4分,共20分)1、非参数检验:2、样本比例的抽样分布:3、原假设:4、众值:5、方差分析:二、判断题(每题2分,共20分)1、在绘制统计表时,对于定序变量而言需要注意次序排列、变化趋势。
2、直方图与条形图形状相同,没有什么本质区别。
3、某个变量取值呈正态分布,它的众值、中位值重叠,与均值不重叠。
4、统计推论是根据局部资料(样本资料)对总体的特征进行推断。
5、总体分布为正态分布N(µ,σ2),且方差已知,随着样本容量n的增加,也不能减少样本均值抽样分布的分散程度。
6、若总体分布为正态分布,大样本均值的极限分布不是N(0,1)。
7、在区间估计中,显著性水平表示用置信区间估计不可靠的概率。
8、大样本二总体成数差的分布不服从正态分布。
9、两个定类变量之间相关性测量得到λ系数不具有减少误差比例性质。
10、下图所示的若为了测量集中趋势,需要在B项前□前打“√”。
三、计算题(每题20分,共60分)1、下列统计表反映是抽取两个社区部分居民受教育年限的统计分布状况:社区类别抽样数量(个)受教育年限分布状况(年)A 5 7、3、11、10、4B 6 6、5、5、8、10、8根据抽样数据,求出两个社区的平均受教育年限各是多少?相同吗?2、以下表中是5对子代和父代之间人际网络(好朋友数量)的抽样调查,求两者回归直线方程。
代际差别好朋友数量(个)父代 2 4 6 8 10子代 4 5 8 7 93、某大学为了了解本校学生每天上网的时间,在全校6000名学生中随机抽取了20名学生进行调查,得到下面的数据:(单位:小时)2.5 3 4 2 1.6 2.5 4 2 3 12.83.5 6 2 4 1 2 3.8 1 5(1)请计算这20学生每天上网的时间的平均数x和方差S。
(最新)社会统计学与spss应用练习题2010—2011学年第一学期《社会统计学与SPSS应用》练习题一、单项选择题1(只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有,与?的数学属性,例如:性别,民族等变量,该类变量是(A) A.定类变量 B.定序变量 C.定距变量 D.定比变量2(根据上题内容,在操作SPSS软件时,在Measure选项中选择正确的是(B) A.B.C.D.3(针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这说明新生婴儿性别状况属于(D)。
A.非统计现象B.统计现象C.非随机现象D.随机现象4(针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这体现新生婴儿性别状况具有(D)。
A.确定性B.因果性C.必然性D.随机性5(为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少年、成年、中年、老年,那么,年龄划分违背了变量取值的原则。
(B)A.完备B.互斥C.整体D.差异6(下列哪类变量能用折线图表示其分布状况,(C)A.定类变量B.定序变量C.定距变量D.虚拟变量7(下列某变量取值状况的累积图,其中正确的表现形式是(B)。
A( B(C( D(28(下两图是正态分布密度曲线,两图的σ相同,图1较之图2的密度曲线向左移了一些,这说明(C)。
图2 图1A.µ,µB.µ=µC.µ,µD.µ?µ 12 1212 129(在SPSS软件中,对于多选项分析而言,如下所示首先应该操作步骤的是(C)A. FrequenciesB. DescriptivesC. DefineVariables SetsD. Frequencies10(下图所示的若为了测量集中趋势,需要在哪个?前打“?”的是(B)。
南京大学社会学系《社会统计分析软件SPSS 》练习题1、文件age1990.txt 中列出了1990年江苏省人口普查时的分性别年龄人口数据,请计算出1990年“四普”时男性人口的平均年龄与年龄中位数。
(平均年龄∑∑≥≥⋅+=)5.0(i mi i mi PP i ,mi P 为i 岁男性人口数)。
2、文件age2000.xls 中列出了2000年江苏省人口普查时的分性别年龄人口数据,请计算出2000年“五普”时15-64岁人口(劳动年龄人口)的平均年龄与年龄中位数。
(平均年龄∑∑==⋅+=64156415)5.0(i ii iPPi ,i P 为i 岁人口数)3、已知240例心肌梗塞患者治疗后24小时内的死亡情况如表1所示,问两组病死率相差是否显著?(example1.sav )(显著性水平为5%)表1:急性心肌梗塞患者治疗后24小时生死情况4、已知数据如表2所示,比较单用甘磷酰芥(单纯化疗组)与复合使用光霉素、环磷酰胺等药(复合化疗组)对淋巴系统肿瘤的疗效,问两组患者的完全缓解率之间有无差别?(example2.sav)(显著性水平为5%)表2:两化疗组的缓解率比较5、已知数据如表3所示,问我国南北方鼻咽癌患者(按籍贯分)的病理组织学分类的构成比有无差别?(example3.sav)(显著性水平为5%)表3:我国南北方鼻咽癌患者病理组织学分类构成6、已知97名被调查儿童体检数据文件为child.sav,请分别计算男性、女性与两性合计的儿童的平均身高与体重、中位身高与体重以及身高与体重的标准差。
7、已知97名被调查儿童体检数据文件为child.sav,请问儿童的身高与体重是否分别受到性别与年龄的影响?(显著性水平为5%)8、文件example.sav中列出了某学校四个年级同学接受专业训练前后的铁饼成绩,问接受专业训练后同学们的铁饼成绩有无显著提高?(显著性水平为5%)9、文件example.sav中列出了某学校四个年级同学的外语与中文成绩,问男女生总成绩(英文+中文)之间有无显著差异?(显著性水平为5%)10、根据以往的资料,学生中文的平均成绩为80分。
社会统计与SPSS应用练习(二)1.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。
2.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之3.以下为两位评判员对10名参赛人名次的打分。
试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。
要求:(1)求回归方程;(2)这是正相关还是负相关;(3)求估计标准误差;(4)用积差法求相关系数。
6.某10户家庭样本具有下列收入(元)和食品支出(元/周)数据:2)在95.46%把握下,当X=45时,写出Y的预测区间。
社会统计与SPSS 应用练习(二)参考答案1.已知十名学生身高和体重资料如下表,(1)根据下述资料算出身高和体重的皮尔逊相关系数和斯皮尔曼相关系数;(2)根据下述资料求出两变量之间的回归方程(设身高为自变量,体重为因变量)。
皮尔逊相关系数与回归方程n xy x y r 0.89-==22n xy x y b 0.659n x (x)y x a=b 54.479n ny=a+bx=-54.479+0.659x-==--=-∑∑∑∑∑∑∑斯皮尔曼相关系数2s 26d r 1-0.94n(n -1)==∑2.以下是婚姻美满与文化程度的抽样调查的结果,请计算婚姻美满与文化程度之s n =9×(30+18+4+7)+16×(18+7)+8×(4+7)+30×7=1229 d n =5×(30+8+3+4)+18×(3+4)+16×(8+3)+30×3=617[]s dc 2n n 1n (m 1)/m 2τ-==-0.183.以下为两位评判员对10名参赛人名次的打分。
试用斯皮尔曼等级相关系数来描述两评判员打分的接近程度。
2s 26d r 1-0.95n(n -1)==∑4.某原始资料为:22n xy x y r 0.95n xy x y b 0.267n x (x)y x a=b 11.477n ny=a+bx=-11.477+0.267x-==-==--=-∑∑∑∑∑∑∑22n xy x yb 0.782n x (x)y x a=b 22.014n ny=a+bx=22.014+0.782x-==--=∑∑∑∑∑∑∑要求:1)写出最小平方法计算的回归直线方程;2)在95.46%把握下,当X =45时,写出Y 的预测区间。
2011 — 2012学年第二学期《社会统计学与SPSS 应用》练习题、单项选择题1. 只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与 工的数学属性,例如:性别,民族等变量,该类变量是( A ) A.定类变量 B.定序变量C.定距变量D.定比变量2. 根据上题内容,在操作 SPSS 软件时,在Measure 选项中选择正确的是(B )File 划i Vie^ Dei Tr?insf ( Analy Grapl Lltilth Add gHel7Fik Edi 址im Dart Iransft Analy Grapl Utilith Add-o Windc Hel& H S & B?D科a View V 4riable ViewSPSS Processor is ready■vData ViewA.B.C.D.3. 针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这说明新生婴儿性别状况属于(D )。
A.非统计现象B.统计现象C.非随机现象D.随机现象4. 针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在50%左右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这体现新生婴儿性别状况具有(D )。
A.确定性B.因果性C.必然性D.随机性5. 为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少年、成年、中年、老年,那么,年龄划分违背了变量取值的________ 原则。
(B)A.完备B.互斥C.整体D.差异6•下列哪类变量能用折线图表示其分布状况? ( C ) A.定类变量 B.定序变量 C.定距变量D.虚拟变量7 •下列某变量取值状况的累积图,其中正确的表现形式是(B )9.在SPSS 软件中,对于多选项分析而言,如下所示首先应该操作步骤的是(C )8.下两图是正态分布密度曲线,两图的移了一些,这说明(C )。
统计学基于spss期末考试题库及答案统计学基于SPSS期末考试题库及答案一、选择题(每题2分,共20分)1. 在SPSS中,数据视图和变量视图分别对应于:A. 表格和图表B. 表格和变量C. 变量和表格D. 图表和变量答案:B2. 以下哪个选项不是SPSS中的数据类型?A. 数字B. 文本C. 日期D. 图像答案:D3. 在SPSS中进行描述性统计分析时,通常使用哪个菜单?A. 分析B. 转换C. 描述统计D. 报告答案:C4. SPSS中,进行t检验的正确步骤是:A. 分析 > 比较均值 > 独立样本T检验B. 分析 > 描述统计 > 描述C. 分析 > 相关性 > 双变量D. 分析 > 回归 > 线性答案:A5. 如果要在SPSS中创建一个饼图,应该选择:A. 图表 > 图表构建器B. 图表 > 图形C. 分析 > 图表D. 转换 > 图表答案:A6. 在SPSS中,要进行方差分析(ANOVA),应该选择哪个菜单?A. 分析 > 比较均值B. 分析 > 描述统计C. 分析 > 相关性D. 分析 > 回归答案:A7. 在SPSS中,进行因子分析时,通常使用哪个菜单?A. 分析 > 降维B. 分析 > 回归C. 分析 > 描述统计D. 分析 > 比较均值答案:A8. 在SPSS中,要进行信度分析,应该选择哪个菜单?A. 分析 > 描述统计B. 分析 > 相关性C. 分析 > 降维D. 分析 > 回归答案:C9. 在SPSS中,进行聚类分析时,通常使用哪个菜单?A. 分析 > 降维B. 分析 > 回归C. 分析 > 描述统计D. 分析 > 比较均值答案:A10. SPSS中,进行相关性分析时,通常使用哪个菜单?A. 分析 > 描述统计B. 分析 > 相关性C. 分析 > 回归D. 分析 > 比较均值答案:B二、简答题(每题5分,共20分)1. 简述在SPSS中进行数据清洗的一般步骤。
统计学基于spss期末考试题库及答案一、选择题(每题2分,共20分)1. 在SPSS中,以下哪个选项不是数据视图的功能?A. 输入数据B. 修改数据C. 计算变量D. 进行统计分析答案:D2. SPSS中进行描述性统计分析的命令是:A. DESCRIPTIVESB. MEANSC. FREQUENCIESD. ALL OF THE ABOVE答案:D3. 以下哪种图表类型在SPSS中用于显示两个或多个变量之间的关系?A. 条形图B. 散点图C. 饼图D. 直方图答案:B4. 在SPSS中,进行t检验的正确步骤是:A. 分析→比较均值→独立样本T检验B. 分析→相关性→双变量C. 分析→回归→线性D. 分析→描述性统计→探索5. 在SPSS中,用于创建一个新变量的命令是:A. COMPUTEB. RECODEC. DESCRIPTIVESD. AGGREGATE答案:A6. 如果你想要在SPSS中查看变量的频率分布,你应该使用:A. DESCRIPTIVESB. FREQUENCIESC. CROSSTABSD. EXAMINE答案:B7. 在SPSS中,进行方差分析的正确步骤是:A. 分析→比较均值→单因素ANOVAB. 分析→回归→线性C. 分析→相关性→双变量D. 分析→描述性统计→描述答案:A8. 在SPSS中,用于检查数据是否符合正态分布的命令是:A. DESCRIPTIVESB. EXPLOREC. FREQUENCIESD. PLOT答案:B9. 当你在SPSS中进行相关性分析时,以下哪个选项不是输出结果的A. 皮尔逊相关系数B. 斯皮尔曼等级相关系数C. 回归分析D. 偏相关系数答案:C10. 在SPSS中,以下哪个选项不是数据导出的格式?A. CSVB. ExcelC. SPVD. RTF答案:C二、填空题(每题2分,共10分)1. 在SPSS中,数据文件的默认扩展名是________。
社会统计学与spss应用练习题2011 — 2012学年第二学期《社会统计学与SPSS 应用》练习题一、单项选择题1. 只能把研究对象分类,即只能决定研究对象是同类或是不同类的,具有=与工的数学属性,例如:性别,民族等变量,该类变量是( A )A.定类变量B.定序变量C.定距变量D.定比变量2. 根据上题内容,在操作 SPSS 软件时,在Measure 选项中选择正确的是(B ) si*! *Untitledl [DataSe-tO] - SPS,. *A.mrisAlignMeasure1尋 RightSc^le ▼£■w* I►Edi Viri Dat TransAnaly Grapl』曲 Add-o V^ndc Hel Dsts Vi&wVariable View面曬爾I 曲左SPSS Processor is readyB3.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在 50%左 右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这说明 新生婴儿性别状况属于(D )。
A.非统计现象B.统计现象C.非随机现象D.随机现象 4.针对出生婴儿性别状况的多年调查发现,新生婴儿男女性别比一直在 50%左 右摆动,但是对于某个家庭而言,是生男孩还是生女孩却具有偶然性。
这体现 新生婴儿性别状况具有(D )。
A.确定性B.因果性C.必然性D.随机性5. 为调查不同年龄段群体对某商品的偏好程度,把年龄划分为:婴幼儿、青少C.fnD.wUntitledl [DataSetO] - SP S -. *年、成年、中年、老年,那么,年龄划分违背了变量取值的________ 原则。
(B)A.完备B.互斥C.整体D.差异6•下列哪类变量能用折线图表示其分布状况? ( C ) A.定类变量 B.定序变量 C.定距变量 D.虚拟变量7 •下列某变量取值状况的累积图,其中正确的表现形式是( B )9•在SPSS 软件中,对于多选项分析而言,如下所示首先应该操作步骤的是(C )8•下两图是正态分布密度曲线,两图的移了一些,这说明(C )。
d 2相同,图1较之图2的密度曲线向左Elfe l=?± yjew Qeta Iramlami 1[J VARDCDaiU4l« VWW% 需MM) G勵Fr^qufR^w..,Ana皿=SeEOt 彳忌sEpIz SMidr:!_:<]]p5fE ^euniAdl-cfiE JJnsnw fcjepjjensiaiLJTWi hliSH •(Joni- IjTWf Nn4^s ■iWkRElhUata ・CprraaB ►* 以曙*輔$ ►M^Lf ii IW^II 卜OAMKfY ►Psi rlinr *咅毕**wr#aic Teals *Trne S^rtaE ■卜□壬F&spcnsff *UnnFlpx Ssnpfrs ■&B4rCcrtro" ►a ■-1(5 PM ••faV n-DlS 1 ffM YWBb rE•也EFEtrcistsc^, tfipfcPFCtakg Rm...L% tllnTil J-il Lfi!3i!r3iSr.Hd SPSS Dvt10•下图所示的若为了测量集中趋势,需要在哪个□前打“V”的是A. Breque Dieesr i ptivesC.bes SetsFrequencies: Statistics11•下图包含两条正态分布密度曲线,它们的卩相同,那么上方曲线的 d i 与下方曲线d 的关系是(C )A. o 1> d 2B. d =dC. o 1< dD. 01 > d12•下列哪类分布图形随着自由度 k 无限增加,逐渐趋于标准正态分布。
(D ) A.E 分布 B. X 分布 C. F 分布 D.t 分布13•在进行区间估计时,置信度与显著性水平之和为(C )。
A. Quar tile-Central TendencyB.M odVahjes are group midpointsr[>is persion-DistrilJiitionC. DVari RanStd deviation | | Minimum Skewness 'jiiirtoaisA. 0B. — 1C. 1D. 2Percentile Valuer^uertille]Cut points for: Mean'Medien ModeSum]percentile (s):equal graufjs£ariance2> ] Maggmum竺竺二I $.£. mean14•在进行区间估计时,显著性水平为a,置信度为(C)。
A. 0B. —aC. 1 —aD. 2 a15•在拒绝原假设时出现的错误称为(D )。
A.第二类错误B.纳伪的错误C.以假当真错误D.弃真的错误16 •大样本二总体均值差进行统计检验时与单样本均值检验相比,主要区别是(A )。
A.标准差B.均值C.统计量分布D.临界值17•大样本二总体成数差进行统计检验时与单样本成数检验相比,主要区别是(A )。
A.标准差B.均值C.统计量分布D.临界值18.如下表所示,求出2 >2表中相关强度©系数为(C)oA. 1B. 0.3C. 0.5D. 0.419.如下表所示,求出该表中同序对的个数为(B)A.310B.624C.524D.31420.两个定序变量之间Gamma系数取值范围为(A)。
A. [ —1,1]B. [ — V 0]C. [0,+为D. [0,1]21.为测量两个定类变量相关系数,需要在下列哪项功能□前打“ "”?(A)二、填空题1•所有变量值百分比对的集合称作百分比分布,又称变量的频率或相对频次分布。
2•在制作统计表时,需要对变量取值进行分组,一般分组点比原统计资料的精度要高一位,例如,原统计资料的年龄以年计算,统计范围为1~2岁、3~4岁、5~6岁、7~8岁等分为四组,实际分组为0.5~2.5岁、2.5~4.5岁、4.5~6.5岁、6.5~8.5岁等四组,那么,原统计资料的分组组界称为标明组界。
3•统计表必须具备的内容有表号、表头、标识行、主体行、表尾等五部分组成,这样才能构成一份完整的统计表。
4.某村家庭子女数量频次分布:2、3、1、4、2、4、3、2、1、2、0、1、2、3、1、3、2、0、4、2,在家庭子女数量这个变量取值中众值是工。
5.某社区六个家庭人口数量分布:3、4、5、8、9、9在家庭人口数量这个变量取值中中位值是_6色o6.方差与标准差用来度量定距变量的离散程度的测量方法。
7.当变量的取值满足了完备性和互不相容性,那么取值和概率对的集合就是随机变量的概率分布。
8 •古典法产生于概率论发展的早期,以“在相似的条件下进行无数次实验”的观点来思考问题,以对象本身所具有的对称性而事先得到的,故被称为先验概率。
9.统计推论的基础是概率论,内容包括两部分:参数估计与假设检验。
10•从总体中抽取容量为n的样本,可以看作n个独立同总体分布的随机变量乳色……,&,那么,随机变量&,題,……,$的任何函数f ( $,題,……,也)也是随机变量。
我们把函数f ( $,$,……,$ )叫作统计量。
11.根据随机变量的观测值X i,X2,……,X n计算得到的一切统计数字特征(例如均值、方差)可以看作是相应统计量的观测值,统计量的分布又称抽样分布。
12.原假设(H o)又称虚无假设或解消假设,常常是根据已有的资料,或根据周密考虑后确定的。
13.备择假设(H1)又称为研究假设,当经过抽样调查,有充分根据否定原有假设时,就产生了需要接受其逻辑对立面的假设。
14.假设检验的基本原理是小概率原理。
15.在某个列联表中,只观察其中某一变量的分布,而不管另一个变量的取值,这样就得到边缘分布。
16.协方差表示两个定距变量观测值相对其各自均值所造成的共同平均偏差。
17.两个定距变量的相关系数r是度量变量间的线性相关程度的,具有PRE性质,r 的平方又称为判定系数有着直观的解释意义。
18 •方差分析是研究定类变量与定距变量之间相关关系,主要分析或检验总体间的均值是否有所不同。
19.方差分析中把被解释掉的误差在总体误差中所占的比率称为相关比率。
20.非参数检验是指“对分布类型已知的总体进行参数检验”之外的所有检验方法。
21 .非参数检验方法是指这类方法的使用不需要对总体分布作任何事先的假定, 也不是检验总体分布的某些参数,而是检验总体某类有关的性质。
三、判断题(根据题意,表述正确的在后面括号内打“V”,表述错误的在后面括号内打“X”)1.在选用社会统计分析方法时,需要注意区分研究的是单变量还是多变量,前者往往分析存在的关系及其强度,后者分析变量的集中或离散的特征情况。
(X)2 •在绘制统计表时,对于定序变量而言需要注意次序排列、变化趋势。
(V)3.直方图可以用来反映定类变量的取值状况。
(X)4.直方图与条形图形状相同,没有什么本质区别。
(X)5.中位值比较适用于定距变量。
(X)6.某个变量取值呈正态分布,它的众值、中位值重叠,与均值不重叠。
(X)7.某个变量取值呈正态分布,它的众值、均值重叠,与中位值不重叠。
(X)8.统计推论是根据局部资料(样本资料)对总体的特征进行推断。
(V)9.“抽样结果与总体参数不一致”是随机现象在推论中所特有的。
(V)10.总体分布为正态分布N (卩,d2),且方差已知,随着样本容量n的增加,也不能减少样本均值抽样分布的分散程度。
(X)11.若总体分布为正态分布,且方差已知,样本均值分布服从t分布。
(X)12.若总体分布为正态分布,大样本均值的极限分布不是N (0,1)0(X)13.在区间估计中,置信度表示用置信区间估计的可靠性。
(V)14.在区间估计中,显著性水平表示用置信区间估计不可靠的概率。
(V)15.大样本二总体均值差的分布不服从正态分布。
(X)16.大样本二总体成数差的分布不服从正态分布。
(X)17.两个定类变量之间以X为基础的相关性测量得到C系数具有减少误差比例性质。
(X)18.两个定类变量之间相关性测量得到入系数不具有减少误差比例性质。
(X)19.Gamma 等级相关的G 系数具有减少误差比例的性质。
20.斯皮尔曼等级相关系数r s具有减少误差比例的性质。
四、计算题(要求步骤完整,计算结果正确)1.根据下表2008年某班级Q课程成绩统计分布情况,求某班级Q课程成绩的中位值。
2008年某班级Q 课程成绩统计分布情况成绩等级 频次 累计频次不及格 3 3 及格 12 15 中 18 33 良好 22 55 优秀5 602 •根据下表某城市抽样调查家庭月收入统计分布情况,求该市家庭月收入的中 位值。