总体与样本直方图条形图及经验分布函数
- 格式:ppt
- 大小:324.50 KB
- 文档页数:44
《概率论与数理统计》教学大纲课程编码:0500805课程性质:专业基础课适用专业:电子信息工程学分:3学分学时:54学时开设学期:第3学期一、教学目的通过教学,应使学生掌握处理随机现象的基本手段和基本方法;能运用概率与统计的基本原理解决实际问题;用比较科学的方法和手段处理实际生活中的统计问题,提高分析问题及解决问题的能力,为学习后继相关的专业课打下基础。
二、重点难点1.重点:随机事件及其概率、一维随机变量及其分布、二维随机变量及其分布、随机变量的数字特征、数理统计、参数估计。
2.难点:贝叶斯公式,随机变量的分布函数,连续型随机变量的概率密度,随机变量的期望、方差,矩估计和最大似然估计。
三、教学方法讲授法:教师讲授概率统计的基本概念和定理。
讨论法:师生共同讨论随机事件的概率。
探究法:师生共同探究概率统计的一些应用问题。
四、教学内容第一章随机事件和概率(10学时)教学要求:了解样本空间(基本事件空间)的概念,理解随机事件的概念,掌握事件的关系与运算,理解概率、条件概率的概念,掌握概率的基本性质,会计算古典型概率和几何型概率,掌握概率的加法公式、减法公式、乘法公式、全概率公式,以及贝叶斯(Bayes)公式,理解事件的独立性的概念,掌握用事件独立性进行概率计算;理解独立重复试验的概念,掌握计算有关事件概率的方法。
1.概率、条件概率2.古典型概率和几何型概率3.概率的加法公式、减法公式、乘法公式、全概率公式、贝叶斯公式4.事件的独立性第二章随机变量及其分(8学时)教学要求:理解随机变量的概念.理解分布函数的概念及性质.会计算与随机变量相联系的事件的概率,理解离散型随机变量及其概率分布的概念,掌握0-1分布、二项分布、几何分布、超几何分布、泊松(Poisson)分布及其应用,了解泊松定理的结论和应用条件,会用泊松分布近似表示二项分布,理解连续型随机变量及其概率密度的概念,掌握均匀分布、正态分布、指数分布及其应用。
数理统计知识小结------缪晓丹 20114041056第五章 统计量及其分布§5.1总体与样本一、 总体与样本在一个统计问题中,把研究对象的全体称为总体,构成总体的每个成员称为个体。
对于实际问题,总体中的个体是一些实在的人或物。
这样,抛开实际背景,总体就是一堆数,这堆数中有大有小,有的出现机会多,有的出现机会小,因此用一个概率分布去描述和归纳总体是合适的,从这个意义上说:总体就是一个分布,而其数量指标就是服从这个分布的随机变量。
例5.1.1考察某厂的产品质量,将其产品分为合格品和不合格品,并以0记合格品,以1记不格品,若以p 表示不合格品率,则各总体可用一个二点分布表示:不同的p 反映了总体间的差异。
在有些问题中,我们对每一研究对象可能要观测两个或更多个指标,此时可用多维随机向量及其联合分布来描述总体。
这种总体称为多维总体。
若总体中的个体数是有限的,此总体称为有限总体;否则称为无限总体。
实际中总体中的个体数大多是有限的,当个体数充分大时,将有限总体看作无限总体是一种合理抽象。
二、样本与简单随机样本 1、样本为了了解总体的分布,从总体中随机地抽取n 个个体,记其指标值为 n x x x ,,,21 , 则n x x x ,,,21 称为总体的一个样本,n 称为样本容量或简称为样本量,样本中的个体称为样品。
当30 n 时,称n x x x ,,,21 为大样本,否则为小样本。
首先指出,样本具有所谓的二重性:一方面,由于样本是从总体中随机抽取的,抽取前无法预知它们的数值,因此样本是随机变量,用大写字母 n X X X ,,,21 表示;另一方面,样本在抽取以后经观测就有确定的观测值,因此样本又是一组数值,此时用小写字母n x x x ,,,21 表示。
简单起见,无论是样本还是其观测值,本书中均用n x x x ,,,21 表示,从上下文我们能加以区别。
每个样本观测值都能测到一个具体的数值,则称该样本为完全样本,若样本观测值没有具体的数值,只有一个范围,则称这样的样本为分组样本。
管理统计》期中作业区别几个重要概念:总体、样本、变量、数据。
分析它们之间的内在关系,并分别进行举例说明。
数据测度分为几个类别试举例说明。
不同类型的数据,在用途上有何差别如何理解抽样调查常见的抽样调查方法有哪些,试分别举例。
分层抽样的作法和适用条件是什么设计问卷的最重要的两个依据是什么样本数据特征(频次与频率)可以用图形表示,常用的频次与频率分布图有哪几种形式它们在适用条件上有何差直方图和条形图的主要区别是什么饼图、条形图和直方图可以在SPSS的哪些分析模块实现并说明点击过程。
.在SPSS中,刻画数据结构的集中特征和离散特征的常用变量有哪些.平均指标和变异指标可以在SPSS的哪些分析模块实现并说明点击过程。
.什么是Sample deviations、sum of Squared deviations 什么是Variance这三者之间的关系是什么.什么是方差(Variance)和标准差(Standard deviation),它们之间是什么关系Variance和Variable的区别何.箱形图可以对样本数据特征进行综合表达,仅适用于刻度级数据,请描述箱形图的基本构造。
.如何在SPSS中定义变量在SPSS中进行变量定义的主要步骤有哪几步(Name/Label/Values等).在SPSS中如何给变量值排序如何给变量值排名次区别Sort和Rank不同的处理模块。
.何为参数何为统计量什么是统计推断常见的均值和方差两个参数如何表示均值和方差统计量又如何表示.常见的抽样分布有哪几种各自的大致分布特征如何.求总体均值置信区间,当σ2未知时,用什么统计量当σ2已知时,用什么统计量.参数区间估计可以在SPSS的什么分析模块实现并说明点击过程。
.请简要写出假设检验的四个步骤。
.假设检验过程中通常会犯何种错误.何谓置信度何谓显着性水平二者是什么关系.经抽样调查,某高校学生身高的统计分析如表1显示,请说明:表1提供了哪些统计量的信息表1 身高(厘米)a Multiple modes exist. The smallest value is shown.关于一个正态分布总体的参数检验的统计量问题:1)检验均值,当σ2未知时,用什么统计量当σ2已知时,用什么统计量2)检验方差常用什么统计量.两个正态总体的假设检验(独立样本和配对样本)在数据形式和应用范围上有何差别为什么两个独立样本的均值验时需要首先检验方差是否齐性,而配对样本检验则无需进行方差齐性检验答案:一、1.总体:所研究对象的全体。
用样本估计总体【第一课时】【教学目标】1.会画一组数据的频率分布表、频率分布直方图.2.会用频率分布表、频率分布直方图、条形图、扇形图、折线图等对总体进行估计.3.掌握求n个数据的第p百分位数的方法.【教学重难点】1.频率分布表、频率分布直方图.2.用样本估计总体.3.总体百分位数的估计.【教学过程】一、问题导入预习教材内容,思考以下问题:1.绘制频率分布表和频率分布直方图有哪些步骤?2.频率分布直方图有哪些特征?3.如何求n个数据的第p百分位数?二、基础知识1.频率分布表、频率分布直方图的制作步骤及意义2.百分位数(1)定义:一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算步骤:计算一组n个数据的第p百分位数的步骤:第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.三、合作探究1.频率分布表、频率分布直方图、频率分布折线图的绘制角度一:频率分布表、频率分布直方图的绘制为考查某校高二男生的体重,随机抽取44名高二男生,实测体重数据(单位:kg)如下:57,61,57,57,58,57,61,54,68,51,49,64,50,48,65,52,56,46,54,49,51,47,55,55,54,42,51,56,55,51,54,51,60,62,43,55,56,61,52,69,64,46,54,48将数据进行适当的分组,并画出相应的频率分布直方图和频率分布折线图.【解】以4频率累计频率分布直方图和频率分布折线图如图所示.(1)在列频率分布表时,极差、组距、组数有如下关系: ①若极差组距为整数,则极差组距=组数;②若极差组距不为整数,则极差组距的整数部分+1=组数.(2)组距和组数的确定没有固定的标准,将数据分组时,组数力求合适,纵使数据的分布规律能较清楚地呈现出来,组数太多或太少,都会影响我们了解数据的分布情况,若样本容量不超过100,按照数据的多少常分为5~12组,一般样本量越大,所分组数越多.角度二:频率分布直方图的应用为了了解高一年级学生的体能情况,某校抽取部分学生进行一分钟跳绳次数测试,将所得数据整理后,画出频率分布直方图(如图所示),图中从左到右各小长方形面积之比为2∶4∶17∶15∶9∶3,第二小组的频数为12.(1)第二小组的频率是多少?样本量是多少?(2)若次数在110以上(含110次)为达标,则该校全体高一年级学生的达标率是多少? (3)样本中不达标的学生人数是多少? (4)第三组的频数是多少?【解】(1)频率分布直方图以面积的形式反映数据落在各小组内的频率大小,因此第二小组的频率为42+4+17+15+9+3=0.08.又因为第二小组的频率=第二小组的频数样本量,所以样本容量=第二小组的频数第二小组的频率=120.08=150.(2)由直方图可估计该校高一年级学生的达标率为17+15+9+32+4+17+15+9+3×100%=88%.(3)由(1)(2)知达标率为88%,样本量为150,不达标的学生频率为1-0.88=0.12. 所以样本中不达标的学生人数为150×0.12=18(人).(4)第三小组的频率为172+4+17+15+9+3=0.34.又因为样本量为150,所以第三组的频数为150×0.34=51.频率分布直方图的应用中的计算问题 (1)小长方形的面积=组距×频率组距=频率;(2)各小长方形的面积之和等于1;(3)频数样本量=频率,此关系式的变形为频数频率=样本量,样本量×频率=频数.2.条形统计图为了丰富校园文化生活,某校计划在午间校园广播台播放“百家讲坛”的部分内容.为了了解学生的喜好,抽取若干名学生进行问卷调查(每人只选一项内容),整理调查结果,绘制统计图如图所示.请根据统计图提供的信息回答以下问题: (1)求抽取的学生数;(2)若该校有3 000名学生,估计喜欢收听易中天《品三国》的学生人数;(3)估计该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的百分比. 【解】(1)从统计图上可以看出,喜欢收听于丹析《庄子》的男生有20人,女生有10人; 喜欢收听《故宫博物院》的男生有30人,女生有15人; 喜欢收听于丹析《论语》的男生有30人,女生有38人; 喜欢收听易中天《品三国》的男生有64人,女生有42人;喜欢收听刘心武评《红楼梦》的男生有6人,女生有45人.所以抽取的学生数为20+10+30+15+30+38+64+42+6+45=300(人).(2)喜欢收听易中天《品三国》的男生有64人,女生有42人,共有106人,占所抽取总人数的比例为106 300,由于该校有3 000名学生,因此可以估计喜欢收听易中天《品三国》的学生有106300×3 000=1 060(人).(3)该校喜欢收听刘心武评《红楼梦》的女学生人数约占全校学生人数的比例为45300×100%=15%.(1)绘制条形统计图时,第一步确定坐标系中横轴和纵轴上坐标的意义,第二步确定横轴上各部分的间距及位置,第三步根据统计结果绘制条形图.实际问题中,我们需根据需要进行分组,横轴上的分组越细,对数据的刻画(描述)就越精确.(2)在条形统计图中,各个矩形图的宽度没有严格要求,但高度必须以数据为准,它直观反映了各部分在总体中所占比重的大小.3.折线统计图小明同学因发热而住院,下图是根据护士为他测量的体温所绘制的体温折线图.根据图中的信息,回答以下问题:(1)护士每隔几小时给小明测量一次体温?(2)近三天来,小明的最高体温、最低体温分别是多少?(3)从体温看,小明的病情是在恶化还是在好转?(4)如果连续36小时体温不超过37.2摄氏度的话,可认为基本康复,那么小明最快什么出院?【解】(1)根据横轴表示的意义,可知护士每隔6小时给小明测量一次体温.(2)从折线统计图中的最高点和最低点对应的纵轴意义,可知最高体温是39.5摄氏度,最低体温是36.8摄氏度.(3)从图中可知小明的体温已经下降,并趋于稳定,因此病情在好转.(4)9月8日18时小明的体温是37摄氏度.其后的体温未超过37.2摄氏度,自9月8日18时起计算,连续36小时后对应的时间为9月10日凌晨6时.因此小明最快可以在9月10凌晨6时出院.(1)绘制折线统计图时,第一步,确定直角坐标系中横、纵坐标表示的意义;第二步,确定一个单位长度表示一定的数量,根据数量的多少描出各点;第三步,用直线段顺次连接即可.(2)在折线统计图中,从折线的上升、下降可分析统计数量的增减变化情况,从陡峭程度上,可分析数据间相对增长、下降的幅度.4.扇形统计图下图是A ,B 两所学校艺术节期间收到的各类艺术作品的情况的统计图: (1)从图中能否看出哪所学校收到的水粉画作品数量多?为什么?(2)已知A 学校收到的剪纸作品比B 学校的多20件,收到的书法作品比B 学校的少100件,请问这两所学校收到艺术作品的总数分别是多少件?【解】(1)不能.因为两所学校收到艺术作品的总数不知道.(2)设A 学校收到艺术作品的总数为x 件,B 学校收到艺术作品的总数为y 件,则⎩⎨⎧10%x -5%y =20,50%y -40%x =100,解得⎩⎨⎧x =500,y =600,即A 学校收到艺术作品的总数为500件,B 学校收到艺术作品的总数为600件.(1)绘制扇形统计图时,第一步计算各部分所占百分比以及对应圆心角的度数;第二步在圆中按照上述圆心角画出各个扇形并恰当标注.(2)扇形统计图表示总体的各部分之间的百分比关系,但不同总量下的扇形统计图,其不同的百分比不可以作为比较的依据.5.百分位数的计算试求甲、乙两组数的25%分位数与75%分位数.【解】因为数据个数为20,而且20×25%=5,20×75%=15.因此,甲组数的25%分位数为x5+x62=2+32=2.5;甲组数的75%分位数为x15+x162=9+102=9.5.乙组数的25%分位数为x5+x62=1+12=1,乙组的75%分位数为x15+x162=10+142=12.求百分位数时,一定要将数据按照从小到大的顺序排列.【课堂检测】1.下列四个图中,用来表示不同品种的奶牛的平均产奶量最为合适的是()解析:选D.用统计图表示不同品种的奶牛的平均产奶量,即从图中可以比较各种数量的多少,因此“最为合适”的统计图是条形统计图.注意B选项中的图不能称为统计图.2.观察新生儿的体重,其频率分布直方图如图所示,则新生儿体重在[2 700,3 000)g的频率为()A.0.1B.0.2C.0.3 D.0.4解析:选C.由题图可得,新生儿体重在[2 700,3 000)g的频率为0.001×300=0.3,故选C.3.观察下图所示的统计图,下列结论正确的是()A.甲校女生比乙校女生多B.乙校男生比甲校男生少C.乙校女生比甲校男生少D.甲、乙两校女生人数无法比较解析:选D.图中数据只是百分比,甲、乙两个学校的学生总数不知道,因此男生与女生的具体人数也无法得知.【第二课时】 【教学目标】1.理解样本数据标众数、中位数、平均数的意义和作用,学会计算数据的众数、中位数、平均数.2.理解样本数据方差、标准差的意义和作用,学会计算数据的方差、标准差.【教学重难点】会用样本的基本数字特征来估计总体的基本数字特征.【教学过程】一、基础知识1.众数、中位数、平均数 众数、中位数、平均数定义(1)众数:一组数据中出现次数最多的数.(2)中位数:把一组数据按从小到大(或从大到小)的顺序排列,处在中间位置的数(或中间两个数的平均数)叫做这组数据的中位数.(3)平均数:如果n 个数x 1,x 2,…,x n ,那么x =1n (x 1+x 2+…+x n )叫做这n 个数的平均数.思考:平均数、中位数、众数中,哪个量与样本的每一个数据有关,它有何缺点? 答案:平均数与样本的每一个数据有关,它可以反映出更多的关于样本数据总体的信息,但是平均数受数据中极端值的影响较大.2.方差、标准差标准差、方差的概念及计算公式(1)标准差是样本数据到平均数的一种平均距离,一般用s 表示.s =1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2].(2)标准差的平方s 2叫做方差.s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2](x n 是样本数据,n 是样本容量,x 是样本平均数).(3)标准差(或方差)越小,数据越稳定在平均数附近.s =0时,每一组样本数据均为x .二、合作探究1.众数、中位数、平均数的计算(1)某学习小组在一次数学测验中,得100分的有1人,得95分的有1人,得90分的有2人,得85分的有4人,得80分和75分的各1人,则该小组数学成绩的平均数、众数、中位数分别为()A.85,85,85B.87,85,86C.87,85,85D.87,85,90(2)以下茎叶图记录了甲、乙两组各五名学生在一次英语听力测试中的成绩(单位:分).已知甲组数据的中位数为15,乙组数据的平均数为16.8,则x,y的值分别为() A.2,5B.5,5C.5,8D.8,8答案(1)C(2)C解析(1)平均数为100+95+90×2+85×4+80+7510=87,众数为85,中位数为85.(2)结合茎叶图上的原始数据,根据中位数和平均数的概念列出方程进行求解.由于甲组数据的中位数为15=10+x,所以x=5.又乙组数据的平均数为9+15+10+y+18+245=16.8,所以y=8,所以x,y的值分别为5,8.【教师小结】平均数、众数、中位数的计算方法:平均数一般是根据公式来计算的;计算众数、中位数时,可先将这组数据按从小到大或从大到小的顺序排列,再根据各自的定义计算.2.标准差、方差的计算及应用甲、乙两名战士在相同条件下各打靶10次,每次命中的环数分别是:甲:8,6,7,8,6,5,9,10,4,7;乙:6,7,7,8,6,7,8,7,9,5.(1)分别计算以上两组数据的平均数;(2)分别求出两组数据的方差;(3)根据计算结果,估计两名战士的射击情况.若要从这两人中选一人参加射击比赛,选谁去合适?解(1)x甲=110×(8+6+7+8+6+5+9+10+4+7)=7(环),x 乙=110×(6+7+7+8+6+7+8+7+9+5)=7(环).(2)由方差公式s 2=1n [(x 1-x )2+(x 2-x )2+…+(x n -x )2],得s 2甲=3,s 2乙=1.2.(3)x 甲=x 乙,说明甲、乙两战士的平均水平相当.又s 2甲>s 2乙说明甲战士射击情况波动比乙大.因此,乙战士比甲战士射击情况稳定,从成绩的稳定性考虑,应选择乙参加比赛.【教师小结】(1)方差和标准差都是用来描述一组数据波动情况的特征数,常用来比较两组数据的波动大小.(2)样本标准差反映了各样本数据围绕样本平均数波动的大小,标准差越小,表明各样本数据在样本平均数周围越集中;反之,标准差越大,表明各样本数据在样本平均数的两边越分散.(3)当样本的平均数相等或相差无几时,就要用样本数据的离散程度来估计总体的数据分布情况,而样本数据的离散程度是由标准差来衡量的.三、课堂总结1.标准差的平方s 2称为方差,有时用方差代替标准差测量样本数据的离散程度.方差与标准差的测量效果是一致的,在实际应用中一般多采用标准差.2.现实中的总体所包含的个体数往往很多,总体的平均数与标准差是未知的,我们通常用样本的平均数和标准差去估计总体的平均数与标准差,但要求样本有较好的代表性.3.在抽样过程中,抽取的样本是具有随机性的,因此样本的数字特征也有随机性,用样本的数字特征估计总体的数字特征,是一种统计思想,没有唯一答案.【课堂检测】1.某市2017年各月的平均气温(℃)数据的茎叶图如图:则这组数据的中位数是( )A .19B .20C .21.5D .23答案 B解析 由茎叶图知,平均气温在20℃以下的有5个月,在20℃以上的也有5个月,恰好是20℃的有2个月,由中位数的定义知,这组数据的中位数为20.故选B .2.下列关于平均数、中位数、众数的说法中正确的一个是( )A .中位数可以准确地反映出总体的情况B .平均数可以准确地反映出总体的情况C .众数可以准确地反映出总体的情况D .平均数、中位数、众数都有局限性,都不能准确地反映出总体的情况答案 D3.在某次测量中得到的A 样本数据如下:82,84,84,86,86,86,88,88,88,88.若B 样本数据恰好是A 样本数据每个都加2后所得的数据,则A ,B 两样本的下列数字特征对应相同的是( )A .众数B .平均数C .中位数D .标准差答案 D4.某校开展“爱我母校,爱我家乡”摄影比赛,七位评委为甲,乙两名选手的作品打出的分数的茎叶图如图所示(其中m 为数字0~9中的一个),去掉一个最高分和一个最低分后,甲,乙两名选手得分的平均数分别为a 1,a 2,则一定有( )A .a 1>a 2B .a 2>a 1C .a 1=a 2D .a 1,a 2的大小与m 的值有关答案 B解析 由茎叶图知,a 1=80+1+5+5+4+55=84, a 2=80+4+4+6+4+75=85,故选B . 5.若样本数据x 1,x 2,…,x 10的标准差为8,则数据2x 1-1,2x 2-1,…,2x 10-1的标准差为________.答案 16解析 设样本数据x 1,x 2,…,x 10的标准差为s ,则s =8,可知数据2x1-1,2x2-1,…,2x10-1的标准差为2s=16.。
统计学参考答案第01章习题解答1. 随机变量:某一变量在实验、调查和观测之前,不能预知其数值的变量。
随机变量的特点是:离散性、变异性、规律性。
总体(population)又叫“母体”,是指具有某一种特征的一类事物的全体。
个体亦称“单位”、“样品”,统计学术语,统计学术语指总体中的每一个单位、样品或成员。
是统计调查、试验或观测的最基本对象,是构成样本、总体的最小单元。
在心理学研究中,个体根据研究目的的不同,可以是人,也可以是人在某种实验条件下的某个反应,或每个实验结果、每个数据。
在总体中按照一定的规则抽取的部分个体,称为总体的一个样本(sample)。
根据样本容量(通常以30为界线)的大小,可区分为大样本和小样本。
根据两样本来自的两总体是相关还是独立,可分为相关样本和独立样本。
次数:某一随机事件在某一类别中出现的数据多少,亦称频数(frequency)。
频率:某一事件发生的次数与总事件的比率。
概率(probability):某随机事件在某一总体中出现的比率。
表示样本的数字特征的量叫统计量。
如描述数据集中趋势的一些统计指标称为平均数;描述一组数据离散程度的统计指标称为标准差。
表示总体的数字特征的量叫参数。
如反应总体集中情况的统计指标称为总体平均数;反应总体离散程度的统计指标称为标准差。
观测值(observation):实验、调查和观测某些个体在某一变量上的具体的数值,即为观测值。
2. 何谓心理与教育统计学?学习它有何意义?心理与教育统计学是专门研究如何搜集、整理、分析在心理教育方面由实验和调查所获得的数据资料,并如何根据这些数字所传递的信息,进行科学推论找出客观规律的一门学科。
它是应用数理统计学的一个分支,是心理与教育研究中的科学工具。
意义:(1)研究心理与教育现象变化的统计规律;(2)为心理与教育研究提供科学的依据;(3)促进量化研究的发展……3.选用统计方法有哪几个步骤?(1)实验或调查设计是否合理,即所获得的数据是否适合用统计方法去处理,正确将其数量化是应用统计方法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的;(2)要分析实验或调查数据的类型,不同数据类型所使用的统计方法有很大差别,针对不同的数据类型选用与之相应的统计方法至关重要;(3)要分析数据的分布规律,看数据是正态分布还是非正态分布,方差是否已知,以及是大样本数据还是小样本数据。
一、名词解释1、统计学:收集、处理、分析、解释数据并从数据中得出结论的科学。
2、总体:包含所研究的全部个体的集合。
3、样本:从总体中抽取的一部分元素的集合。
4、统计量:描述样本特征的概括性数字度量。
5、描述统计:研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。
6、推断统计:研究如何利用样本数据来推断总体特征的统计方法。
7、相关系数:根据样本数据计算的度量两个变量之间线性关系强度的统计量。
8、参数估计:用样本统计量估计总体参数。
9、点估计:用样本统计量的某个取值直接作为总体参数的估计值.10、区间估计:在点估计基础上,给出总体参数估计的一个区间范围,该区间常由样本统计量加减估计误差得到。
11、简单随机抽样:从总体N个单位的抽样框中随机地、一个个地抽取n个单位作为样本,每个单位入样概率相等。
12、分层抽样:将抽样单位按某种特征或某种规则划分为不同的层,从不同层中独立随机地抽取样本。
13、整群抽样:抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。
14、系统抽样:将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。
15、概率抽样(随机抽样):遵循随机原则进行的抽样,总体中每个单位都有一定的机会被选入样本。
16、非概率抽样:根据研究目的对数据的要求,采用某种方式从总体中抽出部分单位对其实施调查。
17、参数:描述总体特征的概括性数字度量。
18、估计量:在参数估计中,用来估计总体参数的统计量称为估计量。
19、抽样误差:由抽样的随机性引起的样本结果于总体真值之间的误差。
20、非抽样误差:除抽样误差之外,由其他原因引起的样本观察结果与总体真值之间的差异。
21、频数:落在某一特定类别或组中的数据个数。
22、频数分布:把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来。
23、列联表:由两个或两个以上变量交叉分类的频数分布表称为列联表。
中国地质大学(武汉)远程与继续教育学院统计学课程作业1(共4次作业)学习层次:专科涉及章节:第1章——第4章1.什么是总体和样本?举例说明。
2.什么是变量,其类型有哪些?3.统计数据可分为哪几种类型?4.概率抽样与非概率抽样的区别有哪些?5.什么是抽样误差?它的大小与哪些因素有关?6.直方图与条形图有何区别?7.统计表由哪几个主要部分组成?制作统计表应注意哪几个问题?8、某班40名学生统计学考试成绩分别为:66 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 7976 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81学校规定:60分以下为不及格,60—70为及格,70—80分为中,80—90分为良,90—100分为优。
要求:(1)将该班学生分为不及格、及格、中、良、优五组,编制频数分布表。
(2)指出分组方法的类型,分析本班学生考试情况。
9、某百货公司连续40天的商品销售额如下:单位:万元41 25 29 47 38 34 30 38 43 4046 36 45 37 37 36 45 43 33 4435 28 46 34 30 37 44 26 38 4442 36 37 37 49 39 42 32 36 35要求:根据数据分组,编制频数分布表,并绘制直方图和折线图。
10、为了确定灯泡的使用寿命(小时),在一批灯泡中随机抽取100只进行测试,所得结果如下:700 716 728 719 685 709 691 684 705 718706 715 712 722 691 708 690 692 707 701708 729 694 681 695 685 706 661 735 665668 710 693 697 674 658 698 666 696 698706 692 691 747 699 682 698 700 710 722694 690 736 689 696 651 673 749 708 727688 689 683 685 702 741 698 713 676 702701 671 718 707 683 717 733 712 683 692693 697 664 681 721 720 677 679 695 691713 699 725 726 704 729 703 696 717 688(1)利用计算机对上面的数据进行排序;(2)以组距为10进行等距分组,整理成频数分布表,并绘制直方图;(3)绘制茎叶图,并与直方图作比较。
统计、成对数据的统计分析一、随机抽样1.简单随机抽样(1)简单随机抽样分为放回简单随机抽样和不放回简单随机抽样。
(2)简单随机样本:通过简单随机抽样获得的样本称为简单随机样本。
(3)简单随机抽样的常用方法。
实现简单随机抽样的方法有很多,抽签法和随机数法是比较常用的两种方法。
注意:除非特殊声明,本章简单随机抽样指不放回简单随机抽样。
2.总体平均数与样本平均数注意在简单随机抽样中我们常用样本平均数去估计总体平均数;②总体平均数是一个确定的数,样本平均数具有随机性(因为样本具有随机性);③一般情况下,样本量越大,估计越准确。
3.分层随机抽样(1)定义:一般地,按一个或多个变量把总体划分成若干个子总体,每个个体属于且仅属于一个子总体,在每个子总体中独立地进行简单随机抽样,再把所有子总体中抽取的样本合在一起作为总样本,这样的抽样方法称为分层随机抽样,每一个子总体称为层。
在分层随机抽样中,如果每层样本量都与层的大小成比例,那么称这种样本量的分配方式为比例分配。
(2)分层随机抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层随机抽样。
(3)分层随机抽样的平均数计算在比例分配的分层随机抽样中,如果层数分为2层,第1层和第2层包含的个体数分别为M和N,抽取的样本量分别为m和n,样本平均数分别为x̅,y̅,总体的样本平均数为w̅,则w̅=MM+N x̅+NM+Ny̅=mm+nx̅+nm+ny̅。
注意:①随机抽样时,总体中的每个个体入样的概率相同。
②比例分配的分层随机抽样,每一层入样的个体数为该层的个体数乘以抽样比。
【重点难点易错点】1.简单随机抽样的要点:.简单随机抽样需满足:①被抽取的样本和总体的个体数有限;②逐个抽取;③等可能抽取。
2.在使用随机数法时,如遇到三位数(或四位数),可从选择的随机数表中的某行某列的数字计起,每三个(或四个)作为一个单位,按某种顺序依次选取,有超过总体号码或出现重复号码的数字舍去。
统计学复习要点第一篇:统计学复习要点第1章统计和统计数据数据类别;总体、样本;几种概率抽样(简单随机抽样,分层抽样,系统抽样,整群抽样)第2章用图表展示数据定性数据表:频数分布表,列联表图:条形图(复式),帕累托图,饼图,环形图定量数据表:频数分布表(分组)图:直方图、茎叶图、箱线图;垂线图、误差图;散点图;雷达图,轮廓图第3章用统计量描述数据水平:均值,中位数,分位数,众数(选择原则)差异:极差,四分位差;方差,标准差,标准分数(经验法则);离散系数分布:偏态,峰态(解读)第4章概率分布重要分布:二项分布,泊松分布,超几何分布,正态分布(判断);t分布,卡方分布,F分布统计量分布:参数,统计量,抽样分布,中心极限定理,标准误第5章参数估计点估计:原理,缺陷区间估计:置信区间,置信度评价标准:无偏,有效,一致性单个总体参数估计待估参数均值比例方差大样本小样本大样本χ2分布σ2已知σ2已知Z分布Z分布Z分布σ2未知σ2未知Z分布t分布两个总体参数估计待估参数均值差独立大样本σ12、σ22已Z分布独立小样本正态总体σ12、σ22已知Z分布σ12=σ22t分布比例差独立大样本Z分布方差比匹配样本F分布t分布σ12、σ22未知σ12、σ22未Z分布σ12≠σ22t分布第6章假设检验原假设,备择假设;如何提假设显著性水平,P值,第一、二类错误结果表述(拒绝,不拒绝)参数检验(对照参数估计)第7章分类变量的推断卡方拟合优度检验,卡方独立性检验,相关性度量(3种系数)第8章方差分析与实验设计方差分析研究的问题,基本原理,基本假设方差分析表,参数估计表实验设计3种设计以及与方差分析的对应第9、10章回归分析回归的基本流程:判断有无关系、建模、检验、预测模型好坏的评判标准:判定系数,估计标准误差多元回归特有问题:调整判定系数,多重共线性(产生的问题,识别,处理),哑变量回归(系数解读)第11章时间序列时间序列的几种成分不同类型时间序列对应的预测方法:基本原理第二篇:应用统计学复习要点(09)应用统计学期末复习要点第一章绪论1、知道统计的三种含义及关系(P1)2、知道统计总体与总体单位的概念与特征(P5)3、知道标志与指标的含义与分类(P6)第二章统计数据的搜集1、知道统计调查的方式分类(P15)2、知道统计调查的方法分类(P17)3、知道调查方案的主要内容(P18)第三章统计数据的整理与显示1、知道统计分组的原则与分组整理的步骤(P31)2、知道统计表的构成及设计原则(P38)3、会编制频数分布表(例3.2、计算题1和2)第四章数据分布特征的统计测度1、知道集中趋势的含义及常用测度指标(P63)2、知道离散程度的含义及常用测度指标(P64)3、知道偏度系数和峰度系数与数据分布特征的关系(P70、P72)4、会计算平均数和离散系数(计算题1、2和4)第八章相关与回归分析1、知道相关关系的含义及分类(P130)2、知道相关系数的含义、性质与相关程度的划分(P135)3、知道相关分析和回归分析的含义(P131)4、知道回归参数的经济意义(P138)5、能完成方差分析表并由回归分析表回答相关问题(计算题3)第九章时间序列分析1、知道时间序列的概念、分类及编制原则(P156、P157)2、知道长期趋势、季节变动、循环变动及不规则变动的含义(P169)3、会计算水平分析指标和速度分析指标(计算题1和4。