统计技术讲义
- 格式:pptx
- 大小:404.95 KB
- 文档页数:21
初级统计师《统计基础知识》讲义:时间数列初级统计师《统计基础知识》讲义:时间数列导语:将反映某一现象的各个时期(或时点)的指标数值,按照时间顺序排列形成的数列。
亦称动态数列。
我们一起来看看相关的考试内容吧。
第一部分本章主要内容一、时间数列的概念和种类(一)时间数列的概念将同一统计指标的数值按其发生的时间先后11.roi,序排列而成的数列称为时间数列。
时间数列一般由两个基本要素构成:1.现象所属的时间;2.反映该现象不同时间的统计指标数值。
(二)时间数列的作用1.时间数列可以描述社会经济现象的发展状态和结果;2.通过时间数列资料可以研究社会经济现象的发展趋势和发展速度;3.通过对时间数列进行分析可以探索社会经济现象发展变化的规律性;4.通过时间数列对某些社会经济现象进行预测,是统计预测方法的一个重要内容;5.把不同的时间数列进行对比,是对社会经济现象进行统计分析的重要方法之一。
(三)时间数列的种类时间数列按其排列的统计指标不同,可分为:总量指标时间数列、相对指标时间数列和平均指标时间数列三种。
其中:总量指标时间数列是基本数列,其余两种是派生数列。
1.将同一总量指标的数值按其发生的'时间先后顺序排列而成的数列叫做总量指标时间数列。
时期数列:当时间数列中所包含的总量指标都是反映社会经济现象在某一段时期内发展过程的总量时,这种总量指标时间数列就称为时期数列。
时点数列:当时间数列中所包含的总量指标都是反映社会经济现象在某一瞬间上所达到的水平时,这种总量指标时间数列就称为时点数列。
2.将同一相对指标的数值按其发生的时间先后顺序排列而成的数列叫做相对指标时间数列。
3.将同一平均指标的数值按其发生的时间先后顺序排列而成的数列叫做平均指标时间数列。
(四)时间数列的特征时间数列一般表现出四种特征:长期趋势、季节变动、循环变动、不规则变动。
(五)时间数列的编制原则1.指标数值所属的时期长短或时间间隔应该一致;2.指标数值所属的总体范围应该一致。
第二节统计学的理论基础和研究方法第三节统计学的基本范畴一、统计总体与总体单位(一)概念统计总体和总体单位,又可以简称为总体和个体,是反映统计认识对象的基本概念.凡是客观存在的,在同一性质基础上结合起来的许多事物的整体,就是统计总体.组成统计总体的个体称为总体单位.例如,一个工业企业,有以职工为单位组成的职工总体,有以每台设备组成的设备总体,有以产品为单位组成的产品总体,有以销售行为为单位组成的销售总体等。
总体和个体是多种多样的,常见的主要有两种,即:以某种客观存在的实体为单位组成的总体,如以个人、家庭、学校、设备、产品、商品等为单位组成的总体称作实体总体;以某种行为、事件为单位组成的总体,如买卖行为、工伤事故、犯罪事件、体育活动等为单位组成的总体称作行为总体。
一个统计总体中所包括的总体单位数可以是无限的,这样的总体称为无限总体;也可以是有限的,则称为无限总体.在社会经济现象中统计总体大多是有限的。
在统计调查中,对无限总体不能进行全面调查,只能调查其中一小部分单位,据以推断总体.对有限总体既可作全面调查,也可只调查其中的一小部分.(二)特点统计总体的形成必须具备一定的条件,作为统计研究具体对象的统计总体,其形成条件主要有三条:第一,同质性。
组成统计总体的所有单位必须是在某些性质上是相同的,例如工业企业总体,必须是由进行工业生产经营的基层单位组成的。
如果是国有工业企业总体,便又多了一个所有制性质上的相同标志,它的范围便小于工业企业总体了。
或数量标志数值;第二,大量性。
统计总体是由许多总体单位构成的。
小型总体(抽样总体)的单位数要足够多;第三,差异性。
构成总体的各单位除了同质性一面还必须有差异性一面,否则便不需要进行统计调查研究了。
例如职工总体中的每个职工,在工种、性别、年龄、文化程度、工资等方面都有差异,这样才构成社会经济统计调查的内容。
二、标志与指标(一)概念标志是说明总体单位属性和特征的名称。
标志按其表现形式有数量标志与品质标志两种。
高中数学必修2《统计》知识点讲义一、引言高中数学必修2中的《统计》部分是我们在日常生活中应用广泛的数学知识。
通过学习统计,我们可以更好地理解世界,做出更明智的决策。
本篇文章将详细讲解统计部分的重要知识点。
二、知识点概述1、描述性统计描述性统计是统计学的基石,它主要研究如何用图表和数值来描述数据的基本特征。
这部分内容将介绍如何制作频数分布表、绘制条形图、饼图和折线图等。
2、概率论基础概率论是统计学的核心,它研究随机事件发生的可能性。
在本部分,我们将学习如何计算事件的概率,了解独立事件与互斥事件的概念。
3、分布论基础分布论是研究随机变量及其分布的数学分支。
本部分将介绍如何计算随机变量的期望和方差,了解正态分布的特点及其在日常生活中的应用。
三、知识点详解1、描述性统计本文1)频数分布表:频数分布表是一种用于表示数据分布情况的表格,其中每一列表示数据的一个取值,每一行表示该取值的频数。
通过频数分布表,我们可以直观地看到数据分布的集中趋势和离散程度。
本文2)图表:图表是描述数据的一种有效方式。
通过绘制条形图、饼图和折线图,我们可以直观地展示数据的数量关系和变化趋势。
2、概率论基础本文1)概率:概率是指事件发生的可能性,通常用P表示。
P(A)表示事件A发生的概率,其值在0和1之间,其中0表示事件不可能发生,1表示事件一定会发生。
本文2)独立事件与互斥事件:独立事件是指两个事件不相互影响,即一个事件的发生不影响另一个事件的概率;互斥事件是指两个事件不包括共同的事件,即两个事件不可能同时发生。
3、分布论基础本文1)期望:期望是随机变量的平均值,通常用E表示。
E(X)表示随机变量X的期望,它是所有可能取值的概率加权平均值。
期望对于预测随机变量的行为非常有用。
本文2)方差:方差是衡量随机变量取值分散程度的指标,通常用D表示。
D(X)表示随机变量X的方差,它是每个取值与期望之差的平方的平均值。
方差越大,随机变量的取值越分散;方差越小,取值越集中。
《统计》讲义一、什么是统计在我们的日常生活和工作中,常常会听到“统计”这个词。
那到底什么是统计呢?简单来说,统计就是对数据的收集、整理、分析和解释的过程。
比如说,一个学校想要了解学生的考试成绩情况,就需要对每个学生的各科成绩进行收集,然后按照班级、年级等进行分类整理,通过计算平均分、最高分、最低分等指标来进行分析,最后得出关于学生学习情况的结论,这就是一个简单的统计过程。
再比如,一家企业想要知道自己产品在市场上的销售情况,会收集各个地区的销售数据,包括销售量、销售额、销售渠道等,整理这些数据后,分析不同地区、不同时间段的销售趋势,从而判断产品的市场表现,为后续的生产和营销策略提供依据。
统计并不仅仅是简单地罗列数据,更重要的是从数据中发现规律、趋势和问题,为决策提供有价值的信息。
二、统计的重要性统计在各个领域都发挥着至关重要的作用。
在经济领域,政府需要通过统计来了解国家的经济运行状况,包括国内生产总值(GDP)、通货膨胀率、失业率等重要指标。
企业也需要统计来分析市场需求、预测销售趋势、评估投资风险等,以制定合理的发展战略。
在医学领域,统计可以帮助研究人员评估药物的疗效、分析疾病的发病率和死亡率,为医疗决策提供依据。
例如,在新冠疫情期间,通过对感染人数、康复人数、死亡人数等数据的统计和分析,政府能够制定相应的防控措施,合理调配医疗资源。
在社会科学领域,统计可以用于研究人口结构、教育水平、收入分配等问题,帮助我们了解社会的发展变化。
在自然科学领域,实验数据的统计分析可以帮助科学家验证假设、发现新的规律。
总之,无论是宏观的国家决策,还是微观的个人生活,统计都在其中扮演着不可或缺的角色。
它能够帮助我们更好地理解世界,做出更明智的决策。
三、统计中的数据收集数据收集是统计的第一步,也是非常关键的一步。
如果收集的数据不准确或者不完整,那么后续的分析和结论就可能出现偏差。
数据收集的方法有很多种,常见的包括普查和抽样调查。
第7节统计基础知识诊断回顾教材务实基础【知识梳理】考点一随机抽样1.抽样的必要性在实际中要全面了解总体的情况,往往难以做到,一般也不可能或没有必要对每个个体逐一进行研究.因为:①一些总体中包含的个体数通常是大量的甚至是无限的.如不可能对所有的灯泡进行试验,记录每一个灯泡的使用寿命;②一些总体具有破坏性.如不可能对所有的炮弹进行试射;③一些调查具有破坏性.如不可能对地里所有的种子是否发芽都挖出来检验;④全面调查(普查)往往要浪费大量的人力、物力和财力.所以常通过从总体中抽取一部分个体,根据对这一部分个体的观察研究结果,再去推断和估计总体情况,即用样本估计总体一一这是统计学的一个基本思想.2.抽样调查(1)总体:统计中所考察对象的某一数值指标的全体构成的集合称为总体.(2)个体:构成总体的每一个元素叫做个体.(3)样本:从总体中抽取若干个个体进行考察,这若干个个体所构成的集合叫做总体的一个样本,样本中个体的数目叫做样本容量.3.简单随机抽样(1)概念一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样.这样抽取的样本,叫做简单随机样本.(2)两种常用的简单随机抽样方法①抽签法(抓阄法):一般地,抽签法就是把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.②随机数法:即利用随机数表、随机数骰子或计算机产生的随机数进行抽样.这里仅介绍随机数表法.随机数表由数字0,1,2,…,9组成,并且每个数字在表中各个位置出现的机会都是一样的.注意:为了保证所选数字的随机性,需在查看随机数表前就指出开始数字的横、纵位置.(3)抽签法与随机数法的适用情况①抽签法适用于总体中个体数较少的情况,随机数法适用于总体中个体数较多的情况,但是当总体容量很大时,需要的样本容量也很大时,利用随机数法抽取样本仍不方便.②一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(3)简单随机抽样的特征①有限性:简单随机抽样要求被抽取的样本的总体个数是有限的,便于通过样本对总体进行分析.②逐一性:简单随机抽样是从总体中逐个地进行抽取,便于实践中操作.③不放回性:简单随机抽样是一种不放回抽样,便于进行有关的分析和计算.④等可能性:简单单随机抽样中各个个体被抽到的机会都相等,从而保证了抽样方法的公平.只有四个特点都满足的抽样才是简单随机抽样.4.系统抽样(1)概念在抽样中当总体个体数较多时,可将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需的样本,这种抽样方法叫做系统抽样.(2)步骤一般地,假设要从容量为N的总体中抽取容量为n的样本,可以按下列步骤进行系统抽样:①先将总体的N个个体编号,有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等.②确定分段间隔k,对编号进行分段.当Nn(n是样本容量)是整数时,取Nkn=.③在第1段用简单随机抽样的方法确定第一个个体编号()l l k≤.④按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号()l k+,再加k得到第3个个体编号(2)l k +,依次进行下去,直到获取整个样本.注意:若Nn不是整数,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.另外,系统抽样适用于总体容量较大,且个体之间无明显差异的情况. 5.分层抽样 (1)概念一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫做分层抽样. 分层抽样适用于已知总体是由差异明显的几部分组成的. (2)分层抽样问题类型及解题思路①求某层应抽个体数量:按该层所占总体的比例计算.②已知某层个体数量,求总体容量或反之求解:根据分层抽样就是按比例抽样,列比例式进行计算. ③分层抽样的计算应根据抽样比构造方程求解,其中“抽样比=样本容量总体容量=各层样本数量各层个体数量”提醒:分层抽样时,每层抽取的个体可以不一样多,但必须满足抽取ii N n n N=⋅(1,2,,i k =)个个体(其中i是层数,n 是抽取的样本容量,i N 是第i 层中个体的个数,N 是总体容量). 6.三种抽样方法的区别和联系三种抽样方法的特点及其适用范围如下表:考点二 用样本估计总体考向1频率分布直方图 1.频率、频数、样本容量的计算方法 (1)频率组距×组距=频率.(2)频数样本容量=频率,频数频率=样本容量,样本容量×频率=频数.(3)频率分布直方图中各个小方形的面积总和等于1 . 2.频率分布直方图中数字特征的计算(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.设中位数为x ,利用x 左(右)侧矩形面积之和等于0.5,即可求出x .(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中n n x p ++,其中为每个小长方形底边的中点,n p 为每个小长方形的面积.考向2百分位数 1.定义一组数据的第p 百分位数是这样一个值,它使得这组数据中至少有00p 的数据小于或等于这个值,且至少有0100p的数据大于或等于这个值.2.计算一组n 个数据的的第p 百分位数的步骤 (1)按从小到大排列原始数据. (2)计算00inp .(3)若i 不是整数而大于i 的比邻整数j ,则第p 百分位数为第j 项数据;若i 是整数,则第p 百分位数为第i 项与第1i 项数据的平均数. 3.四分位数我们之前学过的中位数,相当于是第50百分位数.在实际应用中,除了中位数外,常用的分位数还有第25百分位数,第75百分位数.这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数. 考向3样本的数字特征 1.众数、中位数、平均数(1)众数:一组数据中出现次数最多的数叫众数,众数反应一组数据的多数水平.(2)中位数:将一组数据按大小顺序依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数,中位数反应一组数据的中间水平. (3)平均数:n 个样本数据12,,,n x x x ⋅⋅⋅的平均数为12nx x x x n++⋅⋅⋅+=,反应一组数据的平均水平,公式变2.标准差和方差(1)定义①标准差:标准差是样本数据到平均数的一种平均距离,一般用s 表示.假设样本数据是12,,,n x x x ⋅⋅⋅,x 表示这组数据的平均数,则标准差s =②方差:方差就是标准差的平方,即2222121[()()()]n s x x x x x x n=-+-+⋅⋅⋅+-.显然,在刻画样本数据的分散程度上,方差与标准差是一样的.在解决实际问题时,多采用标准差. (2)数据特征标准差、方差描述了一组数据围绕平均数波动程度的大小.标准差、方差越大,则数据的离散程度越大;标准差、方差越小,数据的离散程度越小.反之亦可由离散程度的大小推算标准差、方差的大小. (3)平均数、方差的性质如果数据12,,,n x x x ⋯⋯的平均数为x ,方差为2s ,那么①一组新数据12,,n x b x b x b ++⋯⋯+的平均数为x b +,方差是2s . ②一组新数据12,,,n ax ax ax ⋯⋯的平均数为ax ,方差是22a s .③一组新数据12,,,n ax b ax b ax b ++⋯⋯+的平均数为ax b +,方差是22a s .考点聚焦突破 分类讲练 以例求法 考点一 随机抽样【例1】(2020•山东泰安)总体由编号为01,02,⋯,29,30的30个个体组成,现从中抽取一个容量为6的样本,请以随机数表第1行第3列开始,向右读取,则选出来的第6个个体的编号为( ) 70 29 17 12 13 40 33 12 38 26 13 89 51 03 56 62 18 37 35 96 83 50 87 75 97 12 55 93A .12B .13C .03D .40【例2】(2020•横峰中学)某中学高二年级共有学生2400人,为了解他们的身体状况,用分层抽样的方法从中抽取一个容量为80的样本,若样本中共有男生42人,则该校高二年级共有女生( ) A .1260B .1230C .1200D .1140【解题总结】1.不论哪种抽样方法,总体中的每一个个体入样的概率都是相同的.2. 分层抽样的前提和遵循的两条原则(1)前提:分层抽样使用的前提是总体可以分层,层与层之间有明显区别,而层内个体间差异较小,每层中所抽取的个体数可按各层个体数在总体的个体数中所占比例抽取. (2)遵循的两条原则:①将相似的个体归入一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则; ②分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比等于抽样比.【训练1】下列抽取样本的方式属于简单随机抽样的个数为( ) ①从无限多个个体中抽取100个个体作为样本.②盒子里共有80个零件,从中选出5个零件进行质量检验.在抽样操作时,从中任意拿出一个零件进行质量检验后再把它放回盒子里.③从20件玩具中一次性抽取3件进行质量检验.④某班有56名同学,指定个子最高的5名同学参加学校组织的篮球赛. A .0 B .1 C .2 D .3【训练2】(2014•湖南理)对一个容器为N 的总体抽取容量为n 的样本,当选取简单随机抽样、系统抽样和分层抽样三种不同方法抽取样本时,总体中每个个体被抽中的概率分别为123,,p p p ,则( ) A .123p p p =< B .231p p p =< C .132p p p =< D .123p p p ==【训练3】(2014•天津理)某大学为了解在校本科生对参加某项社会实践活动的意向,拟采用分层抽样的方法,从该校四个年级的本科生中抽取一个容量为300的样本进行调查.已知该校一年级、二年级、三年级、四年级的本科生人数之比为4:5:5:6,则应从一年级本科生中抽取_______名学生.考点二 用样本估计总体考向1频率分布直方图【例1】(2017•北京文)某大学艺术专业400名学生参加某次测评,根据男女学生人数比例,使用分层抽样的方法从中随机抽取了100名学生,记录他们的分数,将数据分成7组:[)20,30,[)30,40,,[]80,90,并整理得到如下频率分布直方图:(1)从总体的400名学生中随机抽取一人,估计其分数小于70的概率;(2)已知样本中分数小于40的学生有5人,试估计总体中分数在区间[)40,50内的人数; (3)已知样本中有一半男生的分数不小于70,且样本中分数不小于70的男女生人数相 等.试估计总体中男生和女生人数的比例.【解题总结】 1.考查角度:(1)利用频率分布直方图求频率、频数;(2)利用频率分布直方图估计总体.2.易错防范:频率分布直方图的纵坐标是频率组距,而不是频率. 【训练1】(2020•天津)从一批零件中抽取80个,测量其直径(单位:mm ),将所得数据分为9组:[5.31,5.33),[5.33,5.35),,[5.45,5.47],[5.47,5.49],并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间[5.43,5.47)内的个数为( )A .10B .18C .20D .36【训练2】(2016•四川文)我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查,通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照[)0,0.5,[)0.5,1,……[]4,4.5分成9组,制成了如图所示的频率分布直方图.(1)求直方图中的a 值;(2)设该市有30万居民,估计全市居民中月均用水量不低于3吨的人数.说明理由; (3)估计居民月均用水量的中位数.考向2百分位数【例1】5,6,7,8,9,10,11,12,13,14的0025分位数为________,0075分位数为________,0090分位数为________.【训练3】调查某校高三年级男生的身高,随机抽取40名高三男生,实测身高数据(单位:cm )如下:171 163 163 166 166 168 168 160 168 165 171 169 167 169 151 168 170 168 160 174 165 168 174 159 167 156 157 164 169 180 176 157 162 161 158 164 163 163 167 161 试估计该校高三年级男生的身高数据的0030分位数.考向3样本的数字特征【例1】(2019•全国Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y 的频数分布表.(1)分别估计这类企业中产值增长率不低于0040的企业比例、产值负增长的企业比例;(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)8.602≈.【解题总结】1.众数、中位数、平均数、方差的意义及常用结论(1)平均数、中位数、众数描述其集中趋势,方差和标准差描述波动大小.(2)方差的简化计算公式:()22222121[]n s x x x nx n =++⋅⋅⋅+-或写成()22222121n s x x x x n=++⋅⋅⋅+-,即方差等于原数据平方的平均数减去平均数的平方. 2.主要命题角度:(1)样本的数字特征与频率分布直方图交汇(2)样本的数字特征与优化决策问题交汇:利用样本的数字特征解决优化决策问题的依据①平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小.标准差、方差越大,数据的离散程度越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定. ②用样本估计总体就是利用样本的数字特征来描述总体的数字特征.【训练4】(2020•上海)已知有四个数1,2,,a b ,这四个数的中位数为3,平均数为4,则ab = . 【训练5】(2020•全国Ⅲ)设一组样本数据12,,,n x x x ⋯⋯的方差为0.01,则数据1210,10,,10n x x x ⋯⋯的方差为( ) A .0.01B .0.1C .1D .10【训练6】(2020•全国Ⅲ)在一组样本数据中,1,2,3,4出现的频率分别为1234,,,p p p p ,且411i i p ==∑,则下面四种情形中,对应样本的标准差最大的一组是( ) A .14230.1,0.4p p p p ==== B .14230.4,0.1p p p p ==== C .14230.2,0.3p p p p ====D .14230.3,0.2p p p p ====【训练7】(2015•安徽)若样本数据1x ,2x ,⋅⋅⋅,10x 的标准差为8,则数据121x -,221x -,⋅⋅⋅,1021x -的标准差为A .8B .15C .16D .25。