统计学3
- 格式:doc
- 大小:160.50 KB
- 文档页数:7
统计学3西格玛原则
统计学3西格玛原则,也称为“3σ原则”或“3倍标准差原则”,指的是在正态分布的情况下,大约68%的数据会落在平均值附近1个标准差的范围内;约95%的数据会在平均值附近2个标准差的范围内;约99.7%的数据会在平均值附近3个标准差的范围内。
简单来说,3σ原则可以用来衡量数据的离散程度。
在统计分析中,标准差是一种衡量数据分散程度的常用工具。
标准差越小,表示数据越接近平均值,相反,标准差越大则表示数据越分散。
通过3σ原则,我们可以确定数据的分布情况以及异常值的出现频率。
如果数据距离平均值超过3倍的标准差,那么这个数据点就可以被认为是异常值或者离群点。
因此,在数据分析中,我们可以利用3σ原则初步排除掉异常值,使得数据更加准确可信。
此外,3σ原则也可以用来确定产品质量是否达标。
对于某个产品的生产数据,如果均值和标准差都已知,那么我们就可以根据3σ原则来确定该产品的合格率。
例如,如果生产数据呈正态分布,那么如果产品的特性指标离平均值超过3倍标准差,则该产品的合格率只有0.3%,这就需要进一步优化和改进生产工艺和质量管理措施。
需要注意的是,3σ原则只适用于符合正态分布的数据,并且在使用时需要根据实际情况进行调整。
例如,对于非正态分布的数据,需要根据实际情况进行统计分析和处理。
此外,3σ原则只能作为一种初步数据分析的方法,需要配合其他分析工具和方法进行综合分析。
总之,统计学3σ原则是一种常用的数据分析方法,可以用来衡量数据的分布情况、排除异常值以及判断产品质量是否达标。
在实际应用中,需要结合实际情况进行分析和调整,以保证数据分析的准确性和可靠性。
3.1、什么是统计整理?统计整理的程序有哪些?统计整理是根据统计研究任务的要求,对统计调查阶段所取得的各项原始资料进行分类、汇总,使之系统化、条理化、科学化,得出能反映现象总体特征的综合资料的各种过程。
统计资料整理既是统计调查阶段的继续和深入,又是统计分析阶段的基础和前提,在统计工作中起着承前启后的作用。
(1)根据研究目的设计整理汇总方案。
(2)对统计调查资料进行审核、订正。
(3)进行统计分组和汇总。
(4)将汇总整理的资料编制成统计表(5)统计资料的积累、保管和公布。
3.2 统计资料审核哪些内容?统计调查资料的审查检查资料的完整性和及时性应以统计制度和调查方案为准,核实所有被调查单位的资料是否齐全,是否按规定的份数、项目和时间上报。
检查资料的准确性主要是核实调查材料的口径、计算方法、包括的范围、计量单位等是否符合要求。
检查的方法有逻辑检查和计算检查。
逻辑检查是从合理性方面去检查资料的正确性。
计算检查是通过计算,检查在计算方法、计量单位、计算结果、小计、合计、总计间的各项是否正确等等3.3、什么是统计分组?它有什么作用?统计分组根据统计研究的目的和客观现象的内在特点,按某个标志或几个标志把被研究的总体划分为若干个不同性质的组的一种统计方法。
统计分组的对象是总体。
统计分组标志可以是品质标志,也以是数量标志。
(1)划分社会经济现象的类型统计的研究对象是错综复杂的,具有各种不同的类型。
通过统计分组,可以从数量方面说明不同类型现象的数量特征,表明不同类型现象的本质和发展规律。
(2)反映现象的内部结构及其比例关系将所研究现象按某一标志进行分组,计算出各组在总体中的比重,用以说明总体内部的构成。
同时将总体各组之间进行对比,就可以反映各组之间的比例关系。
(3)分析现象之间的依存关系现象不是孤立的,而是相互依存和相互联系的.利用统计分组分析现象之间的依存关系,首先用影响标志对总体进行分组,然后计算出结果标志的数值,从而分析两个标志的联系程度和方向。
模拟题B一、单项选择题(在备选答案中,选择一个正确的答案。
每题2分,共50分)1、某大学的一位研究人员希望估计该大学一年级新生在教科书上的花费,为此,他观察了200名新生教科书上的花费,发现他们每个学期平均在教科书上的花费是250元。
该研究人员所感兴趣的总体是( C )。
A、该大学的所有学生B、所有的大学生C、该大学所有的一年级新生D、样本中的200名新生2、1990年发表的一份调查报告显示,为了估计佛罗里达州有多少居民愿意支付更多的税金以保护海滩环境不受破坏,共有2500户居民接受了调查。
该项调查中,最有可能采用的数据收集方法是( C )。
A、设计的试验B、公开发表的资料C、随机抽样D、实际观察3、1990年发表的一篇文章讨论了男性和女性MBA毕业生起薪的差别。
文章称,从前20名商学院毕业的女性MBA的平均起薪是54749美元,中位数是47543美元,标准差是10250美元。
根据这些数据可以判断,女性MBA起薪的分布形状是( B )。
A、尖峰、对称B、右偏C、左偏D、均匀4、要了解成都市居民家庭的收支情况,最适合的调查方式是( D )。
A、普查B、重点调查C、典型调查D、抽样调查5、某股票在2000年、2001年、2002年和2003年的年收益率分别为4.5%,2.1%,25.5%,1.9%,则该股票在这四年的平均收益率为( A )。
A、8.079%B、7.821%C、8.5%D、7.5%6、根据切比雪夫不等式,至少有( D )的数据落在平均数加减3个标准差的范围之内。
A、68%B、99%C、95%D、89%7、评价统计量标准之一是随着样本统计量的数学期望等于总体参数,该标准称为( A )。
A.、无偏性B、有效性C、一致性D、准确性8、如果峰态系数小于于0,则表明这组数据( A )。
A 、扁平分布B 、尖峰分布C 、左偏分布D 、右偏分布 9、在概率度(可靠程度)一定的条件下( B )。
A 、允许误差较大,应抽取的单位越多B 、允许误差较小,应抽取的单位越多C 、允许误差较小,应抽取的单位越少D 、无法确定允许误差和应抽取单位数的变化10、在其它条件相同时,抽样平均数的抽样标准差减少到原来数1/3,则抽样单位就须( A )A 、增大到原来的9倍B 、增大到原来的3倍C 、比原来增加9倍D 、比原来减少8倍11、在下列两两组合的平均指标中,那一组的两个平均数完全不受极端数值的影响( D )A 、算术平均数和调和平均数B 、几何平均数和众数C 、调和平均数和众数D 、众数和中位数12、若甲单位的平均数比乙单位的平均数小,但甲单位的标准差比乙单位的标准差大,则( B )A 、甲单位的平均数代表性比较大B 、甲单位的平均数代表性比较小C 、两单位的平均数代表性一样大D 、无法判断13、设样本1X ,2X ,……,n X 取自正态总体N (u ,2σ),其中u 、2σ为未知参数。
统计学第3章数值性的主要统计指标统计学中,数值性的主要统计指标是描述和总结数据集中数值变量的中心趋势和离散程度。
这些指标包括平均数、中位数、众数、四分位数、极差、方差和标准差等。
1. 平均数(Mean)是数据集中所有数值的总和除以观测次数。
它是一种常见的统计指标,用于表示数据的“典型”数值。
平均数对异常值敏感,受数据的分布和范围影响较大。
2. 中位数(Median)是将数据按大小排序后,处于中间位置的数值。
它不受异常值的影响,适用于数据存在明显偏态或异常值的情况。
3. 众数(Mode)是数据集中出现频率最高的数值。
对于离散变量,可能存在多个众数;对于连续变量,众数可能不存在或不唯一4. 四分位数(Quartiles)将数据按大小排序后,将数据集分为四个部分。
第一个四分位数(Q1)是排序后数据集中25%位置处的数值,第二个四分位数(Q2)就是中位数,第三个四分位数(Q3)是75%位置处的数值。
四分位数用于描述数据的分布和离群值。
5. 极差(Range)是数据集中最大值与最小值之间的差值。
它衡量了数据的全局离散度,但忽略了数据集的内部变化。
6. 方差(Variance)是数据值与其平均数之间的差的平方和的平均值。
方差表示了数据的离散程度,反映了数据点离平均值的距离。
7. 标准差(Standard Deviation)是方差的平方根。
标准差是用于衡量数据的离散度的常用指标。
一般来说,标准差越大,数据的离散程度越高。
这些统计指标能够揭示数据的集中趋势和离散程度,帮助我们理解数据的分布情况。
根据数据的类型和分布情况,选择适当的统计指标进行描述和总结,能够更好地理解数据,进行进一步的分析和推断。
第三章综合指标教学内容:1.总量指标的含义、种类、计量单位及其各种单位的特点2.相对指标的含义、表现形式及种类3.平均指标的内涵、作用、各种平均数的计算方法、应用场合4.标志变异指标的含义、作用、种类及其计算教学重点:1.总量指标的种类2.相对指标的种类及计算3.平均指标的种类、计算及其应用场合4.标志变异指标的作用、种类及其应用场合教学难点:平均指标、标志变异指标的计算及其应用场合授课学时:8学时统计指标按其作用和表现形式不同分为三大类:总量指标、相对指标和平均指标,我们把这三类指标统称为综合指标,即综合反映总体的数量特征和数量关系的指标。
第一节总量指标一、总量指标的概念概念:总量指标也称绝对指标,是反映现象在一定的时间、地点条件下的总规模和总水平的指标。
如:2007年全国原油产量为1.87亿吨;2007年全国国内生产总值为为246619亿元;2007年末全国总人口为132129万人2007年全国汽车产量为888. 7万辆;2007年全国工业增加值为107367亿元;2007年末全国就业人员76990万人,其中城镇就业人员29350万人。
总量指标均是用绝对指标表达出来的,也称绝对指标,作用:①它是对现象总体认识的起点(基础数据)。
总量指标是最基本的统计指标,利用它可以反映社会经济开展的规模和水平,说明一个国家的经济实力, 也可说明企业生产经营的成果。
②它是计算平均指标和相对指标的基础,平均指标、相对指标是由绝对指标月实际完成的累计数已到达计划规定数,那么剩余的时间为提前完成计划的时间。
或将全部时间减去自计划执行之日起至累计实际数量已到达计划任务的时间,即为提前完成计划的时间。
如上例,某工业部门截止2005年6月底实际完成的基建投资额已到达8000 万元,那么该部门提前半年时间完成十-五规划。
④计划执行进度的检查它是用计划期中某一段时期的实际累计完成数与计划期全期的计划任务数之比来检查计划执行的进度。
《统计学》模拟自测题3一、单项选择题(每小题1分,共20分)1.某生产小组4名工人的月收入分别是1620、1650、1700、1800,这些数是 ( )。
A 、标志 B 、标志值 C 、指标 D 、指标值 2.对某市自行车进行普查,调查对象是( )。
A 、所有自行车车主B 、每一自行车车主C 、所有自行车D 、每一辆自行车3.以1000名职工为一个统计总体,研究其工资情况,则总体单位是( )。
A 、每一名职工B 、1000名职工C 、每名职工的工资D 、1000名职工工资总额4.平均工资,人均GDP ,平均成绩,商业网密度,这四个指标中属于质量指标的有( )。
A 、1个 B 、2个 C 、3个 D 、4个 5.( )是质量指标。
A 、优等品产量B 、社会零售商品总额C 、流动资金余额D 、计划完成程度 6.2010年举行的第六次全国人口普查是( )。
A 、重点调查B 、典型调查C 、一次性调查D 、经常性调查 7.某地区2011年末大牲畜存栏数为1368万头,该项指标应是( )。
A 、时期指标B 、时点指标C 、既是时期指标又是时点指标D 、无法判断8.对浙江省饮食业从业人员的健康状况进行调查,报告单位是( )。
A 、全部网点B 、每个网点C 、所有从业人员D 、每个从业人员 9.在标志变异指标中,由总体中两个极端值决定的是( )。
A 、全距(极差)B 、平均差C 、标准差D 、标准差系数 10.下面哪一条不是统计分组的作用( )。
A 、划分类型B 、反映总体内部结构C 、研究现象间的依存关系D 、反映现象的变动趋势 11.用于反映单个现象变动程度的相对数是( )。
A 、综合指数B 、平均数指数C 、平均指标指数D 、个体指数 12.加权算术平均数的大小( )。
A 、受各组次数的影响最大 B 、受各组标志值的影响最大 C 、受各组标志值和次数的共同影响 D 、不受各组次数的影响 13.统计调查的最基本要求是( )。
A 、统计资料的及时性B ,统计资料的全面性C 、统计资料的准确性D 、统计资料的方便性14.某厂5年的销售收人如下:200万,220万,250万,300万,320万,则平均增长量( )。
A 、5120 B 、4120 C 、5200320 D 、420032015.将各组标志值的次数数都扩大S 倍,则平均数将( )。
A、缩小S倍B、扩大S倍C、不变D、扩大1/S16.已知某企业总产值2010年比2005年增长187.5%,2009年比2005年增长150%,则2010年比2009年增长()。
A、37.5%B、125%C、115%D、15%17.指标数值随研究范围的大小而增减的综合指标是( )。
A、相对指标B、总量指标C、平均指标D、质量指标18.按几何法计算的平均发展速度推算可以使()。
A、推算的各期水平之和等于各期实际水平之和B、推算的期末水平等于实际期末水平C、推算的各期定基发展速度等于实际的各期定基发展速度D、推算的各期增长量等于实际的逐期增长量19.工业企业数、钢产量、电力消耗量、商业网点数四个指标中属于时点指标的是( )。
A、电力消耗量、商业网点数B、工业企业数、商业网点数C、工业企业数、钢产量D、钢产量、电力消耗量20.某农贸市场土豆价格2月份比1月份上升5%,3月份比2月份下降2%,则3月份土豆价格与1月份相比()。
A、提高2.9%B、提高3%C、下降3%D、下降2%二、判断题(每小题1分,共20分)1.发展速度与增长速度都不是综合指标。
()2.时期指标的大小不受计算期时间长短的制约。
()3.编制时间数列的总原则是:保证时间数列中各项指标数值具有可比性。
()4.定基增长速度的连乘积等于环比增长速度。
()5.调查单位就是填报单位。
()6.统计指数不是综合指标。
()7统计整理主要是对调查取得的原始资料进行科学的汇总、加工的工作过程。
()8.某校学生按年龄分组,形成的各组按大小顺序排列,然后列出各组的单位数,即为变量数列。
()9.在等距数列中,全距一定,组距越小,组数肯定越多。
()10.统计学是一门方法论性质的学科。
()11.调和平均数指数实际上是算术平均数指数的变形。
()12.总体和总体单位不是固定不变的,随着研究的目的不同而发生变化。
()13.综合指数是计算总指数的基本形式,应此它比平均数指数应用的范围更广。
()14.统计报表既可用于全面调查,又可用于非全面调查。
()15.全国城镇居民人均收入指标具有平均的含义,因此将其归入平均指标。
()16.时间数列可以分为时期数列和时点数列两种。
()17.甲城市GDP为乙是城市GDP的%是比较相对指标。
()18.统计分析是统计调查和统计整理的基础工作。
()19.现象每期的增长速度相同,说明每期增长的绝对量也相等。
()20.调和平均数是算术平均数的特例。
()三、简答题(每一小题为5分,共10分)1、什么是总体单位总量?什么是总体标志总量?举例说明。
2、编制动态数列的原则是什么?以下各题为计算题(必须列出计算式,计算结果尾数保留:绝对数为0.01、相对数为0.01%)四、计算题(一)(每一小题为5分,共30分)1、设:某企业计划规定,今年的计划产量要比去年实际产量提高5%;而今年的产量计划完成程度为102%,问:今年的实际产量比去年实际提高了多少?要求:(1)平均成绩;(2)标准差。
3、某市“十一五”计划规定2010年比2005年GDP增长80%,要求年平均增长速度达到多少才能完成规定的任务?(2)通过计算有关指标,评价甲、乙两村平均亩产量的代表性大小。
5、某市2000年地区生产总值为1000亿元,2001—2003年期间地区生产总值的年平均增长速度为12%,2004年—2007年期间的年平均增长速度为15%,2008—2010年期间的年平均增长速度为18%。
要求:(1)2010年该市的地区生产总值;(2)10年中该市地区生产总值的年平均增长速度。
要求:(1)销售价格总指数;(2)销售量总指数。
五、计算题(二)(每一小题为10分,共20分)要求:(1)将表中空格数字填齐;(2)计算2006~2011年该企业产量的年平均水平、年平均增长量和年平均增长速度。
要求:试从相对数和绝对数两方面分析总产值变动及其影响因素。
以下为本试卷的标准答案:一、单项选择题(每小题1分,共20分)1、B2、C3、A4、D5、D6、C7、B8、B9、A 10、D11、D 12、B 13、C 14、B 15、C 16、D 17、B 18、B 19、B 20、A二、判断题(每小题1分,共20分)1、×2、×3、√4、×5、×6、×7、√8、√9、√10、√11、×12、√13、×14、√15、×16、×17、√18、×19、×20、×三、简答题(每一小题为5分,共10分)1、答:总体单位总量是用来反映总体中单位数多少的总量指标;总体标志总量是用来反映总体中单位标志值总和的总量指标。
以某企业的全部职工为统计总体时,职工人数是总体单位总量,而职工的工资总额是标志总量。
2、答:编制时间数列的主要目的是通过对数列中各个指标进行动态分析,来研究现象的发展变化过程或趋势。
因此,保证数列中各指标值之间的可比性,就成了编制时间数列时应遵守的基本原则。
可比性的具体要求包括以下几方面:(1)时间长短应该统一;(2)总体范围应该一致;(3)经济内容应该一致;(4)计算方法要一致;(4)计算价格和计量单位要一致。
四、计算题(一)1、解:今年的实际产量比去年实际提高了=(1+5%)×102%-100%=7.1%2、解:(1)平均成绩(分)75.77403110==∑∑fxf (2)标准差=(分))(18.11405.49972==-∑∑ff x x 3、解:年平均增长速度=%100-%8015+=12.47%24000150000120150甲x===145(千克/亩)200+1000+1501500180500315000===157.515005002000x ⨯+⨯+乙(千克/亩)11.18σ==甲(千克/亩)12.99σ==乙(千克/亩)11.18V ==7.71%145σ甲 12.99V ==8.24%157.5σ甲 ∵ V V σσ<乙甲 ∴甲村平均亩产量的代表性大。
5、解:(1)2010年该市的地区生产总值为:3431000 1.12 1.15 1.18=4037.30⨯⨯⨯(亿元) (2)10年中该市地区生产总值的年平均增长速度为:1=14.98%6、解:(1)销售价格总指数11p111860+38005660K ==99.46%186038005690.91+1.10.95pq p q p k==∑∑(2)销售量总指数1005690.91K =162.60%15002000q q p q p==+∑∑五、计算题(二)(每一小题为10分,共20分) 1、(1)见下表(2)年平均水平 =(件)10443611410109001045010400100009500=+++++年平均增长量= (件)3825950011410=-年平均增长速度= %73.3%1009500114105=-2、第一步,分析总产值的总变动:总产值指数168276378822114.97%145220350715++===++报告期比基期增加的总产值=822-715=107(万元) 第二步,分析总产值的变动原因: ①分析出厂价格的变动对总产值的影响 出厂价格总指数=822822109.60%1682763787501.12 1.15 1.05==++由于出厂价格的提高而增加的总产值 = 822-750 =72(万元) ②分析产量的变动对总产值的影响 产量总指数750104.90%715== 由于产量的增加而增加的总产值=750-715=35(万元) 第三步,综合说明114.97% = 104.90% × 109.60%107(万元)= 35(万元)+72(万元)。