当前位置:文档之家› 剑桥大学统计学讲义

剑桥大学统计学讲义

剑桥大学统计学讲义
剑桥大学统计学讲义

Statistical Tables

%points of t n

n0.9950.990.9750.95

2.58 2.33 1.96 1.645 1.282

%points ofχ2n

n0.990.9750.950.9

95%points of F n

,n2

1

n2\n11234568121620304050

统计学讲义稿

第五章统计量及其分布 在概率论的学习中,我们已经知道,随机变量及其概率分布全面描述了随机现象的统计规律性,但在实际问题的研究中概率分布往往是未知的。我们要讨论统计量的分布,找到总体参数与统计量的分布之间的联系,进而通过样本去推断总体的数字特征。 第一节总体与样本 1.总体 统计学把所要研究的事物或现象的全体称为总体,而把构成总体的每个元素(成员)称为个体。要研究10,000名在校大学生,10,000名大学生就构成总体,每位大学生就是个体。实际问题的研究中,我们关心的往往不是大学生(个体)的一切方面,而是它的某个数量标志,比如大学生的身高,这时所有的身高就构成总体,总体表现为一个数据集,其中有的数值大有的数值小,有的出现机会多,有的出现机会少,记身高为X,它是一个随机变量,记其分布函数为F(x)。可以把X的所有可能取值看做总体,并称这一总体为具有分布函数F(x)的总体。 总体也可以是多维的,如研究大学生的身高对体重的影响,身高和体重这两个数量标志就构成二维随机向量(X1,X2),其取值的全体就构成总体,即二维总体,记二维随机向量(X1,X2)的联合分布函数为F(x1, x2),称这一总体为具有分布函数F(x1, x2)的总体。

2.样本 统计学对总体的研究是以样本为工具的。为了掌握总体的分布规律,从总体中随机抽取n 个个体,其标志值(比如身高数值)记为(x 1,x 2,…,x n ),则(x 1,x 2,…,x n )称为总体的一个样本,样本包含的个体的数目n 称为样本容量。 由于样本是从总体中随机抽取的,抽取前无法预知它的数值,每个X i (1,2,…n)都是一个随机变量,样本(X 1,X 2,…,X n )则是一个n 维随机向量。样本在抽取后就有确定的观测值,表现为n 个具体的数据(x 1,x 2,…,x n )。 3. 简单随机样本 抽取样本是手段,推断总体才是目的。为使样本更好的反映总体的信息,对样本抽取有两个基本要求。一是样本具有随机性,总体中每个个体都有同等可能性进入样本,即每个X i 与总体X 具有相同的分布F (x )。二是样本满足独立性,即X 1,X 2,…,X n 相互独立,每一X i 的取值不影响另一X i 的取值。 如果从总体X 中抽取样本(12,,,n X X X L ),其每个分量i X (1,2,,i n =L )都与总体X 具有相同的概率分布,且相互独立,则 这样的抽样方法称为简单随机抽样,而如此得到的样本,称为简单随机样本。如果总体X 具有分布函数()F x 或概率密度()f x ,显然来自总体X 的简单随机样本(12,,,n X X X L )具有联合概率分布 1 ()n i F x =∏或联合概率密度1 ()n i f x =∏。

社会统计学讲义

《社会统计学》讲义 教学目的和要求: 通过本课程的学习,使学生熟悉常用的统计方法,并且学会如何将统计分析知识应用于社会调查研究之中,掌握统计方法的灵活运用。本课程偏重统计方法的实际应用,而非其数理基础。在教学过程中,注重对于不同统计分析方法适用条件的说明,统计公式的讲解,以及对于统计值意义的说明。 教学重点和难点: 本课程的教学重点是不同统计分析方法所适用的条件以及统计值意义的解释。难点是统计公式的讲解以及不同统计分析方法在实际社会调查研究中的应用。 教法特点说明: 课堂讲授为主,注重对实例的讲解。 教材和参考书目: 1、卢淑华著:《社会统计学(第三版)》,北京大学出版社,2007年。 2、李沛良著:《社会研究的统计应用》,社会科学文献出版社,2002年。 3、柯惠新等著:《调查研究中的统计分析法》,北京广播学院出版社,1992年。 4、风笑天著:《现代社会调查方法》,华中科技大学出版社,2001年。 5、袁方主编:《社会研究方法教程》,北京大学出版社,1997年。

第一章统计学简史 教学目的和要求: 通过本章的学习使学生了解统计学的产生、发展历程有初步的认识。 教学重点和难点: 重点是国势学派与政治算数学派的差异,难点是文字记述与数字记述各自的特点。 教学方法: 课堂讲授 教学内容: 一、统计学的起源 统计技术:古埃及、古中国(大禹治水) 统计学:17世纪中叶Status(拉丁词汇,国家、状态)——Statistics 研究国家的宏观状态①国势学②政治算术 二、国势学(17世纪的德国) 德国大学学派:H·Coring 用文字记录一个国家的状况和制度 G·Achenwall 第一个定义——把国家的显著事项全部记录 下来的学科 三、政治算术(17世纪的英国) 英国的经验主义者:用数量或数字的方法说明国家的特征 J·Graunt 《关于伦敦死亡表的观察》用数量分析社 会、政治问题 William Petty 《政治算术》 四、概率论(数理特征更加明显) 1.J Bernoulli(贝努里)瑞士大数法则借助大数法则可以从社会现象复杂 不定的偶然性中寻找规律,它说明了社会现象的稳定性 2.Gauss(高斯)德国正态分布(中心极限定理的基础) 五、数理统计学 Adolphe Quetelet(阿道夫·凯特勒)法籍比利时人 数理统计学派的创始人“经验社会学之父”《社会物理学》

应用统计学试题及答案解析

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

统计学讲义1

Statistics 102133030-01 Lecture 1

Administrative Issues ?Time: Thursday 19:20-21:55 (?)?Location: Teaching Building No. One B305 (Jiang’an Campus) ?Instructor: XIONG Hui(熊晖) Office: Econ507 North (Wangjiang Campus) Email: hxiongecon@https://www.doczj.com/doc/8a5948509.html, Office Hours: ?

Administrative Issues ?Introduction to the use of statistical analysis.?Topics include elementary probability theory, sampling distributions, tests of hypotheses, estimation, and regression analysis.?Emphasis: economic applications ?Bilingual course: instruction language is Mandarin Chinese; course materials are in English.

Administrative Issues ?Text book: Anderson, Sweeney, Williams, Camm, and Cochran: Statistics for Business and Economics 12th Edition, South-Western,201?Software: Stata

卢淑华讲义全

社会统计学讲义(卢淑华) 第一章社会学研究与统计分析 一、社会调查资料的特点(随时掌握) 随机性、统计规律性; 二、统计学的作用:为社会研究提供数据分析和推论的方法 三、统计分析的作用及其前提。 四、统计分析方法的选择 1、全面调查和抽样调查的分析方法 2、单变量和多变量的统计分析方法 五、不同变量层次的比较;定类、定序、定距、定比 定义、数学特征、运算特性、涵盖关系、等 第二章单变量统计描述分析 一、统计图表,熟悉不同层次变量对应的分析图表,不能混淆。尤其是直方图的意义。 二、标明组限与真实组限的换算,重要。 三、集中趋势测量法 1、定义、优缺点、注意事项; 2、众值:定义、计算公式、解释、运用,注意事项; 3、中位值:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项; 4、均值:定义、计算公式(分组与加权)、解释、运用,注意事项; 5、众值、中位值和均值的关系及其相互比较,会用众值和中位值估算均值; 四、离散趋势测量法 1、定义、优缺点、注意事项,与集中趋势的关系; 2、异众比例:定义、计算公式、解释、运用,注意事项; 3、质异指数:定义、计算公式、解释、运用,注意事项; 4、四分位差:定义、计算公式(频数和比例两种公式)、解释、运用,注意事项;要会举一反三,如求十分位差、以及根据数据求其在总体中的位置。 4、方差及标准差:定义、计算公式(分组与加权)、解释、运用,注意事项; 第三章概率 一、概率:就是指随机现象发生的可能性大小。随机现象具有不确定性和随机性。 二、概率的性质: 1、不可能事件的概率为0; 2、必然事件的概率为1; 3、随机事件的概率在0-1之间; 三、概率的计算方法: 1、古典法:计算等概率事件,P=有效样本点数/样本空间数; 2、频率法:求随机事件在多次试验后的极限频率。 3、概率是理论值,只有一个,频率是试验值,不同的试验有不同的频率。 四、概率的运算:会画文氏图 1、加法公式:两个或多个随机事件的求和概率‘ 2、乘法公式:两个或多个随机时间共同发生的概率。分为独立事件的乘法和条件概率的乘法公式。 (1)独立:P(AB)=P(A)*P(B) (2)条件:PAB)=P(A)*P(A/B)=P(B)*P(B/A) 3、条件概率:将(2)反过来即可。P(B/A)是指在A发生的条件下B发生的概率。 4、全概公式:互不相容的完备事件组,求任意一个事件的发生 5、逆概公式:与4相反。

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

统计学第三章习题

第三章数据分布特征的描述 一、单选题 1. 如果所掌握到的只是各单位的标志值(变量值),这时计算算术平均数()。 A 应用简单算术平均数B应用加权算术平均数 C用哪一种方法无法判断D这种资料不能计算算术平均数 2. 加权算术平均数受什么因素的影响()。 A 只受各组变量值大小的影响B只受各组次数多少的影响 C同时受以上两种因素的影响D无法做出判断 3. 权数本身对加权算术平均数的影响决定于()。 A 权数所在组标志值的大小B权数绝对数值的大小 C各组单位数占总体单位数比重的大小D总体单位数的多少 4. 标志值的次数多少,对于算术平均数的影响有权衡轻重的作用。若把标志值的次数都缩小为原来的十分之一,则算术平均数的值为()。 A 也缩小为原来的十分之一B保持不变C扩大为原来的十倍D无法判断 5. 如果被平均的每一个标志值都增加5个单位,则算术平均数的数值()。 A 也增加5个单位B只有简单算术平均数是增加5个单位 C减少5个单位D保持不变 6. 设某企业在基期老职工占60%,而在报告期准备招收一批青年工人,估计新职工所占的比重将比原来增加20%。假定老职工和新职工的工资水平不变,则全厂职工的总平均工资将如何变化()。 A 提高B降低C不变D无法判断 7. 设有8个工人生产某种产品,他们的日产量(件)按顺序排列是:4、6、6、8、9、12、14、15,则日产量的中位数是()。 A 4.5B 8和9 CD没有中位数 8. 在下列哪种情况下, 算术平均数、众数和中位数三者相等()。 A 只有钟形分布B只有U形分布 C钟形分布或U形分布D只有对称的钟形分布 9. 当变量右偏分布时,有()。 A MoMe>X C Mo≤Me≤X D Mo≥Me≥X 10. A 各组工资水平的变动B各组人数的增加C各组人数结构的变动D职工收入的下降 11. 总体的离散程度越大,说明()。 A 平均数的数值越大B平均数的代表性越大C平均数的数值越小D平均数的代表性越小 12. 平均差的基本含义可表述为()。

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

统计学第三章课后题及答案解析

第三章 一、单项选择题 1.统计整理的中心工作是() A.对原始资料进行审核 B.编制统计表 C.统计汇总问题 D.汇总资料的再审核 2.统计汇总要求资料具有() A.及时性 B.正确性 C.全面性 D.系统性 3.某连续变量分为五组:第一组为40—50,第二组为50—60,第三组为60—70,第四组为70—80,第五组为80以上,依习惯上规定() A.50在第一组,70在第四组 B.60在第二组,80在第五组 C.70在第四组,80在第五组

D.80在第四组,50在第二组 4.若数量标志的取值有限,且是为数不多的等差数值,宜编制() A.等距式分布数列 B.单项式分布数列 C.开口式数列 D.异距式数列 5.组距式分布数列多适用于() A.随机变量 B.确定型变量 C.连续型变量 D.离散型变量 6.向上累计次数表示截止到某一组为止() A.上限以下的累计次数 B.下限以上的累计次数 C.各组分布的次数 D.各组分布的频率

7.次数分布有朝数量大的一边偏尾,曲线高峰偏向数量小的方向,该分布曲线属于() A.正态分布曲线 B.J型分布曲线 C.右偏分布曲线 D.左偏分布曲线 8.划分连续变量的组限时,相临组的组限一般要() A.交叉 B.不等 C.重叠 D.间断 二、多项选择题 1.统计整理的基本内容主要包括() A.统计分组 B.逻辑检查 C.数据录入 D.统计汇总

E.制表打印 2.影响组距数列分布的要素有() A.组类 B.组限 C.组距 D.组中值 E.组数据 3.常见的频率分布类型主要有() A.钟型分布 B.χ型分布 C.U型分布 D.J型分布 E.F型分布 4.根据分组标志不同,分组数列可以分为() A.组距数列 B.品质数列 C.单项数列

统计学概论课件讲义

授课目录第一章质量管理概说 第二章统计学概论 第三章机率概论及机率分配 第四章统计制程管制与管制图 第五章计量值管制图 第六章计数值管制图 第七章制程能力分析 第八章允收抽样的基本方法 第九章计数值抽样计划 第十章计量值抽样计划 第十一章量具之再现度与再生度第十二章质量管理之新七大手法

1. 导论 统计学是一探讨如何搜集数据与分析数据的科学研究方法。在不确定的状态下,藉由样本数据所提供的讯息,经归纳分析、推论检定、决策与预测等过程。『以事实(数字)作决策』。

2.1认识统计 ◎自古以来,人类从事各项研究活动均是为求真理,亦是社会文明进步的原动力。然而通往真理的路上充满混沌与挫折,如何厘清真相,统计学自然就成为一门极重要的科学研究工具。 ◎统计学是由搜集数据、整理数据、分析数据及解释意义等规则与程序所组成。 ◎统计学研究过程: 推论= 估计+ 假设检定 Inferential Statistics = Estimation + Testing Hypothesis

2.2 统计精神就是科学研究的精神 ◎ 著名统计学家费雪(R. A. Fisher, 1890-1962)曰:统计方法的目的是基于经验观察,去改进我们对系统的了解---即统计的基本精神。 ◎ 架构一系列有组织有系统且可分析的研究过程,以获得客观可靠的结论---即科学研究的精神。 系 统 理 论---线 性 系 统 “Ref: The Six Sigma Way , by Peter S. Pande, Robert P. Neuman, & Roland R. Cavanagh, McGraw-Hill.” 『系统三要素---输入、过程、输出』

《应用统计学》练习试题和答案解析

《应用统计学》本科 第一章导论 一、单项选择题 1.统计有三种涵义,其基础就是( )。 (1)统计学 (2)统计话动 (3)统计方法 (4)统计资料 2.一个统计总体( )。 (1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标 3.若要了解某市工业生产设备情况,则总体单位就是该市( )。 (1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备 4.某班学生数学考试成绩分刷为65分、71分、80分与87分,这四个数字就是( )。 (1)指标 (2)标志 (3)变量 (4)标志值 5.下列属于品质标志的就是( )。 (1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资 6.现要了解某机床厂的生产经营情况,该厂的产量与利润就是( )。 (1)连续变量 (2)离散变量 ()3前者就是连续变量,后者就是离散变量 (4)前者就是离散变量,后者就是连续变量 7.劳动生产率就是( )。 (1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标 8.统计规律性主要就是通过运用下述方法经整理、分析后得出的结论( )。 (1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法 9.( )就是统计的基础功能。 (1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能 10.( )就是统计的根本准则,就是统计的生命线。 (1)真实性 (2)及时件 (3)总体性 (4)连续性 11.构成统计总体的必要条件就是( )。 (1)差异性 (2)综合性 (3)社会性 (4)同质性 12.数理统计学的奠基人就是( )。 (1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔 13.统汁研究的数量必须就是( )。 (1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量 14.数量指标一般表现为( )。 (1)平均数 (2)相对数 (3)绝对数 (1)众数 15.指标就是说明总体特征的.标志则就是说明总体单位特征的,所以( )。 (1)指标与标志之同在一定条件下可以相互变换 (2)指标与标志都就是可以用数值表示的 (3)指标与标志之间不存在戈系 (4)指标与标志之间的关系就是固定不变的 答案:一、1(2) 2(4)3(4)4(4)5(2)6(4)7(2)8(2)9(3)10(1)11(4)12(3)13(2)14(3)15(1) 二、1× 2× 3√ 4× 5√ 6× 7√ 8× 9√ 10× 11× 12× 二、判析题 l.统计学就是一门研究现象总体数量方面的方法论科学,所以它不关心、也不考虑个别现象的数量特征。 ( ) 2.三个同学的成绩不同.因此仃在三个变量 ( ) 3.统计数字的具体性就是统讣学区别于数学的根本标志。 ( ) 4.统计指标体系就是许多指标集合的总称。 ( ) 5.一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。( ) 6.统计研究小的变异就是指总体单位质的差别。 ( ) 7.社会经济统计就是在质与量的联系中.观察与研究社会经济现象的数量方面。( ) 8.运用大量观察法必须对研究对象的所有单位进行观察调查。( )

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

统计学讲义

(重庆科技学院经管类选修课讲义)统计学讲义 战勇 二0 0五年十月

目录 总论 (3) 第一节统计学的性质与作用 (3) 第二节统计学的理论基础和研究方法 (5) 第三节统计学的基本范畴 (6) 第四节统计指标与统计指标体系 (9) 一、统计指标 (9) 二总量指标 (10) 三、相对量指标 (12) 三、统计指标体系 (16) 第二部分统计资料搜集、整理与显示 (17) 第一节统计调查的种类和内容 (17) 一、统计调查的意义 (17) 二、统计调查的种类 (18) 三、统计调查方案 (18) 第二节统计调查的组织形式 (20) 一、统计报表 (20) 二、专门调查 (21) 第三节统计资料的整理 (22) 一、统计资料整理的概念和作用 (22) 二、统计资料整理的步骤 (23) 三、统计分组 (23) 四、次数分配 (25) 第四节统计表 (29) 一、统计表的构成(与调查表的区别)p79 (29) 二、统计表的种类 (30) 第三部分统计数据的分布特征 (31) 第一节平均指标 (31) 一、平均指标的意义 (31) 二、平均指标的种类及其计算 (31) 第二节标志变动度 (36) 一、标志变动度的意义 (36) 二、测定标志变动度的指标 (37) 第三节运用平均指标的原则 (39) 第四部分抽样推断 (40) 第一节抽样调查的一般问题 (40) 一、抽样的概念和特点 (40) 二、抽样调查的作用 (41) 三、抽样调查的几个基本概念 (41) 四、抽样调查的理论基础 (43) 第二节抽样误差 (43) 一、抽样误差的概念 (43) 三、抽样平均误差 (44) 四、抽样极限误差 (45) 第三节抽样估计的方法 (46) 一、抽样估计的特点 (46) 二、抽样估计的优良标准 (46) 三、抽样估计的方法 (47) 第四节抽样的组织方式 (48) 一、抽样调查的程序 (48)

应用统计学试题和答案汇编

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的 置信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值范围是 。 7、设总体X ~ ) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则 n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共 14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )

统计学讲义

东南大学统计学辅导班笔记 总论 本章学习重点:本章是全课程的总纲,主要讲述统计学的对象和方法、统计的作用和统计学的基本概念。 本章学习难点:是统计学概念的理解和运用以及概念之间的相互关系。 第一节统计学的性质与作用 一、“统计”一词的含义 统计是一种社会调查活动,不论是宏观社会的整体调查研究,还是微观事物的观察分析,都需要统计。在日常生活中“统计”有着多种含义。例如,开学时,辅导员要统计一下到校的学生人数;篮球比赛中教练员要统计每个队员的投篮命中率、犯规的次数;农户在农作物收获后统计其产量等。这时“统计”是一个动词,我们一般称其为统计工作,它是指搜集、整理和分析数字资料的工作,具有计数的含义。 统计工作的结果形成一系列的数字资料,也称统计资料或统计数据,这是“统计”的另一个含义。它和前面讲的统计工作是紧密相连的,是统计工作的结果。例如,我们班的学生人数120人,女生占30%,男女生的比例为2.33:1等。国家统计局每年出版统计年鉴,反映国家的经济、文化教育以及科技发展等情况,这些都是在这个意义上的统计。 除了上面所讲的两个方面的含义之外,“统计”一词还有另外的含义,即作为一门科学的统计学,它是研究客观现象的数量方面的科学。 “统计”一词虽有上述三方面的涵义,但它们之间又是具有密切联系的。统计资料是统计工作的成果,统计学是统计实践活动的经验总结和理论概括,统计工作是在统计理论的指导下进行和完成的。 二、统计学的性质 1.统计学研究的对象是客观现象的数量方面。早期统计所研究的问题有人口调查、出生与死亡的登记等,后来又扩大到社会经济和生物实验等方面。目前不论社会的、自然的、或实验的,凡是有大量数据出现的地方,都要用到统计学。凡能以数量来表现的均可作为统计学的研究对象。统计方法已渗透到其他科学领域,成为当前最活跃的学科之一。 2.统计学研究的是总体现象的数量特征与规律性。统计学所研究的是总体的数量特征及其分布的规律性。总体是由许多个体组成的,各个个体在数量特征上受必然和偶然两种因素的支配,必然因素反映了该总体的特征,但由于受偶然因素的影响又是有差异的,如何通过这些个体的差异来描述或推断总体的特征就产生了统计学。

统计学课件讲义 第4章 统计数据的整理与显示

第4章统计数据的整理与显示 一、统计数据整理 1、概念:统计整理,就是指根据统计研究目的,将统计调查所得的原始资料进行科学的分 类汇总,或对已经加工的次级资料进行再加工,为统计分析准备系统化、条理化 的综合资料的工作过程。 2、作用:它是从对现象的感性认识过渡到理性认识的开始,是这个过程的连续点,并为这 个过程提供坚实的基础。在统计工作中起着承前启后的作用 3、整理汇总必须遵守的原则:在对所研究的社会经济现象进行深刻分析的基础上,抓住最 基本、最能说明问题本质特征的统计分组和统计指标对统计 数据加工整理。 4、数据整理的程序: 设计和编制统计资料的整理方案→对调查获得的资料进行审核{对原始资料进行审核对二手数据进行审核 数据筛选 →按照一定的组织方式和方法,对原始资料进行分组、编码、汇总和计算→对整理好的统计资料再次进行审核,改正在汇总过程中产生的各种差错→将汇总整理的结果编制成统计表或绘制统计图,简明扼要地表明现象的数量特征→积累、公布和管理统计数据 注:对原始资料的审核包括准确性审核、及时性审核和完整性审核 对二手数据的审核包括完整性审核、准确性审核、重审数据的适用性和时效性 5、统计汇总是整理的核心其组织形式基本有3种:集中汇总、逐级汇总和综合汇总,统计汇总的技术主要有手工汇总和电子计算机数据处理2种。 二、统计分组 1、概念:统计分组是指根据事物内在的特点和统计研究的需要,将统计总体按照一定的标 志区分为若干组成部分的一种统计方法。 2、原则:组内同质,组间差异原则、穷尽原则、互斥原则 3、作用:I.可以区分现象质的差别 II.可以分析总体内部结构和总体结构特征 III.可以揭示现象之间的依存关系 4、种类: 按分组标志的多少,统计分组可分为简单分组和复合分组 按分组的标志性质不同,统计分组可分为品质分组(属性分组)和数量分组(变量分组)。 品质分组:就是按品质标志进行分组。一般地,对于类别数据,采用品质分组。 数量分组:就是按数量标志分组。数量标志的变异性体现在它不断变动自身的数量上,故也称为变量分组。 品质分组所形成的数列成为品质数列,数量分组所形成的数列称为变量数列。 按分组的作用和任务不同,统计分组可分为类型分组、结构分组和分析分组 5、分组标志的选择:统计分组中关键的问题在于选择分组标志和各组界限的划分,而选择分组标志则是统计分组的核心问题。 I.根据统计研究的目的与任务选择分组标志 II.在若干个标志中,要抓住具有本质性的或主要的标志作为分组的依据 III.根据现象所处的历史条件或经济条件来选择标志

应用统计学试题及答案193765讲课讲稿

应用统计学试题及答案193765

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 一. 单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85% 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位

B.时间每增加一个单位,产品成本平均下降1.75个单位 C.产品成本每变动一个单位,平均需要1.75年时间 D.时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=5.6件乙车间: x=90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二.多选题 (每题2分,共14分) 1.下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E.企业职工人数2000人 2.在数据的集中趋势的测量值中,不受极端数值影响的测度值是 A. 均值 B. 众数 C. 中位数 D. 几何平均数 E. 调和平均数

统计整理讲义

统计整理 第一节统计资料整理的意义和程序 一、统计整理的概念和意义 统计整理是根据统计研究的任务与要求,对调查得来的各种原始资料,进行科学的整理与加工,使之系统化,从而得出反映总体特征的综合资料,包括系统地积累资料与为研究特定问题对资料的再加工。 统计调查取得的原始资料是分散的、杂乱的、不系统的,只能表明各个被调查单位的具体情况,反映事物的表面现象或一个侧面,不能说明事物的全貌、总体情况。因此,只有对这些资料进行加工整理才能认识事物的总体及其内部联系。 统计资料整理,是统计调查的继续,也是统计分析的前提,在整个统计工作中具有承前启后的作用。 二、统计整理的程序 统计整理是一项细致周密的工作,需要有计划、有组织的进行,因此,进行统计资料整理必须按以下步骤进行: 1.设计和编制统计资料的汇总方案。 2.对原始资料进行审核和修订。为了保证统计资料的质量,在统计资料进行整理前,应该对统计调查材料的准确性、及时性、完整性进行严格的审核,看它们是否达到准确、及时、完整,若发现问题及时纠正。汇总后须对其结果进行逻辑检查和技术性检查。 3.用一定的组织形式和方法对原始资料进行分组。 主要根据汇总的要求和工作条件选择适当的汇总组织形式和具体方法对原始资料进行整理、加工,以达到我们的目的。 4.对分组后的资料进行汇总和计算。它包括汇总各个指标的分组数值和总计数值,即计算各组和总体的单位总数,计算各组和总体的标志总量。 手工汇总:划记法、记录法、折叠法、卡片法。 电子计算机汇总:原始数据加工、存储、合并与分类、逻辑检查、运算和汇总表打印。 5.对汇总好的资料再一次审核。以便改正汇总整理过程中所产生的各种差错。

相关主题
文本预览
相关文档 最新文档