当前位置:文档之家› 麻省理工学院应用统计学教程

麻省理工学院应用统计学教程

多因素实验分析

对应于Tamhane和Dunlop所著讲义的第13章

幻灯片主要由Elizabeth Newton(美国麻省理工学院)制作,其中一部分由Jacqueline (约翰霍普金斯大学)制作。

1

多因素实验分析

见课本第505页的图表13.1

2

模型和估计

3

对任何模型

观测的响应值向量

拟合值向量

总平均向量

SST =总平方和=

SSM=模型平方和=

SSE=误差平方和=

4

?经过嘌呤霉素处理的细胞的生物化学反应

5

嘌呤霉素数据文件的矩阵散点图

6

因子(conc,vel)图

图中横坐标为:酶作用物的浓度;纵坐标为:反应的初始速度

7

因子(state,vel)图

图中横坐标为:告知是否被处理过的状态因子;纵坐标为:反应的初始速度

8

“均衡的嘌”

呤霉素数据文件中的速率

9

速率的直方图

10

交互作用图

(pyb$state,pyb$conc,pyb$vel)

图中横坐标为:pyb$state;纵坐标为:pyb$vel的平均值

11

交互作用图

(pyb$conc,pyb$state,pyb$vel)

图中横坐标为:pyb$conc;纵坐标为:pyb$vel的平均值

12

嘌呤霉素模型的小结

13

带有交互作用的嘌呤霉素模型的观测速率和拟合值

14

模型的表格

15

命令

multicomp(pyb.aov,focus=“concf”)

16

嘌呤霉素模型的残差vs.拟合值图中横坐标为:拟合值( pyb.aov);纵坐标为:残差(pyb.aov)

17

嘌呤霉素模型的残差的QQ图

图中横坐标为:标准正态化的分位数;纵坐标为:残差(pyb.aov)

18

没有交互作用的嘌呤霉素模型的小结

19

没有交互作用的嘌呤霉素模型的观测速率和拟合值

20

应用统计学试题及答案解析

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 1 C 2 B 3 A 4 C 5 B 6 B 7 A 8 A 9 C 10 C 一.单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分 比为 A. –5% B. –4.76% C. –33.3% D. 3.85%

6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位 B. 时间每增加一个单位,产品成本平均下降1.75个单位 C. 产品成本每变动一个单位,平均需要1.75年时间 D. 时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公 斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x =70件,σ=5.6件 乙车间: x =90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A 甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间

(完整版)EXCEL统计学应用教程

数学与统计学院 本科教学实验讲义(实验)课程名称统计学 贵州财经学院教务处制表

统计学实验教学讲义 Excel 工作界面简介 附图1 Excel 工作界面 按附图1 从上到下的顺序,Excel 工作界面包含如下几项内容:“标题”栏、“菜单”栏、“工具”栏、“编辑”栏、工作表、工作表标签、滚动条、 和“状态”栏。下面分别介绍它们的作用。 (一)“标题”’栏 “标题”栏告诉用户正在运行的程序名称和正在打开的文件的名称。 如图附-1 所示,标题栏显示“Microsoft Excel-Book1”表示此窗口的应用程序为Microsoft Excel ,在Excel 中打开的当前文件的文件名为Book1.xls。 (二)“菜单”栏 “菜单”栏按功能把Excel 命令分成不同的菜单组,它们分别是“文件”、“编

辑”、“视图”、“插入”、“格式”、“工具”、“表格”、“帮助”。当菜单项被选中时,引出一个下拉式菜单,可以从中选取相应的子菜单。另外,在屏幕的不同地方单击鼠标右键时,“快捷菜单”将出现在鼠标指针处。选取“快捷菜单”中的命令同从菜单栏的菜单上选取相应命令的效果是一样的,但选取速度明显增快。 (三)“工具”栏 Excel 可显示几种工具栏,这些工具可控制简化用户的操作。“工具”栏中的按钮都是菜单中常用命令的副本,当鼠标指向某一按钮后,稍等片刻在按钮右下方会显示该按扭命令的含意。用户可以配置“工具”栏的内容,通过“视图”菜单中的“工具”栏子菜单来选择显示不同类型的“工具”或全部显示出来。下面介绍出现在Excel 开始屏幕中的两种“工具”栏。 1.“常用”工具栏 “常用”工具栏中为用户准备了访问Excel 最常用命令的快捷按钮,如“新建文件”按扭,“打开文件”按扭,“保存文件”按钮等。 2.“格式”工具栏 “格式”工具栏专门放那些和文本外观有关的命令,如字体、字号、对齐方式及其他选项。 (四)“编辑”栏 “编辑”栏给用户提供活动单元格的信息。在“编辑”栏中用户可以输入和编辑公式,“编辑”栏位于图1 中第5 行。 “编辑”栏由“名字”栏和“公式”栏组成。位于“编辑”栏左侧的“名字”栏中显示的是活动单元格的坐标,也可在“名字”栏中直接输入一个或一块单元格的地址进行单元格的快速选定;位于“编辑”栏右侧的“公式”栏可用于编辑活动单元格的内容,它包含三个按钮和一个编辑区。当向活动单元格输入数据时,公式栏中便出现三个按钮,三个按钮从左至右分别是:“╳”(取消)按钮、“√”(确认)按钮和“=”(公式指南)按钮。 通常Excel 在工作区中显示“编辑”栏。在“视图”菜单中的“编辑栏”命令是一个开关命令,它可以用于隐藏或显示“编辑”’栏。 (五)工作表 工作簿窗口包含了16 张独立的工作表(sheet)。开始时,窗口中显示第一张工作表“Sheetl”,该表为当前工作表。当前工作表只有一张,用户可通过点击工作表下方的标签击活其他工作表为当前工作表。 工作表是一个由行和列组成的表格。行号和列号分别用字母和数字区别。行由上自下范围1~65536,列号则由左到右采用字母编号A~IV。因此,每张表为256 列╳65536 行,若从Excel 导入的数据超过以上范围,则会被Excel 自动截去。每一个行、列坐标所指定的位置称之为单元格。在单元格中用户可以键人符号、数值、公式以及其他内容。 (六)工作表标签 工作表标签通常用“Sheet1”,“Sheet2”等名称来表示,用户也可以通过用鼠标右击标签名,选择弹出菜单中“重命名”命令来修改标签名。 Excel 一般同时显示工作表队列中的前3 个标签。利用标签队列左边的一组标签滚动按钮可显示队列中的后续工作表的标签。工作簿窗口中的工作表称之为当前工作表,当前工作表的标签为白色,其他为灰色。 (七)“滚动”栏

应用统计学试题及答案

应用统计学试题及答案 LG GROUP system office room 【LGA16H-LGYY-LGUA8Q8-LGA162】

二、单项选择题(每题1分,共10分) 1.重点调查中的重点单位是指( ) A.处于较好状态的单位 B.体现当前工作重点的单位 C.规模较大的单位 D.在所要调查的数量特征上占有较大比重的单位 2.根据分组数据计算均值时,利用各组数据的组中值做为代表值,使用这一代表值的假定条件是()。 A.各组的权数必须相等 B.各组的组中值必须相等 C.各组数据在各组中均匀分布 D.各组的组中值都能取整数值 3.已知甲、乙两班学生统计学考试成绩:甲班平均分为70分,标准差为分;乙班平均分为75分,标准差为分。由此可知两个班考试成绩的离散程度() A.甲班较大 B.乙班较大 C.两班相同 D.无法作比较 4.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600公斤,其余亩产为500公斤,则该乡全部早稻平均亩产为() 公斤公斤公斤公斤 5.时间序列若无季节变动,则其各月(季)季节指数应为() A.100% % % % 6.用最小平方法给时间数列配合直线趋势方程y=a+bt,当b<0时,说明现象的发展趋势是() A.上升趋势 B.下降趋势 C.水平态势 D.不能确定 7.某地区今年和去年相比商品零售价格提高12%,则用同样多的货币今年比去年少购买()的商品。 8.置信概率表达了区间估计的() A.精确性 B.可靠性 C.显着性 D.规范性 9.H 0:μ=μ ,选用Z统计量进行检验,接受原假设H 的标准是() A.|Z|≥Z α B.|Z|-Z α 10.对居民收入与消费支出的几组不同样本数据拟合的直线回归方程如下,你认为哪个回归 方程可能是正确的() A.y=125-10x =-50+8x =150-20x =-15-6x 三、多项选择题(每题2分,共10分) 1.抽样调查的特点有()。 A.抽选调查单位时必须遵循随机原则 B.抽选出的单位有典型意义 C.抽选出的是重点单位 D.使用部分单位的指标数值去推断和估计总体的指标数值 E.通常会产生偶然的代表性误差,但这类误差事先可以控制或计算 2.某种产品单位成本计划比上年降低5%,实际降低了4%,则下列说法正确的是 () A.单位成本计划完成程度为80% B. 单位成本计划完成程度为% C.没完成单位成本计划 D.完成了单位成本计划 E.单位成本实际比计划少降低了1个百分点 3.数据离散程度的测度值中,不受极端数值影响的是() A.极差 B.异众比率 C.四分位差 D.标准差 E.离散系数

统计学专业及其应用领域的介绍

一、统计学专业介绍 统计学专业主要培养具有良好的数学、计算机与经济学素养,掌握统计学的基本理论和方法,能熟练地运用计算机分析数据,能在企业、事业单位和经济、管理部门从事统计调查、统计信息管理、数量分析等开发、应用和管理工作。 在偶然中寻求必然是应用统计技术的核心。统计方法作为一种为决策提供依据的工具,可以帮助企业进行数据分析,了解产品质量状态的分布情况,找出问题、缺陷及原因,有针对性地采取措施,提高产品和服务的质量。有不少著名企业在市场分析、产品开发与设计、工艺设计、生产控制与营销策略方面应用统计技术,结果使得其产品成本下降,产品质量和市场占有率提高,公司经济效益显著提高。 二、统计学的应用 1、企业发展战略 发展策略是一个企业长远的发展方向。控制发展战略一方面需要及时的了解和把握整个宏观经济的状况及发展变化趋势,另一方面还要对企业进行合理的市场定位,把握企业自身的优势和劣势。所有这些都需要统计提供可靠的数据,利用统计方法进行科学的数据分析和预测。 2、产品质量管理 质量是企业的生命,是企业持续发展的基础。质量管理中离不开统计的应用。在一些知名的跨国公司, 6准则已经成为一种重要的管理理念。质量控制应经成为统计学在生产领域中的一项重要应用。各种统计质量控制图被广泛应用于监测生产过程。 3、市场研究 企业要在激烈的市场竞争中取得优势,首先必须了解市场,要了解市场就需要进行广泛的市场统计调查,取得所需信息,并对这些信息进行统计分析,以便作为生产和营销的依据。 4、财务分析 上市公司的财务数据是股民投资的重要参考依据。一些投资咨询公司主要是

根据上市公司提供的财务和统计数据进行分析,为股民提供参考。企业自身的投资也离不开对财务数据的分析,其中要用到大量的统计方法。 5、经济预测 企业要对未来市场状况进行预测。比如:对产品的市场潜力进行预测,及时调整生产计划。这就需要利用统计方法进行收集、整理和分析数据。 6、人力资源管理 利用统计方法对企业员工的年龄、性别、受教育程度、工资等进行分析,并作为企业制度工资计划、奖惩程度的依据。

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为元,标准差为元。试以%的置信水平估计该快餐店顾客的总体平均花费数额的置信区 间;(φ(2)=)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==? n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额%的置信区间为(,) 3 要求:①、利用最小二乘法求出估计的回归方程;②、计算判定系数R 。 附:10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β) ==-??-?290 217900572129042430554003060 = =-= ∑∑n x n y ββ)) 1 0 – ×58= 估计的回归方程为:y ) =+x ② 计算判定系数: 4 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数

= 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷(二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下:257、276、297、252、238、310、240、236、265,则其下四分位数 5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 % 。 7、对回归系数的显着性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p e M >o M ③、x >o M >e M 3、比较两组工作成绩发现σ甲>σ乙,x 甲>x 乙,由此可推断 ( )

统计学课程教程教案

统计学课程教程教案(1) 2010~2011学年第一学期 课程名称:统计学(statistics)课程代码:62251020(62251030) 学时:54 学分:3 适用专业:税务财务管理会计旅游管理物流管理电子商务国际经济与贸易课程类别:专业主干课 先修课程:政治经济学、经济数学参考教材:《统计学基础》陈仁恩、厦门大学出版社 一、课程目的、任务 统计学是经济与管理学科各专业的学生必修的一门重要基础课,本课的内容既包括统计方法,也包括必要的社会经济指标核算的基本知识。通过课堂教学使学生能掌握统计学的基本知识和技能,能运用所学的统计理论对社会经济现象进行调查研究,并能运用统计方法分析、研究有关经济问题,为国民经济的管理提供真实可靠的数字资料,提高经济管理水平。因此,在教学上要通过本课程的学习,使学生能够掌握统计学的基本原理、基本方法及基本统计指标的核算,并能运用所学知识,完成对统计资料的搜集、整理和分析,提高学生对社会经济问题的数量分析能力。 在经济与管理学科各专业的教学中,对统计知识的需求不一样,因此有的内容对不同的专业有不同的要求,具体的要求将在各章的教学内容中加以说明。 在各章的教学要求中,有关基本概念、基本理论的内容按“了解、一般了解、重点理解”三个层次要求;有关指标的基本公式、计算方法及数量分析方法等内容按“会、掌握、熟练掌握”三个层次要求。

二、课程教学基本要求 教学要求:学习《统计学》课程,总的要求是要熟悉统计学基本理论、理解和掌握统计学的基本分析方法。 教学目标:学生初步掌握对统计信息资料基本分析方法的运用。 主要教学环节安排:理论教学45学时,实验教学9学时 教学方法:课堂理论讲授与实例分析相结合。本课程以教师讲授和学生自主学习为主,同时组织相应教辅材料、教学活动以配合本课程教学的顺利进行。 教学形式:以教师讲授的板书内容为主(教学内容中的粗体字),同时组织相应统计实验(以实验大纲和实验指导书为标准)、统计习题。 考核方式:闭卷考试+实践报告 三、课程教学重点 1、统计学的有关基本概念; 2、统计实践活动的环节; 3、统计基本分析方法。 课程教学难点 统计调查方式理解与选择;统计资料的分组整理;统计分析指标及统计分析方法。

统计学专业职业生涯规划

职业生涯规划书 一、职业规划对自我的意义 从专业角度来看,职业生涯规划是指个人与组织相结合,在对一个人职业生涯的主客观条件进行测定、分析、总结的基础上,对自己的兴趣、爱好、能力、特点进行综合分析与权衡,结合时代特点,根据自己的职业倾向,确定其最佳的职业奋斗目标,并为实现这一目标做出行之有效的安排。职业设计的目的绝不仅是帮助个人按照自己的资历条件找到一份合适的工作,达到与实现个人目标,更重要的是帮助个人真正了解自己,为自己定下事业大计,筹划未来,拟定一生的发展方向,根据主客观条件设计出合理且可行的职业生涯发展方向。 于我自身而言,职业生涯规划就是有计划的规划自己的未来,一步一个脚印的去实现自己的职业理想。学习了职业生涯规划,让我更加清晰的认清了自己的发展方向,让我更加明白这条路该如何走。 二、自我分析 1.兴趣爱好:自己的性格有时候比较活泼开朗,有时候又比较内向,不太善和同学交流;喜欢听歌,但不会唱歌;还是比较喜欢运动,比如篮球、足球都还挺喜欢的,但对于舞蹈不太感冒;平时就上上网啊,看看电影,玩玩游戏,时不时出去游玩;对于学习,通常是前半学期比较积极,后半学期就开始懒惰了,导致成绩总是不理想。 2.性格特征:具有双重性的,在做事方面通常都是很认真但不太积极,有时存在一定的惰性,在理智中又存在着盲目。现在来到学校我想主动去观察已经代替了过去在高中的那种被动的接受,自己在清醒的面对现实时又多少带有一种脱离实际的幻想。在以后的学习工作中,我要努力改进自己的不足,发扬自己的长处,让自己变的更优秀。 3.学习方面:有点马虎不认真,造成学习成绩的不理想,以后这方面应该积极的改进,在以后我将以积极的态度努力学习,争取以优异的成绩完成学业。 4. 自我潜能分析:我想每个人都有自己的潜能,只是发挥没发挥出来的问

应用统计学:参数估计习题及答案

简答题 1、矩估计的推断思路如何?有何优劣? 2、极大似然估计的推断思路如何?有何优劣? 3、什么是抽样误差?抽样误差的大小受哪些因素影响? 4、简述点估计和区间估计的区别和特点。 5、确定重复抽样必要样本单位数应考虑哪些因素? 计算题 1、对于未知参数的泊松分布和正态分布分别使用矩法和极大似然法进行点估计,并考量估计结果符合什么标准 2、某学校用不重复随机抽样方法选取100名高中学生,占学生总数的10%,学生平均体重为50公斤,标准差为48.36公斤。要求在可靠程度为95%(t=1.96)的条件下,推断该校全部高中学生平均体重的范围是多少? 3、某县拟对该县20000小麦进行简单随机抽样调查,推断平均亩产量。根据过去抽样调查经验,平均亩产量的标准差为100公斤,抽样平均误差为40公斤。现在要求可靠程度为95.45%(t=2)的条件下,这次抽样的亩数应至少为多少? 4、某地区对小麦的单位面积产量进行抽样调查,随机抽选25公

顷,计算得平均每公顷产量9000公斤,每公顷产量的标准差为1200公斤。试估计每公顷产量在8520-9480公斤的概率是多少?(P(t=1)=0.6827, P(t=2)=0.9545, P(t=3)=0.9973) 5、某厂有甲、乙两车间都生产同种电器产品,为调查该厂电器产品的电流强度情况,按产量等比例类型抽样方法抽取样本,资料如下: 试推断: (1)在95.45%(t=2)的概率保证下推断该厂生产的全部该种电器产品的平均电流强度的可能范围 (2)以同样条件推断其合格率的可能范围 (3)比较两车间产品质量 6、采用简单随机重复和不重复抽样的方法在2000件产品中抽查200件,其中合格品190件,要求: (1)计算样本合格品率及其抽样平均误差

应用统计学练习题(含答案)

应用统计学练习题 第一章绪论 一、填空题 1.统计工作与统计学的关系是__统计实践____和___统计理论__的关系。 2.总体是由许多具有_共同性质_的个别事物组成的整体;总体单位是__总体_的组成单位。 3.统计单体具有3个基本特征,即__同质性_、__变异性_、和__大量性__。 4.要了解一个企业的产品质量情况,总体是_企业全部产品__,个体是__每一件产品__。 5.样本是从__总体__中抽出来的,作为代表_这一总体_的部分单位组成的集合体。 6.标志是说明单体单位特征的名称,按表现形式不同分为__数量标志_和_品质标志_两种。 7. 8.统计指标按其数值表现形式不同可分为__总量指标__、__相对指标_和__平均指标__。 9.指标与标志的主要区别在于: (1)指标是说明__总体__特征的,而标志则是说明__总体单位__特征的。 (2)标志有不能用__数量__表示的_品质标志_与能用_数量_表示的_数量标志_,而指标都是能用_数量_表示的。 10.一个完整的统计工作过程可以划分为_统计设计_、_统计调查_、_统计整理_和__统计分析__4个阶段。 二、单项选择题 1.统计总体的同质性是指(A)。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志或数量标志 D.总体各单位具有若干互不相同的品质标志属性或数量标志值 2.设某地区有800家独立核算的工业企业,要研究这些企业的产品生产情况,总体是( D)。

A.全部工业企业 B.800家工业企业 C.每一件产品 D.800家工业企业的全部工业产品 3.有200家公司每位职工的工资资料,如果要调查这200家公司的工资水平情况,则统计总体为(A)。 A.200家公司的全部职工 B.200家公司 C.200家公司职工的全部工资 D.200家公司每个职工的工资 4.一个统计总体( D)。 A.只能有一个标志 B.可以有多个标志 C.只能有一个指标 D.可以有多个指标 5.以产品等级来反映某种产品的质量,则该产品等级是(C)。 A.数量标志 B.数量指标 C.品质标志 D.质量指标 6.某工人月工资为1550元,工资是( B )。 A.品质标志 B.数量标志 C.变量值 D.指标 7.某班4名学生金融考试成绩分别为70分、80分、86分和95分,这4个数字是( D)。 A.标志 B.指标值 C.指标 D.变量值 8.工业企业的职工人数、职工工资是(D)。 A.连续变量 B.离散变量 C.前者是连续变量,后者是离散变量 D.前者是离散变量,后者是连续变量 9.统计工作的成果是(C)。 A.统计学 B.统计工作 C.统计资料 D.统计分析和预测 10.统计学自身的发展,沿着两个不同的方向,形成(C)。 A.描述统计学与理论统计学 B.理论统计学与推断统计学 C.理论统计学与应用统计学 D.描述统计学与推断统计学

应用统计学专业大数据方向人才培养方案

应用统计学专业(大数据方向)人才培养方案 学科门类:理学 二级类:统计学类 专业代码:071202 英文名称:Applied Statistics(Big data) 一、专业培养目标 本专业培养德、智、体、美全面发展,掌握数学、统计学和经济学等相关学科的基本理论和知识,具备运用统计方法和大数据处理技术,利用计算机处理和分析数据的能力,能在企事业、经济、金融、保险等部门从事数据采集、预处理、数据挖掘、大数据应用分析及开发、数据可视化等工作的高素质应用型人才。 二、专业培养规格 1、知识结构 (1)掌握计算机的基础知识。 (2)掌握中外文资料查询、文献检索及运用现代信息技术获取相关信息的基本方法。 (3)熟练掌握一门外语,能顺利阅读本专业的外文资料和撰写外文摘要。 (4)具有社会学、文学、哲学和历史学等社会科学基本知识。 (5)掌握经济学、管理学的基本理论知识。 (6)掌握政治、形式与政策、思想道德修养与法律基础等基本知识。 (7)具有坚实的数学理论基础。 (8)了解与统计学相关的自然学科的基本知识,具有坚实的统计学和经济学理论基础。 (9)掌握统计学的基本思想和方法,熟悉统计政策和法规; (10)理解大数据技术领域的基本理论和基本知识。 (11)掌握大数据科学与技术的基本思维方法和研究方法,了解大数据技术的应用前景、以及相关行业最新进展与发展动态。 (12)具有分布式数据库原理与应用、大数据技术框架、数据分析与方法、数据挖掘技术、数据可视化技术、并行与分布式计算原理、大数据编程技术等专

业知识。 2、能力结构 (1)具有一定的语言文字表达能力,掌握资料查询,文献检索及运用现代信息技术获得相关信息的能力,能够跟踪统计学领域最新技术发展趋势。 (2)具备自主学习、对终身学习有正确的认识,具有不断学习和适应发展的能力。 (3)具有运用统计方法进行数据采集、处理、分析、推断和预测的能力。 (4)能熟练使用统计软件并具备一定的编程能力,并且能正确利用统计思想和方法分析判断软件的计算结果。 (5)具备应用统计方法解决企事业、经济、金融、保险等领域实际问题的能力。 (6)了解相关的技术标准,具有数据处理、分析、呈现等应用技能,具备大数据项目的组织与管理能力。 (7)具有大数据行业领域相关软件产品的应用、大数据系统分析、设计、部署以及维护和管理能力。 (8)具备一定的创新意识和从事大数据领域科学研究的初步能力,有获取最新科学技术知识和信息的基本能力。 (9)具有一定的独立工作能力、人际交往能力和团队合作能力。 3、素质结构 (1)掌握马列主义、毛泽东思想、邓小平理论和“三个代表”重要思想的基本原理,树立辩证唯物主义、历史唯物主义和科学发展观的基本观点。 (2)具有良好的道德品质、社会公德、职业道德和良好的文化素养。 (3)具有爱岗敬业、艰苦奋斗、团结合作的优秀品质。 (4)具有健全的人格、健康的体魄、良好的心理素质和积极乐观的人生态度,养成健全的职业人格和对统计的热爱态度以及良好的体育锻炼习惯, 达到国家规定的大学生体育合格标准和军事训练标准。 三、专业培养规格实现矩阵

《应用统计学》练习试题和答案解析

《应用统计学》本科 第一章导论 一、单项选择题 1.统计有三种涵义,其基础就是( )。 (1)统计学 (2)统计话动 (3)统计方法 (4)统计资料 2.一个统计总体( )。 (1)只能有个标志 (2)只能有一个指标 (3)可以有多个标志 (4)可以有多个指标 3.若要了解某市工业生产设备情况,则总体单位就是该市( )。 (1)每一个工业企业 (2)每一台设备 (3)每一台生产设备 (4)每一台工业生产设备 4.某班学生数学考试成绩分刷为65分、71分、80分与87分,这四个数字就是( )。 (1)指标 (2)标志 (3)变量 (4)标志值 5.下列属于品质标志的就是( )。 (1)工人年龄 (2)工人性别 (3)工人体重 (d)工人工资 6.现要了解某机床厂的生产经营情况,该厂的产量与利润就是( )。 (1)连续变量 (2)离散变量 ()3前者就是连续变量,后者就是离散变量 (4)前者就是离散变量,后者就是连续变量 7.劳动生产率就是( )。 (1)动态指标 (2)质量指标 (3)流量指标 (4)强度指标 8.统计规律性主要就是通过运用下述方法经整理、分析后得出的结论( )。 (1)统计分组法 (2)大量观察法 (3)练台指标法 (4)统计推断法 9.( )就是统计的基础功能。 (1)管理功能 (2)咨询功能 (3)信息功能 (4)监督功能 10.( )就是统计的根本准则,就是统计的生命线。 (1)真实性 (2)及时件 (3)总体性 (4)连续性 11.构成统计总体的必要条件就是( )。 (1)差异性 (2)综合性 (3)社会性 (4)同质性 12.数理统计学的奠基人就是( )。 (1) 威廉·配第 (2)阿亭瓦尔 (3)凯特勒 (4)恩格尔 13.统汁研究的数量必须就是( )。 (1)抽象的量 (2)具体的量 (3)连续不断的量 (4)可直接相加量 14.数量指标一般表现为( )。 (1)平均数 (2)相对数 (3)绝对数 (1)众数 15.指标就是说明总体特征的.标志则就是说明总体单位特征的,所以( )。 (1)指标与标志之同在一定条件下可以相互变换 (2)指标与标志都就是可以用数值表示的 (3)指标与标志之间不存在戈系 (4)指标与标志之间的关系就是固定不变的 答案:一、1(2) 2(4)3(4)4(4)5(2)6(4)7(2)8(2)9(3)10(1)11(4)12(3)13(2)14(3)15(1) 二、1× 2× 3√ 4× 5√ 6× 7√ 8× 9√ 10× 11× 12× 二、判析题 l.统计学就是一门研究现象总体数量方面的方法论科学,所以它不关心、也不考虑个别现象的数量特征。 ( ) 2.三个同学的成绩不同.因此仃在三个变量 ( ) 3.统计数字的具体性就是统讣学区别于数学的根本标志。 ( ) 4.统计指标体系就是许多指标集合的总称。 ( ) 5.一般而言,指标总就是依附在总体上,而总体单位则就是标志的直接承担者。( ) 6.统计研究小的变异就是指总体单位质的差别。 ( ) 7.社会经济统计就是在质与量的联系中.观察与研究社会经济现象的数量方面。( ) 8.运用大量观察法必须对研究对象的所有单位进行观察调查。( )

统计学必看教材推荐

一、统计学基础部分 1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译中国统计出版社据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 2、《Mind on statistics(英文版)》机械工业出版社只需要高中的数学水平,统计的扫盲书。有一句话影响很深:Mathematics as to statistics is something like hammer, nails, wood as to a house, it\'s just the material and tools but not the house itself。 3、《Mathematical Statistics and Data Analysis(英文版.第二版)》机械工业出版社看了就发现和国内的数理统计树有明显的不同。这本书理念很好,讲了很多新的东西,把很热门的Bootstrap方法和传统统计在一起讲了。Amazon上有书评。 4、《Business Statistics a decision making approach(影印版)》中国统计出版社在实务中很实用的东西,虽然往往为数理统计的老师所不屑 5、《Understanding Statistics in the behavioral science(影印版)》中国统计出版社和上面那本是一个系列的。老外的书都挺有意思的 6、《探索性数据分析》中国统计出版社和第一本是一个系列的。大家好好看看陈希儒老先生做的序,可以说是对中国数理统计的一种反思。 二、回归部分 1、《应用线性回归》中国统计出版社还是著名的蓝皮书系列,有一定的深度,道理讲得挺透的。看看里面对于偏回归系数的说明,绝对是大开眼界啊!非常精彩的书 2、《Regression Analysis by example (3rd Ed影印版)》这是偶第一本从头到底读完的原版统计书,太好看了。那张虚拟变量写得比小说都吸引人。没什么推导,甚至说“假定你有统计软件可以算出结果”,主要就是将分析,怎么看图,怎么看结果。看完才觉得回归真得很好玩 3、《Logistics回归模型——方法与应用》王济川郭志刚高等教育出版社不多的国内的经典统计教材。两位都是社会学出身,不重推导重应用。每章都有详细的SAS和SPSS 程序和输出的分析。两位估计洋墨水喝得比较多,中文写的书,但是明显老外写书的风格 三、多元 1、《应用多元分析(第二版)》王学民上海财经大学出版社现在好像就是用的这本书,但是请注意,这本书的亮点不是推导,而是后面和SAS结合的部分,以及其中的一些想法(比如P99 n对假设检验的影响,绝对是统计的感觉,不是推推公式就能感觉到的)。这是一本国内很好的多元统计教材。

应用统计学试题及答案1

北京工业大学经济与管理学院2007-2008 年度 第一学期期末应用统计学 主考教师 专业:学号:姓名:成绩: 1C2B3A4C5B6B7A8A9C10C 一.单选题(每题 2 分,共 20 分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A50B8C0.02D4 3.某连续变量数列,其末组为“ 500 以上”。又知其邻组的组中值为 480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、 9%,则最后一期的定基增长速度为 A .5%× 7%× 9% B. 105% × 107%× 109% C.(105%× 107%× 109%)- 1 D. 3 105%107%109%1 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品 ,则物价增 (减 )变化的百分比为 A. –5% B. –4.76% C. –33.3% 6.对不同年份的产品成本配合的直线方程为 D. 3.85% ? y 280 1.75x ,回归系数b=-1.75表示 A.时间每增加一个单位,产品成本平均增加 1.75 个单位 B.时间每增加一个单位,产品成本平均下降 1.75 个单位 C. 产品成本每变动一个单位,平均需要 1.75 年时间 D. 时间每减少一个单位,产品成本平均下降 1.75 个单位 7.某乡播种早稻5000 亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8. 甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间 : x =70 件,=5.6 件乙车间 :x =90件,=6.3 件 哪个车间日加工零件的离散程度较大: A 甲车间 B.乙车间 C.两个车间相同 D.无法作比较 9.根据各年的环比增长速度计算年平均增长速度的方法是

应用统计学试题和答案分析

六、计算题:(要求写出计算公式、过程,结果保留两位小数,共4题,每题10分) 1、某快餐店对顾客的平均花费进行抽样调查,随机抽取了49名顾客构成一个简单随机样本,调查结果为:样本平均花费为12.6元,标准差为2.8元。试以95.45%的置信水平估计该快餐店顾客的总体平均花费数额的置信区间;(φ(2)=0.9545)49=n 是大样本,由中心极限定理知,样本均值的极限分布为正态分布,故可用正态分布对总体均值进行区间估计。 已知:8.2,6.12==S x 0455.0=α 则有: 202275 .02 ==Z Z α 平均误差=4.07 8 .22==n S 极限误差8.04.022 2 =?==?n S Z α 据公式 x x ±=±? 代入数据,得该快餐店顾客的总体平均花费数额95.45%的置信区间为(11.8,13.4) 附: 10805 1 2 ) (=∑-=i x x i 8.3925 1 2 ) (=∑-=i y y i 58=x 2.144=y 179005 1 2 =∑=i x i 1043615 1 2 =∑=i y i 424305 1 =∑=y x i i i 3题 解 ① 计算估计的回归方程: ∑∑∑∑∑--= )(22 1x x n y x xy n β ==-??-?290 217900572129042430554003060 =0.567 =-= ∑∑n x n y ββ 1 0144.2 – 0.567×58=111.314 估计的回归方程为:y =111.314+0.567x ② 计算判定系数:

22 212 2 ()0.56710800.884392.8 () x x R y y β-?= ==-∑∑ 4、某家具公司生产三种产品的有关数据如下: 计算下列指数:①拉氏加权产量指数;②帕氏单位成本总指数。 4题 解: ① 拉氏加权产量指数 = 1 000 00 1.1445.4 1.13530.0 1.08655.2 111.60%45.430.055.2q p q q p q ?+?+?==++∑∑ ② 帕氏单位成本总指数= 11100053.633.858.5 100.10%1.1445.4 1.13530.0 1.08655.2q p q q p q ++==?+?+?∑∑ 模拟试卷( 二) 一、填空题(每小题1分,共10题) 1、我国人口普查的调查对象是 ,调查单位是 。 2、___ 频数密度 =频数÷组距,它能准确反映频数分布的实际状况。 3、分类数据、顺序数据和数值型数据都可以用 饼图 条图 图来显示。 4、某百货公司连续几天的销售额如下: 257、276、297、252、238、310、240、236、265,则其下四分位数5、某地区2005年1季度完成的GDP=30亿元,2005年3季度完成的GDP=36亿元,则GDP 年度化增长率6、某机关的职工工资水平今年比去年提高了5%,职工人数增加了2%,则该企业工资总额增长了 7.1% 。 7、对回归系数的显著性检验,通常采用的是 t 检验。 8、设置信水平=1-α,检验的P 值拒绝原假设应该满足的条件是 p

应用统计学试题和答案汇编

《统计学》模拟试卷(一) 一、填空题(每空1分,共10分) 1、依据统计数据的收集方法不同,可将其分为____________数据和_____________数据。 2、收集的属于不同时间上的数据称为 数据。 3、设总体X 的方差为1,从总体中随机取容量为100的样本,得样本均值x =5,则总体均值的置信水平为99%的 置信区间_________________。(Z 0.005=2.58) 4、某地区2005年1季度完成的GDP=50亿元,2005年3季度完成的GDP =55亿元,则GDP 年度化增长率为 。 5、在某城市随机抽取13个家庭,调查得到每个家庭的人均月收入数据如下:1080、750、1080、850、960、2000、1250、1080、760、1080、950、1080、660,则其众数为 ,中位数为 。 6、判定系数的取值范围是 。 7、设总体X ~ ) ,(2 σμN ,x 为样本均值,S 为样本标准差。当σ未知,且为小样本时, 则 n s x μ -服从自由度为n-1的___________________分布。 8、若时间序列有20年的数据,采用5年移动平均,修匀后的时间序列中剩下的数据有 个。 二、单项选择题(在每小题的3个备选答案中选出正确答案,并将其代号填在题干后面的括号内。每小题1分,共 14分) 1、.研究如何对现象的数量特征进行计量、观察、概括和表述的理论和方法属于 ( ) ①、应用统计学 ②、描述统计学 ③、推断统计学 2、若各个标志值都扩大2倍,而频数都减少为原来的1/3,则平均数 ( ) ①、扩大2倍 ②、减少到1/3 ③、不变 3、在处理快艇的6次试验数据中,得到下列最大速度值:27、38、30、37、35、31. 则最大艇速的均值 的无偏估计值为 ( ) ①、32.5 ②、33 ③、39.6 4、某地区粮食作物产量年平均发展速度:1998~2000年三年平均为1.03,2001~2002年两年平均为1.05,试确定1998~2002五年的年平均发展速度 ( ) 5、若两个变量的平均水平接近,平均差越大的变量,其 ( ) ①、平均值的代表性越好 ②、离散程度越大 ③、稳定性越高 6、对正态总体均值进行区间估计时,其它条件不变,置信水平α-1越小,则置信上限与置信下限的差( ) ①、越大 ②、越小 ③、不变 7、若某总体次数分布呈轻微左偏分布,则成立的有 ( )

应用统计学专业学位培养方案

应用统计学专业学位培养方案

应用统计硕士专业学位研究生培养方案 适用专业:应用统计专业 一、学科概况 应用统计专业属于统计学学科领域,是上个世纪以来迅速发展起来的专业,在统计学领域中占有重要的地位,在金融工程、经济规划和管理、产品质量控制、经营管理、医药卫生、交通工程、人文科学和社会科学等领域有着广泛应用。随着人类社会活动体系的日益庞大、复杂、精密,以及计算机的广泛使用,应用统计将发挥越来越重要的作用。 广西师范大学统计学科拥有一支学历、年龄、职称结构合理的学术队伍。现有教师25人,其中博士生导师2人,教授11人,副教授8人,教师全部具有研究生以上学历。学科带头人杨善朝教授为中国概率统计学会理事、国务院政府津贴专家、广西优秀专家、入选广西十百千人才工程;秦永松教授是中国现场统计研究会理事、入选广西十百千人才工程。近两年来, 本学科承担国家自然科学基金10项,国家社科基金3项,广西自然科学基金项目10余项,公开发表论文200余篇,其中被SCI、EI、ISTP收录70余篇,获得2项省部级科研成果奖。我校统计学科在长期办学过程中与国家统计局广西调查总队、广西气象局、广西统计局、桂林电器科学研究所等单位建立了良好的合作关系。广西师范大学概率论与数理统计专业于1982年开始招收硕士研究生,2000年获得硕士学位授予权,是广西最早培养统计人才的硕士点。广西师范大学于2010年在全国首批获得统计专业硕士学位授权,并于当年开始招生。在国务院学位委员会和教育部于2011年3月颁布的新的“学位授予和人才培养学科目录(2011年)”中,统计学成为“理学”门类下的一级学科,我校当年获统计学一级学科硕士授予权。 二、培养目标 培养具备良好的政治思想素质和职业道德素养,具有良好的统计学背景,系统掌握数据采集、处理、分析和开发的知识与技能,具备熟练应用计算机处理和分析数据的能力,能够在国家机关、党群团体、企事业单位、社会组织及科研教学部门从事统计调查咨询、数据分析、决策支持和信息管理的高层次、

应用统计学试题及答案193765讲课讲稿

应用统计学试题及答案193765

北京工业大学经济与管理学院2007-2008年度 第一学期期末 应用统计学 主考教师 专业: 学号: 姓名: 成绩: 一. 单选题(每题2分,共20分) 1. 在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2. 一组数据的均值为20, 离散系数为0.4, 则该组数据的标准差为 A 50 B 8 C 0.02 D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4. 已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A .5%×7%×9% B. 105%×107%×109% C .(105%×107%×109%)-1 D. 1%109%107%1053- 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –4.76% C. –33.3% D. 3.85% 6.对不同年份的产品成本配合的直线方程为x y 75.1280? -=, 回归系数b= -1.75表示 A. 时间每增加一个单位,产品成本平均增加1.75个单位

B.时间每增加一个单位,产品成本平均下降1.75个单位 C.产品成本每变动一个单位,平均需要1.75年时间 D.时间每减少一个单位,产品成本平均下降1.75个单位 7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间:x=70件,σ=5.6件乙车间: x=90件, σ=6.3件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二.多选题 (每题2分,共14分) 1.下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E.企业职工人数2000人 2.在数据的集中趋势的测量值中,不受极端数值影响的测度值是 A. 均值 B. 众数 C. 中位数 D. 几何平均数 E. 调和平均数

相关主题
文本预览
相关文档 最新文档