当前位置:文档之家› 统计学习_数据集可视化实验报告

统计学习_数据集可视化实验报告

统计学习_数据集可视化实验报告
统计学习_数据集可视化实验报告

作业2

上机题实验报告

(一)实验内容:

1.对Iris 数据集计算其协方差矩阵和相关系数,并计算协方差矩阵的特征值和特征向量,实现KL 变换。

2. 分别以Iris 数据集的四个变量作为坐标,画出各自的二维直方图。

(二)实验原理:

1. KL 变换步骤:

1)、减去平均值

2)、计算协方差矩阵

3)、计算协方差矩阵的特征值和特征向量

4)、将特征值从大到小排序

5)、将数据转换到上述N 个特征向量构建的新空间中

2. 二维直方图:

直方图是用面积而非高度来表示数量。直方图由一组块形组成,每一个块形的面积表示在相应的小组区间中事例的百分数。

(三)实验方案:

1. KL 变换:

1). 方案一:

按照KL 变换步骤,计算出所需的去均值后的数据矩阵,数据矩阵的协方差矩阵,对应的特征值和特征向量,进行相关运行算。

2). 方案二:

直接调用matlab 中函数princomp ,正确理解相关输入参数意义,实现主成分分析。

2. 二维直方图:

直接调用matlab 中函数hist ,分别输入四个不同变量。

(四)实验编程:

1. KL 变换:

1). 样本均值:

函数名称:mean

函数功能:求向量或矩阵的均值

函数语法:(以X 为矩阵为例)

mean(X) %默认dim=1)就会求X 每一列的均值

mean(X ,2) %求X 每一行的均值 样本均值:1

1N

i i X X N ==∑

2). 协方差矩阵:

函数名称:cov

函数功能:求协方差矩阵

函数语法:

cov(X) % cov(X,0) = cov(X)=vor(x)

cov(X,Y) %求矩阵X 与Y 的协方差矩阵。若X 大小为M*N ,Y 为K*P ,

则X ,Y 的大小必须满足M*N=K*P ,即X ,Y 的元素个数

相同。

cov(X,1) %计算方法如cov(x),归一化参数为1/N

cov(X,Y ,1) %计算方法如cov(x,y),但归一化参数为1/N 。 样本方差:()211N

i i S X X N ==-∑ 样本之间协方差:()()

11N

i i i C X X Y Y N ==--∑

3). 相关系数矩阵:

函数名称:corrcoef

函数功能:求相关系数矩阵

函数用法:

corrcoef(X) % 求矩阵X 的相关系数,X 每一行为一次观察,一列

为一个变量

corrcoef (X,Y) % X,Y 必须是各维数都相同的矩阵

样本之间相关系数:,i k p =

4). 矩阵特征值和特征向量:

函数名称:eig

函数功能:计算矩阵的特征值和特征向量

函数语法:

E=eig(A) %求矩阵A 的全部特征值,构成向量E 。

[V,D]=eig(A) %求矩阵A 的全部特征值,构成对角阵D ,并求A 的

特征向量构成V 的列向量。

5).主成分分析:

函数名称:princomp

函数功能:主成分分析

函数语法:

[coeff, score, latent] = princomp(x)

coeff : 协方差矩阵的特征向量按照特征值递减顺序排列;

score :是原来的样本矩阵在新的坐标系中的表示,也就是去均值后的样本矩阵乘上

转换矩阵;

latent :score 矩阵每一列的方差,由latent 可以算出降维后的空间所能表示原空间

的程度,计算累计程度

cumsum(latent)./sum(latent)可表示新空间表示原空间的程度。

2. 二维直方图:

函数名称:hist3

函数功能:绘制直方图函数

函数用法:

Hist3(Y) %Y为m*2维矩阵,按10*10画直方图

hist(Y,N) %按N(1)*N(2)画出直方图

(五)实验结果及分析:

1.实验运行结果各参数含义:

1). KL 变换:

covMat.mat:原始数据矩阵的协方差矩阵;

correoff.mat:原始数据矩阵的相关系数;

eigVals.mat:协方差矩阵的特征值;

eigVects.mat:协方差矩阵的特征向量;

KLMat.mat:方案一中KL变换未降维后的数据矩阵;

score.mat:方案二中主成分分析未降维后的数据矩阵;

2). 二维直方图:

sepal length:变量1,对应原始数据矩阵第一列;

sepal width:变量2,对应原始数据矩阵第二列;

petal length:变量3,对应原始数据矩阵第三列;

petal width:变量一4,对应原始数据矩阵第四列;

2.实验运行结果和分析:

1). KL 变换:

实验中,对原始数据降维后重构的标准是,新数据可反映原始数据程度大于95%:在方案一中,将数据协方差矩阵的特征值从大到小排序,再将数据转换到上述N 个特征向量构建的新空间中;

在方案二中,直接调用函数实现主成分分析,得到新的数据矩阵‘

比较可以看出,两种方案中,主成分分析后,KL变换得到数据结果相同,方案一的应用可以更清晰的理解KL变换的数学意义。

2). 二维直方图:

如图1,分别以Iris数据集的四个变量作为坐标,画出各自的二维直方图。

图1:四个变量两两之间的二维直方图

统计学实验报告汇总

本科生实验报告 实验课程统计学 学院名称商学院 专业名称会计学 学生姓名苑蕊 学生学号0113 指导教师刘后平 实验地点成都理工大学南校区 实验成绩 二〇一五年十月二〇一五年十月

依据上述资料编制组距变量数列,并用次数分布表列出各组的频数和频率,以及向上、向下累计的频数和频率, 并绘制直方图、折线图。 学生 实验 心得

2.已知2001-2012年我国的国内生产总值数据如表2-16所示。 学生 实验 心得 要求:(1)依据2001-2012年的国内生产总值数据,利用Excel软件绘制线图和条形图。

(2)依据2012年的国内生产总值及其构成数据,绘制环形图和圆形图。 学生 实验 心得 3.计算以下数据的指标数据 1100 1200 1200 1400 1500 1500 1700 1700 1700 1800 1800 1900 1900 2100 2100 2200 2200 2200 2300 2300 2300 2300 2400 2400 2500 2500 2500 2500 2600 2600 2600 2700 2700 2800 2800 2800 2900 2900 2900 3100 3100 3100 3100 3200 3200 3300 3300 3400 3400 3400 3500 3500 3500 3600 3600 3600 3800 3800 3800 4200

4.一家食品公司,每天大约生产袋装食品若干,按规定每袋的重量应为100g。为对产品质量进行检测,该企业质检部门采用抽样技术,每天抽取一定数量的食品,以分析每袋重量是否符合质量要求。现从某一天生产的一批食品8000袋中随机抽取了25袋(不重复抽样),测得它们的重量分别为: 学生实验心得 101 103 102 95 100 102 105 已知产品重量服从正态分布,且总体方差为100g。试估计该批产品平均重量的置信区间,置信水平为95%.

统计学实验报告1

统计学实验报告1 -标准化文件发布号:(9456-EUATWK-MWUB-WUNN-INNUL-DDQTY-KII

实验报告

二、打开文件“数据 3.XLS”中“城市住房状况评价”工作表,完成以下操作。 1)通过函数,计算出各频率以及向上累计次数和向下累计次数;2)根据两城市频数分布数据,绘制出两城市满意度评价的环形图三、打开文件“数据 3.XLS”中“期末统计成绩”工作表,完成以下操作。 1)要求根据数据绘制出雷达图,比较两个班考试成绩的相似情况。 实验过程: 实验任务一: 1)利用函数frequency制作一张频数分布表 步骤1:打开文件“数据 3. XLS”中“某公司4个月电脑销售情况”工作表 步骤 2.在“频率(%)”的右侧加入一列“分组上限”,因统计分组采用“上限不在内”,故每组数据的上限都比真正的上限值小0.1,例如:“140-150”该组的上限实际值应为“150”,但我们为了计算接下来的频数取“149.9”. 步骤3.选定C20:C29,再选择“插入函数”按钮 3 步骤 4.选择类别“统计”—选择函数“FREQUENCY”

步骤5.在“data_array”对话框中输入“A2:I13”,在“bins_array”对话框中输入“E20:E29 该函数的第一个参数指定用于编制分布数列的原始数据,第二个参数指定每一组的上限. 步骤6.选定C20:C30区域,再按“自动求和” 按钮,即可得到频数的合计

步骤7.在D20中输入“=(C20/$C$30)*1OO” 步骤8:再将该公式复制到D21:D29中,并按“自动求和”按钮计算得出所有频率的合计。

多元统计学SPSS实验报告一

华东理工大学2016–2017学年第二学期 《多元统计学》实验报告 实验名 称实验1数据整理与描述统计分析

教师批阅:实验成绩: 教师签名: 日期: 实验报告正文: 实验数据整理 (一)对“employee”进行数据整理 1.观察量排序 ( based on current salary) 2.变量值排序(based on current salary : rsalary) 3.计算新的变量(incremental salary=current salary - beginning salary)

4.拆分数据文件(based on gender) 结论:There are 215 female employees and 259 male employees. 5.分类汇总 (break variable: gender ; function: mean ) 结论:The average current salary of female is . The average current salary of male is . (二)分别给出三种工作类别的薪水的描述统计量 实验描述统计分析 1)样本均值矩阵 结论:总共分析六组变量,每组含有十个样本。 每股收益(X1)的均值为;净资产收益率(X2)的均值为;总资产报酬率(X3)的均值为;销售净

利率(X4)的均值为;主营业务增长率(X5)的均值为;净利润增长率(X6)的均值为. 2)协方差阵 结论:矩阵共六行六列,显示了每股收益(X1)、净资产收益率(X2)、总资产报酬率(X3)、销售净利率(X4)、主营业务增长率(X5)和净利润增长率(X6)的协方差。 3)相关系数 结论:矩阵共六行六列,显示了每股收益 (X1)、净资产收益率(X2)、总资产报酬 率(X3)、销售净利率(X4)、主营业务增 长率(X5)和净利润增长率(X6)之间的 相关系数。 每格中三行分别显示了相关系数、显著性 检验与样本个数。 4)矩阵散点图

软件工程实验报告

软件工程实验报告 姓名:冯巧 学号 实验题目:实验室设备管理系统 1、系统简介: 每天对实验室设备使用情况进行统计,对于已彻底损坏的作报废处理,同时详细记录有关信息。对于有严重问题(故障)的要即时修理,并记录修理日期、设备名、修理厂家、修理费用、责任人等。对于急需但又缺少的设备需以“申请表”的形式送交上级领导请求批准购买。新设备购入后立即对新设备登记(包括类别、设备名、型号、规格、单价、数量、购置日期、生产厂家、购买人等),同时更新申请表的内容。 2、技术要求及限定条件: 采用C#语言设计桌面应用程序,同时与数据库MySql进行交互。系统对硬件的要求低,不需要网络支持,在单机环境下也能运行,在局域网环境下也能使用。方案实施相对容易,成本低,工期短。 一:可行性分析 1、技术可行性分析 计算机硬件设备,数据库,实验室设备管理软件与实验室设备管理系统的操作人员组成,能够实现实验室设备管理的信息化,提高工作效率,实现现代化的实验室设备管理。系统需要满足实验室设备管理(包括对实验设备的报废、维修和新设备的购买)、实验室设备信息查询(包括按类别进行查询和按时间进行查询)、实验室设备信息统计报表(包括对已报废设备的统计、申请新设备购买的统计和现有设备的统计)。这些功能框图如下图所示: 2、经济可行性分析 依据用户的现实需求、技术现状、经济条件、工期以及其他局限性因素等等因素,考虑到工期的长短、技术的成熟可靠、操作方便等因素,本方案具备经济可行性。

3、系统可选择的开发方案 ①方案A用C#开发系统的特点是:开发工具与数据库集成一体,可视化,开发速度较快,但数据库能够管理的数据规模相对较小。系统对硬件的要求低,不需要网络支持,在单机环境下也能运行,在局域网环境下也能使用。方案的实施相对容易,成本低,工期短。 ②方案B:以小型数据库管理系统为后台数据库,该前台操作与数据库分离,也能够实现多层应用系统。系统对硬件的要求居中,特别适合在网络环境下使用,操作方便。但系统得实现最复杂,成本最高,工期也较长。 二:软件需求分析 1.软件系统需求基本描述: 实验室设备管理系统是现代企业资源管理中的一个重要内容,也是资源开发利用的基础性工作。实验室设备在信息化之前,在用户系统管理、设备维修管理、设备的增删改查管理等方面存在诸多不利于管理的地方,不适应现代的企业管理形势和资源的开发利用。 2.软件系统数据流图(由加工、数据流、文件、源点和终点四种元素组成): 1)顶层数据流图 2)二层流程图 3)总数据流图

统计学实验报告

统计学实验报告 一.实验步骤总结数据的搜集与整理 一.数据的搜集 ●间接数据的搜集 方法一:直接通过进入专业的数据库网站查询数据 方法二:使用搜索引擎进行数据的搜索 ●直接数据的搜集 抽样调查: 1.调查方案设计 2.调查问卷设计 3.问卷发放 4.问卷回收 二.数据的整理 ●数据编码 1.在Excel中选择三列,将三列分别命名,后两列为:编码符号、代表含义 2.数据搜集好后,按照他们的特征进行分类,并依次放入第一列 3.在“编码符号”列为每一个列别编码,并在“代表含义”列说明编码的含义 ●数据的录入 转置(行与列换位): 1.激活数据所在单元格 2.单击鼠标右键,选中“复制” 3.在空白处激活另一单元格,点击鼠标右键,选中“选择性粘贴”项。 4.在弹出的“选择性粘贴”对话框中,粘贴项选中“全部”,运算选中“无”,选中“转置” 复选框,点击确定按钮既得转置的结果。 单元格内部换行:“Alt+Enter”组合键 ●数据的导入 方法一:1.单击菜单栏“文件—打开”,在弹出的的“打开”对话框中找到要导入的文件。 2.双击鼠标左键或者单击打开按钮,所需要的文件就被导入了。 方法二:1.单击菜单栏“数据—导入外部数据—导入数据”,在弹出的“选取数据源”的对话框中找到要导入的文件。 2.双击鼠标左键或者单击打开按钮,所需要的文件就被导入了。 ●数据的筛选 自动筛选: 1.选中要筛选的数据区域 2.使用菜单栏中的“数据—筛选—自动筛选”,这时每列的第一个单元格的右边都会出现 一个下拉箭头,我们就可以通过下拉菜单中的选择实现筛选。 3.如果选择了下拉菜单中的“自定义”,就会弹出一个“自定义自动筛选方式”对话框, 在对话框中可自己选择筛选条件,然后点击确定按钮。 高级筛选: 1. 将要筛选数据区域的列标题复制粘贴在空白区域,并在他们对应下的单元格中输入所要

医院信息系统 详细分析实验报告

信息与电气工程学院HIS信息系统详细分析报告(2016/2017学年第一学期) 题目: HIS信息系统详细分析 __ 专业班级:信息1401 姓名:谭玉龙 指导教师:崔东 设计周数: 设计成绩: 2016年12月8日

一、实验目的 1.详细分析个系统的详细内容,具体功能和相应流程图 二、具体内容 一、门诊管理系统 挂号系统 1、系统特点 ●提高医院工作效率,减轻工作人员的劳动强度,缩短患者 排队挂号的等候时间 ●支持多种挂号方式(随时挂号、电话预约挂号、磁卡/IC 卡自动挂号、网上预约挂号) ●支持各种身份的患者挂号(自费、公费、合同单位、医保) ●患者初诊的门诊号自动保存,方便患者复诊时基本信息及 上次就诊信息的快速查询调用 ●支持患者选择医生 ●可以对所有就诊患者的地域来源进行统计分析,服务于医 院的经营决策 ●实时快速准确的工作量统计 2、功能简介 ●日常挂号业务 ●预约挂号业务 ●专家门诊时间安排及专家限号功能

●患者挂号、退号、修改、转科业务 ●各种数据维护功能 ●挂号工作人员财务交款 3、查询统计 ●门诊患者挂号明细查询 ●门诊挂号科室工作量统计 ●门诊挂号费用收入统计 ●全院门诊量分科室统计 ●全院门诊量分类别统计 ●医生(专家)挂号量统计 ●就诊患者区域来源分布统计分析 4、业务流程图 图一:挂号业务流程路

收费系统 1、系统特点 ●支持划价、收费于一体和划价、收费分开两种业务工作模 式 ●各种费用同一窗口录入(西药处方,中药处方,检查化验 单等),根据价表自动划价 ●支持套餐和协定处方录入 ●支持病人信息IC卡存储及读取 ●支持多种结算方式,结算比例,同时提供结算比例的自定 义功能 ●与门诊药房库存关联,实现实时无药报警 ●支持与医生工作站,医技科室工作站联网,实现医生处方 的接收和信息传递 ●支持门诊患者费用明细清单的打印 ●具有前屏显示功能,通过语音和屏幕显示患者应收,实收, 找零及问候语等信息 ●提供严密的发票管理功能 ●强大的统计报表功能 ●快捷方便的录入方式,全键盘操作,简单易学 2、功能简介 ●划价收费 ●退费功能(处方退费,红方退费,检查单退费),退费权

误差统计实验报告3

机械制造技术基础实验指导书 同济大学机械工程学院 二00九年十一月

实验一 加工误差统计分析 一、实验目的 1、学会用点图法研究被加工零件尺寸的变化规律和控制被加工零件 尺寸 2、在已调整好的机床上加工一批零件,鉴定该机床的工艺能力。 3、掌握绘制R x -点图的方法,能根据R x -点图分析工艺过程的稳定性,计算工序能力系数等。 二、实验使用的设备和工具 1、机床:斯来福临精密数控平面磨床K-P36 Compact 2、量具:螺旋测微仪、千分仪 三、实验内容 在数控磨床上加工一批零件,依次测量出其高度尺寸,然后绘制被加 工零件尺寸的R x -图,分析被加工零件尺寸的变化规律,从中找出误差的性质和原因,并计算机床的工艺能力系数、确定机床的工艺能力等级。 四、实验原理和方法 在磨床上用磨削45HRC59~62工件一批,做出R x -控制图。 应用数理统计方法对加工误差(或其他质量指标)进行分析,是进行过程控制的一种有效方法,也是实施全面质量管理的一个重要方面。其基本原理是利用加工误差的统计特性,对测量数据进行处理,作出R x -点图,据此对加工误差的性质、工序能力及工艺稳定性等进行识别和判断,进而对加工误差作出综合分析。详见教材相关章节。 1、 R x -图绘制: 1)确定样组容量,对样本进行分组 样组容量一般取m=2~10件,通常取4或5。 按样组容量和加工时间顺序,将样本划分成若干个样组。 2)计算各样组的平均值和极差 对于第i 个样组,其平均值和极差计算公式为: 1 1 n i i j m j x x == ∑,a x i n i i i 式中 i x ——第i 个样组的平均值;

统计学实验报告【最新】

统计学实验报告 一、实验主题:大学生专业与实习工作的关系 二、实验背景: 二十一世纪的今天大学生已是一个普遍的社会群体,高校毕业人数日益增加,社会、企业所提供的职位日益紧张,大学生就业问题是当今社会关注的焦点。面对日益沉重的就业压力,越来越多的大学毕业生选择了企业需求的职业,而这种职业与自己在校所学专业根本“无关”或相去甚远,大学毕业生就业专业不对口的现象非常严重。专业对口是个广义的概念,就是说你所学的专业与你所作的工作相关,比如你专业是会计,工作后你到了一个企业做会计,或者到银行做柜员,这都是与经济相关的,这就是对口。如果你学机械设计,但工作后却做了统计员,业务员等于你所学专业无关的工作,这就叫专业不对口。专业不对口导致毕业生所学知识没有用武之地,所以这是一种人力资源的浪费。 三、实验目的: 大学生就业专业不对口是客观存在的问题,我们研究此问题有这几点目的:①了解当代大学生实习工作与专业是否对口的情况,当代大学生对工作与专业不对口现象的态度。②分析大学生就业结构和

专业对口问题,了解当今大学生专业对口情况,为以后大学生选择专业、选择工作岗位提供有效的信息和借鉴。③寻找导致专业不对口的原因,以减少社会普遍存在的人力资源的浪费。 四、实验要求:就相关问题收集一定数量的数据,用EXCEL进行如下 分析:1进行数据筛选、排序、分组;2、制作饼图并进行简要解释;3、制作频数分布图,直方图等并进行简要解释。 五、实验设备及材料:计算机,手机,EXCEL软件,WORD软件。 六、实验过程: (一)制作并发放调查问卷。 (二)收回并统计原始数据:收回了102名大学生填写的调查问卷,并对相关数据进行统计。 (三)筛选与实验相关问题: 1.您的性别( ): A. 男B.女

概率统计实验报告

概率统计实验报告 班级16030 学号16030 姓名 2018 年1 月3 日

1、 问题概述和分析 (1) 实验内容说明: 题目12、(综合性实验)分析验证中心极限定理的基本结论: “大量独立同分布随机变量的和的分布近似服从正态分布”。 (2) 本门课程与实验的相关内容 大数定理及中心极限定理; 二项分布。 (3) 实验目的 分析验证中心极限定理的基本结论。 2、实验设计总体思路 2.1、引论 在很多实际问题中,我们会常遇到这样的随机变量,它是由大量的相互独立的随机 因素的综合影响而形成的,而其中每一个个别因素在总的影响中所起的作用是微小的,这种随机变量往往近似的服从正态分布。 2.2、 实验主题部分 2.2.1、实验设计思路 1、 理论分析 设随机变量X1,X2,......Xn ,......独立同分布,并且具有有限的数学期望和方差:E(Xi)=μ,D(Xi)=σ2(k=1,2....),则对任意x ,分布函数 满足 该定理说明,当n 很大时,随机变量 近似地服从标准正 态分布N(0,1)。因此,当n 很大时, 近似地服从正 态分布N(n μ,n σ2). 2、实现方法(写清具体实施步骤及其依据) (1) 产生服从二项分布),10(p b 的n 个随机数, 取2.0=p , 50=n , 计算n 个随 机数之和y 以及 ) 1(1010p np np y --; 依据:n 足够大,且该二项分布具有有限的数学期望和方差。 (2) 将(1)重复1000=m 组, 并用这m 组 ) 1(1010p np np y --的数据作频率直方图进 行观察. 依据:通过大量数据验证随机变量的分布,且符合极限中心定理。

统计学实验报告7.统计指数分析.docx

实验报告 课程名称统计学学号 11学生姓名辅导教师 系别经济与管理系实验室名称实验时间 1.实验名称 统计指数分析 2.实验目的 掌握各项指数的计算及因素分析法的运用。 在 Excel 中完成各项指数及有关数值的计算,主要用到的是公式和公式复制 3.实验内容 甲乙丙三种商品基期和报告期各项数据如下: 价格(元) P销量 q 商品计量单位 基期 p0报告期 p1基期 q0报告期 q1 甲个302810001200 乙双202120001600 丙公斤232515001500 合计 1)计算三种商品的个体销售量指数和个体价格指数。 2)三种商品的销售额总指数。 3)三种商品的销售量总指数和价格总指数。 4)分析销售量变动和价格变动对销售额影响的绝对额。(这一问分析要手写完成) 4.实验原理 在 Excel 中实现综合指数及其相关数值的计算,主要用到的是公式和公式的复制功 能 5.实验过程及步骤 (1)在工作表中输入已知数据的名称和数值(包括商品名称,计量单位,基期价格,报告 期价格,基期销售量和报告期销售量) (2)计算综合指标的各个综合总量在单元格G4中输入公式“ =C4*E4”,在H4中输入“=D4*F4”, 在 I4 中输入“ =C4*F4”, 在 J4 中输入“ =D4*E4”, 公式复制 在 A7 中输入合计,在单元格中输入“=SuM(G4:G6),再将单元格 G7的公式向右复制到 J7 (3)分别计算各个综合指标及其分子分母之差额 在单元格 A10 中输入“销售额总额指数” ,在单元格 F10 中输入公式“ =H7/G7*100” , 在单元格 H10 中输入公式” =H7-G7”

统计学实验报告

重庆大学 学生实验报告 实验课程名称统计学课程实验 开课实验室 DS1421 学院建管年级 2011级专业班财管02班学生姓名熊俸英学号 开课时间 2012 至 2013 学年第 2 学期 建设管理及房地产学院制

《统计学》实验报告 开课实验室:年月日

陈谦87769277 刘文55845182 周克66628579 程前75507288 徐非64859193 1)选中以上数据后,复制到excel表格中,点击工具栏中”数据”下“自动筛选”,点击统计学成绩栏分数等于“90”; 结果为: 2)继上一小题,点击“经济学成绩”下“前10个”,会出现对话框,把数字“10”改为“3”,点击确定;

结果为: 3)选中数据,前面留出两栏空白,并复制数据表头(选中数据第一排),到空白处第一排,在第二排各科成绩下面输入“>60”,如图:选中数据,点击“数据”—“高级筛选”,点击条件区 域(选中表格前2行),点击确定: 2.B 组题第5题 为评价家电行业售后服务的质量,随机抽取了由100个家庭构成的一个样本。服务质量的等级分别表示为: A.好;B .较好;C.一般;D.较差;E .差。调查结果如下所示; B C A C B E C B A B D A D B C C E D E B A D B A C B E C B A B A C C D A B D D A C D C E B B C D C C A A C A C C D C E D A E C C A C D A A E B A D E C A B C E B A D A B C B E D B C A B C D C B A B A D 要求编制品质数列,列出频率、频数,并选用适当的统计图如:圆形图、条形图等形象地显示资料整理的结果。(要求展现整理过程) 留出两栏空白,条件区域时输入筛选条件 为查询结

统计分析实验报告

统计分析综合实验报告 学院: 专业: 姓名: 学号:

统计分析综合实验考题 一.样本数据特征分析: 要求收集国家统计局2011年全国人口普查与2000年全国人口普查相关数据,进行二者的比较,然后写出有说明解释的数据统计分析报告,具体要求如下: 1.报告必须包含所收集的公开数据表,至少包括总人口,流动人口,城乡、性别、年龄、民族构成,教育程度,家庭户人口八大指标; 2.报告中必须有针对某些指标的条形图,饼图,直方图,茎叶图以及累计频率条形图;(注:不同图形针对不同的指标)3.采用适当方式检验二次调查得到的人口年龄比例以及教育程度这两个指标是否有显著不同,写明检验过程及结论。 4.报告文字通顺,通过数据说明问题,重点突出。 二.线性回归模型分析: 自选某个实际问题通过建立线性回归模型进行研究,要求: 1.自行搜集问题所需的相关数据并且建立线性回归模型; 2.通过SPSS软件进行回归系数的计算和模型检验; 3.如果回归模型通过检验,对回归系数以及模型的意义进行 解释并且作出散点图

一、样本数据特征分析 2010年全国人口普查与2000年全国人口普查相关数据分析报告 2011年第六次全国人口普查数据显示,总人口数为1370536875,比2000年的第五次人口普查的1265825048人次,总人口数增加73899804人,增长5.84%,平均年增长率为0.57%。

做茎叶图分析: 描述 年份统计量标准误 人口数量2000年均值40084265.35 4698126.750 均值的 95% 置信区间 下限30489410.50 上限49679120.21 5% 修整均值39305445.50 中值35365072.00 方差 68424424372574 4.400 标准差26158062.691 极小值2616329

统计学实验报告模板学生版

成都工业学院 实验报告 专业国际商务 实验课程统计实务 实验项目统计数据整理与分析指导教师王晓燕 班级1403022 姓名学号赵澜豫18

一、实验目的项目一:《统计数据整理》实验通过上机实验,使每个学生掌握利用Excel 对 原始资料进行统计分组并编制分配数列的方法;掌握利用Excel 进行图表制作的方法。项目二:《数据分布 特征的描述及抽样推断》实验通过上机实验,使学生掌握Excel 在数据分布特征的描述及抽样推断中的应 用方法,并能对实验结果进行解释、分析,得出明确实验结论。项目三: 《回归分析》实验 通过上机实验,使学生掌握利用Excel 进行回归分析的方法,并能对实验结果进行解释、得出明确实验结论。 分析,二、实验内容 项目一:某灯泡厂准备采用一种新工艺,为检查新工艺是否使灯泡的寿命有所延长,对采用新工艺生产的100 只灯泡进行测试,结果如下:(单位:小时) 716 728 719 685 709 691 684 705 718 700 715 712 722 691 708 690 692 707 701 706 729 694 681 695 685 706 661 735 665 708 710 693 697 674 658 698 666 696 698 668 692 691 747 699 682 698 700 710 722 706 690 736 689 696 651 673 749 708 727 694 689 683 685 702 741 698 713 676 702 688 671 718 707 683 717 733 712 683 692 701 697 664 681 721 720 677 697 695 691 693 699 725 726 704 729 703 696 717 688 713

随机数的产生及统计特性分析-实验报告

电子科技大学通信与信息工程学院 标准实验报告 实验名称:随机数的产生及统计特性分析 电子科技大学教务处制表

电子科技大学 实验报告 学生姓名:吴子文学号:2902111011 指导教师:周宁 实验室名称:通信系统实验室 实验项目名称:随机数的产生及统计特性分析 实验学时:6(课外) 【实验目的】 随机数的产生与测量:分别产生正态分布、均匀分布、二项分布和泊松分布或感兴趣分布的随机数,测量它们的均值、方差、相关函数,分析其直方图、概率密度函数及分布函数。通过本实验进一步理解随机信号的一、二阶矩特性及概率特性。 编写MATLAB程序,产生服从N(m, sigma2)的正态分布随机数,完成以下工作: (1)、测量该序列的均值,方差,并与理论值进行比较,测量其误差大小,改变序列长度观察结果变化; (2)、分析其直方图、概率密度函数及分布函数; (3)、计算其相关函数,检验是否满足Rx(0)=mu^2+sigma2,观察均值mu 为0和不为0时的图形变化; (4)、用变换法产生正态分布随机数,重新观察图形变化,与matlab函数产生的正态分布随机数的结果进行比较。 【实验原理】 1、产生服从N(m, sigma2)的正态分布随机数,在本实验中用matlab中的函数normrnd()产生服从正态分布的随机数。 (1)R = normrnd(mu,sigma) 产生服从均值为mu,标准差为sigma的随机数,mu和sigma可以为向量、矩阵、或多维数组。 (2)R = normrnd(mu,sigma,v) 产生服从均值为mu 标准差为sigma的随机数,v是一个行向量。如果v是一个1×2的向量,则R为一个1行2列的矩阵。

统计学实验报告

实验报告 实验名称:描述性统计综合实验实验课程:统计学 同学姓名:******ZZH***** 班级学号:0312*********** 指导教师:白玉新 报告时间:2014年10月13日

《统计学》实验一 一、实验名称:数据的整理 二、实验日期:2014年10月13日 三、实验地点:经济管理实验室 四、实验软件:EXCEL 软件2003版 五、实验目的和原理 目的:培养处理数据的基本能力。通过本组实验,熟练掌握利用Excel,完成对数据进行输入、定义、数据的分类与整理。 原理:Microsoft Excel在数据组织、数据管理、数据计算、数据分析及图表分析等方面的强大功能。其主要内容包括:Excel数据输人的各种方法,工作表及单元格数据的格式化,数组公式,工作表、单元格或单元格区域的名字及其应用,公式与函数,图表分析,数据的排序、筛选、分类与汇总等。 本实验基于课本的相关问题收集一定数量的数据,利用EXCEL进行如下操作: 1.进行数据排序。 2.进行数据分组,筛选。 3.将数据进行次数分布处理。 六、实验内容: 问题与数据 【例2.2】江浦县苗圃对110株树苗的高度进行测量(单位:cm ),数据如下,编制次数分布表。

实验步骤 1、输入原始数据,存放在A2:A111。 2、计算基础数据,如B、C列,B列是文字提示,C列存放的是相应公式和函数。 3、输入分组标志,如D列;列出各组上限,如H3:H10。 4、C1输入函数f(x)=COUNT(A2:A111),输出个数为C1=110.同理在C2输入函数

f(x)=MAX(A2:A111),C3输入f(x)=MIN(A2:A111),C2=154,C3=80. 5、全距C4=C2-C3=74. 6、组数m=1+3.322LOG(C1,10),组距i=C4/C5。设置单元格格式,小数位为2.

统计学实验报告

统计学实验报告

实验一:数据特征的描述 实验内容包括:众数、中位数、均值、方差、标准差、峰度、偏态等实验资料:某月随机抽取的50户家庭用电度数数据如下: 88 65 67 454 65 34 34 9 77 34 345 456 40 23 23 434 34 45 34 23 23 45 56 5 66 33 33 21 12 23 3 345 45 56 57 58 56 45 5 4 43 87 76 78 56 65 56 98 76 55 44 实验步骤: (一)众数 第一步:将50个户的用电数据输入A1:A50单元格。 第二步:然后单击任一空单元格,输入“=MODE(A1:A50)”,回车后即可得众数。 (二)中位数 仍采用上面的例子,单击任一空单元格,输入“=MEDIAN(A1:A50)”,回车后得中位数。 (三)算术平均数 单击任一单元格,输入“=AVERAGE(A1:A50)”,回车后得算术平均数。 (四)标准差 单击任一单元格,输入“=STDEV(A1:A50)”,回车后得标准差。 故实验结果如下图所示:

上面的结果中,平均指样本均值;标准误差指样本平均数的标准差;中值即中位数;模式指众数;标准偏差指样本标准差,自由度为n-1;峰值即峰度系数;偏斜度即偏度系数;区域实际上是极差,或全距。 实验二:制作统计图 实验内容包括: 1.直方图:用实验一资料 2.折线图、柱状图(条形图)、散点图:自编一时间序列数据, 不少于10个。 3.圆形图:自编有关反映现象结构的数据,不少于3个。 实验资料:1.直方图所用数据:某月随机抽取的50户家庭用电度数数据如下: 88 65 67 454 65 34 34 9 77 34 345 456 40 23 23 434 34 45 34 23 23 45 56 5 66 33 33 21 12 23 3 345 45 56 57 58 56 45 5 4 43 87 76 78 56 65 56 98 76 55 44 2.折线图、柱状图(条形图)、散点图、圆形图所用数据: 2005年至2014年各年GDP总量统计如下: 年份 GDP (亿元) 2005 184575.8 2006 217246.6 2007 268631 2008 318736.1 2009 345046.4 2010 407137.8 2011 479576.1 2012 532872.1 2013 583196.7 2014 634043.4 实验步骤:

机械加工误差统计分析实验报告

机械加工误差统计分析实验 一、实验目的: 了解机械加工过程中工件的尺寸分布状态和变化规律,学习、掌握加工误差的统计分析方法。 二、实验原理: 机械加工过程中存在系统性和随机性误差的综合影响,造成工件的加工尺寸不断变化。统计分析方法就是以生产现场对一定数量的工件测量所得的结果为基础,运用数理统计方法进行处理,评定其加工情况,进而研究误差的性质及影响因素。 机械加工中采用的统计分析有两种方法:即分布图法和点图法。 1、分布图法 理论研究与生产实践证明,在调整好的机床上连续加工一批工件,如果没有系统性误差存在,只在随机性误差因素的作用下,加工工件的尺寸将服从正态分布,(见图4-1),它的方程为: ( )()2 2σ?Χ?Χ? Χ= 式中:X--工件的尺寸; Χ--工件的平均尺寸; σ--均方根偏差(标准差)。 根据概率论与数理统计原理: 工件的尺寸可近似的认为分布在X ±3σ的范围内,那么该工序的工艺能力系数: 6C δσ Ρ= 式中:δ—图纸上规定的工件的公差值。 在实验过程中,根据加工情况所做实验分布曲线符合正态分布,则说明工艺过程是稳定的。若出现明显差异,说明工艺过程不稳定,工艺系统中存在系统误差因素。因此,根据分布曲线可以很方便的推测、判断工序的加工情况。 2、点图法 在生产实践中常用点图法来观察尺寸变化趋势,控制加工过程。在调整好的机床上连续加工一批工件,依次进行分组,计算小组平均值 X 和极差R ,以加工组序或时间为横坐标,则平均值Χ为纵坐标,做出X 图;极差R 为纵坐标,作出R 图(见图 4-2)

Χ能够反映变值系统性误差的变化规律,R 图则反映随机性误差的大小。 对于稳定工艺过程,若样组数为m ,则点图的中心线及上、下控制线按表4-1 各式计算: 上表4-2式中:A 、D 1、D 2--系数,可根据工件分组情况查表得出;若点子超出R 图控制线,则说明随机误差过大,工艺系统出现了异常情况,都应对机床重新调整或停机检查。 对于不稳定工艺过程,由于系统存在变值系统误差因素的影响,被加工工件尺寸将按一定规律变化,其控制图就不能按上述办法来做了,具体做法可以参考教材。 三、实验所用设备、仪器、试件 机床:M1020A 无心外圆磨床 量具:千分尺一把 试件:(8~20)mm 的轴 四、 实验方法与步骤 五、本实验的试件在M1020A 无心外圆磨床上加工。磨床调整好以后,连续磨削100个轴, 按加工顺序排列,然后用千分尺进行测量,然后数据处理。 表-2 m 2 3 4 5 6 7 8 9 10 c 1.128 1.693 2.059 2.326 2.534 2.704 2.847 2.970 3.078 d 0.8528 0.8884 0.87980.86410.84800.83300.8200 0.808 0.797 A 1.8806 1.0231 0.72850.57680.48330.41930.3726 0.3367 0.3082D 1 3.2681 2.5742 2.2819 2.1145 2.0039 1.9242 1.8641 1.8162 1.7768D 2 0 0 0 0 0 0.0758 0.1359 0.1838 0.2232

管理同学SPSS描述统计分析 实验报告

描述统计分析 一、实验目的与要求 1. 了解统计描述的常用工具及SPSS 中的统计描述模块。 2. 掌握分类变量和连续变量的统计描述方法及指标。 二、实验内容提要 1.根据数据,分析受访者的年龄分布情况,尝试分城市/合并描述。 2.根据SPSS 自带数据Employee ,分析员工性别、受教育程度、少数民族、职位类别的分布情况,并尝试分析这些属性之间的关系以及这些属性和工资之间的关系。 三、实验步骤 根据数据 在数据栏中找到拆分文件,点击,将城市添加到分组方式中,对城市进行拆分,点击确定。 在分析中选择描述统计下的描述,点击确定。 描述统计量 S0. 城市 N 极小值 极大值 均值 标准差 100北京 S3. 年龄 378 18 65 有效的 N (列表状态) 378 200上海 S3. 年龄 387 18 65 有效的 N (列表状态) 387 300广州 S3. 年龄 382 18 65 有效的 N (列表状态) 382 根据SPSS 自带数据Employee 在分析一栏中的描述统计下找到频率,点击确定。 性别分析表 Gender 频率 百分比 有效百分比 累积百分比 有效 Female 216 Male 258 合计 474

受教育程度分析表 Educational Level (years) 频率 百分比 有效百分比 累积百分比 有效 8 53 12 190 14 6 15 116 16 59 17 11 18 9 19 27 20 2 .4 .4 21 1 .2 .2 合计 474 少数民族分析表 Minority Classification 频率 百分比 有效百分比 累积百分比 有效 No 370 Yes 104 合计 474 2.选择分析,描述统计下的交叉表,点击确定,分析性别和受教育程度之间的情况,将性别添加到行,将受教育程度添加到列中,点击确定。

统计学实验报告汇总

本科生实验报告 实验课程__________________ 统计学__________________________ 学院名称__________________ 商学院________________________ 专业名称__________________ 会计学__________________________ 学生姓名__________________ 苑蕊____________________________ 学生学号_______________ 201308040113 ___________________ 指导教师__________________ 刘后平__________________________ 实验地点____________ 成都理工大学南校区 ___________________ 实验成绩__________________________________________________ 二?一五年十月 __________ 二?一五年十月

1.某高校二级学院60名教职工的月工资资料如下: 1100 1200 1200 1400 1500 1500 1700 1700 1700 1800 1800 1900 1900 2100 2100 2200 2200 2200 2300 2300 2300 2300 2400 2400 2500 2500 2500 2500 2600 2600 2600 2700 2700 2800 2800 2800 2900 2900 2900 3100 3100 3100 3100 3200 3200 3300 3300 3400 3400 3400 3500 3500 3500 3600 3600 3600 3800 3800 3800 4200 学生实验心得

统计学实验报告1统计计量描述

分析报告(一) 实验项目:统计量描述实验日期:2012-3-16 实验地点:8教80680实验目的:熟悉描述性统计量的类型划分及作用;准确理解各种描述性统计量的构造原理;熟练掌握计算描述性统计量的SPSS 操作;培养运用描述统计方法解决身边实际问题的能力。 实验内容:(1):分析被调查者的户口和收入的基本情况 (2):分析储户存款金额的分布情况 (3):计算存款金额的基本描述统计量,并对城镇和农村户口进行比较分析 (4):分析储户存款数量是否存在不均衡现象 实验步骤:analysze—Descriptive statistics-- Frequencies 实验结果 : 【注释】:其中2.00 表示收入基本不变 【注释】:这是对城镇户口,农村户口的收入情况的描述性分析,frequency 代表频率,percent 代表所占总体的百分比

【注释】:这是对存款金额的描述性分析,最小值是1,最大值是80502,均值是2454.27,标准差是6881.827,标准误是 0.141 【注释】:本表描述的是城镇户口和农村户口的最小值,最大值,均值,标准差,标准误。实验分析:(一)、总体看来,城镇户口和农村户口的收入情况:基本不变占据很大比例,说明经济发展较稳定(二)、城镇户口的收入增加所占的比例为34.3%,远超过农村户口的18.9%,说明农村的发展相较于城镇,还有很大的发展空间。(三)、存款金额最大值 (80502)和最小值(1)之间差距过大,说明贫富差距过大,从长远角度来看,不利于经济的发展,我们国家也有出台一些减小贫富差距的政策,加快城镇化建设之类的。实验小结: 备注:

应用统计学实验报告

(此文档为word格式,下载后您可任意编辑修改!) 西安理工大学实验报告 第 1 页(共 X X 页) 课程:应用统计学实验日期: 2013 年 4月21日 专业班号:组别:______ 交报告日期: 20 13年5月1日 姓名:学号:报告退发:(订正、重做) 同组者教师审批签字: 实验报告格式 一、预习准备:实验目的和要求、实验仪器和设备等; 二、实验过程:实验步骤和实验数据记录等; 三、实验总结:实验数据处理和实验结果讨论等。 实验名称 应用统计学综合实验 大学生手机消费情况的调查报告

第一部分调查方案设计 一、调查方案 调查地点:西安理工大学曲江校区 调查方法:问卷调查 最近调查时间:2013年3月25日至 2013年4月10日 样本量: 30 被访者:西安理工大学本科生;男女生各15人 调查人员:王申玮 报告说明: 1.由于各年级上课时间分配情况以及经费问题,我们以一小部分本科生为调查对象; 2.调查方式:西安理工大学曲江校区随机抽学生作为样本,共计30人,男女各半。 报告内容: 1.目前大学生使用手机的价格区间及品牌分析。如今大学生对于手机消费的倾向; 2.手机的用途分析以及大学生对手机的消费需求情况。 3.手机的使用寿命及更换次数和原因问题。 二、问卷设计 大学生手机消费情况调查问卷 亲爱的同学: 您好!为了了解当前大学生的手机消费行为及消费特点,我们调查小组特邀请您参与此项调查。本调查不记名,我们将严格为您保密。您的所有回答仅用于统计分析,感谢您的支持和配合!

西安理工大学经济管理学院管111班 2013年4月 1.性别: □男□女 2.年级:□大一□大二□大三 3. 你现在正使用的手机,当时购买的价格多少钱?( ) A1000元以下 B1000~2000元 C2000~3000元 D3000元以上 现在的手机具体价格: 4. 你现在正在使用的手机品牌是:( ) A国产品牌 B欧美品牌 C日本品牌 D其他 5.你最喜爱哪个品牌的手机?为什么? 6. 除了手机基本通信外,你最常用手机干什么?(多选)( ) A玩游戏 B听音乐 C拍照 D上网 E其他 7. 你现在所使用的手机用多久了?( ) A一年以下 B一年至两年 C两年至三年 D三年以上 8. 你更换过几次手机?( ) A一次 B两次 C三次 D三次以上 E从来没换过 9.如果你想更换手机,那么促使你更换手机的原因是:( ) A原手机样式陈旧 B原手机功能少 C原手机坏了 D售后服务不好E其他 10. 当你选购手机时,你最看重手机的:( )(多选) A质量 B功能 C售后服务 D价格 E外观 F品牌信誉 G 其他11.手机在你的眼中还可以成为什么?( )(多选) A身份的象征 B时尚科技的结晶 C不可缺少的生活伴侣 D休闲娱乐的工具 E朋友之间的话题 F其他

相关主题
文本预览
相关文档 最新文档