统计学实验报告书频数分布图表等
- 格式:doc
- 大小:130.50 KB
- 文档页数:5
实验一:频数分布表的编制统计学的最基本工作是收集数据。
把原始数据收集上来之后,首先要对数据进行整理并分析这些数据的特性和变化规律。
生物统计学中经常遇到的数据有两种类型,一种是连续型数据(continuous data),又称为计量数据(measurement data);另一种是离散型数据(discrete data),又称为计数数据(count data)。
描述数据变化规律的最简单方法是将这些数据列成频数表(frequency table)。
1、离散型数据频数分布表的制作例1:检查200丛稻遗株,每丛内越冬三化螟幼虫的原始调查资料如下(见SAS程序),试编制频数分布表。
data freq_01; input x @@; cards;1 1 0 02 0 0 1 0 2 1 0 1 1 0 1 0 03 0 2 1 0 0 1 0 1 0 0 1 0 1 0 1 0 0 0 0 5 0 1 0 0 0 04 2 0 0 3 0 4 1 3 1 4 0 1 2 6 0 3 2 1 0 2 0 0 1 1 0 0 0 0 0 0 0 0 2 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 02 0 1 0 1 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 0 0 1 1 1 0 0 0 1 1 1 0 0 1 1 1 0 1 0 0 0 1 1 0 0 0 0 0 1 0 1 1 1 0 0 0 0 0 0 0 1 1 0 0 0 0 1 0 0 0 0 1 0 1 1 0 0 0 0 0 1 0;proc freq; run;运行结果:2 连续型数据频数分布表的制作例2:在广州天河区称量106头越冬三化螟幼虫的体重(单位:毫克),根据原始资料(见SAS程序),以6毫克为组距,分成13组,第一组下限为10毫克,制作频数分布表。
一.实验目的与要求(一)目的实验一: EXCEL的数据整理与显示1. 了解EXCEL的基本命令与操作、熟悉EXCEL数据输入、输出与编辑方法;2. 熟悉EXCEL用于预处理的基本菜单操作与命令;3. 熟悉EXCEL用于整理与显示的基本菜单操作与命令。
实验二: EXCEL的数据特征描述、抽样推断熟悉EXCEL用于数据描述统计、抽样推断实验三: 时间序列分析掌握EXCEL用于移动平均、线性趋势分析的基本菜单操作与命令。
实验四: 一元线性回归分析掌握EXCEL用于相关与回归分析的基本操作与命令。
(二)要求1.按要求认真完成实验任务中规定的所有练习;2.实验结束后要撰写格式规范的实验报告, 正文统一用小四号字, 必须有页码;3、实验报告中的图表制作要规范, 图表必须有名称和序号;4、实验结果分析既要简明扼要, 又要能说明问题。
二、实验任务实验一根据下面的数据。
1.1用Excel制作一张组距式次数分布表, 并绘制一张条形图(或柱状图), 反映工人加工零件的人数分布情况。
从某企业中按随即抽样的原则抽出50名工人, 以了解该企业工人生产状况(日加工零件数):117 108 110 112 137 122 131 118 134 114 124 125 123127 120 129 117 126 123 128 139 122 133 119 124 107133 134 113 115 117 126 127 120 139 130 122 123 123128 122 118 118 127 124 125 108 112 135 5091.2整理成频数分布表, 并绘制直方图。
1.3 假设日加工零件数大于等于130为优秀。
实验二百货公司6月份各天的销售额数据如下(单位:万元)257 276 297 252 238 310 240 236 265 278271 292 261 281 301 274 267 280 291 258272 284 268 303 273 263 322 249 269295(1)计算该百货公司日销售额的均值、众数、中位数;(2)计算该百货公司日销售额的极差、标准差;(3)计算日销售额分布的偏态系数和峰度系数。
统计学实验内容一、频数统计1.A公司在招聘时采用了综合能力测试(满分为100分),由于应聘的人数较多,现随机抽取了157名应聘者的测试成绩,其测试分数的数据如book1所示。
(1)根据上面的资料,进行分组,并确定组数和组距。
根据资料判断,进行分组,分为六组,组距为10。
(2)编制频率分布表上限成绩频数频率19 10~20 16 0.10191129 20~30 27 0.17197539 30~40 56 0.35668849 40~50 39 0.24840858 50~60 14 0.08917268 60~70 5 0.031847合计157接收频率累积 %19 16 10.19%29 27 27.39%39 56 63.06%49 39 87.90%59 14 96.82%69 5 100.00%其他0 100.00%(3)画出直方图。
2. 为评价家电行业售后服务的质量,随机抽取了由100家庭构成的一个样本。
服务质量的等级分别表示为:A.好;B.较好;C.一般;D.差;E.较差。
调查结果见book2。
(1) 指出表中的数据属于什么类型?定序型(2) 制作一张频数分布表;服务质量等级频数频率1 A 14 0.142 B 21 0.213 C 32 0.324 D 18 0.185 E 15 0.15合计100(3)绘制一张条形图,反映服务质量的分布。
等量质计数项:服务质量等级服务质量等级汇总A 14B 21C 32D 18E 15总计100二、参数估计1.已知灯管使用寿命服从正态分布,其标准差为50小时。
现从一批产品中抽取25个作为样本,测得其平均使用寿命为1600小时,要求在95%的概率保证下估计该批产品平均使用寿命的置信区间。
(运用CONFIDENCE函数)标准差50置信度0.95样本容量25平均值1600极限误差19.59964置信区间1580.4 1619.6抽样平均误差 19.59964,置信区间即(1580.4003~1619.59964)2.在一篇关于“通货紧缩”的文章中,作者考察了各种各样投资的收益情况。
统计学中的频数分布与频率分布统计学是一门研究数据收集、分析和解释的学科,而频数分布与频率分布是统计学中常用的数据展示方法。
它们能够帮助我们更好地理解数据的特征和分布规律。
一、频数分布频数分布是将数据按照不同数值进行分类,并统计每个数值出现的次数,从而得到一个数据表。
以下是一个关于某班级学生考试成绩的频数分布表:成绩范围频数60-69 570-79 880-89 1290-100 10通过这个表格,我们可以直观地看到学生在各个成绩范围内的分布情况。
例如,在80-89分数段内,有12个学生获得了这个分数范围内的成绩。
频数分布表不仅可以展示数据的分布情况,还能帮助我们计算各个分数段内学生人数的百分比。
二、频率分布频率分布是通过统计每个数值出现的次数,然后将次数转化为频率(占总数的比例),得到一个数据表。
以下是使用相同数据的频率分布表:成绩范围频率60-69 0.2570-79 0.480-89 0.690-100 0.5与频数分布表相比,频率分布表更加直观地展示了各个成绩范围内学生所占的比例。
例如,在80-89分数段内的学生占总人数的0.6,即60%。
频数分布和频率分布都能够帮助我们更好地理解数据的特征和分布规律。
它们的选择取决于我们想要表达的信息。
如果我们更关注每个数值出现的次数,那么使用频数分布表更为合适;如果我们更关注各个数值所占的比例,那么使用频率分布表更为合适。
总结起来,频数分布和频率分布是统计学中常用的数据展示方法。
通过这些分布表,我们可以更加直观地了解数据的特征和分布规律,从而做出更准确的统计和分析。
在实际应用中,我们可以根据具体情况选择合适的分布表来展示数据。
统计学实验报告姓名:田媛学号:20092771 班级:营销0901 成绩:一、实验步骤总结:成绩:实验一:数据的搜集与整理1.数据收集:(1)间接数据的搜集。
有两种方法,一种是直接进入网站查询数据,另一种是使用百度等搜索引擎。
(2)直接数据的搜集。
直接统计数据可以通过两种途径获得:一是统计调查或观察,二是实验。
统计调查是取得社会经济数据的最主要来源,它主要包括普查、重点调查、典型调查、抽样调查、统计报表等调查方式。
2.数据的录入:数据的录入是将搜集到的数据直接输入到数据库文件中。
数据录入既要讲究效率,又要保证质量。
3.数据文件的导入:Excel数据文件的导入是将别的软件形成的数据或数据库文件,转换到Excel工作表中。
导入的方法有二,一是使用“文件-打开”菜单,二是使用“数据-导入外部数据-导入数据”菜单,两者都是打开导入向导,按向导一步步完成对数据文件的导入。
4.数据的筛选:数据的筛选是从大数据表单中选出分析所要用的数据。
Excel中提供了两种数据的筛选操作,即“自动筛选”和“高级筛选”。
5.数据的排序:Excel的排序功能主要靠“升序排列”(“降序排列”)工具按钮和“数据-排序”菜单实现。
在选中需排序区域数据后,点击“升序排列“(“降序排列”)工具按钮,数据将按升序(或降序)快速排列。
6.数据文件的保存:保存经过初步处理的Excel数据文件。
可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。
实验二:描述数据的图标方法1.频数频率表:(一)Frequency函数使用方法举例:假设工作表里列出了考试成绩。
这些成绩为79、85、78、85、83、81、95、88 和97,并分别输入到单元格A1:A9。
这一列考试成绩就是data_array。
Bins_array 是另一列用来对考试成绩分组的区间值。
在本例中,bins_array 是指C4:C6 单元格,分别含有值70、79 和89。
区分指标与标志,总量指标分类、分配数列、上限不在内原则、各种平均数之间的关系、平均发展指标!计算可能考的公式有:计划完成情况相对指标、结构(比例/比较/强度/动态)相对指标、各种平均数算法、众数、中位数、四分位数、平均差、标准差、标准差系数、偏态和峰度、发展速度和增长速度、总指数(很重要)、平均指标指数、重要经济指数的编制(上证指数、工业产品产量总指数、农副产品收购价格指数)统计学(第三版课后习题答案) 贾俊平版2.1 (1)属于顺序数据。
(2)频数分布表如下:服务质量等级评价的频数分布服务质量等级家庭数(频率)频率%A1414B2121C3232D1818E1515合计100100(3)条形图(略)2.2 (1)频数分布表如下:(2)某管理局下属40个企分组表按销售收入分组(万元)企业数(个)频率(%)先进企业良好企业一般企业落后企业11119927.527.522.522.5合计40 100.0 2.3 频数分布表如下:某百货公司日商品销售额分组表按销售额分组(万元)频数(天)频率(%)25~30 30~35 35~40 40~45 45~5046159610.015.037.522.515.0合计40 100.0 直方图(略)。
2.4 (1)排序略。
(2)频数分布表如下:100只灯泡使用寿命非频数分布按使用寿命分组(小时)灯泡个数(只)频率(%)650~660 2 2660~670 5 5670~680 6 6680~690 14 14690~700 26 26700~710 18 18710~720 13 13720~730 10 10730~740 3 3740~750 3 3合计100 100 直方图(略)。
2.5 (1)属于数值型数据。
(2)分组结果如下:分组天数(天)-25~-20 6-20~-15 8-15~-10 10-10~-5 13-5~0 120~5 45~10 7合计60(3)直方图(略)。
《应用统计学》实验报告班级:管121班姓名:学号:北京建筑大学2015年01月实验1 描述统计 (3)一、实验目的与要求 (3)二、实验原理 (3)三、实验步骤 (3)1.频数分析(Frequencies) (3)2.描述统计(Descriptives) (8)实验2 统计推断 (11)一、实验目的与要求 (11)二、实验原理 (11)三、实验演示内容与步骤 (11)1.单个总体均值的区间估计 (12)2.两个总体均值之差的区间估计 (14)4.两独立样本的假设检验(两独立样本T检验) (17)5.配对样本T检验 (19)实验1 描述统计一、实验目的与要求统计分析的目的在于研究总体特征。
但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。
因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。
通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。
二、实验原理描述统计是统计分析的基础,它包括数据的收集、整理、显示,对数据中有用信息的提取和分析,通常用一些描述统计量来进行分析。
集中趋势的特征值:算术平均数、调和平均数、几何平均数、众数、中位数等。
其中均数适用于正态分布和对称分布资料,中位数适用于所有分布类型的资料。
离散趋势的特征值:全距、内距、平均差、方差、标准差、标准误、离散系数等。
其中标准差、方差适用于正态分布资料,标准误实际上反映了样本均数的波动程度。
分布特征值:偏态系数、峰度系数、他们反映了数据偏离正态分布的程度。
三、实验步骤1.频数分析(Frequencies)实验数据1:表2.7为某班级16位学生的身高数据,对其进行频数分析,并对实验报告作出说明。
一、实验目的本次实习实验旨在通过实际操作,使学生掌握统计学的基本理论和方法,提高运用统计学知识解决实际问题的能力。
通过本次实验,学生应能够熟练运用统计软件(如SPSS、Excel等)进行数据处理和分析,并能对实验结果进行解释和总结。
二、实验内容1. 实验背景本次实验以某城市居民消费水平为研究对象,通过收集相关数据,运用统计学方法进行分析。
2. 实验数据(1)居民收入水平:月收入(元)(2)居民消费水平:月消费(元)3. 实验步骤(1)数据录入:将实验数据录入统计软件(如SPSS、Excel等)。
(2)数据整理:对录入的数据进行清洗、筛选和整理,确保数据的准确性和完整性。
(3)描述性统计:计算居民收入水平和消费水平的均值、标准差、最大值、最小值等指标。
(4)频数分布:绘制居民收入水平和消费水平的频数分布图,分析数据的分布特征。
(5)相关分析:计算居民收入水平和消费水平的相关系数,分析两者之间的关系。
(6)回归分析:建立居民收入水平和消费水平的线性回归模型,分析收入水平对消费水平的影响。
三、实验结果与分析1. 描述性统计结果(1)居民收入水平:均值为6000元,标准差为2000元,最大值为12000元,最小值为2000元。
(2)居民消费水平:均值为4000元,标准差为1500元,最大值为8000元,最小值为1000元。
2. 频数分布结果(1)居民收入水平:大部分居民月收入在3000-8000元之间,呈正态分布。
(2)居民消费水平:大部分居民月消费在2000-6000元之间,呈正态分布。
3. 相关分析结果居民收入水平和消费水平的相关系数为0.7,说明两者之间存在较强的正相关关系。
4. 回归分析结果建立居民收入水平和消费水平的线性回归模型,模型如下:消费水平= 3000 + 0.6 × 收入水平模型的决定系数为0.49,说明收入水平对消费水平的解释程度为49%。
四、实验总结通过本次实习实验,我们掌握了以下统计学知识和技能:1. 统计软件的使用:熟练运用SPSS、Excel等统计软件进行数据处理和分析。