数理统计学实验报告
- 格式:doc
- 大小:240.50 KB
- 文档页数:11
应用数理统计学课程实验报告201330170078 学生学号实验课成绩学生实验报告书应用数理统计学课程实验实验课程名称土木与交通学院开课学院胡郁葱指导教师姓名邓艳辉学生姓名交通运输学生专业班级学年第 1 学期 2014 2015 --上机实验一实验项目名称上机实验1 实验日期 2014.12.26 实验者邓艳辉专业班级交通运输组别第二组一部分:实验预习报告(包括实验目的、意义,实验基本原理与方法,实验方案与技术路线等)一、实验目的:掌握SPSS的基本操作(认识SPSS、变量定义、变量属性理解、数据录入等) 二、实验任务:设计“交通量调查表”的相关变量及属性,便于将纸质调查表转换为电子调查表,并导入数据。
三、实验基本原理和方法:一、定义变量启动SPSS后,出现如图1-1所示数据编辑窗口。
由于目前还没有输入数据,因此显示的是一个空文件。
输入数据前首先要定义变量。
定义变量即要定义变量名、变量类型、变量长度(小数位数)、变量标签(或值标签)和变量的格式。
1(定义变量名NameSPSS默认的变量为Var00001、Var00002等。
用户也可以根据自己的需要来命名变量。
SPSS变量的命名和一般的编程语言一样,有一定的命名规则,具体内容如下: (1)变量名必须以字母、汉字或字符,开头,其他字符可以是任何字母、数字或_、@、#、$等符号。
(2)变量最后一个字符不能是句号。
(3)变量名总长度不能超过8个字符(即4个汉字)。
4(4)不能使用空白字符或共他待殊字符(如“~”、“?”等)。
(5)变量命名必须唯一,不能有两个相同的变量名。
(6)在SPSS中不区分大小写,例如,HXH、hxh或Hxh对SPSS而言,均为同一变量名称。
(7)SPSS的句法系统中表达逻辑关系的字符串不能作为变量的名称,如ALL、AND、WITH、OR等2(定义变量类型Type单击Type相应单元中的按钮,出现如图1-2所示的对话框,在对话框中选择合适的变量类型并单击OK按钮,即可定义变量类型。
数理统计学实验报告院:专业:班级:学号:学生姓名:指导教师姓名:实验日期:实验11950~1983年我国三类产品出口总额及其构成年份出口总额(亿元)其中工矿产品农副产品加工品农副产品金额(亿元)占总额%金额(亿元) 占总额%金额(亿元)占总额%195020。
21。
99。
4 6。
733。
2 11。
657.4195548.712。
425。
5 13.828.4 22.546.1196063.316。
926.7 26.842.3 19.631。
0196563。
119。
530.9 22。
736.0 20。
933。
1197056。
814.525.6 21。
437。
7 20.936.7 197514356.239.3 44.531.1 42。
329.6 1980282。
4141。
151.8 90。
4 29。
550.918。
7 1983434。
5249.457.4 11626。
7 69。
115.9用表中的资料,按以下要求绘制图表:(一)用表中1950、1960、1970、1980四年三类产品的出口金额绘制分组柱形图,然后将图复制到Word文档.(二)用表中1950和1980两年三类产品的出口金额占总金额的百分比,分别绘制两幅饼图, 然后将图复制到Word文档;(三)用1950、1960、1970、1980四年三类产品出口金额绘制折线图, 然后将图复制到Word文档。
(四)将以上一张表、三幅图联系起来,结合我国当时的历史背景写一篇300字左右的统计分析报告。
(一)(二)1950:1980:(三)(四)总结建国初期,我国对外贸易仅限于原苏联和东欧等前社会主义国家,对外贸易规模极其有限,基本上处于封闭半封闭状态。
1950年,出口额极少,以农副产品为主的出口占我国出口总额的百分之五十八,而工矿产品的出口极少只占百分之九。
随着经济发展,出口额增长,工矿产品的出口额增长迅速,而出口产品以农副产品加工品为主.改革开放以来,我国走上了对外开放之路,从大规模“引进来”到大踏步“走出去”,一跃而成为世界对外贸易大国。
西北农林科技大学实验报告学院名称:理学院专业年级:姓名:学号:课程:数理统计学报告日期:实验二一.实验目的1.利用样本数据推断储户总体一次平均存款金额是否为2000元。
并求置信区间(自己确定置信水平)。
检验城镇储户与农村储户一次平均存款金额是否无显著差异。
2.利用样本数据推断保险公司具有高等教育水平的员工比例小于等于0.8.3.利用样本数据检验减肥茶是否有明显的减肥作用。
二.实验要求1.学会用spss比较均值,并求出置信区间.三.实验内容(一)利用样本数据推断储户总体一次平均存款金额是否为2000元。
并求置信区间(自己确定置信水平)。
检验城镇储户与农村储户一次平均存款金额是否无显著差异。
1、用spss软件打开所给文件“居民储蓄调查数据(存款)”。
2、在数据视图界面点击分析->比较均值->单样本T检验,把题目要求的“存取款金额[a5]”加入到检验变量中,在检验值处填2000(如图所示)。
点击粘贴,会得到一串代码如下:DATASET ACTIV ATE 数据集1.T-TEST/TESTV AL=2000/MISSING=ANALYSIS/V ARIABLES=a5/CRITERIA=CI(.95).点击运行->全部,就能得到所求“样本数据推断储户总体一次平均存款金额是否为2000元。
并求置信区间(自己确定置信水平)。
”的结果(如图所示)。
3、回到数据视图界面,点击分析->比较均值->独立样本T检验,按要求把“存取款金额[a5]”加入到检验变量中,把户口[a13]加入到变量中。
根据变量视图中a13的值标签显示1=“城镇户口”,2=“农村户口”(如图所示)所以在把户口[a13]加入到变量中之后点击定义组,在使用指定值处分别填“1”,“2”(如图所示)。
最后点击确定,得到所求“检验城镇储户与农村储户一次平均存款金额是否无显著差异。
”的结果(如图所示)。
(二)利用样本数据推断保险公司具有高等教育水平的员工比例小于等于0.8。
实验名称:用Excel画直方图(实验一)指导教师:实验时数: 4 实验设备:安装了VC++、mathematica、matlab的计算机实验日期:2012 年 3 月 20 日实验地点:第五教学楼北902学生:学号:实验目的:1.学会利用Excel画直方图的方法;2.应用这种方法解决一些实际问题。
实验准备:1.在开始本实验之前,请回顾教科书的相关内容;2.需要一台安装有Windows XP Professional操作系统和完整安装office2003的计算机。
实验内容及要求:40种刊物的月发行量如下(单位:百册):59545022 14667 6582 6870 1840 2662 45081208 3852 618 3008 1268 1978 7963 20483077 993 353 14263 1714 11127 6926 2047714 5923 6006 14267 1697 13876 4001 22801223 12579 13588 7315 4538 13304 1615 8612(1)求该批数据的平均值,最大值,最小值,样本标准差,中位数;(2)建立该批数据的频数分布表,取组距为1700百册,并应用Excel画频数直方图,频率直方图,单位频率直方图;(3)由Excel自行确定组距,画出频数直方图。
实验过程:(程序代码及运行结果)最大值14667 组限353接收频数频率单位频率最小值353 205335310.0250.025平均值5552.15 37532053130.3250.325样本标准差4585.082 5453375340.10.1中位数4254.5 7153545350.1250.125极差14314 8853715360.150.15组数10 10553885330.0750.075组距1700 1225310553000139531225310.0250.025156531395340.10.11565330.0750.075其他000一·最大值:依次在单元格中输入数据,在A6中输入最大值,选定B6,输入函数MAX,选定区域(A1:H5)然后确定,即可得出。
数理统计实验指导1报告数理统计实验实验指导书⼀理学院实验中⼼数学专业实验室编写实验⼀常见的概率分布以及分位数【实验类型】综合性【实验学时】4【实验内容】1、会利⽤ MATLAB 软件计算离散型随机变量的概率、连续型随机变量概率密度值, 以及产⽣离散型随机变量的概率分布(即分布律);2、会利⽤ MATLAB 软件画出各种常见分布图形;2、会利⽤ MATLAB 软件计算分布函数值, 或计算形如事件{X≤x}的概率;3、给出概率p和分布函数, 会求上α分位点, 或求解概率表达式中的待定参数。
【实验前的预备知识】1、掌握常见离散型随机变量的分布律及性质;2、掌握常见连续型随机变量的分布密度函数及性质;3、理解上分位数的定义及求法4、掌握基本的描绘函数的MATLAB编程法。
【实验⽅法或步骤】1、通⽤MATLAB函数计算概率分布律及密度函数值命令通⽤函数计算概率密度函数值函数pdf 或者namepdf格式:Y=pdf(‘name',K,A,B)或者:namepdf (K,A,B)说明(1)上述函数表⽰返回在X=K处、参数为A、B、C的概率值或密度值,对于不同的分布,参数个数是不同;name为分布函数名,其取值如表1。
(2)第⼀个函数名加' ',第⼆个⽆需加。
表1 常见分布函数表例1事件A在每次试验中发⽣的概率是0.3, 计算在10次试验中A恰好发⽣6次的概率.解: p=pdf('bino',6, 10, 0.3)或者p=binopdf(6, 10, 0.3)p =0.0368结果表明:参数是n=10,概率是p=0.3的⼆项分布在X=6处的概率为0.0368.例2 事件A在每次试验中发⽣的概率是0.3, 求在4次试验中A发⽣次数的概率分布.解: p=pdf('bino',0:4,4,0.3) %0: 4产⽣步长为 1 的等差数列 0, 1, 2, 3, 4.或者p=binopdf(0:4,4,0.3)p =0.2401 0.4116 0.2646 0.0756 0.0081计算的结果是: 参数是n=4, 概率是p=0.3的⼆项分布的分布律(当x=0,1,2,3,4 时).例 3 设随机变量X服从参数是3的泊松分布, 求概率P{X=6}.解: p=pdf('poiss',6,3)或者p=poisspdf(6,3)p =0.0504结果表明:参数是λ=3 的泊松分布在x=6处的概率为0.0504.例4 写出参数为 3 的泊松分布的前6项的概率分布.解:p=pdf('poiss',0:5,3)或者p=poisspdf(0:5,3)% 0:5 产⽣步长为 1的等差数列0,1,2,3,4,5.p =0.0498 0.1494 0.2240 0.2240 0.1680 0.1008计算的结果是, 参数为λ=3的泊松分布的前6项的概率(当x=0,1,2,3,4,5时).例5设随机变量X服从区间[2, 6]上的均匀分布, 求X=4 时的概率密度值.解:y=unifpdf(4,2,6) 或y=pdf('unif',4,2,6)y =0.2500例6 计算正态分布N(0,1)的随机变量X在点0.6578的密度函数值。
研究生数理统计实验报告(方差分析+回归分析)《数理统计》日期:实验成绩:评阅人:实验学院:班级:学号:姓名:报告实验一:单因素方差分析一.实验内容在1990 年秋对“亚运会期间收看电视的时间”调查结果如下表所示。
问:收看电视的时间比平日减少了(第一组)、与平日无增减(第二组)、比平日增加了(第三组)的三组居民在“对亚运会的总态度得分”上有没有显著的差异?第一组 42 41 42 42 43 第二组 39 40 40 41 41 第三组 43 44 43 45 45 二.实验步骤1.打开excel(2021版),输入数据2.点击“数据”→数据分析→单因素分析3.输出结果组列 1 列 2 列 3 差异源组间组内总计SS 36.133 8.800 44.933 df 2 12 14 MS 18.067 0.733 F 24.636 P-value0.0001 F crit 3.89 观测数 5 5 5 求和 210 201 220 平均 42 40.2 44 方差 0.5 0.7 1 三.实验结果从上述软件结果可知,p-value为0.0001<0.01,所以在1%的显著性水平下,拒绝原假设,即三组居民在“对亚运会的总态度得分”上有显著的差异。
实验二:双因素方差分析(无交互作用)一.实验内容从由五名操作者操作的三台机器每小时产量中分别各抽取1 个不同时段的产量,观测到的产量如表6-31所示。
试进行产量是否依赖于机器类型和操作者的方差分析。
机器1 操作者1 53 操作者2 47 操作者3 46 操作者4 50 操作者5 49 机器2 61 55 52 58 54 机器3 51 51 49 54 50 二.实验步骤1.打开excel(2021版),输入数据2.点击“数据”→数据分析→无重复双因素分析3.输出结果 SUMMARY 行 1 行 2 行3 行4 行5 列 1 列 2 列 3 差异源行列误差总计SS 72 130 22 224 df 4 2 8 14 MS 18 65 2.75 F 6.5455 23.6364 P-value0.0122 0.0004 F crit 3.8379 4.4590 观测数 3 3 3 3 3 5 5 5 求和 165 153147 162 153 245 280 255 平均 55 51 49 54 51 49 56 51 方差 28 16 9 16 7 7.5 12.5 3.5 三.实验结果因操作者因素的P-value值为0.0122,在5%显著性水平下,差异显著;机器因素的P-value值为0.0004,在1%显著性水平下,差异显著,说明产量依赖于机器类型和操作者。
第1篇一、实验课程名称:统计学实验二、实验项目名称:例题分析与解决三、实验日期:2023年10月26日四、实验者信息:- 专业班级:经济与管理学院经济学专业- 姓名:张三- 学号:20190001五、实验目的:1. 理解统计学的基本概念和原理。
2. 掌握统计学中的常用方法和技巧。
3. 提高运用统计学知识解决实际问题的能力。
六、实验原理:统计学是一门应用数学的分支,主要用于收集、整理、分析数据,从而对现象进行描述、解释和预测。
本实验主要通过分析例题,加深对统计学理论和方法的理解。
七、实验内容:1. 例题一:计算一组数据的平均数、中位数、众数(1)数据:10, 15, 20, 25, 30, 35, 40(2)计算过程:- 平均数 = (10 + 15 + 20 + 25 + 30 + 35 + 40) / 7 = 25- 中位数 = 30- 众数 = 30(出现次数最多)2. 例题二:求解一组数据的方差和标准差(1)数据:10, 15, 20, 25, 30, 35, 40(2)计算过程:- 方差 = [(10 - 25)^2 + (15 - 25)^2 + (20 - 25)^2 + (25 - 25)^2 + (30 - 25)^2 + (35 - 25)^2 + (40 - 25)^2] / 7 = 91.43- 标准差= √方差= √91.43 ≈ 9.533. 例题三:分析两组数据的关联性(1)数据集A:身高(cm):160, 165, 170, 175, 180体重(kg):50, 55, 60, 65, 70(2)数据集B:身高(cm):165, 170, 175, 180, 185体重(kg):55, 60, 65, 70, 75(3)计算过程:- 相关系数= (Σ(xy) - nΣxΣy) / √[(Σx^2 - nΣx^2)^2 (Σy^2 -nΣy^2)]- 其中,x为身高,y为体重,n为数据个数计算得出两组数据的关联性较强,说明身高和体重之间存在正相关关系。
西北农林科技大学实验报告学院名称:理学院专业年级:姓名:学号:课程:数理统计学报告日期:实验三非参数假设检验一.实验目的1. 验证某产品的合格率是否是否低于0.9.2. 检验某地区儿童身高是否符合正态分布。
3. 为研究心脏病猝死人数与日期的关系,收集到168个观测数据,利用这批样本数据推断猝死人数与日期的关系是否为2.8:1:1:1:1:1:1.4. 某工厂用甲乙两种工艺生产同一种产品,利用样本数据检验两种工艺下产品使用寿命是否存在显著差异。
二.实验要求用spss实现非参数假设检验,包括二项式检验,单样本正态分布检验,两个独立样本检验,卡方检验。
三.实验内容(一)验证某产品的合格率是否是否低于0.9.打开文件“非参数检验(产品合格率)”,点击分析->非参数检验->旧对话框->二项式,把数据“是否合格”添加到检验变量列表,把检验比例默认的0.5该为题目要求的0.9(如图所示)。
点击确定得到结论(如图所示)。
结论:由上表知,SPSS的悖假设检验案例比例小于0.9的,并且在精确显著(单侧)值sig=0.193>0.05,即接受原假设检验,即二项式检验的案例比例是大于0.9的。
(二)检验某地区儿童身高是否符合正态分布。
打开文件“非参数检验(单样本KS-儿童身高)”,点击分析->非参数检验->旧对话框->1样本,把数据“周岁儿童的身高(sg)”添加到检验变量列表,检验分布默认为常规,即正态(如图所示)。
点击确定得到结论(如图所示)。
结论:由上述的结果可以看出,周岁儿童的身高是满足正态分布其中均值为71.8571,标准差为3.97851,可知某地区的儿身高满足正态分布。
除此之外,由上面的结果中的检验值sig=0.344>0.05也可以得出原假设检验是成立的,即接受身高满足正态分布的假设。
(三)为研究心脏病猝死人数与日期的关系,收集到168个观测数据,利用这批样本数据推断猝死人数与日期的关系是否为2.8:1:1:1:1:1:1.打开文件,在变量视图窗口中,点击数据->加权个案,对话框右边选项点击加权个案,把“死亡日期”添加到频率变量中,(如图所示),点击确定。
《概率论与数理统计》实验报告学生姓名学生班级学生学号指导教师学年学期实验报告实验内容实验过程(实验操作步骤)实验结果1 .某厂生产的化纤强度X 〜N( ,0.852),现抽取一个容量为n 25的样本,测定其强度,得样本均值X 2.25,试求这批化纤平均强度的置信水平为0.95的置信区间. 第1步:打开【单个正太总体均值Z估计活动表】。
第2步:在单元格【B3】中输入0.95,在单元格【B4】中输入25,在单元格【B5】中输入2.25 ,显示结果。
单YE盍总臣均值出石计;騙洙由此可得,这批化纤平均强度的置信水平为0.95的置信区区间为(1.92 , 2.58).2 .已知某种材料的抗压2强度X ~ N(,),现随机抽取10个试件进行抗压试验,测得数据如下:482,493, 457, 471, 510,446, 435, 418, 394, 469 求平均抗压强度的置信水平为 0.95的置信区间;2(2)求的置信水平为0.95的置信区间. 第1步:打开【单个正太总体均值t估计活动表】•第2步:在D列输入原始数据.第3步:点击【工具(T)】-选择【数据分析(D)】一选择【描述统计】一点击【确定】按钮一在【描述统计】对话框输入相关内容—点击【确定】按钮,得到F列与G列结果。
第4步:在单元格【B3】中输入0.95,在单元格【B4】中输入10, 在【B5】中引用G3,在【B6】中引用G7,显示结果。
单个正击豆悴旳毡文洁id汚加置馆水平0.95禅本容呈10禅本均疽4E7. 5捽本掠性差35. 217b??68彳就误差11. 13677591I分应麹(軍)L. 333112^33十命惊數(双》 2.262157163单侧直订下限d37. 0S5C32至厕宣世丄限^77.^14563区可估计估i 下陨-132. 3063?26估计上限4S 2. 6^3137449?■J&7平均45T, 5裁上上椎代差11.丄3閃辭土51(1中也戲-I-.-446刪倍祈准年35.517^77^3H5方差124OLZT77YBjy^蛀度-0.僦希仙7・菟勺克飾¥04&9帽备眞坤11639Q总人值510㈣6LQM y J1ti)顼•£_唄w -由此可得,平均抗压强度的置信水平为0.95的置信区间(432.31 , 482.69)草不正蛊盘悴方茎卡方诂计^动B却計:平0.能畔多Fir1Q45T. 5祥車•方差1240. 2?7?78卡方下分G激 3. 325L12843卡方上分位厳f单了卡方下5K触(股)卡方上沁憨(敢)16. 91897762. 7GD3E9E19-022T67BC59. TCZOSSV二1“芒K7用匡is■估计3357, 02393?咕计EFU5B€. 7«S2S3'舌H丄哽4133.56324由此可得,2的置信水平为0.95的置信区间为(586.80 , 4133.66)3 .用一个仪表测量某一物理量9次,得样本均值x 56.32,样本标准差s 0.22.(1)测量标准差的大小反映了仪表的精度,试求的置信水平为 0.95 的置信区间;(2)求该物理量真值的置信水平为0.99的置信区间.(1)第1步:打开【单个正太总体方差卡方分布】第2步:在单元格【B3】中输入0.95 ,在单元格【B5】中输入56.32 ,在单元格【B6】中输入0.0484 ,显示结果。
数理统计学实验报告
院: 理学院 专业: 统计学 班级: 1402 学号: 09 学生姓名: 曹漫林 指导教师姓名: 王剑君 实验日期: 2016.6.2
实验1
(一)用表中1950、1960、1970、1980四年三类产品的出口金额绘制分组柱形图,然后将图复制到Word文档。
(二)用表中1950和1980两年三类产品的出口金额占总金额的百分比,分别绘制两幅饼图, 然后将图复制到Word文档;
(三)用1950、1960、1970、1980四年三类产品出口金额绘制折线图, 然后将图复制到Word文档。
(四)将以上一张表、三幅图联系起来,结合我国当时的历史背景写一篇300字左右的统计分析报告。
实验2
一、统计分组与直方图
某市50家商城某年营业额如下:(单位:百万元)
(二)给出按降序分组的次数和累积频率,绘制降序直方图。
二、描述统计
实验3
一、t-检验
[习题一]为了解学生身体发育情况,从甲校抽查9名学生,从乙校抽查11
现假定两校学生身高的方差相等,要求对两校学生的平均身高有无显著差异进行检验。
结论:接受原假设,认为两校学生的平均身高无显著差异。
[习题二]某厂甲、乙两车间分别用两种不同工艺生产同一型号的钢丝,钢丝的抗拉强度服从正态分布,现各抽取8根,测得其抗拉强度如下(单位:公
结论:接受原假设,认为两种工艺生产的钢丝的平均抗拉强度无显著差异。
[习题三]有10个失眠症患者,服用甲、乙两种安眠药,延长睡眠的时间如
结论:落入拒绝域,所以认为两种安眠药的平均疗效有显著差异。
二、Z-检验
某暖水瓶厂生产金龙牌和孔雀牌两种暖水瓶,根据过去资料已知去其保暖时间的方差分别为1.08小时和5.62小时。
现各抽取5只作为样本,测得其保
结论:接受原假设,认为两种暖水瓶的总体平均保温时间无显著差异。
三、F-检验
某橡胶配方原用氧克锌5g ,拟减为1g ,现分别按两种用量各作一批试验,
要求:检验两种用量的橡胶伸长率的总体方差有以下关系,即22
12σσ≤。
结论:接受原假设,认为22
12σσ≤。
实验4
一、方差分析
为考察温度对某化工产品得率的影响,选定5种不同的温度,每种温度各做
0.05 下,分析温度的变化对产品的得率有无显著影响。
结论:拒绝原假设,认为温度的变化对产品的得率有显著影响。
二、相关系数分析
某大学从统计系学生中随机抽取16人,了解其数学和统计学的考试成绩如
结论:数学和统计学考试成绩的相关系数为0.785,相关性还是比较高。
三、回归分析
到25000万元时,社会商品零售总额将达到多少。
回归方程:x y 14943
.12014.179+= 把预测值25000代入回归方程的:y=28914.957
所以当居民收入达到25000万元时,社会商品零售总额将达到28914.957。