当前位置:文档之家› 实验三: 数据的简单统计分析与推断

实验三: 数据的简单统计分析与推断

实验三: 数据的简单统计分析与推断
实验三: 数据的简单统计分析与推断

实验三 数据的简单统计分析与推断

一、 实验目的:

对采集数据利用数理统计的知识,辅以matlab 进行估计、分析和推断,即

从一定总体中随机抽出一部分样本简单估计、分析和推断,以此对所研究的总体进行推测性的判断。

1. 掌握参数估计和假设检验的基本理论模型与分类;

2. 了解方差分析和线性回归模型的matlab 解决方案;

3. 根据问题的要求建立模型;

4. 针对已经建立的模型,确定参数,通过Matlab 求解;

二、 预备知识:

1. 参数估计:利用样本统计量对总体(服从正态分布)参数进行估计:点估

计、区间估计; 2. 假设检验:总体均值的假设检验、总体方差的假设检验和两总体的检验; 3. 方差分析:

背景:事件的发生往往与多个因素有关,但各个因素对事件发生的影响

可能是不一样的,而且同一因素的不同水平对事件发生的影响也是不同的。通过方差分析,可以研究不同因素以及因素的不同水平对事件发生的影响程度。根据自变量个数的不同,方差分析可以分为单因子方差分析和多因子方差分析。 数学原理:

一个实验有多个影响因素,如果只有一个在发生变化,则称为单

因子分析。假设某一实验有s 个不同条件,则在每个条件(或称

水平)下进行实验,可以得到s 个总体,分别记为s X X X 21,,个总体的平均数表示为s μμμ 21,,各总体的方差表示为

22221,s σσσ 。现在,在这s 个总体服从正态分布且方差相等的

情况下检查各总体的平均数是否相等,若相等则认为因素对实验结果之间没有显著影响。双因子方差分析,因素水平的改变所造成的实验结果的改变,称为主效应。当某一因素的效应随另一因素的水平不同而不同,则称这两个因素之间存在交互作用。由于交互作用引起的实验结果的改变称为交互效应。

4. 线性回归:

背景:实际生活中,某个现象的发生或某种结果的出现往往与其他的某

个或某些因素有关,但这种关系又是不确定的,只是从数据上可以看出有关的趋势。回归分析就是用来研究具有这种特征的变量之间的相关关系的。线性回归假设因变量与自变量之间为线性关系,用一定的线性回归模型来拟合变量,确定模型中的未知参数。

5. 参数估计、假设检验、方差分析和回归分析的matlab 实现;

6. 用matlab 进行基本统计分析:

[1] 基本统计量:

均值:mean(x):平均值或数学期望;

中位数:median(x):将数据由小到大排序后中间位置的数据; 标准差:std(x):各个数据与均值偏离程度的度量; 方差:var(x):标准差的平方;

偏度:skewness(x):反映分布的对称性,大于零:此时数据位于

均值右边的比位于左边的多;等于零,对称分布;小于零,偏向均值的左侧。

峰度:kurtosis(x):用于衡量偏离正态分布尺度的统计量之一。

正态分布的峰度为3,若2 ν 比3 大得多, 表示分布有沉重的尾巴,说明样本中含有较 多远离均值的数据,因而峰度可以用作衡量 偏离正态分布的尺度之一。

参数估计:

1、正态总体的参数估计

设总体服从正态分布,则其点估计和区间估计可以同时以下命令获得:

[muhat,sigmahat,muci,sigmaci] = normfit(DATA,alpha) 参数说明:

DATA 为样本、alpha 为显著性水平(缺省时默认为0.05) muhat :均值 的点估计;sigmahat :标准差的点估计 muci :针对于均值的置信水平为1-alpha 的区间估计;

sigmaci :针对于标准差的置信水平为1-alpha 的区间估计;

2、其他分布的参数估计

若无法保证总体服从正态分布,有两种处理方法:一是取容量充分

大的样本(n>50),按中心极限定理,它近似的服从正态分布,仍可以用上面的估计公式计算;二是使用matlab 工具箱中具有特定总体分布的估计命令,常见命令:

[muhat,muci] = expfit(DATA,alpha):)(λE ,在显著性水平alpha 下,求指数

分布的数据DATA 的均值的点估计和取间估计

[lambdahat,lambdaci] = poissfit(DATA,alpha):)(λp 在显著性水平alpha 下,

求指数分布的数据DATA 的参数λ的均值

的点估计和取间估计

[phat,pci] = mle(data,'distribution',value,'alpha',value):

通用参数估计命令,在显著性水平alpha 下,求‘distr ’分布的数据DATA 的参数估计。

示例:

[phat,pci] = mle(data,'distribution','binomial','alpha',.05,')

phat =

0.7370

pci =

0.7171

0.7562

假设检验:

在总体服从正态分布的情况下,可以用以下命令进行检验。

1)、总体方差已知,总体均值的检验(z-检验)

[h,sig,ci] = ztest(x,m,sigma,alpha,tail)

检验数据x的关于均值的某一假设是否成立,其中sigma为已知

方差,alpha为显著性水平

tail = 0 m

x<;

x>;tail = -1 m

x≠;tail = 1 m

h=0:接受假设;h=1:拒绝假设( h:bull);

sig:假设成立的概率;

ci:均值的1-alpha置信区间;

2)、总体方差未知,总体均值的假设检验(t-检验)

[h,p,ci]= ttest(x,m,alpha,tail)

检验数据x的关于均值的某一假设是否成立,其它参数说明同上

述z-检验的参数说明相一致。

3)、两总体均值的假设检验(t-检验)

[h,p,ci]= ttest2(x,y,alpha,tail)

检验数据x,y的关于均值的某一假设是否成立,其它参数说明同

上述z-检验的参数说明相一致。

4)、非参数检验,总体分布的检验

[1]h=normplot(x)

此命令显示数据矩阵的正态概率图。如果数据来自于正态分布,则

图形显示出直线性形态,而其他概率分布函数显示出曲线形态。

方差分析:

1)、用anoval函数进行单因子方差分析:

p=anova1(X)

m?的矩阵X中多列数据的均值,返回所有样本取自同比较样本n

一群体的零假设成立的概率。该命令将生成两个图形,第一个为标

准方差分析表,第二个显示X每一列的箱型图,箱型图中心线上较

大的差异对应较大的F值和较小的p值。一般当p值小于0.05时

认为结果是显著的。

方差分析一般用的显著性水平是:取01

a,拒绝0H,称因素 A

=.

的影响(或 A各水平的差异)非常显著;取01

a,不拒绝0H,

=.

但取05

a,不拒

=.

=.

a,拒绝0H,称因素 A的影响显著;取05

H,称因素 A无显著影响。

2)、用anova2函数进行双因子方差分析:

P=anova2(X,reps)进行平衡双因子方差分析,以比较样本X中两

列或两列以上和两行或两行以上数据的均值。不同列中的数据代表

一个因子A的变化,不同行中的数据代表因子B的变化。其中reps

代表每一个单元格中观测值的个数,当reps=1返回两个p值,当

reps>1时返回3个p值。

线性回归:

1)、用regress进行线性回归

[b,bint,r,rint]=regress(y,X,alpha)

2)、用rcoplot会残差图

Reoplot(r,rint)

示例:

1、综合示例:

一道工序用自动化车床连续加工某种零件,由于刀具损坏等会出现故障.故障是完全随机的,并假定生产任一零件时出现故障机会均相同.工作人员是通过检查零件来确定工序是否出现故障的.现积累有100次故障纪录,故障出现时该刀具完成的零件数如下:

459 362 624 542 509 584 433 748 815 505

612 452 434 982 640 742 565 706 593 680

926 653 164 487 734 608 428 1153 593 844

527 552 513 781 474 388 824 538 862 659

775 859 755 49 697 515 628 954 771 609

402 960 885 610 292 837 473 677 358 638

699 634 555 570 84 416 606 1062 484 120

447 654 564 339 280 246 687 539 790 581

621 724 531 512 577 496 468 499 544 645

764 558 378 765 666 763 217 715 310 851

试观察该刀具出现故障时完成的零件数属于哪种分布.

%数据录入

x1=[459 362 624 542 509 584 433 748 815 505];

x2=[612 452 434 982 640 742 565 706 593 680];

x3=[926 653 164 487 734 608 428 1153 593 844];

x4=[527 552 513 781 474 388 824 538 862 659];

x5=[775 859 755 49 697 515 628 954 771 609];

x6=[402 960 885 610 292 837 473 677 358 638];

x7=[699 634 555 570 84 416 606 1062 484 120];

x8=[447 654 564 339 280 246 687 539 790 581];

x9=[621 724 531 512 577 496 468 499 544 645];

x10=[764 558 378 765 666 763 217 715 310 851];

x=[x1 x2 x3 x4 x5 x6 x7 x8 x9 x10];

%绘制频率直方图

figure(1)

hist(x,10)

%分布的正态性检验

figure(2)

normplot(x)

%参数估计

[muhat,sugmuhat,muci,sigmuci]=normfit(x,0.05) %假设检验

[h,sig,ci]=ttest(x,594)

运行结果:

muhat =

594

sugmuhat =

204.1301

muci =

553.4962

634.5038

sigmuci =

179.2276

237.1329

h =

sig =

1

ci =

553.4962 634.5038

2、一位教师想要检查3种不同教学方法的效果,为此随机的选取了水平相等

的15位学生。把他们分为3组,每组5人,每一组用一种教学方法,一段时间以后,这位教师给这15位学生进行统考,统考成绩如下表。要求检验

这3种教学方法的效果有没有显著差异。

score=[75 81 73;62 85 79;71 68 60;58 92 75;73 90 81];

p=anova1(score)

p =

0.0401

3、设火箭的射程在其他条件基本相同时与燃料种类和推进器型号有关。现在

考虑四中不同的燃料及3种不同的推进器,对于每种搭配各发射了火箭两次,测得数据如表,要求检验各自变量和自变量的交互效应是否对火箭的

射程有显著影响。

disp2=[58.2 52.6 49.1 42.8 60.1 58.3 75.8 71.5;

56.2 41.2 54.1 50.5 70.9 73.2 58.2 51;

65.3 60.8 51.6 48.4 39.2 40.7 48.7 41.4]';

p=anova2(disp2,2)

p =

0.0035 0.0260 0.0001

4、

)

01.0,0(~10I N x y εε

++=

X = [ones(10,1) (1:10)'];

y = X * [10;1] + normrnd(0,0.1,10,1); [b,bint,r,rint] = regress(y,X,0.05) rcoplot(r,rint) b =

10.0337 0.9943 bint =

9.8369 10.2304 0.9626 1.0260 r =

0.0014 -0.1560 0.0547 0.1513 -0.0745 0.0861 0.1314 -0.1477 -0.1268

0.0801

rint =

-0.2476 0.2505

-0.3856 0.0737

-0.2207 0.3302

-0.1042 0.4069

-0.3588 0.2097

-0.1957 0.3679

-0.1325 0.3952

-0.3958 0.1003

-0.3697 0.1161

-0.1590 0.3192

三、实验内容与要求:

1、从一批火箭推力装置中抽取10个进行试验,测得燃烧时间如下:

50.7 54.9 54.3 44.8 42.2 69.8 53.4 66.1 48.1 34.5

设燃烧时间服从正态分布,求燃烧时间的均值和方差,其中置信水平为

90%。

2、某种元件,要求其使用寿命不得低于1000小时,现在随机的从这批元件中

抽取25件测得其寿命分别为:

906.7 783.4 962.5 978.8 835.4 1068.9 946.2 982.7 967.5 931.3 102.3 891.2 1168.3 936.4 961.4 1056.7 955.9 940.4 866.8 979.4 816.4 1021.4 1112.4 880.8

α的显著已知这种元件的寿命服从标准差为100的正态分布,试在05

.0

=

性水平下确定这批元件是否合格。

3、某校60名学生的一次考试成绩如下:

93 75 83 93 91 85 84 82 77 76 77 95 94 89 91

88 86 83 96 81 79 97 78 75 67 69 68 84 83 81

75 66 85 70 94 84 83 82 80 78 74 73 76 70 86

76 90 89 71 66 86 73 80 94 79 78 77 63 53 55

1)计算均值、标准差、极差、偏度、峰度,画出直方图;

2)检验分布的正态性;

3)若检验符合正态分布,估计正态分布的参数并检验参数。

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基 本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N 有效359 359 缺失0 0 首先,对该地区的男女性别分布进行频数分析,结果如下 性别 频率百分比有效百分 比 累积百分 比 有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0

性别 频率百分比有效百分 比 累积百分 比 有效女198 55.2 55.2 55.2 男161 44.8 44.8 100.0 合计359 100.0 100.0 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差171 47.6 47.6 47.6 一般79 22.0 22.0 69.6 比较 好 79 22.0 22.0 91.6 好24 6.7 6.7 98.3 非常 好 6 1. 7 1.7 100.0 合计359 100.0 100.0 其次对原有数据中的积极性进行频数分析,结果如下表:

统计分析综合实验报告

统 计 分 析 综 合 实 验 报 告 专业:班级: 姓名:学号: 规定题目

一.问题提出及分析目的 (一)问题提出 夏春同学打算毕业后去上海创办一家属于自己的投资咨询服务公司,以便利用在学校里学到的经济学知识,去为广大的货币市场从业人员提供必要的投资指导。为了能顺利地实现自己的创业计划,他着手编辑了一份投资信息简报、分发给一些投资商,希望这些人能提供各方面的建议,进而了解投资商们感兴趣的东西。(二)分析目的 (1)、对货币市场的交易规模和收益情况进行描述分析。 (2)在95%的置信水平下,对整个货币市场的投资规模、每周收益率和每月收益率进行区间估计,并作出解释。 (3)对周收益率和月收益率进行比较。 (4)资产规模大小对收益率影响是否显著? 二.数据收集及录入

1.打开SPSS 应用程序,在“变量视图”编辑框中录入以下数据: 2.在“数据视图”编辑框中依据收集的数据录入以下数据:(因版面需要在此呈现前5行数据,后面27行按前5行方式录入) 三.数据分析 (一)描述性分析 1.在SPSS 中依次选取“分析”—“描述统计”—“描述”,将资产规模和过去一周、一月的平均收益率全部选取转至右侧方框: 2.在描述性对话框中点击右侧“选项”,进入选项属性设置对话框,选中“均值”、“标准差”、“最大值”、“最小值”、“峰度”、“偏度”、“变量列表”选项:

(二)区间估计 1.在SPSS中依次选取“分析”—“描述统计”—“探索过程”,将资产规模和过去一周、一月的平均收益率全部选取转至右侧方框: 2. .在“探索”对话框中点击右侧“统计量”,进入统计量设置对话框,设置均值置信区间为95%: (三)周月收益率分析 1.在SPSS中依次选取“分析”——“比较均值”——“配对样本T检验”,将过去一周、一月的平均收益率选取转至右侧方框: 2. .在“配对样本T检验”对话框中点击右侧“选项”,进入选项属性设置对话框,设置置信区间为95%:

试验统计分析

试验统计分析 一、术语统计 总体与样本 总体:N 样本:n 总体平均数:μ样本平均数:x 总体的标准差:δ样本标准差:s 机械误差:不可避免错误:人为因素 准确性:测定值对真值符合程度的大小 精确性:测定值之间变异程度 二、实验材料的分类: 数量性状资料:方式:计数和测量,变数分为不连续性变数和连续性变数 质量性状资料:1)应用统计次数的方法2)赋值法以相当数量的性状 次数分布表:间断性变数和连续性变书分布表需要特征数:极差、组数、组距、组中点値 分组满足:a≤x≤b 次数分布图:方柱形、多边形、条形图 三、试验资料的特征数 1、平均数:算数平均数x 中数:Md 众数:Mo n 几何平均数:G=x1?x2?x3…xn 算数平均数的计算方法:

1)直接法:适用于小样本,未分组的资料 2)加权法:适用于大样本,已分组资料 2、特性:离均差的平方和最小 离均差之和为0 3、总体平均数 μ= Xi N i =1N 4、变异数:极差R 、方差、样本S 2(包含自由度) 总体δ2 5、标准差计算: 直接法:s= 加权法: 变异系数:cv=s x *100% 6、事件:必然事件U 和不可能事件V 和事件 积事件 互斥事件 对立事件 完全事件系 小概率事件实际不可能原理 计算概率: 1)加法定理:互斥事件 P (A+B )=PA+PB 2)乘法定理:积事件 P (A*B )=PA*PB 3)对立事件概率 PA+PB=1 4)完全事件系:PA+PB+PC …=1 推断统计开始 参数估计: 1、点估计

用样本统计量的某个取值,作为总体样本的估计值,用样本均值作为总体均值的估计。 缺点:无法给出估计值接近总体参数的信息 2、区间估计 1)区间由样本统计量加减估计误差得到 置信区间区间上下限是置信限L1下限L2上限 2)需要给出置信水平(置信度) 上限方程省略 下限方程省略 置信区间的计算相当于假设测验的整体步骤 假设测验是确定显著水平区间估计是确定置信区间显著水平与置信区间是对立关系,两者有相同的临界值。

田间试验与统计分析课后习题解答及复习资料

田间试验与统计分析-习题集及解答 1.在种田间试验设计方法中,属于顺序排列的试验设计方法为:对比法设计、 间比法 2.若要控制来自两个方面的系统误差,在试验处理少的情况下,可采用:拉丁 方设计 3.如果处理内数据的标准差或全距与其平均数大体成比例,或者效应为相 乘性,则在进行方差分析之前,须作数据转换。其数据转换的方法宜采用:对数转换。 4.对于百分数资料,如果资料的百分数有小于30%或大于70%的,则在进 行方差分析之前,须作数据转换。其数据转换的方法宜采用:反正弦转换(角度转换)。 5.样本平均数显著性测验接受或否定假设的根据是:小概率事件实际不可能性 原理。 6.对于同一资料来说,线性回归的显著性和线性相关的显著性:一定等价。 7.为了由样本推论总体,样本应该是:从总体中随机地抽取的一部分 8.测验回归和相关显著性的最简便的方法为:直接按自由度查相关系数显著 表。 9.选择多重比较的方法时,如果试验是几个处理都只与一个对照相比较,则应 选择:LSD法。 10.如要更精细地测定土壤差异程度,并为试验设计提供参考资料,则宜采用: 空白试验 11.当总体方差为末知,且样本容量小于30,但可假设==(两样本 所属的总体方差同质)时,作平均数的假设测验宜用的方法为:t测验 12.因素内不同水平使得试验指标如作物性状、特性发生的变化,称为:效应 13.若算出简单相差系数大于1时,说明:计算中出现了差错。 14.田间试验要求各处理小区作随机排列的主要作用是:获得无偏的误差估计值 15.正态分布曲线与轴之间的总面积为:等于1。 16.描述总体的特征数叫:参数,用希腊字母表示;描述样本的特征数叫:统计 数,用拉丁字母表示。 17.确定分布偏斜度的参数为:自由度 18.用最小显著差数法作多重比较时,当两处理平均数的差数大于时,推断两处 理间差异为:极显著 19.要比较不同单位,或者单位相同但平均数大小相差较大的两个样本资料的变 异度宜采用:变异系数 20.选择多重比较方法时,对于试验结论事关重大或有严格要求的试验,宜用: q测验。 21.顺序排列设计的主要缺点是:估计的试验误差有偏性 22.田间试验贯彻以区组为单位的局部控制原则的主要作用是:更有效地降低试 验误差。

数据的统计与分析综合测试题(含答案)

综合测试题 一、选择题: 1.为筹备班级的初中毕业联欢会,班长对全班学生爱吃哪几种水果作了民意调查,决定最终买什么水果,下面的调查数据中最值得关注的是(). A.中位数 B.平均数 C.众数 D.加权平均数 2.为了了解某中学某班的睡眠情况,随机抽取该班10名学生,在一段时间里,每人平均每天的睡眠时间统计如下(单位:小时):6,8,8,7,7,9,10,7,6,9,由此估计该班多数学生每天的睡眠时间为() A.7小时 B.7.5小时 C.7.7小时 D.8小时 3.小明准备参加校运会的跳远比赛,下面是他近期六次跳远的成绩(单位:米):3.6,3.8, 4.2,4.0,3.8,4.0,那么这组数据的() A、众数是3.9米 B、中位数是3.8米 C、极差是0.6米 D、平均数是4.0米 4.小伟五次数学考试成绩分别为:86分、78分、80分、85分、92分,老师想了解小伟数学学习变化情况,则老师最关注小伟数学成绩的() A、平均数 B、众数 C、中位数 D、方差 5.已知一组数据为:4、5、5、5、6,其中平均数、中位数和众数的大小关系是()A、平均数>中位数>众数 B、中位数<众数<平均数 C、众数=中位数=平均数 D、平均数<中位数<众数 6.如果一组数据6,x,2,4的平均数是3,那么x是(). A. 0 B.3 C.4 D. 2 7.某班一次英语测验的成绩如下:得100分的3人,得95分的6人,得90分的5人,得80分的2人,得70分的18人,得60分的6人,则该班这次英语测验成绩的众数是(). A.70分 B. 18人 C. 80分 D.10人 8.某校四个科技兴趣小组在“科技活动周”上交的作品数分别如下:10、10、x、8,已知这组数据的众数与平均数相等,则这组数据的中位数是() A.8 B. 12 C.9 D. 10 9.甲、乙两人在同样的条件下练习射击,每人打5发子弹,命中环数如下: 甲:6,8,9,9,8 乙: 10,7,7,7,9 则两人射击成绩谁更稳定(). A.甲 B.乙 C.一样稳定 D.无法确定 10.若数据的平均数为m,2,5,7,1,4,n则的平均数为4,则m、n的平均数为()A、7.5 B、5.5 C、2.5 D、4.5

试验统计分析方法

名词 1 变量:数据所具有的变异特征或性。 2 观察值:变量所测得的具体观测数据,或每一个体的某一性状,特征的测定数据。 3 总体:具有共同性质的个体所组成的集体。 4 个体:总体中的一个成员。 5 样本:从总体中抽出的部分个体的总和。即总体的一部分样本容量:样本中所包含的个体数目。 6 参数:由总体的全部观察值而算得的总体特征值。 7.统计数:由样本观察值而算得的样本特征数。 8. 算数平均数:指资料中各观察值总和除以观测值个数所得的商。 9. 中位数:将资料内所有观测值从小到大依次排列,位于中间的那个观测值。 10.众数:资料中出现次数最多的那个观测值或次数最多一组的组中值。 11.无偏估计量:当一个统计量的数学期望等于所估计的总体参数时则称此统计量为该总体参数的无偏估计量 12.极差:指样本观察值中最大值与最小值之差,也称变异幅度或全距。 13.变异系数:标准差与平均数的百分率称为变异系数,记为C.V。 14.试验:通常我们把根据某一研究目的,在一定条件下对自然规律现象所进行的观察或试验统称为试验。 15.小概率原理:在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理 16.试验指标:为衡量试验结果的好坏或处理效应的高低,在试验中具体测定额性状或观测的项目。 17.试验因素:试验中所研究的影响试验指标的因素。 18.试验水平:试验因素所处的某种特定状态或数目等级。 19.试验处理:每一试验因素不同或多因素间的水平组合构成了实验处理。 20.L8(27):L代表正交表的符号 L右下角的数字“8”代表8行,包含8个处理(水平组合);“2”表示因素水平数,“7“表 示有7列,用这张正交表最多可以安排7个2水平因素。 22.单一差异原则;除需要比较的因素外,其他因素都必须保持的相同的水平上 23.β-错误:无效假设是错误的,备择假设是正确的,可是测验结果却接受了无效假设,这种错误称为第二类错误,即参数见本来 有差异,可是测验结果却认为参数见无差异。 24α-错误:无效假设是正确的情况下,可是由于假设测验结果否定了无效假设,这种错误称为第一类错误,即不同总体的参数见本来没有差异,可测试结果却认为有错误。 25.方差分析:将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总便有意中相对重要程度的一种统计分析方法。 26.多重比较:在方差分析的基础上,对各处理平均数进一步分析比较,以选拔出最优的处理方法。 27.肥底:为使被研究对象处于同一可比状态而设置的肥料底肥。

多元统计分析实验报告

实验一 一、实验目的及要求 对应分析是你也降维的思想以达到减化数据结构的目的,凤的研究广泛用于定义属性变量构成的列联表利用对应分析方法分析问卷中教育程度与网上购物支付方式之间的相互关系。 二、实验环境 SPSS 19.0 window 7系统 三、实验内容及实验步骤(实践内容、设计思想与实现步骤) 实验题目: 通过分析问卷数据,绘制如下的教育程度与网上购物支付方式的交叉表,运用对应分析方法研究教育程度与网上购物所选择的支付方式之间的相关性,及揭示不同人群网上购物的特征等问题。 设计思想:原假设:H1:χ2>χα2[(n?1)(p?1)] 实现步骤: 1.在变量视窗中录入3个变量,用edu表示【教育程度】,用fangshi表示【在网上购物时采用什么样的支付方式】,用pinshu表示【频数】;如图所示:

2.先对数据进行预处理。执行【数据】→【加权个案】命令,弹出【加权个案】对话框。选中【加权个案】按钮,把【频数】放入【频率变量】框中,点击【确定】按钮完成。 3.打开主窗口,选择菜单栏中的【分析】→【降维】→【对应分析】命令,弹出【对应分析】对话框。 4.将【教育程度】导入【行】,将【在网上购物时采用什么样的支付方式】导入【列】。 5. 单击【定义范围(D)】,打开【对应分析:定义行范围】对话框; 定义行变量分类全距最小值为1,最大值为4,单击【更新】;点击【继续】,返回【对应分析】对话框;同方法打开【对应分析:定义列范围】对话框; 定义列变量全距最小值为1,最大值为5,单击【更新】; 6. 单击【统计量】打开【对应分析:统计量】对话框;选择【行轮廓表】,【列轮廓表】;单击【继续】,返回【对应分析】对话框, 7.选择【绘制】→【对应分析:图】对话框,选择【散点图】中的【行点】、【列点】选择【线图】中的【已转换的行类别】、【已转换的列类别】,单击【继续】,返回【对应分析】对话框。 8.单击【确定】按钮,完成设置并执行列联表分析。 四、调试过程及实验结果(详细记录实验在调试过程中出现的问题及解决方法。记录实验的结果) SPSS实验结果及分析: 上表显示了在32155名被调查者中,大多数消费者在网上购物时选择第三方支付和网上银行支付,在网上购物的消费人群以大学本科生相对最多。

试验设计与统计分析

广东药学院自编教材试验设计与统计分析 卫生统计学教研室 2014.8

第一章绪论 在医药卫生、食品等专业研究领域,常需要开展大量的试验来确定或验证研究者在科研过程中提出的科学假设,例如临床上研究某种新的降糖药的疗效时,研究者需要将研究对象(如糖尿病患者)随机地分组,使其中一组患者服用研究中的该降糖药,另一组患者服用传统的降糖药,进而比较两组药物的疗效。但在具体的试验实施之前,研究者需要面对很多问题,如试验中试验对象应如何选择和分组?如何在试验过程中避免服用不同试验药物对试验对象心理产生影响,继而影响到最终疗效的判断?选择什么样的指标可更好的反映药物疗效?样本量需要多少?试验数据应如何收集以及运用何种统计方法进行分析等等问题。因为研究过程中研究结果会受到诸多因素影响,如研究对象的年龄、性别和病情可能影响药物疗效,如果不采取科学的方法使这些因素在比较组间分布均衡,就不能得到令人信服的结论。因此为使科学研究在消耗最少人力和物力的情况下,最大限度地减少误差,获得科学可靠的结论,需要在研究开始之前对整个试验过程做出精心安排,制定详细具体的试验实施方案,即进行试验设计(experimental design)。一个科学合理的试验设计,可以达到事半功倍的效果,是试验获得成功的关键。 一、试验设计的基本要素 医学试验包括三个基本要素:即处理因素、试验对象和试验效应。如研究某降糖新药的疗效,处理因素为降糖新药及比较的传统降糖药;研究者需用糖尿病患者作为试验对象;试验效应是能反映药物疗效的指标,如患者空腹血糖或餐后血糖的下降。处理因素作用于试验对象后产生试验效应(图1),三个要素缺一不可,因此试验设计时要先明确三个基本要素,再制定详细的研究计划。 1. 处理因素 处理因素(treatment)是指研究者根据研究目的施加于试验对象,以考察其试验效应的因素。如临床上研究降糖药的疗效,降糖药即为处理因素。在试验过程中处理因素的状态称为水平(level),如比较降糖新药和传统降糖药的疗效,

2019年统计学数据分析报告

统计学数据分析报告 一、调查研究方案的设计与组织实施 (一)调查目的 (1)描述和反映本校商学院14级金融系学生对于毕业去向的意向,分析并研究各意向的分布情况; (2)在专业,性别,家庭因素,个人因素等方面对毕业意向的分布进行研究,探究这些因素对于毕业意向分布的影响。(3)分析和解释形成毕业意向分布差异的因素和原因; (二)调查对象和调查单位 本次调查的基本调查对象是本校商学院金融类的部分同学。调查单位为此范围内的每一个同学。 在此基础上,在每个专业内随机抽取样本进行抽样调查,进而对整体进行推断。 (三)调查的组织和实施方法 获取资料的方法:问卷法、文献法本小组采用的基本方法为问卷法,发放问卷60份,收回问卷54份。辅助方法为文献法,通过图书馆和网络获取相关背景资料,对研究素材进行丰富和补充。调查方法:抽样调查抽样方法:分层抽样 将调查对象按专业分为金融工程、金融学和信用管理三个类别,然后从各个类别中随机抽取组成样本,用于对整体进行推断。数据资料整理结果如下:

在全部被调查对象中,男生23人,占43%,女生31人,占57%,金融学18人,占总体1/3,信用管理18人,占总体1/3,金融工程18人,占总体1/3。选择考研的有14人,占总体的26%。选择出国深造的有1人,占总体的2%。选择自主创业的有3人,占总体6%。选择直接就业的有29人,占总体54%。选择考公务员的有7人,占总体12%。 (四)调查时间和调查期限 调查时间:20XX年5月9日 调查期限:20XX年5月9日―20XX年5月14日(五)调查项目和调查表 调查项目:性别年级专业毕业意向家庭收入情况性格特点就业优势调查表如下: 二、统计数据的整理和分析 (一)总体分布情况与相关分析 根据问卷统计的数据得到的频数分布表和毕业意向分布饼图如下: 由上表可以得到以下结论: 选择直接就业的人数占总体的比例最大,占总体的54%其次是选择考研和考公务员,分别占总体的26%和12%。 选择出国深造和自主创业的人数最少,只占总体的2%和6%。可以看出大部分同学的毕业意向集中在直接就业和考研两个方面,而出国深造和自主创业对本校商学院来说仍旧是比较冷僻的意向。

统计分析实验1-熟悉SPSS

实验一熟悉SPSS 一、实验目的 通过本次实验,了解SPSS的基本特征、结构、运行模式、主要窗口等,了解如何录入数据和建立数据文件,掌握基本的数据文件编辑与修改方法,对SPSS有一个浅层次的综合认识。 二、实验性质 必修,基础层次 三、主要仪器及试材 计算机及SPSS软件 四、实验内容 1.操作SPSS的基本方法(打开、保存、编辑数据文件) 2.问卷编码 3.录入数据 五、实验学时 2学时(可根据实际情况调整学时) 六、实验方法与步骤 1.开机 2.找到SPSS的快捷按纽或在程序中找到SPSS,打开SPSS 3.认识SPSS数据编辑窗、结果输出窗、帮助窗口、图表编辑窗、语 句编辑窗 4.对一份给出的问卷进行编码和变量定义 5.按要求录入数据 6.联系基本的数据修改编辑方法 7.保存数据文件 8.关闭SPSS,关机。 七、实验注意事项

1.实验中不轻易改动SPSS的参数设置,以免引起系统运行问题。 2.遇到各种难以处理的问题,请询问指导教师。 3.为保证计算机的安全,上机过程中非经指导教师和实验室管理人员 同意,禁止使用移动存储器。 4.每次上机,个人应按规定要求使用同一计算机,如因故障需更换, 应报指导教师或实验室管理人员同意。 5.上机时间,禁止使用计算机从事与课程无关的工作。 八、上机作业 (1)、定义变量:试录入以下数据文件,并按要求进行变量定义。 1)变量名同表格名,以“()”内的内容作为变量标签。对性别(Sex)设值标签“男=0;女=1”。 2)正确设定变量类型。其中学号设为数值型;日期型统一用“mm/dd/yyyy“型号;生活费用货币型。

3)变量值宽统一为10,身高与体重、生活费的小数位2,其余为0。

试验数据统计分析步骤

试验数据统计分析教程

第一章:数据分析基本方法与步骤 §1-1:数据分类(定量资料和定性资料) 统计资料一般分为定量资料和定性资料两大类。 定量资料测定每个观察单位某项指标量的大小,所得的资料称为定量资料。定量资料又可细分为计量资料(可带度量单位和小数点,如:某人身高为1.173 m)和计数资料(一般只带度量单位,但不可带小数点,如:某人脉搏为73次/min) 。①计量资料在定量资料中,若指标的取值可以带度量衡单位,甚至可以带小数标志测量的精度的定量资料,就叫“ 计量资料” 。例如测得正常成年男子身高、体重、血红蛋白、总铁结合力等所得的资料。②计数资料在定量资料中,若指标的取值可以带度量衡单位,但不可以带小数即只能取整数,通常为正整数的定量资料,就叫“ 计数资料” 。例如测得正常成年男子脉搏数次、引体向上的次数次。 定性资料观测每个观察单位某项指标的状况,所得的资料称为定性资料。定性资料又可细分为名义资料(如血型分为:A、B、AB、O型)和有序资料(如疗效分为:治愈、显效、好转、无效、死亡) 。①名义资料在定性资料中,若指标的不同状况之间在本质上无数量大小或先后顺序之分的定性资料,就叫“ 名义资料” 。例如某单位全体员工按血型系统型、型、型、型来记录每个人的情况所得的资料;又例如某市全体员工按职业分为工人、农民、知识分子、军人等来记录每个人的情况所得的资料。②有序资料在定性资料中,若指标质的不同状况之间在本质上有数量大小或有先后顺序之分的定性资料,就叫“ 有序资料” 。例如某病患者按治疗后的疗效治愈、显效、好转、无效、死亡来划分所得的资料;又例如矽肺病患者按肺门密度级别来划分所得的资料。 判断资料性质的关键是把资料还原为基本观察单位的具体取值

多元统计分析实验报告

1. 正态性检验 Kolmogorov-Smirnov a Shapir o-Wilk 统计量df Sig. 统计量df Sig. 净资产收益率.113 35 .200*.978 35 .677 总资产报酬率.121 35 .200*.964 35 .298 资产负债率.086 35 .200*.962 35 .265 总资产周转率.180 35 .006 .864 35 .000 流动资产周转率.164 35 .018 .885 35 .002 已获利息倍数.281 35 .000 .551 35 .000 销售增长率.103 35 .200*.949 35 .104 资本积累率.251 35 .000 .655 35 .000 *. 这是真实显著水平的下限。 a. Lilliefors 显著水平修正 此表给出了对每一个变量进行正态性检验的结果,因为该例中样本中n=35<2000,所以此处选用Shapiro-Wilk统计量。由Sig.值可以看到,总资产周转率、流动资产周转率、已获利息倍数及资本积累率均明显不遵从正态分布,因此,在下面的分析中,我们只对净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标进行比较,并认为这四个变量组成的向量遵从正态分布(尽管事实上并非如此)。这四个指标涉及公司的获利能力、资本结构及成长能力,我们认为这四个指标可以对公司运营能力做出近似的度量。 2. 主体间因子 N 行业电力、煤气及水的生产和供应 业 11 房地行业15 信息技术业9 多变量检验a 效应值 F 假设 df 误差 df Sig. 截距Pillai 的跟踪.967 209.405b 4.000 29.000 .000 Wilks 的 Lambda .033 209.405b 4.000 29.000 .000 Hotelling 的跟踪28.883 209.405b 4.000 29.000 .000 Roy 的最大根28.883 209.405b 4.000 29.000 .000 行业Pillai 的跟踪.481 2.373 8.000 60.000 .027 Wilks 的 Lambda .563 2.411b8.000 58.000 .025 Hotelling 的跟踪.698 2.443 8.000 56.000 .024 Roy 的最大根.559 4.193c 4.000 30.000 .008 a. 设计 : 截距 + 行业

统计学数据分析报告记录

统计学数据分析报告记录

————————————————————————————————作者:————————————————————————————————日期:

统计学数据分析报告 一、调查研究方案的设计与组织实施 (一)调查目的 (1)描述和反映本校商学院14级金融系学生对于毕业去向的意向,分析并 研究各意向的分布情况; (2)在专业,性别,家庭因素,个人因素等方面对毕业意向的分布进行研 究,探究这些因素对于毕业意向分布的影响。 (3)分析和解释形成毕业意向分布差异的因素和原因; (二) 调查对象和调查单位 本次调查的基本调查对象是本校商学院金融类的部分同学。 调查单位为此范围内的每一个同学。 在此基础上,在每个专业内随机抽取样本进行抽样调查,进而对整体进行推断。 (三)调查的组织和实施方法获取资料的方法:问卷法、文献法 本小组采用的基本方法为问卷法,发放问卷60份,收回问卷54份。 辅助方法为文献法,通过图书馆和网络获取相关背景资料,对研究素材进行丰富和补充。 调查方法:抽样调查 抽样方法:分层抽样 将调查对象按专业分为金融工程、金融学和信用管理三个类别,然后从各个类别中随机抽取组成样本,用于对整体进行推断。 数据资料整理结果如下:

在全部被调查对象中,男生23人,占43%,女生31人,占57%,金融学18人,占总体1/3,信用管理18人,占总体1/3,金融工程18人,占总体 1/3。选择考研的有14人,占总体的26%。选择出国深造的有1人,占总体的2%。选择自主创业的有3人,占总体6%。选择直接就业的有29人,占总体54%。选择考公务员的有7人,占总体12% 。 (四)调查时间和调查期限 调查时间:2016年5月9日 调查期限:2016年5月9日―2016年5月14日 (五)调查项目和调查表 调查项目:性别年级专业毕业意向家庭收入情况性格特点就业优势 调查表如下: 毕业意向 专业性别 考研出国深造自主创业直接就业考公务员金融工程男7 0 0 0 6 1 女11 2 0 0 8 1 金融学男8 2 1 0 4 1 女10 6 0 1 2 1 信用管理男8 1 0 1 5 1 女10 3 0 1 4 2 合计54 14 1 3 29 7 二、统计数据的整理和分析

统计学综合测试及答案

精心整理 综合练习(二) 一.判断题: 1.所谓序时平均数就是将同一总体的不同时期的平均数按时间顺序排列起来。× 2.发展水平就是时间数列中的每一项指标的数值,又称发展量。(√) 3.定基发展速度等于相应各个环比发展速度的连乘积,定基增长速度也等于相 应各个环比增长速度的连乘积。(×) 4.季节变动指的就是现象受自然因素的影响而发生的一种有规律的变动。(×) 5. 6. 7. 8. 9. 10. 二. 1. C. 2. A. 3. 4. 5. 6. (D 7. C.各期发展水平. D.平均增长速度. 8.平均发展速度是(C) A.定基发展速度的算术平均数. B.环比发展速度的算术平均数. C.环比发展速度连乘积的几何平均数. D.增长速度加上100%. 9.说明现象在较长时期内发展的总速度的指标是(C) A.环比发展速度. B.平均发展速度 C.定基发展速度. D.定基增长速度. 10.若要观察现象在某一段时期内变动的基本趋势,需要测定现象的(C). A.季节变动. B.循环变动. C.长期趋势. D.不规则变动. 三.多项选择题: 1.下列哪些现象侧重于用几何平均法计算平均发展速度( BDE ).

A.基本建设投资额. B.商品销售量. C.垦荒造林数量. D.居民消费支出状况. E.产品产量. 2.下列哪些属于序时平均数( ABDE ) A.一季度平均每月的职工人数. B.某产品产量某年各月的平均增长量. C.某企业职工第四季度人均产值. D.某商场职工某年月平均人均销售额. E.某地区近几年出口商品贸易额增长速度. 3.增长1%的绝对值( AD ) A.等于前期水平除以100. B.等于逐期增长量除以环比增长速度. C.等于逐期增长量除以环比发展速度. D.表示增加1%所增加的绝对量. E.表示增加1%所增加的相对量. 4.定基增长速度等于( BDE ). A. 5. 6. 7. . 8. A. D. 9. A. D. 10. A. D. 样调查资料。③综合指数的分子与分母之差具有一定的经济内容,即说明由于指数化因素变动带来的价值总量指标的增减量,而平均指数的分子与分母之差却不具有价值总量指标增减的经济内容。特别是采用固定权数的平均指数,只有相对数的意义。因此,纵然平均指数有许多优点,也不能完全取代综合指数的应用。 2.平均发展速度的几何平均法和方程式法的计算原理有何不同?各适用于哪些现象? 几何平均法(水平法)和代数平均法(累计法或方程式法) 几何平均法侧重于考察最末一年发展水平,按这种方法所确定的平均发展速度,推算最末一年发展水平,等于最末一年的实际水平;几何平均法的实质是要求从最初水平出发,按所求的平均发展速度发展,计算出的末期水平应等于实际末期水平。适用预测目标发展过程一贯上升或下降,且逐期

建设工程质量的统计分析和试验检测方法

. 建设工程质量的统计分析和试验检测方法 第一节质量统计分析 1.工程质量统计及抽样检验的基本原理和方法 ■质量数据的特征值 ■质量数据的分布特征 ■质量数据的收集方法(抽样方法、方案) 2.工程质量统计分析方法 ■调查表法、分层法、相关图片 ■排列图法、因果分析图、直方图、控制图 一、工程质量统计及抽样检验的基本原理和方法 (一)总体、样本及统计推断工作过程 ■概念:【说明】对一批(2000块)瓷砖进行质量检验,抽取200块进行外观检查。 定义示例 一批2000块瓷砖总体所研究对象的全体 每块瓷砖个体 N)组成总体的基本元素(抽取的200样本块瓷砖由从总体中随机抽取,根据对其研究成果推断总体质量的部分个体 抽取的每一块瓷砖样品每个被抽中进入样本的单位200个样本容量样品的数目(n) ■统计推断工作过程 (二)质量数据的特征值 样本数据特征值是由样本数据计算的描述样本质量数据波动规律的指标。统计推断就是根据这些样本数据特征值来分析、判断总体的质量状况。 集中趋势的特征值:算术平均数、中位数;(两数) 离中趋势的特征值:极差、标准偏差、变异系数 (两差一系数) 1.描述数据集中趋势的特征值 )算术平均数(1 ①总体算术平均数 ②样本算术平均数. . 【举例】

样本中位数 样本中位数是将样本数据按数值大小有序排列后,位置居中的数值。 4 、8、931、5、、6、 9 8、、6、3、4、、5 先排序:1=5 中位数 7 、9、43、6、8、1 、5、9 、7、8、5、6、先排序: 1、3、4/2=5.5 )(5+6 中位数= 描述数据离散趋势的特征值2. )极差(1 极差是数据中最大值与最小值之差,是用数据变动的幅度来反映其分散状况的特征值。 优点——极差计算简单、使用方便。 缺点——粗略,数值仅受两个极端值的影响,损失的质量信息多,不能反映中间数据的分布和波动规律。仅适 用于小样本。4 9、6、8、【举例】1、5、3、 =9-1=8 极差 2)标准偏差-标准差或均方差(个体数据与均值离差平方和的算术平均数的算术根。 表示。标准差值小说明分布集中程度高,离散程度小,均值对总体S 总体的标准差用σ表示;样本的标准差用(样本) 的代表性好。 总体的标准偏差 样本的标准偏差 CV )变异系数(3 变异系数又称离散系数,是用标准差除以算术平均数得到的相对数。 变异系数适用于均值有较大差异的总体之间离散程度的比较。 (三)质量数据的分布特征 1.质量数据的特性 个体数值的波动性■总体(样本)分布的规律性■年)、1207、06、、0904 2.质量数据波动的原因(正常 波动,是偶然原因引起的;(偶然正常)■异常波动,是有系统性原因引起的。(系统异常)■)偶然性原因(1 。不可避免、难以测量和控制的,或者是在经济上不值得消除随机发生的特点,是微小变化4M1E 通常把因素的这 类归为影响质量的偶然性原因、不可避免原因或正常原因。. . (2)系统性原因

多元统计分析实验报告,计算协方差矩阵,相关矩阵,SAS

院系:数学与统计学学院 专业:__统计学 年级:2009 级 课程名称:统计分析 ____ 学号:____________ 姓名:_________________ 指导教师:____________ 2012年4月28日 (一)实验名称 1. 编程计算样本协方差矩阵和相关系数矩阵;

2. 多元方差分析MANOVA。 (二)实验目的 1. 学习编制sas程序计算样本协方差矩阵和相关系数矩阵; 2. 对数据进行多元方差分析。 (三)实验数据 第一题: 第二题:

(四)实验内容 1. 打开SAS软件并导入数据; 2. 编制程序计算样本协方差矩阵和相关系数矩阵; 3. 编制sas程序对数据进行多元方差分析; 4. 根据实验结果解决问题,并撰写实验报告; (五)实验体会(结论、评价与建议等) 第一题: 程序如下: proc corr data=sasuser.sha n cov; proc corr data=sasuser.sha n no simple cov; with x3 x4; partial x1 x2; run; 结果如下: (1)协方差矩阵 $AS亲坯 曲;15 Friday, Apr: I SB,沙DO COUR过程 x4 目由度=30 Xi x2x3x4x5X? -10.I9B4944-0.45E2GJ5I.3347097-G.1193E48-£0.e75?GS

-ID. 188494669,36&Q3?9-7.22IO&OS1J5692043I5.49ee^91S.Oa97SM -8.45S2645■7,221050829.S78&S46-6.372E47I-15.3084183-21.7352376-11.5674785 1.3841097 1.G5S2M7t.3726171IJ24?17B 4.e093011 4.4C12473 2.B747CM -G. I1S3S49 1.GS92043-is.soul aa 4.B09B01I68.7978495劣』S670971S.57ai1B3 -IH.05l6l?a15.43S6569-J1.73S2376孔耶124TB27.0387097105.103225&S7.3505S7E: -2D K5752??319-11337204-1L55M7S52r9747?3i19,573118337.3S0&87E33.3SQ6452 (2) 相关系数矩阵 Pearson相关系数” N =引 当HO: Rho=0 时.Prob > |r| Xi Xi xl 1.QQ000 x2 -C.23954 0.2061 x3 -0,30459 0.0957 x4 0.18975 Q.3092 x5 '0.14157 0.4475 x6 -0.83787 0.0630 -0.49292 0.0150 x2-0.23354 1.00000-0.162750.143510.022700.181520.24438 x20.20C10.31:1?0.441?0.90350.32640.1761 x3-0.30459-0.16275 1.00000-0.06219-0.34641-0.^797-0.23674 x30.095?0.381?<.00010.0563o.oses0 JS97 x40.1S8760.14351-0.86219L000000.400540,313650.22610 x40.30920.4412<.0001 D.02EG Q.085S0.2213 x5-0J 41570.02270-0.946410.40054 1.000000.317370.26750 x50.4J750.90350.0G68Q.025&0.08130 + 1620 x6-0.33?e?0.1S162-0.397970.813650.31787LOOOOO0.82976 x60.0S300.32840.02660.08580.0813C0001辺-0.432920.24938-0.288740.22810 D.267600.92976 1.00000 x70,01500J7610.19970.22130JG20<.0001 第二题: 程序如下: proc anova data=sasuser.hua ng; class kind; model x1-x4=k ind; manova h=k ind; run; 结果如下: (1)分组水平信息 The ANNA Procedure Cla^s Level Informat ion Class Level?Values kind 3 123 Number of observatIons CO (2) x1、x2、x3、x4的方差分析

多元统计分析实验报告

多元统计分析实验报告 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

1. 正态性检验 Kolmogorov-Smirnov a Shapir o-Wilk 统计量df Sig.统计量df Sig. 净资产收益 .11335.200*.97835.677 率 总资产报酬 .12135.200*.96435.298 率 资产负债率.08635.200*.96235.265 总资产周转 .18035.006.86435.000 率 流动资产周 .16435.018.88535.002 转率 已获利息倍 .28135.000.55135.000 数 销售增长率.10335.200*.94935.104 资本积累率.25135.000.65535.000 *. 这是真实显着水平的下限。 a. Lilliefors 显着水平修正 此表给出了对每一个变量进行正态性检验的结果,因为该例中样本中 n=35<2000,所以此处选用Shapiro-Wilk统计量。由Sig.值可以看到,总资产周转率、流动资产周转率、已获利息倍数及资本积累率均明显不遵从正态分布,因此,在下面的分析中,我们只对净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标进行比较,并认为这四个变量组成的向量遵从正态分布(尽管事实上并非如此)。这四个指标涉及公司的获利能力、资本结构及成长能力,我们认为这四个指标可以对公司运营能力做出近似的度量。 2. 主体间因子 N

行业电力、煤气及水的 生产和供应业 11 房地行业15 信息技术业9 多变量检验a 效应值F假设 df 误差 df Sig. 截距Pillai 的跟 踪 .967.000 Wilks 的 Lambda .033.000 Hotelling 的跟踪 .000 Roy 的最大 根 .000 行业Pillai 的跟 踪 .481.027 Wilks 的 Lambda .563.025 Hotelling 的跟踪 .698.024 Roy 的最大 根 .559.008 a. 设计 : 截距 + 行业 b. 精确统计量 c. 该统计量是 F 的上限,它产生了一个关于显着性级别的下 限。 上面第一张表是样本数据分别来自三个行业的个数。第二张表是多变量检验表,该表给出了几个统计量,由Sig.值可以看到,无论从哪个统计量来看,三个行业的运营能力(从净资产收益率、总资产报酬率、资产负债率及销售增长率这四个指标的整体来看)都是有显着差别的。 3. 主体间效应的检验

《田间试验与统计分析》实习报告

农学院实验(实习)报告 专业班级:园艺专业2010级2班组别: 1 学号:2010014109 课程名称:《田间试验与统计分析》设计性实习指导教师:郭凤霞 实验时间:2012年5月20日至6月25日成绩: 施肥对水稻盆栽产量的影响 姓名:宋占楠E-mail:914196192@https://www.doczj.com/doc/be13525564.html, 1 目的意义 通过本实习,旨在利用国际国内科学文献资源库数据,了解试验设计的种类及方法,并利用一些数据进行系统的统计分析,最后对结果进行正确的分析,得出结论,探讨试验设计及统计分析在科学研究中的意义。 2 材料与方法 作一水稻施肥的盆栽实验,设5个处理,A和B系分别施用两种不同工艺流程的氨水,C施碳酸氢铵,D 施尿素,E不施氮肥。每处理4盆(施肥处理的施肥量每盆皆为折合纯氮1.2克),共5*4=20盆,随机放置于同一网室,其稻谷产量(克/盆)列于表6.11,对其进行方差分析。 2.1 试验设计方法 采用完全随机的试验设计方法,试验中,每一个区组中每一个处理都有同等的机会设置在任何一个试验小区上,避免任何主观成见。进行随机排列,用抽签发或随机数字列表(盖钧镒.试验统计方法.2000),随机排列与重复相结合,提供无偏的实验误差估计值。 2.2统计分析方法 (1).对试验所得数据进行F检验,假设Ho:μA=μB=···=μE,HA:μA、μB、...、μE不全相等。通过测验,推断这个实验的处理平均数间是否有显著性差异(F检验分析见背面)。 (2).对各处理平均数比较(见背面)。 3 结果与分析 3.1.计算处理间均方与误差均方的比率,算得F=75.3/6.73=11.19,查F表当ν1=4,ν2=15时,F0.01= 4.89,故否定Ho,则试验处理平均数间存在有极显著差异。 3.2.根据对个处理平均数的比较可知,施用氮肥与不施氮肥有显著性差异,且尿素与碳酸氢铵、碳酸氢铵与氨水1、氨水1与氨水2处理间均无显著性差异。 3.3实习心得 实验课上,我做了许多类型的实验,让我受益菲浅。其中很多知识在平时的学习中都是无法学习到的,开阔了我们的视野。我们学到的许多理论都来源于实验。很多实验都是需要花费许多心思去学习的,也是非常复杂的。经过了几节课的实验,我发现做实验有许多需要注意的地方,掌握了这些技巧才能让实验结果变的更加准确和方便。( 1 )做实验的时候,一定要集中精神,比如我们在做置信度置信区间的实验时,要注意观察各个数据,选取恰当的公式和计算方法,填写表格时也要注意看清楚,一旦错了一处,就处处都会错。因此集中注意力是相当重要的。(2 )做实验时要有足够的耐心和定力。就像在计算方差的时候,每个数据都不同,而且分组很多,虽然是用计算机EXCEL 做,但是我们一定要看清楚数字到底是多少,现在实验结果错了可以改正,但是将来走上工作岗位后,一个数据错了,后果就不堪设想,这就需要足够的耐心。 参考文献 [1] 盖钧镒.1999.试验统计方法.中国农业出版社.P111~112 [2] 刘春盛、胡仁健等.2006.改性尿素碳酸氢铵对水稻生物学性状及产量的影响.安徽农业科学期刊.

相关主题
文本预览
相关文档 最新文档