数据分析实验报告

  • 格式:docx
  • 大小:146.00 KB
  • 文档页数:7

下载文档原格式

  / 7
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

数据分析实验报告

文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-

第一次试验报告

习题1.3

1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出:

统计量

全国居民

农村居民

城镇居民

N 有效 22 22 22 缺失

均值 1116.82 747.86 2336.41 中值 727.50

530.50 1499.50 方差

1031026.918

399673.838

4536136.444

百分位数 25

304.25 239.75 596.25 50 727.50 530.50 1499.50 75

1893.50

1197.00

4136.75

3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出:

全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788

数据分析实验报告

【最新资料,WORD 文档,可编辑修改】

2.00 1 . 03

1.00 1 . 7

1.00 2 . 3

3.00 2 . 689

1.00 3 . 1

Stem width: 1000

Each leaf: 1 case(s)

分析—描述统计—QQ图,选择如下:

输出:

习题1.1

4数据正态性的检验:K—S检验,W检验数据:

取显着性水平为0.05

分析—描述统计—探索,选择如下:(1)K—S检验

结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。 (2

)W 检验

结果:在Shapiro-Wilk 检验结果972.00 w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5

5

多维正态数据的统计量 数据:

均值向量为:)767.33,505.4,836.27,219.18(=-

X

结果:x4与其他数据无相关性,其他三组数据线性相关

结果:由Spearman相关矩阵的输出结果看,取显着性水平0.1,p值皆小于

0.1,所以数据相关性显着

习题2.4

6线性回归线的拟合,回归系数的区间估计与假设检验,回归系数的选择、逐步回归。

7残差分析

分析—回归—线性,选择如下:

输出:

逐步回归结果:

两变量的系数p值均小于0.05均有统计学意义。

结果:由残差统计量表看出,数据无偏离值,标准差比较小,认为模型健康。概率论课本习题7.5

8一个正态总体独立样本均值的t检验与区间估计

分析—比较均值—独立样本T检验:

输出:

结果:样本均值为2833.50与总体均值2820比较接近

结果:

t值为1.218小于临界值2.26,且P值为0.254大于显着性水平0.05,接受原假设,即认为样本均值与总体均值之差可能是抽样误差所导致

概率论课本习题7.7

9两个正态总体均值差异比较的t检验与配对检验

分析—均值比较—独立样本T检验,选择如下:

输出:

结果:P值为1大于显着性水平0.05,认为方差相等。此时,p值(Sig. (2-tailed))为0.229大于显着性水平0.05,认为样本均值是相等的,即电阻均值没有显着性差异。

分析—比较均值—配对样本T检验,选择如下:

输出:

结果同上:认为样本均值是相等的,即电阻均值没有显着性差异。