数据分析实验报告
- 格式:docx
- 大小:146.00 KB
- 文档页数:7
数据分析实验报告
文稿归稿存档编号:[KKUY-KKIO69-OTM243-OLUI129-G00I-FDQS58-
第一次试验报告
习题1.3
1建立数据集,定义变量并输入数据并保存。 2数据的描述,包括求均值、方差、中位数等统计量。 分析—描述统计—频率,选择如下: 输出:
统计量
全国居民
农村居民
城镇居民
N 有效 22 22 22 缺失
均值 1116.82 747.86 2336.41 中值 727.50
530.50 1499.50 方差
1031026.918
399673.838
4536136.444
百分位数 25
304.25 239.75 596.25 50 727.50 530.50 1499.50 75
1893.50
1197.00
4136.75
3画直方图,茎叶图,QQ 图。(全国居民) 分析—描述统计—探索,选择如下: 输出:
全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 5.00 0 . 56788
数据分析实验报告
【最新资料,WORD 文档,可编辑修改】
2.00 1 . 03
1.00 1 . 7
1.00 2 . 3
3.00 2 . 689
1.00 3 . 1
Stem width: 1000
Each leaf: 1 case(s)
分析—描述统计—QQ图,选择如下:
输出:
习题1.1
4数据正态性的检验:K—S检验,W检验数据:
取显着性水平为0.05
分析—描述统计—探索,选择如下:(1)K—S检验
结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。 (2
)W 检验
结果:在Shapiro-Wilk 检验结果972.00 w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。 习题1.5
5
多维正态数据的统计量 数据:
均值向量为:)767.33,505.4,836.27,219.18(=-
X
结果:x4与其他数据无相关性,其他三组数据线性相关
结果:由Spearman相关矩阵的输出结果看,取显着性水平0.1,p值皆小于
0.1,所以数据相关性显着
习题2.4
6线性回归线的拟合,回归系数的区间估计与假设检验,回归系数的选择、逐步回归。
7残差分析
分析—回归—线性,选择如下:
输出:
逐步回归结果:
两变量的系数p值均小于0.05均有统计学意义。
结果:由残差统计量表看出,数据无偏离值,标准差比较小,认为模型健康。概率论课本习题7.5
8一个正态总体独立样本均值的t检验与区间估计
分析—比较均值—独立样本T检验:
输出:
结果:样本均值为2833.50与总体均值2820比较接近
结果:
t值为1.218小于临界值2.26,且P值为0.254大于显着性水平0.05,接受原假设,即认为样本均值与总体均值之差可能是抽样误差所导致
概率论课本习题7.7
9两个正态总体均值差异比较的t检验与配对检验
分析—均值比较—独立样本T检验,选择如下:
输出:
结果:P值为1大于显着性水平0.05,认为方差相等。此时,p值(Sig. (2-tailed))为0.229大于显着性水平0.05,认为样本均值是相等的,即电阻均值没有显着性差异。
分析—比较均值—配对样本T检验,选择如下:
输出:
结果同上:认为样本均值是相等的,即电阻均值没有显着性差异。