数据分析实验报告
- 格式:docx
- 大小:23.65 KB
- 文档页数:10
数据分析实验报告
【最新资料,WORD文档,可编辑修改】
第一次试验报告
习题1.3
1建立数据集,定义变量并输入数据并保存。
2数据的描述,包括求均值、方差、中位数等统计量。
分析—描述统计—频率,选择如下:
输出:
方差1031026.918399673.8384536136.444百分位数25304.25239.75596.25 50727.50530.501499.50
751893.501197.004136.75 3画直方图,茎叶图,QQ图。(全国居民)
分析—描述统计—探索,选择如下:
输出:
全国居民Stem-and-Leaf Plot
Frequency Stem & Leaf
9.00 0 . 122223344
5.00 0 . 56788
2.00 1 . 03
1.00 1 . 7
1.00 2 . 3
3.00 2 . 689
1.00 3 . 1
Stem width: 1000
Each leaf: 1 case(s)
分析—描述统计—QQ图,选择如下:
输出:
习题1.1
4数据正态性的检验:K—S检验,W检验数据:
取显着性水平为0.05
分析—描述统计—探索,选择如下:(1)K—S检验
单样本Kolmogorov-Smirnov 检验
身高N60正态参数a,,b均值139.00
标准差7.064
最极端差别绝对值.089
正.045
负-.089
Kolmogorov-Smirnov Z.686
渐近显着性(双侧).735
a. 检验分布为正态分布。
b. 根据数据计算得到。
结果:p=0.735 大于0.05 接受原假设,即数据来自正太总体。(2)W检验
a. Lilliefors 显着水平修正
*. 这是真实显着水平的下限。
结果:在Shapiro-Wilk 检验结果972.00=w ,p=0.174大于0.05 接受原假设,即数据来自正太总体。
习题1.5
5多维正态数据的统计量
数据: 统计量
x1 x2 x3 x4
N 有效 21 21 21 21
缺失 0 0 0 0
均值 18.219 27.867 4.505 33.767
均值向量为:)767.33,505.4,836.27,219.18(=-
X
结果:x4与其他数据无相关性,其他三组数据线性相关
相关系数
x1x2x3x4
x1相关系数 1.000.790**.434*.431 Spearman 的
rho
Sig.(双侧)..000.049.051
N21212121 x2相关系数.790** 1.000.511*.488*
Sig.(双侧).000..018.025
N21212121
x3相关系数.434*.511* 1.000.691**
Sig.(双侧).049.018..001
N21212121
x4相关系数.431.488*.691** 1.000
Sig.(双侧).051.025.001.
N21212121
**. 在置信度(双测)为0.01 时,相关性是显着的。
*. 在置信度(双测)为0.05 时,相关性是显着的。
结果:由Spearman相关矩阵的输出结果看,取显着性水平0.1,p值皆小于0.1,所以数据相关性显着
习题2.4
6线性回归线的拟合,回归系数的区间估计与假设检验,回归系数的选择、逐步回归。
7残差分析
分析—回归—线性,选择如下:
输出:
逐步回归结果:
两变量的系数p值均小于0.05均有统计学意义。
结果:由残差统计量表看出,数据无偏离值,标准差比较小,认为模型健康。概率论课本习题7.5
8一个正态总体独立样本均值的t检验与区间估计
分析—比较均值—独立样本T检验:
输出:
结果:样本均值为2833.50与总体均值2820比较接近
One-Sample Test
Test Value = 2820
结果:
t值为1.218小于临界值2.26,且P值为0.254大于显着性水平0.05,接受原假设,即认为样本均值与总体均值之差可能是抽样误差所导致
概率论课本习题7.7
9两个正态总体均值差异比较的t检验与配对检验
分析—均值比较—独立样本T检验,选择如下:
输出:
结果:P值为1大于显着性水平0.05,认为方差相等。此时,p值(Sig. (2-tailed))为0.229大于显着性水平0.05,认为样本均值是相等的,即电阻均值没有显着性差异。
分析—比较均值—配对样本T检验,选择如下:
输出:
结果同上:认为样本均值是相等的,即电阻均值没有显着性差异。