17
回归分析
假设P有个自变量x1, x2 ,, xp ,n是观测值的个
数,因变量的观测值、观测值的均值及回归值分 别用符号 y、y、yˆ 表示。
总离差平方和,表示观测值与均值之差的平方
和,它反映了数据总的波动情况:
n
n
Lyy ( yi y)2 yi2 ny 2
i 1
i 1
18
回归分析
13
回归分析的基本原理
变量之间的关系分为两类,一类是变量之间存 在着完全确定的函数关系,称为函数相关;另一 类是变量之间存在统计上相关,称为统计相关, 即既存在一定的制约关系,又不能由一个(或几 个)变量精确地求出另一个变量的值来。使用统 计方法研究变量之间统计相关的规律就是回归分 析,它利用建立的经验公式处理连续型随机变量 之间的相关关系。
20
2 .理论上,变行体的变形场是惟一的客观存在。 由于观测误差和模型误差的存在,无法获取客观存在 的变形场。因此,在外业数据采集过程中,在内业数 据处理和变形分析中,均应采用合适的方法和程序排 除误差干扰,以便获取客观变形场的最佳描述。
3
平差过程
(1)采取一定的物理方法或数学模型消除系统误差的 影响,获得仅包含偶然误差的观测值空间向量。如采 取一定的观测程序和方法消除仪器的误差,将系统误 差作为未知参数进行解算等。
对于第一个问题,主要运用专业的知识来确定,然后利用 统计检验的方法对因子的显著性进行检验,以使回归方程中只 保留影响显著的因子,剔除影响不显著的因子。
n
y b0 bi xi v
i 1
第二个问题:利用最小二乘法由观测资料计算回归系数的 估值,实际上就是测量中的间接平差问题。
16
回归分析
逐步回归的基本思想是在众多的自变量中,根 据这些自变量对回归方程影响程度的大小,逐次 地选入到回归方程中,在这个过程中,先前被选 入回归方程的变量,有些由于其后新引入的变量 而失去了重要性,这时就应从回归方程中将它们 淘汰掉。持续上述过程,直到回归方程中不在有 可淘汰的变量,也没有再可引入的变量为止,最 后所得的结果就是选定的回归方程。