最小二乘法原理

发表于 2013/4/19 下午2:31:24 阅读（3482）

最小二乘法原理

在我们研究两个变量(x, y)之间的相互关系时，通常可以得到一系列成对的数据(x1, y1、x2, y2... xm , ym)；将这些数据描绘在x -y直角坐标系中(如图1), 若发现这些点在一条直线附近，可以令这条直线方程如(式1-1)。

Y计= a0 + a1 X (式1-1)

其中：a0、a1 是任意实数

为建立这直线方程就要确定a0和a1，应用《最小二乘法原理》，将实测值Yi与利用(式1-1)计算值(Y计=a0+a1X)的离差(Yi-Y计)的平方和〔∑(Yi - Y计)2〕最小为“优化判据”。

令: φ = ∑(Yi - Y计)2 (式1-2)

把(式1-1)代入(式1-2)中得:

φ = ∑(Yi - a0 - a1 Xi)2 (式1-3)

当∑(Yi-Y计)平方最小时，可用函数 φ 对a0、a1求偏导数，令这两个偏导数等于零。

(式1-4)

(式1-5)

亦即：

m a0 + (∑Xi ) a1 = ∑Yi (式1-6)

(∑Xi ) a0 + (∑Xi2 ) a1 = ∑(Xi, Yi) (式1-7)

得到的两个关于a0、 a1为未知数的两个方程组，解这两个方程组得出：

a0 = (∑Yi) / m - a1(∑Xi) / m (式1-8)

a1 = [∑Xi Yi - (∑Xi ∑Yi)] / [∑Xi2 - (∑Xi)2 )] (式1-9)

这时把a0、a1代入(式1-1)中, 此时的(式1-1)就是我们回归的元线性方程即：数学模型。

在回归过程中，回归的关联式是不可能全部通过每个回归数据点(x1, y1、 x2, y2...xm,ym),为了判断关联式的好坏,可借助相关系数“R”，统计量“F”，剩余标准偏差“S”进行判断；“R”越趋近于 1 越好；“F”的绝对值越大越好；“S”越趋近于 0 越好。

R = [∑XiYi - m (∑Xi / m)(∑Yi / m)]/ SQR{[∑Xi2 - m (∑Xi / m)2][∑Yi2 - m (∑Yi / m)2]} (式1-10) ＊

在(式1-1)中，m为样本容量，即实验次数；Xi、Yi分别任意一组实验X、Y的数值。微积分应用课题一最小二乘法

从前面的学习中, 我们知道最小二乘法可以用来处理一组数据, 可以从一组测定的数据中寻求变量之间的依赖关系, 这种函数关系称为经验公式. 本课题将介绍最小二乘法的精确定义及如何寻求与之间近似成线性关系时的经验公式. 假定实验测得变量之间的个数据 , , …, , 则在平面上, 可以得到个点 , 这种图形称为“散点图”, 从图中可以粗略看出这些点大致散落在某直线近旁, 我们认为与之间近似为一线性函数, 下面介绍求解步骤.

考虑函数 , 其中和是待定常数. 如果在一直线上, 可以认为变量之间的关系为 . 但一般说来, 这些点不可能在同一直线上. 记 , 它反映了用直线来描述 , 时, 计算值与实际值产生的偏差. 当然要求偏差越小越好, 但由于可正可负, 因此不能认为总偏差时, 函数就很好地反映了变量之间的关系, 因为此时每个偏差的绝对值可能很大. 为了改进这一缺陷, 就考虑用来代替 . 但是由于绝对值不易作解析运算, 因此, 进一步用来度量总偏差. 因偏差的平方和最小可以保证每个偏差都不会很大. 于是问题归结为确定中的常数和 , 使为最小. 用这种方法确定系数 , 的方法称为最小二乘法.

最小二乘法的矩阵形式

Ax=b，其中A为nxk的矩阵，x为kx1的列向量，b为nx1的列向量。如果n>k（方程的个数大于未知量的个数），这个方程系统称为Over Determined System，如果n<k（方程的个数小于未知量的个数），这个系统就是Under Determined System。

正常来看，这个方程是没有解的，但在数值计算领域，我们通常是计算 min ||Ax-b||，解出其中的x。比较直观的做法是求解A'Ax=A'b，但通常比较低效。其中一种常见的解法是对A进行QR分解（A=QR），其中Q是nxk正交矩阵（Orthonormal Matrix），R是kxk上三角矩阵（Upper Triangular Matrix），然后min ||Ax-b|| = min ||QRx-b|| = min ||Rx-Q'b||，用MATLAB命令x=R\(Q'*b）可解得x。^[1]

以上内容来自百度文库