最小二乘法 有效性公式化简怎么推导的?

在给别人的回答中,描述了这个推导过程,希望对你有帮助喽,对于任何曲线都是这个原理哒。
题目:炼钢是氧化脱碳的过程,钢液含碳量直接影响冶炼时间长短。设通过5次实验已得到某平炉冶炼时间y与钢液含碳量x的一组数据
求y与x的函数表达式。(用最小二乘法 直线 拟合此题)
 喵。。也就我这么好心。。。只有15分还帮你写程序。。。。
 如果你将来做技术,你就会经常要搭建数学模型,那么就会大量运用各种的最小二乘法来拟合模型参数,所以要好好学哦,亲~
 希望通过这个例子,能够让你对最小二乘法入门。。。
 最小二乘法,通常用在,我们已知数学模型,但是不知道模型参数的情况下,通过实测数据,计算数学模型,例如,在题目中,数学模型就是直线方程y=ax+b,但是不知道直线方程的a和b。
 本来呢,我们只需要两组(xi,yi),就可以解得a和b,但是由于实测数据都存在误差,所以,我们很容易想到一个办法,我们测很多组数据来让我的a和b更加准确。
“我们测很多组数据来让我的a和b更加准确” ,那么我从数学角度如何体现这句话呢?
比如在此例中,已知数学模型 y=ax+b 
 我们有很多组数据,那么我们要找一条直线,使得我们测得的每个数据,到这条直线的偏离量的总和最小。(这句话有点拗口,慢慢理解下 = =)
 那么怎么用数学描述“偏离量总和最小”这个概念呢? 
 那么对于模型上的点(注意是模型上的点,也就是理论值),F=ax+b-y=0
 但是对于实际值来说,F=axi+b-yi 一定不等于0。那么我们就要找到一对a和b,使得F尽可能接近于0。
 也就是说,“偏离量总和最小”这个概念,在数学上实际上就是要求F的方差最小。
 即 Σ F^2→0 (F的平方和趋近于0)
 也就是说,我们要找到的实际上是f(a,b)的最小值点。(因为方差不可能小于0)
因此我们需要求f(a,b)的极值点。我们借助数学工具偏导。
 那么f(a,b)就是极值点,如果a,b只有一对,那么它就是最小值点。
 其中N是(xi,yi)的个数。即我们测了多少组数据
解上面的二元方程,我们就可以得到唯一的一组a,b啦,这就是我们所需要的a和b
O(∩_∩)O~是不是蛮简单的?
}
  • 1), 若发现这些点在一条直线附近,可以令这条直 线方程如(式 1-1)。 Y 计= a0 + a1 X (式 1-1) 其中:a0、a1 是任意实数 为建立这直线方程就要确定 a0 和 a1,应用《最小二乘法原理》,将实测值 Yi 与利用(式 1-1)计算值 (Y 计=a0+a1X)的离差(Yi-Y 计)的平方和〔∑(Yi - Y 计)2〕最小为“优化判据”。 令: φ = 此时的(式 1-1)就是我们回归的元线性方程即:数学模型。 在回归过程中,回归的关联式是不可能全部通过每个回归数据点(x1, y1、

  • 角坐标系中(如图 1), 若发现这些点在一条直线附近, 可以令这条直线方程 如(式 1-1)。 Y 计= a0 + a1 X (式 1-1) 其中:a0、a1 是任意实数 为建立这直线方程就要确定 a0 和 a1,应用《最小二乘法原理》,将实 测值 Yi 与利用(式 1-1)计算值(Y 计=a0+a1X)的离差(Yi-Y 计)的平方和 〔∑(Yi - Y

  • 最小二乘法主要用来求解两个具有线性相关关系的变量的回归方程,该方法适用于求 解与线性回归方程相关的问题,如求解回归直线方程,并应用其分析预报变量的取值 等.破解此类问题的关键点如下: ①析数据,分析相关数据,求得相关系数 r,或利用散点图判断两变量之间是 否存在线性相关关系,若呈非线性相关关系,则需要通过变量的变换转化构造 线性相关关系. ②建模型.根据题意确定两个变量,结合数据分析的结果建立回归模型. ③求参数.利用回归直线 y=bx+a 的斜率和截距的最小二乘估计公式,求出 b, a,的值.从而确定线性回归方程. ④求估值.将已知的解释变量的值代入线性回归方程 y=bx+a 中,即可求得 y 的预测值. 注意:回归直线方程的求解与应用中要注意两个方面:一是求解回归直线方程时, 利用样本点的中心(x,y)必在回归直线上求解相关参数的值;二是回归直线 方程的应用,利用回归直线方程求出的数值应是一个估计值,不是真实值. 经典例题: 下图是某地区 2000 年至 2016 年环境基础设施投资额(单位:亿元)的折线 图. 为了预测该地区 2018 年的环境基础设施投资额,建立了与时间变量的两个线 性回归模型.根据 2000 年至 2016 年的数据(时间变量的值依次为 1,2.,……, 17)建立模型①:y=-30.4+13.5t;根据 2010 年至 2016 年的数据(时间变 量的值依次为)建立模型②:y=99+17.5t. (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由. 思路分析:(1)两个回归直线方程中无参数,所以分别求自变量为 2018 时所 对应的函数值,就得结果,(2)根据折线图知 2000 到 2009,与 2010 到 2016 是两个有明显区别的直线,且 2010 到 2016 的增幅明显高于 2000 到 2009,也高于模型 1 的增幅,因此所以用模型 2 更能较好得到 2018 的预测. 解析:(1)利用模型①,该地区 2018 年的环境基础设施投资额的预测值为 =

}

最小二乘法(Least Squares Method,简记为LSE)是一个比较古老的方法,源于天文学和测地学上的应用需要。在早期数理统计方法的发展中,这两门科学起了很大的作用。丹麦统计学家霍尔把它们称为“数理统计学的母亲”。此后近三百年来,它广泛应用于科学实验与工程技术中。美国统计史学家斯蒂格勒( S. M. Stigler)指出, 最小二乘方法是19世纪数理统计学的压倒一切的主题。1815年时,这方法已成为法国、意大利和普鲁士在天文和测地学中的标准工具,到1825年时已在英国普遍使用。

追溯到1801年,意大利天文学家朱赛普·皮亚齐发现了第一颗小行星谷神星。经过40天的跟踪观测后,由于谷神星运行至太阳背后,使得皮亚齐失去了谷神星的位置。随后全世界的科学家利用皮亚齐的观测数据开始寻找谷神星,但是根据大多数人计算的结果来寻找谷神星都没有结果。时年24岁的高斯也计算了谷神星的轨道。奥地利天文学家海因里希·奥尔伯斯根据高斯计算出来的轨道重新发现了谷神星。高斯于其1809年的著作《关于绕日行星运动的理论》中。在此书中声称他自1799年以来就使用最小二乘方法,由此爆发了一场与勒让德的优先权之争。

近代学者经过对原始文献的研究,认为两人可能是独立发明了这个方法,但首先见于书面形式的,以勒让德为早。然而,现今教科书和著作中,多把这个发明权归功于高斯。其原因,除了高斯有更大的名气外,主要可能是因为其正态误差理论对这个方法的重要意义。勒让德在其著作中,对最小二乘方法的优点有所阐述。然而,缺少误差分析。我们不知道,使用这个方法引起的误差如何,就需建立一种误差分析理论。高斯于1823年在误差e1 ,… , en独立同分布的假定下,证明了最小二乘方法的一个最优性质: 在所有无偏的线性估计类中,最小二乘方法是其中方差最小的!在德国10马克的钞票上有高斯像,并配了一条正态曲线。在高斯众多伟大的数学成就中挑选了这一条,亦可见这一成就对世界文明的影响。

现行的最小二乘法是勒让德( A. M. Legendre)于1805年在其著作《计算慧星轨道的新方法》中提出的。它的主要思想就是选择未知参数,使得理论值与观测值之差的平方和达到最小:

我们现在看来会觉得这个方法似乎平淡无奇,甚至是理所当然的。这正说明了创造性思维之可贵和不易。从一些数学大家未能在这个问题上有所突破,可以看出当时这个问题之困难。欧拉、拉普拉斯在许多很困难的数学问题上有伟大的建树,但在这个问题上未能成功。

在高斯发表其1809年著作之前,约在1780年左右,拉普拉斯已发现了概率论中的“中心极限定理”。根据这个定理,大量独立的随机变量之和,若每个变量在和中起的作用都比较小,则和的分布必接近于正态。测量误差正具有这种性质。一般地说,随机(而非系统)的测量误差,是出自大量不显著的来源的叠加。因此,中心极限定理给误差的正态性提供了一种合理的理论解释。这一点对高斯理论的圆满化很有意义,因为高斯原来的假定(平均数天然合理)总难免给人一种不自然的感觉。

耐人寻味的是,无论是中心极限定理的发明者拉普拉斯,还是早就了解这一结果的高斯,都没有从这个结果的启示中去考察误差分布问题。对前者而言,可能是出于思维定势的束缚,这对拉普拉斯来说可算不幸,他因此失掉了把这个重要分布冠以自己名字的机会(正态分布这个形式最早是狄莫弗( De Moiv re) 1733年在研究二项概率的近似计算时得出的。以后也有其他学者使用过,但都没有被冠以他们的名字。高斯之所以获得这一殊荣,无疑是因为他把正态分布与误差理论联系了起来) 。

可以说,没有高斯的正态误差理论配合, 最小二乘方法的意义和重要性可能还不到其现今所具有的十分之一。最小二乘方法方法与高斯误差理论的结合,是数理统计史上最重大的成就之一,其影响直到今日也尚未过时!由于本文是主要介绍最小二乘法与矩阵投影之间的关系,对于最小二乘和概率之间的关系,请参看靳志辉的《正态分布的前世今生》。

那么,投影矩阵与最小二乘二者有什么必然的联系么,当我开始写这篇文章的时候我也这样问自己。先说说投影吧,这个想必大家都知道,高中的知识了。一个向量在另一个向量上的投影,实际上就是寻找在上离最近的点。

现在我们假设投影点是向量上的一点p,可以规定p=xa(x是某个数)。定义e=b-p,称e 为误差。因为e 与p 也就是a 垂直,所以有,展开化简得到:

我们发现:如果改变b,那么p相对应改变,然而改变a,p无变化。接下来,我们可以考虑更高维度的投影,三维空间的投影是怎么样的呢,我们可以想象一个三维空间内的向量在该空间内的一个平面上的投影:

我们假设这个平面的基(basis)是a1, a2。那么矩阵A 的列空间就是该平面。假设一个不在该平面上的向量b 在该平面上的投影是p 。我们的任务就是找到合适的x,使得p=Ax 。这里有一个关键的地方:e 与该平面垂直,所以。我们把上边式子展开,得到

有了上面的背景知识,我们可以正式进入主题了,投影矩阵(projection matrix):

这里我们最需要关注的是投影矩阵的两个性质:

对于第一个,很容易理解,因为P本身就是个对称阵。第二个,直观的理解就是投影到a上后再投影一次,显然投影并没有改变,也就是二次投影还是其本身。

这个投影到底有什么用呢?从上面的分析中我们可以看出:投影矩阵P可以吧向量b投影成向量p!从线性代数的角度来说,Ax=b并不一定总有解,这在实际情况中会经常遇到(m >
n)。所以我们就把b投影到向量p上,因为p在a1,a2的平面内,所以Ax =p是可以求解的。

好了,在此我们先暂别“投影”。下面,开始说一下最小二乘的故事吧:在实际应用中,线性回归是经常用到的,我们可以在一张散列点图中作一条直线(暂时用直线)来近似表述这些散列点的关系。比如:

设变量y 与t 成线性关系,即.现在已知m 个实验点ai和bi ,求两个未知参数C,D 。将代入得矛盾方程组

从线性代数的角度来看,就是A的列向量的线性组合无法充满整个列空间,也就是说Ax=b这个方程根本没有解。从图形上也很好理解:根本没有一条直线同时经过所有蓝色的点!所以为了选取最合适的x,让该等式"尽量成立",引入残差平方和函数H:

这也就是最小二乘法的思想。我们知道,当x取最优值的时候,Ax恰好对应图中线上橙色的点,而b则对应图中蓝色的点,e的值则应红色的线长。

看到这里你有没有和之前投影的那部分知识联系在一起呢?最小二乘的思想是想如何选取参数x使得H最小。而从向量投影的角度来看这个问题,H就是向量e长度的平方,如何才能使e的长度最小呢?b和a1,a2都是固定的,当然是e垂直a1,a2平面的时候长度最小!换句话说:最小二乘法的解与矩阵投影时对变量求解的目标是一致的!

于是,根据矩阵投影的知识,我们可以直接写出最小二乘法问题的解

其中 A 称为结构矩阵, b 称为数据矩阵, 称为信息矩阵, 称为常数矩阵。而最小
二乘的求解实质上就是 Ax=b 没有解,我们就把 b 投影到向量 p 上,求解 Ax =p.

为了定量地给出与实验数据之间线性关系的符合程度,可以用相关系数来衡量.它定义为

r也就是我们之前介绍的向量夹角。r 值越接近1, y与t 的线性关系越好.为正时,直线斜率为正,称为正相关;r 为负时,直线斜率为负,称为负相关.接近于0时,测量数据点分散或之间为非线性.不论测量数据好坏都能求出和,所以我们必须有一种判断测量数据好坏的方法,用来判断什么样的测量数据不宜拟合,判断的方法是时,测量数据是非线性的. r0称为相关系数的起码值,与测量次数n 有关。

最小二乘讲到这里似乎已经说完了,但是有一个问题,那就是我们所利用的投影矩阵P这里我们假定是可逆的,这种假定合理吗?Strang在最后给我们作了解答:

写到这里,我想有必要总结一下,为什么最小二乘和投影矩阵要扯到一起,它们有什么联系:最小二乘是用于数据拟合的一个很霸气的方法,这个拟合的过程我们称之为线性回归。如果数据点不存在离群点(outliers),那么该方法总是会显示其简单粗暴的一面。我们可以把最小二乘的过程用矩阵的形式描述出来,然而,精妙之处就在于,这与我们的投影矩阵的故事不谋而合,所以,我们又可以借助于投影矩阵的公式,也就是来加以解决。

最小二乘法是从误差拟合角度对回归模型进行参数估计或系统辨识,并在参数估计、系统辨识以及预测、预报等众多领域中得到极为广泛的应用。在数据拟合领域,最小二乘法及其各种变形的拟合方法包括:一元线性最小二乘法拟合、多元线性拟合、多项式拟合、非线性拟合。最小二乘法能将从实验中得出的一大堆看上去杂乱无章的数据中找出一定规律,拟合成一条曲线来反映所给数据点总趋势,以消除其局部波动。它为科研工作者提供了一种非常方便实效的数据处理方法。随着现代电子计算机的普及与发展,这个占老的方法更加显示出其强大的生命力。

想了解更多有关矩阵的内容,可以搜索《神奇的矩阵》。

1.陈希孺院士,《最小二乘法的历史回顾与现状》

2.靳志辉,《正态分布的前世今生》

}

我要回帖

更多关于 最小二乘法b的推导过程 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信