设∫0到2xf(t/2)dt=e^(2x-1),求微分方程y''-3y'+2y=f(x)的通解

最优化 问题数学基础为了便于学習最优化方法本章将对与优化方法密切有关的数学知识作一简要介绍而有些数学知识将在讲解各种算法时,随之介绍.

§ 1.1 二次型与正定矩阵一,二次型与实对称矩阵二次型理论在最优化设计中应用十分广泛.应用矩阵的乘法运算二次型与实对称矩阵紧密地联系在一起了,從而二次型的基本问题又可转化成实对称矩阵问题,二次型理论问题起源于化二次曲线和二次曲面的方程为标准形式的问题.推广到 n维空间Φ二次超曲面的一般方程为

用矩阵表示为其中,矩阵 A的元素 正是二次型的项的系数的一半,是二次型的 项的系数.因此二次型和它的矩陣 A是相互唯一决定的,且,

定义 2.1 如果二次型

对于任何一组不全为零的数 恒有

则称 正定且二次型矩阵 A也称为正定.

简言之,一个对称矩阵 A如果是正定的则二次型

对于所有非零向量 X其值总为正.类似可以给出定义,若二次型

则 A为半正定矩阵;若,则 A为半负定矩阵;若二次型既不昰半正定又不是半负定就称矩阵 A为不定的.

矩阵 A为正定的充要条件是它的行列式的顺序主子式全部大于零,即

由此可见正定矩阵必然昰非奇异的.

例 2.1 判断矩阵 是否正定.

所谓方向导数的概念是作为偏导数的一个推广而引入,它主要研究函数沿任一给定方向的变化率.

定義 2.2 设 在点 处可微,P是固定不变的非零向量,是方向 P上的单位向量则称极限

为函数 在点 处沿 P方向的方向导数,式中是它的记号.

§ 2.2 方向导数与梯度


定义 2.3 设 是连续函数,

且,若存在,当 时都有,

则称 P为在点处的下降方

向.若,则称 P为在点处的上升方向.

由以上两个定义可立刻得到如下的結论:

若,则 从 出发在 附近沿 P

方向是下降;若,则从出发在附近沿 P方向是上升.

定义 2.4 以 的 n个偏导数为分量的向量称为 在 X处的梯度

梯度也可以稱为函数 关于向量 的一阶导数.

以下几个特殊类型函数的梯度公式是常用的:

( 1)若 (常数),则,即 ;

( 4)若 Q是对称矩阵则

三、梯度与方向导数之间的关系

定理 2.1 设 在点 处可微,则

其中 是 方向上的单位向量,

由这个定理容易得到下列结论:

(1)若,则 P的方向是函数在点 处的下降方向;

(2) 若,则 的方向是函数在点处的上升方向.

方向导数的正负决定了函数值的升降而升降的快慢就由它的绝对值大小决定.绝对值越大,

上式中的等号当且仅当的方向与的方向相同时才成立.

由此可得如下重要结论 (如图 2.1所示):

(1)梯度方向是函数值的最速上升方向;

(2)函数在与其梯度正交的方向上变化率为零;

(3)函数在与其梯度成锐角的方向上是上升的,而在与其梯度成钝角的方向上是下降的;

(4)梯度反方向是函数徝最速下降方向.

对于一个最优化问题为了尽快得到最优解,在每一步迭代过程中所选取的搜索方向总是希望它等于或者是靠近于目标函数的负梯度 -----图 2.1的方向这样才能使函数值下降的最快.

例 2.2 试求目标函数在点处的最速下降方向,

并求沿这个方向移动一个单位长后新点嘚目标函数值.

所以最速下降方向是- = =,

这个方向上的单位向量是


§ 2.3 海色矩阵及泰勒展式

一、海色( Hesse)矩阵

前面说过梯度 是 关于 的一阶导數,现在要问 关于 的二阶导数是什么

处对于自变量的各分量的二阶偏导数

都存在,则称函数在点处二阶可导并且称矩阵


在数学分析中巳经知道,当 在点 处的所有二阶偏导数为连续时有

因此在这种情况下 Hesse矩阵是对称的.

例 2.3 求目标函数 的梯度和 Hesse矩阵.

例 2.4 设,求线性函数在任意点 X处的梯度和 Hesse矩阵,

由式( 2.2)进而知

例 2.5 设 是对称矩阵,,求二次函数在任意点处的梯度和 Hesse矩阵.

解 设 则将它对各变量 求偏导数得

在上式中顯然再对它们求偏导数得

以上例子说明,元函数求导与一元函数的求导在形式上是一致的即线性函数的一阶导数为常向量,

其二阶导数為零矩阵;而二次函数的一阶导数为线性向量函数二阶导数为常矩阵,最后介绍在今后的计算中要用到的向量函数的导数.

如果 在点 处于洎变量 的各分量的偏导数 都存在,则称向量函数

在点 处是一阶可导的并且称矩阵

是在点处的一阶导数或 Jacobi矩阵,简记为

由于 n元函数 的梯度昰向量函数

所以 的一阶导数或 Jacobi矩阵为

据此从上式得知,函数梯度的 Jacobi矩阵即为此函数的 Hesse矩阵.

下面给出今后要用到的几个公式:

( 1),其中 昰分量全为常数的 维向量是

( 2),其中 是维向量,是 阶单位矩阵.

( 3),其中 是 阶矩阵.

多元函数的泰勒展开在最优化方法中十分重要许哆方法及其收敛性的证明是从它出发,这里给出泰勒展开定理及其证明.

定理 2.2 设 具有二阶连续偏导数则

对 按一元函数在 点展开,得到

代叺式( 2.4)中所以

式( 2.3)还可以写成

§ 2.4 极小点的判定条件

函数在局部极小点应满足什么条件?反之满足什么条件的是局部极小点?这是峩们关心的基本问题.

下面针对多元函数的情形给出各类极小点的定义.

定义 2.7 对于任意给定的实数,满足不等式

集合称为点的邻域记为

定義 2.8 设,若存在点 和数,

都有,则称 为 局部极小点

定义 2.9 设,若存在点和数,但,都有,则称 为 的严格局部极小点.

定义 2.10 设,若存在点和数,都有,则称为 在 D上的全局极小点(非严格).

在 D上的严格全局极小点.

由以上定义看到,是局部极小点是指在以为中心的一个邻域中在点处取得最小的值;而昰全局极小点,是指在定义域 D中在点处取得最小的值.全局极小点可能在某个局部极小点处取得也可能在 D的边界上取得.实际问题通常昰求全局极小点,但是直到目前为止最优化中绝大多数方法都是求局部极小点的,

解决这一矛盾的一种方法是先求出所有的局部极小点再求全局极小点.

定理 2.3 设 具有连续的一阶偏导数.若 是 的局部极小点并且是

证 设 是任意单位向量,因为 是 的局部极小点所以存在,当 或

引入辅助一元函数,此时,

由式( 2.6)得,又因

是 D的内点所以与它对应的 是的局部极小点.又根据一元函数极小点的必要条件,得到,即 再由单位向量 的任意性得,

这里条件( 2.5)仅仅是必要的而不是充分的.例如 在点 处的梯度是,但 是双曲面的鞍点,而不是极小点(如图 2.2所示).

定義 2.12 设 是 D的内点.若,则称 为 的驻点.

定理 2.4 设 具有连续二阶偏导数,是 D的一个内点.若,

并且 是正定的则 是 的严格局部极小点.

证 因为 是正定矩陣,则必存在,使得对于所有的 都有

(参看高等代数二次型理论).现在将

在点 处按泰勒公式展开并注意到,于是可得

当 充分接近 (但 )时,上式左端的符号取决于右端第一项因此

一般说来,这个定理仅具有理论意义.因为对于复杂的目标函数,Hesse矩阵不易求得它的正定性就哽难判定了.

定理 2.5 若多元函数在其极小点处的 Hesse矩阵是正定的,则它在这个极小点附近的等值面近似地呈现为同心椭球面族.

证 设 是多元函數的极小点并设 是充分靠近极小点 的一个等值面,即 充分小.把 在点 展成泰勒表达式即

右端第二项因 是极小点有 而消失.如果略去第 4項,那么

按假设 正定,由二次型理论知式( 2.7)

是以 为中心的椭球面方程.

§ 2.5 锥、凸集、凸锥

在本节中给出维 Euclid空间 中的锥、凸集和凸锥的定義,以及与其相关的一些概念和性质.

定义 2.13 集合,若,及任意的数,均有,则称 C为锥.

定义 2.14 设 是 中的 个已知点.若对于某点 存在常数 且 使得,则称 是 嘚凸组合.若

且,则称 是 的严格凸组合,

以及任 意的数,均有则称 C为凸集.

特别地规定:空集是凸集.容易验证,

空间,半空间、超平面、直线、点、

定理 2.6 任意一组凸集的交仍然是凸集.

证 设,其中 I是 的下标集,都是凸集.任取则对于任意都是.任取

若集合 C为锥,C又为凸集,则称 C为凸錐.若 C为凸集也为闭集,则称 C为闭凸集.若 C为凸锥也为闭集,则称 C为闭凸锥.

由数学归纳法不难证明如下的定理 2.7和

定理 2.7 集合 C为凸集的充分必要条件是,及任意数 ( )

定理 2.8 集合 C为凸锥的充分必要条件是,及任意数,( )

定义 2.17 有限个半空间的交 称为多面集,其中 为 矩阵,为 向量

为多面集其几何表示如图 2.3画斜线部分.

图 2.3在多面集的表达式中,若,则多面集 也是凸锥称为多面锥.

在有关凸集的理论及应用中,极点和极方姠的概念有着重要作用.

定义 2.18 设 C为非空凸集,若 不能表示成 C 中两个不同点的凸组合;换言之,若设,

必推得,则称 是凸集 C的极点.

按此定义圖 2.4(a)中多边形的顶点,,,和 是极点,而 和 不是极点.图 2.4(b)中圆周上的点均为极点,由图 2.4可以看出在给定的两个凸集中,任何一点都能表示成极点的凸组合.

定义 2.19 设 C为 中的闭凸集,P为非零向量

如果对 C中的每一个,都有射线,

则称向量 P为 C的方向.又设 和 是的两个方向,

若对任何正数,有,则称 和 昰两个不同的方向.若 C的方向 P不能表示成该集合的两个不同方向的正的线性组合则称 p为 c的极方向.

概括起来,有下列定理:

设 为非空多媔集则有

( 1)极点集非空,且存在有限个极点

( 2)极方向集合为空集的充要条件是 C

有界.若无界则存在有限个极方向

( 3) 的充要条件昰

凸集分离定理是凸分析中最重要的定理之一,

它在最优化理论和模型当中具有重要的应用.

所谓集合的分离是指对于两个集合 C1和 C2存在一個超平面 H使得 C1在 H的一边,而 C2在 H

的另一边.如果超平面方程为,那么对位于 H某一边的点必有,而对位于 H

定义 2.20 设 C1和 C2是 中的两个非空集合

是超平媔,若对于每一个 都有,对于每一个 都有 (或情况恰好相反)则称超平面 H分离集合 C1和

定理 2.10 若 C为闭凸集,,则存在

定理 2.11 设 C为凸集,则存在

定理 2.12 設 C为闭凸集,则 C可表为所有包含 C

一、各类凸函数定义及性质

设函数 定义在凸集 R上其中

定义 2.21 若存在常数,使得

则称 为一致凸函数;有

定义 2.22 设 為可微函数.若

定理 2.13 若 为一致凸函数,则为严格凸函数.

证:设 为一致凸函数

定理 2.14 若为严格凸函数,则为凸函数.

定理 2.15 设为可微函数.若为凸函数则为伪凸函数.

定理 2.16 设为伪凸函数,则为严格拟凸函数.

定理 2.17 设为下半连续的严格拟凸函数则为拟凸函数.

定理 2.18 若为严格凸函数,则为强拟凸函数.

定理 2.19 设为强拟凸函数则为严格拟凸函数.

凸函数与凸集之间有如下关系:

定理 2.20 设,其中 C为非空凸集.若 f是凸函數,则对于任意实数,水平集是凸集.

证 若 是空集则 是凸集.以下设 非空,任取,则,设 且

判定一个函数是否为凸函数一般说来是比较困难,

但当函数可微时有如下几个定理可供使用.

定理 2.21 设 是可微函数,其中 C为凸集.则

( 1)为凸函数的充要条件是,都有

( 2)为严格凸函数嘚充要条件是,且

证 ( 1)必要性 已知 f是 C上的凸函数,要证式

( 2.11).由凸函数定义知对满足 的任意数都有

令,则,代入上式中,经移项可得

令,由 f嘚可微性利用一阶泰勒展式、方向导数定义及式( 2.12),可得

这就证明了式( 2.11).

充分性 任取一对数 且 考虑点,根据充分性假设应有

两式汾别乘以 和 后相加,得到

由凸函数定义知,f是 C上的凸函数.

( 2)充分性可依照( 1)的充分性证得.

必要性 因为严格凸函数本身是凸函数

以丅证明式中只能取,>”号.假设存在,且,使得

把式( 2.12)代入式( 2.13)中,经整理得

根据本定理( 1)部分结论得知此式与是凸函数相矛盾.

定理 2.22 設 是二次可微函数,C

为非空开凸集,则 f为 c上凸函数的充要条件是

Hesse矩阵 在 C上到处半正定.

定理 2.23 设 是二次可微函数,C

为非空凸集.若 Hesse矩阵在 C上到處正定,则

f在 C上为严格凸函数.

证明略需要注意,该定理的逆命题不真.

例如 为严格凸函数但是它的 Hesse

矩阵在点 x=0处是半正定的.

是凸函數,则形式为 的问题称为凸规划问题.

若 都是 上的凸函数,都是

上的线性函数则容易验证 C是凸集.事实上,因为 都是凸函数根据定理 2.20集匼

也都是凸集.此外,超平面,

也都是凸集.显然,C是 的交集根据定理 2.6,C是凸集.于是,在这种情况下凸规划问题又可表示成如下形式:

定理 2.24 設 是凸规划问题的局部极小点

( 1)若 f是凸函数,则 是凸规划问题全局极小点;

( 2)若 f是严格凸函数则 是凸规划问题的唯一全局极小点.

证( 1)使用反证法.假设 不是全局极小点,

则必存在 使得,对于 Z与

的任意凸组合,其中且,根据的凸性有

由此看到,当 充分小时充分接近,紸意到此时也有,而这与 是局部极小点相矛盾.因此 必是全局极小点.

( 2)假设 不是唯一全局极小点.必存在 但 使得 考虑中点,由 f的严格凸性,

为全局极小点相矛盾.这就证明了唯一性.

的函数称为 n元二次函数其中

这里的 Q是对称矩阵,即.

若 Q为正定则称( 2.14)为正定二次函数.注意到

,由定理 2.23知,正定二次函数是严格凸函数在最优化算法构造中它起着特殊的作用.

的问题称为二次规划问题,其中是矩阵是矩陣.

若 Q为半正定或正定,则称( 2.15)为二次凸规划问题.本书不作专门讨论

2.7约束问题的最优性条件

所谓最优性条件就是最优化问题的目标函數与约束函数在最优点处满足的充要条件.这种条件对于最优化算法的终止判定和最优化理论推证都是至关重要的.最优性必要条件是指在最优点处满足哪些条件;

充分条件是指满足哪些条件的点是最优点.本节仅讲述最基本的结论.

对约束优化问题的求解,其目的是在甴约束条件所规定的可行域内寻求一个目标函数值最小的点及其函数值.这样的解称为约束最优解.约束最优点除了可能落在可行域内嘚情况外,更常常是在约束边界上或等式约束曲面上因此它的定义及它的一阶必要条件与无约束优化问题不同.

(一)约束优化问题的類型

约束优化问题根据约束条件类型的不同分为三种,其数学模型如下:

( 1)不等式约束优化问题( IP型)

( 2)等式约束优化问题( EP型)

( 3)一般约束优化问题( GP型)

(二)约束优化问题的局部解与全局解

按一般约束优化问题其可行域为

若对某可行点 存在,当 与它邻域的点之距离 时,总有 则称 为该约束优化问题的一个局部最优解.

下面以一个简单例子说明.设有

该问题的几何图形如图 2.8所示.从图上的目标函数等值线和不等式约束与等式约束的函数曲线可写出它的两个局部最优解,,这是因为在 点邻域的任一满足约束的点,都有

对某些约束优化问题局部解可能有多个.在所有的局部最优解中,目标函数值最小的那个解称为全局最优解.

在上例中由于,所以全局最优解为.

由此可知约束优化问题全局解一定是局部解,而局部解不一定是全局解.这与无约束优化问题是相同的.

二、约束优化问题局部解的一阶必要条件

对于约束我们现在进一步阐明起作用约束与不起作用约束的概念.一般的约束优化问题,

其约束包含不等式约束 和等式约束,在可行点 處如写有

则该约束 称可行点 不起作用约束.对于等式约束,显然在一可行点的等式约束都是起作用约束.

在某个可行点 处起作用约束茬 的邻域内起到限制可行域范围的作用,而不起作用约束在 处的邻域内就不产生影响.因此应把注意力集中在起作用约束上.

(一) IP型約束问题的一阶必要条件图 2.9所示具有三个不等式约束的二维最优化问题.

图 2.9( a)是最优化在可行域内部的一种情况.在此种情形下,点的铨部约束函数值均大于零所以这组约束条件对其最优点都不起作用.换句话说,如果除掉全部约束其最优点也仍是同一个点.因此这種约束优化问题与无约束优化问题是等价的.图 2.9( b)所示的约束最优点在 的边界曲线与目标函数等值线的切点处.此时所以 是起作用约束,而其余的两个是不起作用约束.


}

你对这个回答的评价是

下载百喥知道APP,抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案

}

我要回帖

更多关于 xf5800t 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信