当前位置:文档之家› 多元凸函数的性质及其应用

多元凸函数的性质及其应用


收稿日期:2008-06-30
第16卷 第4期
2008年12月
北京石油化工学院学报
Journal of Beijing Institute of
Petro-chemical Technology
Vol.16 No.4
Dec.2008
多元凸函数的性质及其应用
游 煦
(北京石油化工学院数理系,北京102617)
摘要 从多元凸函数的定义及文献中已有的性质出发,利用方向导数和极限等数学工具,
给出了一个判别多元函数凸性的充分必要条件,进一步利用函数f(x)的Hesse矩阵Hf(x)的半正
定性来判定函数的凸性。特别地,对于二次函数f(x)=12xTAx+bTx直接利用矩阵A的正定性可以判
别它的凸性。这在实际应用中有一定的意义。
关键词 多元凸函数;梯度向量;Hesse矩阵;半正定阵;二次函数
中图法分类号 O174
凸分析是近几十年形成和发展起来的一个
新数学分支。它在数学规划、控制论、多元统计
等领域都有广泛的应用。文献[1-3]给出了一
些判别多元函数凸性的充分必要条件,但是这
些定理在实际使用过程中比较复杂。为了改进
判别方法,笔者利用极限和方向导数等数学工
具得到定理1[4],给出了利用多元函数的Hesse
矩阵来判别函数的凸性,改进了文献[1,3]中的
判别方法,在实际计算中很方便。
1 预备知识
多元凸函数和严格凸函数的定义:
定义1 设f(x),x∈D Rn,其中D为非
空凸集,若对于任意的x1,x2∈D及t∈(0,1)有
f tx1+(1-t)x2≤tf(x1)+(1-t)f(x2),
则称f(x)为D上的凸函数;若对于任意的x1,
x2∈D且x1≠x2及t∈(0,1)有
f tx1+(1-t)x2则称f(x)为D上的严格凸函数。
凸函数的几何意义如下:设x1,x2是凸集
上的任意两点,tx1+(1-t)x2为这两点连线
上的一点,则f(x)在tx1+(1-t)x2处的函数
值ftx1+(1-t)x2不超过f(x1)与f(x2)的
加权平均值f(x1)+(1-t)f(x2)。
例1 二元函数f(x,y)=x2-2xy+y2+
x+y为R2上的凸函数。
因为
f(x,y)=
1
2x y2-2-2 2xy+1 1xy,
令f(x,y)=f(x)=12xTAx+bTx,其中
x=x
y,A=2-2-2 2,b=11。
任意取x1=a1
b1,x2=a2b2∈R2,t∈(0,
1),则
f tx1+(1-t)x2=
f ta1+(1-t)a2,tb1+(1-t)b2=
t(a1-b1)+(1-t)(a2-b2)2+
t(a1+b1)+(1-t)(a2+b2),
tf(x1)+(1-t)f(x2)=t(a1-b1)2+
(1-t)(a2-b2)2+t(a1+b1)+
(1-t)(a2+b2),
利用一元函数g(x)=x2为x∈R上的凸
函数可知
t(a1-b1)+(1-t)(a2-b2)2≤
t(a1-b1)2+(1-t)(a2-b2)2,
因此,f(x,y)=x2-2xy+y2+x+y是R2上
的凸函数。利用凸函数的定义可以得到如下的
性质[1]:
设f(x)是定义在Rn上的凸函数,则对于
任意的x1,x2…xk∈Rn和t1,t2…tk≥0且t1+
t2+ … +tk=1,有
f t1x1+t2x2+…+tkxk≤
t1f(x1)+t2f(x2)+…+tkf(xk); (1)
如果f(x)是定义在Rn上的严格凸函数,
当x1,x2…xk不全相等时,有
f t1x1+t2x2+…+tkxk<
t1f(x1)+t2f(x2)+…+tkf(xk)。(2)
特别的在式(1)、式(2)中令λi=ti1-tn+1,
ti=λiλ1+λ2+ … +λk,i=1,2,…,k,有
fλ1x1+λ2x2+…+λkxkλ1+λ2+…+λk≤

λ1f(x1)+λ2f(x2)+…+λkf(xk)
λ1+λ2+…+λk;(3)
这里f(x)是定义在Rn上的凸函数;如果f(x)
是定义在Rn上的严格凸函数,有
fλ1x1+λ2x2+…+λkxkλ1+λ2+…+λk<
λ1f(x1)+λ2f(x2)+…+λkf(xk)
λ1+λ2+…+λk。(4)
式(3)、式(4)则是推广的多元函数Jensen
不等式。
2 主要结论及其证明
利用凸函数的定义及其性质可以判别函数
的凸性,但是从例1中可以看到在实际应用的
过程中计算比较复杂,很不实用。下面进一步
研究凸函数的判别方法。
定理1 设f(x)是定义在非空开凸集D
Rn上的可微函数,则f(x)是凸函数的充分必
要条件是对于任意两点x1,x2∈D,都有
f(x2)≥f(x1)+gradf(x1)·x2-x1x2-x1;
f(x)是严格凸函数的充分必要条件是对
于任意两点x1,x2∈D且x1≠x2,都有
f(x2)>f(x1)+gradf(x1)·x2-x1x2-x1,
其中gradf(x1)表示f(x)在点x1处的梯度向
量,x2-x1表示x2-x1的模长。
证明 先证必要性。设f(x)是D上的凸
函数,由定义1,对任意的x1,x2∈D及t∈(0,
1),有
f tx2+(1-t)x1≤tf(x2)+(1-t)f(x1),
变形后得
f tx2+(1-t)x1-f(x1)
t≤
f(x2)-f(x1), (5)
令t※0+,式(5)左端得到f(x)在点x1处沿方
向l=x2-x1的方向导数[4],即
limt※0+f tx2+(1-t)x1-f(x1)t=
limt※0+fx1+t(x2-x1)-f(x1)t= f lx1,
则由式(5)得
f(x2)-f(x1)≥ f lx1=gradf(x1)x2-x1x2-x1

f(x2)≥f(x1)+gradf(x1)·x2-x1x2-x1。
再证充分性。对任意的x1,x2∈D,都有
f(x2)≥f(x1)+gradf(x1)·x2-x1x2-x1,
(6)
令y=tx2+(1-t)x1,t∈(0,1),显然y∈D,则
由式(6)有
f(x1)≥f(y)+gradf(y)·x1-yx1-y, (7)
f(x2)≥f(y)+gradf(y)·x2-yx2-y, (8)
用1-t乘式(7)两端,t乘式(8)两端,相加
可得
(1-t)f(x1)+tf(x2)≥f(y)+gradf(y)×
1-t
x1-y(x1-y)+tx2-y(x2-y)
令M=maxx1-y,x2-y,则
(1-t)f(x1)+tf(x2)≥f(y)+
gradf(y)·1-tM(x1-y)+tM(x2-y)=
f(y)+1Mgradf(y)·(1-t)(x1-y)+
t(x2-y) =f(y)=f tx2+(1-t)x1,
根据凸函数的定义可以得到f(x)为凸函
数。同理可以证明严格凸函数的情形。
定理2 设f(x)是定义在非空开凸集D
Rn的二次可微函数,则f(x)是凸函数的充分
必要条件是在任意点x∈D处f(x)的Hesse
矩阵Hf(x)半正定。
62北京石油化工学院学报2008年第16卷证明 先证必要性。设f(x)是D上的凸
函数。对任意的x*∈D及x∈Rn,因为D为开
集,则必存在δ>0,当t∈[-δ,δ]时,x*+tx∈
D,由定理1得
f(x*+tx)≥f(x*)+gradf(x*)·xx,
(9)
又f(x)在x*处二阶可微,根据Taylor公式有
f(x*+tx)=f(x*)+gradf(x*)×
x
x+12x2xTHf(x*)x+t2ox2,
(10)
由式(9)、式(10)可得
1
2x2xTHf(x*)x+t2ox2≥0,
令t※0,有
xTHf(x*)x≥0,
即f(x)的Hesse矩阵Hf(x)半正定。
再证充分性。设f(x)的Hesse矩阵
Hf(x)在任意点x∈D处半正定,则对任意
x*,x∈D,由中值定理有
f(x)=f(x*)+gradf(x*)·x-x*x-x*+
1
2x-x*2x-x*THf(ξ)(x-x*),
(11)
其中ξ=tx*+(1-t)x,t∈(0,1),因为D是凸
集,所以ξ

∈D,而Hf(ξ)半正定,则
x-x*THf(ξ)(x-x*)≥0,(12)
由式(11)、式(12)得
f(x)≥f(x*)+gradf(x*)·x-x*x-x*,
根据定理1,f(x)是D上的凸函数。
推论1 设f(x)是定义在非空开凸集D
Rn的二次可微函数,若f(x)的Hesse矩阵
Hf(x)在任意点x∈D处正定,则f(x)是严
格凸函数。
而对于二次函数f(x)=12xTAx+bTx,因
为Hf(x)=A,则有
推论2 二次函数f(x)=12xTAx+bTx
是严格凸函数的充分必要条件是f(x)的Hes-
se矩阵A正定。
凹函数也可以得到以上类似的结论。
3 应用举例
例2 函数f(x,y)=xe-x-y是R2上的严
格凹函数。
这里H(f)=-1x-1
x-1xe-x-y,因为它
的1阶顺序主子式-e-x-y、2阶顺序主子式
(-x2+x-1)e-x-y= -x-122+34e-x-y
在任意点x
y∈R2处都小于0。所以H(f)=
-1x-1
x-1xe-x-y在任意点xy∈R2处都是
负定的。函数f(x,y)=xe-x-y是R2上的严格
凹函数。
例3 二次函数f(x,y)=3x2+2y2-
4xy+x+y+1是R2上的严格凸函数。
因为
f(x,y)=
1
2x y6-4-4 4xy+1 1xy+1,
这里H(f)=6-4-4 4是正定矩阵,所以二
次函数f(x,y)=3x2+2y2-4xy+x+y+1是
R2上的严格凸函数。
参考文献
[1] 刘梦琼,陈上仿.多元凸函数的特征[J].湖南冶
金职业技术学院学报,2005,5(3):322-324.
[2] 杨定华.广义多元凸函数的判别条件[J].科学技
术与工程,2005,5(21):1581-1585.
[3] 李碧荣,李日光.多元凸函数的判别条件[J].哈
尔滨师范大学自然科学学报,2004,20(3):32-34.
[4] 同济大学应用数学系.高等数学[M].北京:高等
教育出版社,2002.
[5] Chen D R,You X.Minimax optimal rates of
convergence for multicategory classifications[J].
Acta Mathematica Sinica,2007,27(8):
1419-1126.
[6] Yuan P Zh,Chen H B.Two inequalities for con-
vex functions[J].Acta Mathematica Sinica,
2004,21(1):193-196.
63第4期游 煦.多元凸函数的性质及其应用The Properties and Applications of Convex
Function of Many Variables
You Xu
(DepartmentofMathematic&Physics,Beijing Institute of
Petro-chemical Technology,Beijing102617)
Abstract From the definition of convex function of many variables and the conclusion in refer-
ence[1,3],we can get some necessary and sufficient conditions for judging the convexity of func-
tion of many variables by directional derivative and limit.Furthermore,we obtain the method of
the determination of convex function of many variables by using the positive semi-definite of the
Hessian matrix of the functionf(x).At last,we derived the method of the determination of
strict convex quadratic functionf(x)=12xTAx+bTxwith the positive definite matrixA.
Key words convex function of many variables;gradient vector;hessian matrix;positive semi-
definite matrix;quadratic function
64北京石油化工学院学报2008年第16卷

相关主题
文本预览
相关文档 最新文档