实分析

17.3 偏导数和方向导数

摘录

  1. (梯度与导数矩阵)根据定理17.3.8和引理17.3.5,我们可以知道若有函数f:ERm在某个集合F上的偏导数存在且连续,那么在F中的任意一个内点x0处,全体方向导数都存在且有公式:D(v1,...,vn)f(x0)=j=1nvj\partf\partxj(x0)​ 特别地,如果f:ER是一个实值函数,并且定义fx0处的梯度f(x0)n维行向量为f(x0):=(\partf\partx1(x0),...,\partf\partxn(x0))。那么只要x0是某个梯度存在且连续的内点,我们就有公式:Dvf(x0)=vf(x0)​ 更一般地,如果f:ERm是一个函数,其中f=(f1,...,fm),而F是满足f的偏导数存在且连续的E的子集,x0F的内点,那么根据定理17.3.8我们有:f(x0)(vj)1jn=j=1nvj\partf\partxj(x0)=(j=1nvj\partfi\partxj(x0))i=1m​ 考虑到f(x0)是一个线性映射,于是上面的式子可以改写为:LDf(x0)(vj)1jn其中Df(x0)是如下所示的m×n矩阵:Df(x0):=(\partfi\partxj(x0))1im;1jn=(\partf1\partx1(x0)\partf1\partx2(x0)\partf1\partxn(x0)\partf2\partx1(x0)\partf2\partx2(x0)\partf2\partxn(x0)\partfm\partx1(x0)\partfm\partx2(x0)\partfm\partxn(x0))​ 也即:(Dvf(x0))T=(f(x0)v)T=Df(x0)vT​ 矩阵Df(x0)有时也被称为fx0处的导数矩阵或者微分矩阵。考虑到梯度的定义,我们同样可以把Df写成:Df(x0)=(\partf\partx1(x0)T,\partf\partx2(x0)T,,\partf\partxn(x0)T)=(f1(x0)f2(x0)fm(x0))​ 如果特别考虑f是一个实值函数的情景,那么Df就是f

定义

  1. (17.3.1 方向导数)ERn的子集,f:ERm是一个函数,x0E的内点,并设vRn中的向量。如果极限

    limt0;t>0,x0+tvEf(x0+tv)f(x0)t

    存在,那么我们称**fx0处沿方向v可微**,并将上述极限记作Dvf(x0)

    Dvf(x0):=limt0;t>0f(x0+tv)f(x0)t

    (注:应当将这个概念与可微的定义做比较,由于方向导数的除数是标量因此我们可以直接通过极限去定义它;我们不在边界给出定义,但是如果只是为了定义“朝里”方向上的方向导数,那么也可以在边界上给出方向导数的定义)

  2. (17.3.7 偏导数)ERn的子集,f:ERm是一个函数,x0E的内点,并设1jn。如果极限

    limt0;t0,x0+tejEf(x0+tej)f(x0)t

    存在,那么我们定义fx0处关于变量xj的偏导数\partf\partxj(x0)为:

    \partf\partxj(x0):=limt0;t0,x0+tejEf(x0+tej)f(x0)t=ddtf(x0+tej)|t=0

    (注:偏导数即将函数视为xj的单变量函数然后求导;如果我们将f写为f=(f1,...,fm),那么显然有\partf\partxj(x0)=(\partf1\partxj(x0),...,\partfm\partxj(x0));注意区分偏导数与方向导数,这点我们会在习题17.3.2中讨论)


命题

  1. (17.3.5 全导数与方向导数?)ERn的子集,f:ERm是一个函数,x0E的内点,并设vRn中的向量。如果fx0处可微,那么fx0处沿方向v也可微,并且

    Dvf(x0)=f(x0)v

    (注:这个命题说明了全可微性蕴含了方向可微性,但是反过来这个命题并不成立)

  2. (17.3.8 偏导数与全导数?)ERn的子集,f:ERm是一个函数,FE的子集,并设x0F的内点。如果fF上的全体偏导数\partf\partxj都存在,并且它们在x0处也都是连续的,那么fx0处是可微的,并且线性变换f(x0):RnRm定义有

    f(x0)(vj)1jn=j=1nvj\partf\partxj(x0)

    (注:这给出了另一种确定全导数的方法)


课后习题

17.3.1 证明引理17.3.5(这与习题17.2.2类似)

fx0处可微,那么存在线性映射L使得极限

limxx0;xE\{x0}f(x)(f(x0)+L(xx0))xx0=0

换言之也即对任意的ε>0,存在δ>0使得对任意的xB(x0,δ)\{x0}都有:

f(x)(f(x0)+L(xx0))xx0<ε

于是考虑任意的vRn,对任意的ε>0,根据上面的结论我们知道存在一个δ>0使得对任意的xB(x0,δ)\{x0}都有:

f(x)(f(x0)+L(xx0))xx0<εv

特别地,我们考察满足x=x0+tv(其中t>0)的xB(x0,δ)\{x0}(于是显然有t<δv)。于是上面的式子可以改写为:

f(x0+tv)f(x0)L(tv)tv<εvf(x0+tv)f(x0)tLv<ε

换言之即:对任意的ε>0,存在δv>0使得对任意的t满足t>0|t|<δv

f(x0+tv)f(x0)tLv<ε

从而根据收敛的定义,即有Dvf(x0)=limt0;t>0,x0+tvEf(x0+tv)f(x0)t=Lv,考虑到L就是f(x0),于是引理17.3.5得证。

17.3.2 设ERn的子集,f:ERm是一个函数,x0E的内点,并设1jn。证明:\partf\partxj(x0)存在当且仅当Dejf(x0)Dejf(x0)都存在且互为相反数(也即Dejf(x0)=Dejf(x0),据此进一步得到\partf\partxj(x0)=Dejf(x0)

分别证明充分必要性。


\partf\partxj(x0)存在(我们简记为L),则根据极限的定义即对任意的ε>0,存在δ>0使得对任意的t(δ,0)(0,δ)都有:

f(x0+tej)f(x0)tL<ε

从而对任意的z(0,δ),我们有:

{f(x0+zej)f(x0)zL<εz(0,δ)f(x0+(z)ej)f(x0)(z)L<εz(δ,0)

特别地,由于对第二个式子化简,我们有:

f(x0+z(ej))f(x0)z(L)<ε

于是第一第二个式子分别对应了极限limt0;t>0f(x0+tej)f(x0)t=Llimt0;t>0f(x0+t(ej))f(x0)t=L,即Dejf(x0)Dejf(x0)都存在且互为相反数,从而必要性得证。


Dejf(x0)Dejf(x0)都存在且互为相反数(我们分别记为LL),于是即对任意的ε>0,分别存在δ1,δ2>0使得:

{t(0,δ1),f(x0+tej)f(x0)tL<εt(0,δ2),f(x0+t(ej))f(x0)t(L)<ε

于是我们令δ:=min(δ1,δ2),从而对任意的t(δ,0)(0,δ),我们有:

{ift(0,δ)t(0,δ1),f(x0+tej)f(x0)zL<εift(δ,0)t(0,δ2),f(x0+(t)(ej))f(x0)(t)(L)<ε

再化简第二行的式子,有:

{ift(0,δ)t(0,δ1),f(x0+tej)f(x0)zL<εift(δ,0)t(0,δ2),f(x0+tej)f(x0)tL<ε

从而根据极限的定义我们有limt0;t0,x0+tejEf(x0+tej)f(x0)t=L,于是结论得证。


综上,于是题目结论得证。

17.3.3 设f:R2R是具有如下定义的函数:当(x,y)(0,0)时,f(x,y):=x3x2+y2;当(x,y)=(0,0)时,f(x,y):=0。证明:f(00)处不可微,尽管f(0,0)处沿着任何方向vR2都可微。解释为什么这不与定理17.3.8相矛盾

不妨使用反证法去证明f(00)处不可微。我们设f是在(0,0)处可微的且导数为L:R2R,从而对任意的ε>0,都存在δ>0使得当(x,y)0R2满足(x,y)0<δ(也就是x2+y2<δ2)的时候都有:

f(x,y)(f(0,0)+L((x,y)(0,0)))(x,y)(0,0)<ε|x3x2+y2L(x,y)|x2+y2<ε

特别地,由于L是一个线性变换,因此存在一个1×2矩阵A=(ab)使得:

L(x,y)=(ab)(xy)=ax+by

于是我们的反证假设即存在两个实数a,b使得对任意的ε>0,存在δ>0使得:

(1)|x3x2+y2axby|x2+y2<ε

对所有的满足x2+y2<δ(x,y)成立。假如b是一个非零实数,则我们考虑ε=|b|/2的情况,此时考虑点(0,δ/2)代入(1)式:

|bδ/2|δ/2=|b|>|b|/2

与“对所有的满足x2+y2<δ(x,y)成立(1)式”的假设矛盾,因此b只能是0。然后类似地假如a是一个非零实数,则我们考虑ε=|1a|/2的情况,在上面b=0的前提下将点(δ/2,0)代入(1)式:

|δ/2aδ/2||δ/2|=|1a|>|1a|/2

同样与“对所有的满足x2+y2<δ(x,y)成立(1)式”的假设矛盾,因此a同样也只能是0。但是如果a,b都为0也会导出矛盾,这是因为:

对任意的0<ε<1,我们单独考察所有形如(σ,0)的点,代入(1)式有:

(2)f(x,y)(f(0,0)+L((x,y)(0,0)))(x,y)(0,0)=|σ|σ2=1>ε

这和导数定义要求的“对任意ε>0,都存在δ>0使得对任意的(x,y)满足(x,y)(0,0)<δ都有(2)式小于ε”矛盾(因为无论δ多小你总是能找到小于δσ)。


另一方面,f(0,0)处沿着任何方向vR2都可微。设v:=(a,b),根据方向导数的定义我们有:

D(a,b)f(0,0)=limt0;t>0t3a3t2a2+t2b2t=a3a2+b2

因此f是在(0,0)处沿着任意方向可微的。

(事实上也可以先证明这一点再利用引理17.3.5来证明f(0,0)不是全可微的,这里仅提供思路)

之所以不与定理17.3.8矛盾,是因为f(0,0)处关于变量x,y的偏导存在但是不连续,这一点可以尝试从方向(a,2a)逼近(0,0)取计算得到:

lima0\partf\partx(a,2a)=13251lima0\partf\party(a,2a)=4250

因此f不是符合定理17.3.8要求的函数,自然也不能应用定理17.3.8。

17.3.4 设f:RnRm是一个可微函数,并且对于所有的xRn都有f(x)=0。证明:f是一个常值函数(提示:你可能会用到一元函数的平均值定理(推论10.2.9)或者微积分基本定理。但是需要注意这些定理并不能对多元函数进行直接类比,不建议使用第一性原理来解题);另一个更难的挑战是,尝试将定义域Rn换成Rn的一个连通开子集Ω后再证明这个命题

(思路不是本人想的, 转述别人的证明)

我们直接来证明对Rn的一个连通开子集Ω的结论,对于Rn也是通用的。为了完成这个证明,我们需要完成两个部分结论的证明:

我们设f具有f(x)=(f1(x),...,fm(x))的形式。

结论1:设a,bΩ,若对任意的t[0,1]都有a+t(ba)Ω,则有f(a)=f(b)

证明:

对任意的1im,我们定义函数g:[0,1]R有:

g(t):=fi(a+t(ba))

注意到对任意的t0(0,1)有:

g(t0)=limt0f(a+(t+t0)(ba))f(a+t(ba))t

由方向导数定义此极限的左极限为Dbaf(a+t0(ba)),右极限为Dabf(a+t0(ba))。而由于f(a+t0(ba))=0,因此根据引理17.3.5我们有Dbaf(a+t0(ba))=Dabf(a+t0(ba))=0,也即gt0处可微且导数为0

此时根据平均值定理我们有:

0=g(0)g(1)01fi(a)=fi(b)

由于i是任意的因此这也表明了有f(a)=f(b),结论得证。

对任意的a,bΩ,若对任意的t[0,1]都有a+t(ba)Ω,则我们称a,b之间存在直线道路;若存在Ω中的有限点列(pi)i=0l满足p0=apl=b且对任意的1il都有pi1,pi之间存在直线道路,则我们称两个点a,bΩ之间存在有限折线道路,并记为ab

由于我们已经证明了结论1,因此不难发现通过归纳法我们可以得证对任意的a,bΩ若有ab则有f(a)=f(b)。由于Ω是非空的因此我们设x0Ω,然后定义集合Γ为:

Γ:={pΩ:px0}

首先Γ必然是非空的(x0Γ),其次对任意的pΓ由于px0因此有f(x0)=f(p),最后我们显然可以证明是一个等价关系(所以它满足自反性,对称性,传递性公理)。为了证明f是一个常值函数,我们希望能够证明Γ=Ω,于是尝试证明结论2。

结论2:Γ是是Ω的一个又开又闭的子集。

证明:

先证明Γ是一个开集,于是我们需要证明对任意的pΓ存在r>0使得B(p,r)Γ

首先由于Ω是一个开集,因此存在一个r>0使得B(p,r)Ω。此时对任意的qB(p,r),我们可以注意到显然p,q之间存在直线道路,进而有pq,从而根据的传递性我们有qx0qΓ,从而有B(p,r)Γ

然后证明Γ是一个闭集,于是我们需要证明对任意的(pi)i=0Γ中的收敛点列(设其收敛于p),都有pΓ

一方面,由于Ω是一个开集,因此存在一个r>0使得B(p,r)Ω;另一方面,因为点列(pi)i=0收敛因此存在N0使得对任意的iN都有pip<r。于是我们有pNB(p,r),类似于开集证明中的讨论我们知道有pNp,同理利用传递性公理我们有px0pΓ

综上,于是结论得证。

由于Γ是非空的又开又闭集,若ΓΩ则根据不连通集的定义可以得到Ω是不连通的,这和Ω是连通开集的前提矛盾,因此只能有Γ=Ω。再结合上面的讨论于是我们证明了“对任意的pΩf(x0)=f(p)”,也即f是一个常值函数,题目结论得证。


题外话:这里其实也证明了Rn的任意一个连通开子集Ω都是道路连通的(两点之前存在有限折线道路那么我们很容易分段列出它们之间的道路函数)


本节相关跳转

实分析 10.2 局部最大值、局部最小值以及导数

实分析 11.9 微积分的两个基本定理

实分析 17.2 多元微积分中的导数