实分析

17.2 多元微积分中的导数

摘录

  1. (从11nm在单变量微积分中,我们曾经给过一个函数f:ERx0E处微分的定义,即:f(x0):=limxx0;xE\{x0}f(x)f(x0)xx0基于我们以前的学习经历,我们也不妨从这个定义出发,尝试定义一个多变量函数f:ERm(其中ERn)在x0E处的导数为:f(x0):=limxx0;xE\{x0}f(x)f(x0)xx0但是在这里我们遇到了困难,我们很难去定义一个m维向量除以一个n维向量到底要怎么解释,因此我们需要转变思路,我们将fx0处的可微性看为fx0附近的“近似于线性性质”的描述,基于这个前提展开本节的内容。

定义

  1. (17.2.2 可微性)ERn的子集,f:ERm是一个函数,x0E是一个点,并设L:RnRm是一个线性变换。如果有:

    limxx0;xE\{x0}f(x)(f(x0)+L(xx0))xx0=0

    其中yy的长度(在l2度量下),即:

    (y1,y2,...,yn)=(i=1nyi2)1/2

    则我们称**fx0处是可微的**,并且导数为L

    (注:使用原始定义去计算导数太过麻烦(原书有个例子),之后会用更好的方式去计算;如同一元微积分一样,我们也可以将fx0处的导数记为f(x0)(这需要引理17.2.4去保证唯一性),于是f(x0)是满足f(x)f(x0)f(x0)(xx0)的线性变换(这也被称为牛顿近似,与命题10.1.7比较);有时候我们称ff全导数(为了和后面的偏导数与方向导数区分),并且全导数f导数矩阵Df有密切的联系,这个是下一节的内容了)


命题

  1. (17.2.2 可微性描述的改写?)ER的子集,f:ER是一个函数,且x0ELR。那么下面这两个命题是等价的:

    1. fx0处是可微的,并且f(x0)=L
    2. limxx0;xE\{x0}|f(x)(f(x0)+L(xx0))||xx0|=0

    (注:这个等价关系相当于给出了近似式f(x)f(x0)=L(xx0),这个定义看起来与微分差别不大,但是最注意到的是这个命题给出了不使用xx0作为除数,这样就规避了向量“除法”的问题。然后从这个等价定义出发,我们去思考找出如何有一个对应的L作用于n维向量xx0,使得m维向量f(x)f(x0)近似L(xx0)。从这个角度出发,我们不难想到L应该有一个线性变换的形式)

  2. (17.2.4 导数的唯一性)ERn的子集,f:ERm是一个函数,x0E是一个点,并设L1:RnRmL2:RnRm都是线性变换。如果fx0处可微,并且导数为L1的同时还有导数为L2,那么L1=L2

    (注:需要注意的是这里强调了x0是一个内点,这个结论在边界点上面并不一定,书里给了个很极端的单点集的例子)


课后习题

17.2.1 证明引理17.2.1

我们知道limxx0;xE\{x0}|f(x)(f(x0)+L(xx0))||xx0|=0即有:对任意的ε>0,存在δ>0使得对任意的xE\{x0}满足|xx0|δ都有:

|f(x)(f(x0)+L(xx0))||xx0|ε|f(x)(f(x0)+L(xx0))|ε|xx0|

而我们又注意到x=x0|f(x)(f(x0)+L(xx0))|ε|xx0|是显然成立的,与fε无关。因此我们可以得到等价关系有:limxx0;xE\{x0}|f(x)(f(x0)+L(xx0))||xx0|=0当且仅当对任意的ε>0,存在δ>0使得对任意的xE满足|xx0|δ都有|f(x)(f(x0)+L(xx0))|ε|xx0|。然后利用牛顿逼近法(命题10.1.7)我们就可以进一步得到这等价于fx0处的导数为L

17.2.2 证明引理17.2.4(提示:利用反证法。如果L1L2,那么存在一个向量v使得L1vL2v,并且这个向量一定不是零向量。(为什么?)然后再利用导数的定义,专门考察x=x0+tv(其中t时一个标量)时的情景来导出矛盾)

使用反证法,若L1L2,那么至少存在一个vRn使得L1vL2v。特别地,我们可以假定这个v不是零向量,这是因为:

由于L1,L2都是线性变换,若v是零向量,且对任意其它的vRn都有L1v=L2v。则我们任取v0Rn,根据线性变换的性质有:

L1v0=L1(v0+v)=L1v0+L1vL2v0+L2v=L2(v0+v)=L2v0

导出了矛盾,因此除了零向量以外至少存在一个vRn满足L1vL2v

于是回到可微的定义。根据命题14.1.5,我们特别考虑收敛于x0的点列xn:=x0+cnv(其中n1c是一个足够小的正常数满足点列xn包含于E,由于x0是内点因此c是存在的),则由于L1,L2都是导数应当有极限:

limnf(xn)(f(x0)+L1(xnx0))xnx0=limnf(xn)(f(x0)+L2(xnx0))xnx0=0

也即:

limnf(x0+cnv)f(x0)cnL1vcnv=limnf(x0+cnv)f(x0)cnL2vcnv=0

再结合到v是一个确定的向量,c是一个常数,运用极限定律,我们可以化简为:

limnnf(x0+cnv)nf(x0)cL1v=limnnf(x0+cnv)nf(x0)cL2v=0

从而利用三角不等式,我们有:

cL1vcL2vcL1vnf(x0+cnv)+nf(x0)+nf(x0+cnv)nf(x0)cL2vL1vL2v=0

这与L1vL2v导出了矛盾,于是反证结束,反证假设不成立,只能有L1=L2

17.2.3 设ERn的子集,f:ERm是一个函数,x0E的一个内点,并设f1,...,fn:ERmf的分量函数(即f=(f1,...,fm)。证明:f是在x0处可微的当且仅当所有的分量函数f1,...,fm都是在x0处可微的

注:本题来自第四版勘误表,详情请参考Analysis II:Errata


分别证明充分必要性。

fx0处可微,那么存在一个线性变换L:RnRm满足:对任意的ε>0,存在δ>0使得对任意的xE{x0}满足xx0<δ有:

f(x)(f(x0)+L(xx0))xx0<ε

若我们设L(x)=(L1(x),...,Lm(x)),则我们可以注意到对任意的1im有:

|fi(x)(fi(x0)+Li(xx0))|f(x)(f(x0)+L(xx0))

一个需要注意的事实:

f(x)(f(x0)+L(xx0))=(f1(x)(f1(x0)+L1(xx0))fm(x)(fm(x0)+Lm(xx0)))T

这个事实给出了上面的不等式,并且在下面也会用到。(太长了请原谅我写成列向量的转置)

并且还可以注意到Li显然是一个线性映射,因此这表明了:

存在线性映射Li:ER,对任意的ε>0,存在δ>0使得对任意的xE{x0}满足xx0<δ有:

|fi(x)(fi(x0)+Li(xx0))|xx0<ε

f1,...,fmx0处都是可微的。

反过来,若f1,...,fm均在x0处可微,我们分别设它们在x0处的全导数为L1,...,Lm。于是我们令L(x):=(L1(x),...,Lm(x)),显然L也是一个线性映射。于是对任意的ε>0,分别存在δ1,...,δm>0使得对任意的1im有:

|fi(x)(fi(x0)+Li(xx0))|xx0<εm

此时取δ:=min{δi:1im},从而对任意的我们有:

f(x)(f(x0)+L(xx0))xx0i=1m|fi(x)(fi(x0)+Li(xx0))|xx0<ε

综上即:

存在一个线性变换L:RnRm,对任意的ε>0,存在δ>0使得对任意的xE{x0}满足xx0<δ有:

f(x)(f(x0)+L(xx0))xx0<ε

fx0处可微的。

综上,于是结论得证。


本节相关跳转

实分析 10.1 基本定义

实分析 17.3 偏导数和方向导数