返回

考研数学(微积分)(下)

  part Ⅱ主要内容为 不等式常微分方程 (ODE)级数理论多元函数微积分,包括工具定理、计算方法与部分证明,以例题辅助解释。


常用常数

任何正数的任意根次之值$\sqrt[k]{a}=x_0\Leftrightarrow f(x_0)=x^k_0-a=0$都可以用牛顿-辛普森优化算法计算:$x_{n+1}=x_n-\frac{f(x_n)}{f'(x_n)}=\frac1k\left((k-1)x_n+\frac a{x^{k-1}_n}\right)$,特别的对于二次根式$\sqrt{a}=x$有$x_{n+1}=\frac12\left(x_n+\frac a{x_n}\right)$;非多项式函数不方便笔算,也可以类似地考虑切线法、不动点法等其他优化算法计算其数值解(要是有计算机,利用已有的库现写一个BFGS算法也不是难事)。不过简便起见,本文提供一些常见的常数以供查阅,略去计算的步骤。

  • $\pi\approx3.141593$;
展开/收起 π 的一些极限/级数式$$ \pi=\lim\limits_{\,n\to\infty}n\sin\frac{180\degree}{n} $$$$ \pi=\lim\limits_{n\to\infty}2^n\underbrace{\sqrt{2-\sqrt{2+\sqrt{2+\sqrt{2+\cdots+\sqrt2}}}}}_{n-1\text{ squre roots}} $$Pi1 Pi2
  • $e=\lim\limits_{n\to\infty}\left(1+\frac1n\right)^n\approx2.718282$;

  • $\gamma=\lim\limits_{n\to\infty}\left(\sum\limits^n_{k=1}\frac1k-\ln n\right)=\lim\limits_{n\to\infty}\left(\displaystyle{\int^1_0\frac{1-x^n}{1-x}\mathrm{d}x-\ln n}\right)\approx0.577216$;

  • $\pi^2\approx8.824978$;

  • $e^2=7.389056$;

  • $\sqrt2\approx1.414214$;

  • $\sqrt{e}=1.648721$;

  • $\sqrt3\approx1.732051$;

  • $\sqrt{\pi}=\displaystyle{\int_{\mathbb{R}}e^{-x^2}\mathrm{d}x=2\,\Gamma\big(\frac12\big)\approx1.772454}$;

  • $\sqrt5\approx2.236068$;

  • $\sqrt7\approx2.645751$;

  • $\sqrt{11}\approx3.316625$;

  • $\sqrt{13}\approx3.605551$;

  • $\ln2\approx0.693147$;

  • $\ln3\approx1.098612$;

  • $\ln5\approx1.609438$;

  • $\ln7\approx1.945910$;

不等式综述

不等式在分析学中是极其重要的,某种意义上,数学分析和实分析是玩弄不等式的艺术。

多元不等式

多元不等式更“普适”、更“普通”,例如柯西不等式和$x>0$时$\sin x\lt x$的区别。

排序不等式

$$ \text{倒序和 }\leqslant\text{ 乱序和 }\leqslant\text{ 顺序和} $$

设长度为$n$的有限数列$\{a_i\}$与$\{b_i\}$单调递增,即$a_1\leqslant a_2\leqslant\cdots\leqslant a_n$、$b_1\leqslant b_2\leqslant\cdots\leqslant b_n$,则

$$ \sum^n_{i=1}a_ib_{n-i+1}\leqslant\sum^n_{i=1}a_ib_{k_i}\leqslant\sum^n_{i=1}a_ib_i $$

其中$\{b_{k_i}\}$是$\{b_i\}$中元素的任意乱序排列。

排序不等式的证明(配合Abel变换)

切比雪夫的和不等式

切比雪夫不等式的离散形式是排序不等式的推广。

离散形式:设$a_1\leqslant a_2\leqslant\cdots\leqslant a_n$、$b_1\leqslant b_2\leqslant\cdots\leqslant b_n$,则

$$ n\left(\sum^n_{i=1}a_ib_i\right)\geqslant\left(\sum^n_{i=1}a_i\right)\left(\sum^n_{i=1}b_i\right) $$$$ \text{当且仅当}a_1=a_2=\cdots=a_n\text{且}b_1=b_2=\cdots=b_n\text{时取等} $$

积分形式:$f,g$在$[a,b]$上连续、单调且单调性相同,则

$$ \frac1{b-a}\int^b_af(x)g(x)\mathrm{d}x\geqslant\left(\frac1{b-a}\int^b_af(x)\mathrm{d}x\right)\left(\frac1{b-a}\int^b_ag(x)\mathrm{d}x\right) $$$$ \text{当且仅当}f\text{和}f\text{都为常数时取等} $$$$ ^{\ast}\ \text{如果}f\text{和}g\text{一个不增一个不减,则不等式反向后式子仍成立} $$

切比雪夫不等式还算直观,其离散形式构造$(a_ib_j)$矩阵再利用排序不等式即可得到;积分形式可以通过积分定义得到——直接从离散切比雪夫不等式入手、取极限得黎曼和直接导出其积分形式,也可以利用二重积分证明,构造$\displaystyle{\iint\limits_D\big[f(x)-f(y)\big]\big[g(x)-g(y)\big]\mathrm{d}\sigma}$,将其化为累次积分后证明式子大于等于$0$即可。

积分形式的推广:设$p(x)\geqslant0$且在$[a,b]$上可积,$f,g$在$[a,b]$上单调且单调性相同,则

$$ \int^b_ap(x)\mathrm{d}x\cdot\int^b_ap(x)f(x)g(x)\mathrm{d}x\geqslant\int^b_ap(x)f(x)\mathrm{d}x\cdot\int^b_ap(x)g(x)\mathrm{d}x $$

推广形式的证明可以参考:切比雪夫不等式(积分型)

基本不等式

  • $\forall a,b\in\mathbb{R},\ \ a^2+b^2\geqslant2ab$;
  • $\forall a,b,c\geqslant0,\ \ a^3+b^3+c^3\geqslant3abc$.

基本不等式可以被认为是下述均值不等式的特例,因为$a^3+b^3+c^3\geqslant3abc$可以被等价地转写为$\frac{a+b+c}{3}\geqslant\sqrt[3]{abc}$。

离散均值不等式

$$ H_n\text{ 调和平均数}\leqslant G_n\text{ 几何平均数}\leqslant A_n\text{ 算术平均数}\leqslant S_n\text{ 平方平均数(均方根)} $$

即对于非负数列$\{x_i\}$:

$$ \frac{n}{\sum\limits^n_{i=1}\frac{1}{x_i}}\leqslant\sqrt[n]{\prod\limits^n_{i=1}x_i}\leqslant\frac{\sum\limits^n_{i=1}x_i}{n}\leqslant\sqrt{\frac{\sum\limits^n_{i=1}x^2_i}{n}}=RMSE(\boldsymbol{x}) $$

当且仅当$x_1=x_2=\cdots=x_n$时等号成立。

如果当$n\to\infty$时各式极限均存在,则不等式仍成立。

积分均值不等式

$$ \frac{b-a}{\displaystyle{\int^b_a\frac1{f(x)}\mathrm{d}x}}\leqslant\exp{\frac{\displaystyle{\int^b_a\ln f(x)\mathrm{d}x}}{b-a}}\leqslant\frac{\displaystyle{\int^b_af(x)\mathrm{d}x}}{b-a}\leqslant\sqrt{\frac{\displaystyle{\int^b_af^2(x)\mathrm{d}x}}{b-a}} $$

从左到右,不等式中的四式分别被称为积分调和平均数 ($H^b_a$)、积分几何平均数 ($G^b_a$)、积分算术平均数 ($A^b_a$) 和积分平方平均数 ($S^b_a$),因此可以简记为:

$$ H^b_a\leqslant G^b_a\leqslant A^b_a\leqslant S^b_a $$

对数平均值不等式

$$ G_n\text{ 几何平均数}\leqslant\text{ 对数平均值 }\leqslant A_n\text{ 算术平均数} $$

当$a,b>0$且$a\neq b$时。

$$ \sqrt{ab}\leqslant\frac{a-b}{\ln a-\ln b}\leqslant\frac{a+b}{2} $$

Schur不等式

设$a,b,c>0$,则$\forall r\in\mathbb{R}$,有

$$ a^r(a-b)(a-c)+b^r(b-a)(b-c)+c^r(c-a)(c-b)\geqslant0 $$

当且仅当$a=b=c$时等号成立。

伯努利不等式

如果$\{x_i\}^n_{i=1}$同号且均大于$-1$,则有

$$ (1+x_1)(1+x_2)\cdots(1+x_n)\geqslant1+x_1+x_2+\cdots+x_n $$

当且仅当$n=1$时取等;特别地,当$x_1=x_2=\cdots=x_n=x$时,有:

$$ (1+x)^n\geqslant1+nx $$

三角不等式

三角不等式在度量空间中有重要作用。

$$ \big||a|-|b|\big|\leqslant|a\pm b|\leqslant|a|+|b| $$

当且仅当$a$与$b$线性相关时取等;该不等式对任意实数、负数与向量均成立。在内积空间中,其形式为$\Vert x+y\Vert\leqslant\Vert x\Vert+\Vert y\Vert$,但是在一般的赋范线性空间上不一定成立,若赋范线性空间一致凸则成立。

琴生不等式

琴生不等式(Jensen’s inequality)描述了一个由于凸函数的凸性而导致的不等式,于1906年被丹麦数学家Johan Jensen证明。首先要说明的是,(下) 凸函数本身有多种等价定义,例如在区间$I$上函数$f$有定义时,若:

$$ \forall x_1,x_2\in I\ and\ \lambda\in(0,1),\ \,f\big(\lambda x_1+(1-\lambda)x_2\big)\geqslant\lambda f(x_1)+(1-\lambda)f(x_2) $$

则称$f(x)$是一个(下)凸函数;该定义推广至多元函数$f:\mathbb{R}^n\to\mathbb{R}$时,要求$I$是凸集,其余条件不变;上述不等式的等号对于严格凸函数只在$x=y$时才取到。二阶导数存在的(下)凸函数,其二阶导数是大于等于$0$的。

对于区间$I$上的(下)凸函数,有琴生不等式:

$$ f\left(\frac{x_1+x_2+\cdots+x_n}{n}\right)\geqslant\frac{f(x_1)+f(x_2)+\cdots+f(x_n)}{n} $$

如果函数在$I$上是凹的(或称上凸),则琴生不等式不等号反向后成立;当且仅当$x_1=x_2=\cdots=x_n$时取等。

柯西不等式

柯西不等式(Cauchy-Buniakowsky-Schwarz inequality)有多种形式,从离散实数和、积分到测度论、泛函分析,都有他的身影,实在是贯彻了数学的许多分支、方向。

实数空间里,柯西不等式的离散形式与积分形式分别为:

$$ \boxed{\sum^n_{i=1}a^2_i\sum^n_{i=1}b^2_i\geqslant\left(\sum^n_{i=1}\big|a_ib_i\big|\right)^2}\geqslant\left(\sum^n_{i=1}a_ib_i\right)^2 $$$$ \text{在}l^2\text{空间中:}\Vert\boldsymbol{a}\Vert_2\cdot\Vert\boldsymbol{b}\Vert_2\geqslant\vert\boldsymbol{ab}^T\vert $$$$ \text{当}\frac{a_1}{b_1}=\frac{a_2}{b_2}=\cdots=\frac{a_n}{b_n}\text{或}\{a_i\}\text{、}\{b_i\}\text{中有一列全为}0\text{时取等} $$

$$ \boxed{\int_{\mathbb{R}}f^2(x)\mathrm{d}x\int_{\mathbb{R}}g^2(x)\mathrm{d}x\geqslant\left(\int_{\mathbb{R}}\big|f(x)g(x)\big|\mathrm{d}x\right)^2}\geqslant\left(\int_{\mathbb{R}}f(x)g(x)\mathrm{d}x\right)^2 $$$$ \text{在}L^2\text{空间中:}\Vert f\Vert_2\cdot\Vert g\Vert_2\geqslant\Vert fg\Vert_1 $$$$ \text{当}f(x)=k\cdot g(x)\ \;a.e.\text{或}f\text{与}g\text{中有一个几乎处处为}0\text{时取等} $$

其实$\sum\limits^n_{i=1}a^2_i\sum\limits^n_{i=1}b^2_i\geqslant\left(\sum\limits^n_{i=1}\big|a_ib_i\big|\right)^2$与$\sum\limits^n_{i=1}a^2_i\sum\limits^n_{i=1}b^2_i\geqslant\left(\sum\limits^n_{i=1}a_ib_i\right)^2$是等价的,因为始终可以认为$a^2_i$是一个正数的平方——尽管$a_i$可以取任何数,他完全可以是一个负数。所以,由前者可以推出后者,由后者也可以推出前者,但简洁起见,通常还是后者的形式更为人熟知。

应当注意,在离散形式中,将$a_i$替换为$|a_i|^2$、$b_i$替换为$|b_i|^2$后,不等式在复数域同样成立;此外,有限数$n$还可以推广到$\infty$的情况。顺便一提,柯西不等式还在许多领域以各种各样的形式出现:

  • 解析几何:$|\boldsymbol{a}|\cdot|\boldsymbol{b}|\geqslant|\boldsymbol{a}||\boldsymbol{b}|\cos\theta=\boldsymbol{a}\cdot\boldsymbol{b}^T$,当向量$\boldsymbol{\alpha}$与$\boldsymbol{\beta}$线性相关取等;

  • $\mathbb{R}^n$中:$|\boldsymbol{\alpha}|^2\cdot|\boldsymbol{\beta}|^2\geqslant|\boldsymbol{\alpha}\cdot\boldsymbol{\beta}|^2$,当向量$\boldsymbol{\alpha}$与$\boldsymbol{\beta}$线性相关取等;

  • 概率空间中:$\mathbb{E}(X^2)\cdot\mathbb{E}(Y^2)\geqslant\left[\mathbb{E}(XY)\right]^2$,要求随机变量$X$与$Y$的二阶矩存在、$\mathbb{E}(XY)$存在,当$P(X=kY)=1$或$P(X=0)=1$与$P(Y=0)=1$成立其一时取等;

  • 对于正定矩阵$\boldsymbol{A}$:$\boldsymbol{xAx}^T\cdot\boldsymbol{yAy^T}\geqslant(\boldsymbol{xAy}^T)^2$;

离散形式的柯西不等式证明法里,除了用数学归纳法完成,最直接、最直观的办法应该是构造二次函数。记

$$ f(x)=\left(\sum^n_{i=1}a^2_i\right)x^2+\left(2\sum^n_{i=1}a_ib_i\right)x+\left(\sum^n_{i=1}b^2_i\right)=\sum^n_{i=1}(a_ix+b_i)^2\geqslant0 $$

由于有$f(x)=\sum\limits^n_{i=1}(a_ix+b_i)^2\geqslant0$,所以针对二次函数$f(x)$有$\Delta=\left(2\sum\limits^n_{i=1}a_ib_i\right)^2-4\cdot\left(\sum\limits^n_{i=1}a^2_i\right)\left(\sum\limits^n_{i=1}b^2_i\right)\leqslant0$,这就是柯西不等式的离散形式,当且仅当$\Delta=0$,即当$\frac{a_1}{b_1}=\frac{a_2}{b_2}=\cdots=\frac{a_n}{b_n}$或$\{a_i\},\{b_i\}$中有一列全为$0$时取等。

连续形式的柯西不等式也可以按如上过程证明,取

$$ \begin{align}F(t)&=\left(\int^b_ag^2(x)\mathrm{d}x\right)t^2+\left(2\int^b_af(x)g(x)\mathrm{d}x\right)t+\left(\int^b_af^2(x)\mathrm{d}x\right)\\&=\int^b_a\big[f(x)+tg(x)\big]^2\mathrm{d}x\geqslant0\end{align} $$

剩余的步骤同上。

柯西不等式有非常之多的证明方法,例如还可以利用二重积分、通过构造函数和依据定积分定义等进行证明,这里不再一一陈述。

Young不等式

设$1\lt p<\infty$、$1\lt q<\infty$且$\frac{1}{p}+\frac{1}{q}=1$,则对非负实数$a,b$,有$ab\leqslant\frac{a^p}{p}+\frac{b^q}{q}$。

Young不等式能通过$e^x$的凸性简单证明:$ab=e^{\ln a+\ln b}=e^{\frac{1}{p}\log a^p+\frac{1}{q}\log b^q}\leqslant\frac{e^{\log a^p}}{p}+\frac{e^{\log b^q}}{q}=\frac{a^p}{p}+\frac{b^q}{q}$。

还可以利用拉格朗日乘子法证明,由于证Young不等式等价于证$ab$在条件$\frac{a^p}{p}+\frac{b^q}{q}=k>0$下最大值为$k$,故构造拉格朗日函数$L(a,b,\lambda)=ab+\lambda\left(\frac{a^p}{p}+\frac{b^q}{q}-k\right)$,然后令$L$对各个自变量的偏导为$0$,得到方程组

$$ \left\{\begin{aligned} &\nabla_aL=b+\lambda a^{p-1}=0\\ &\nabla_bL=a+\lambda b^{p-1}=0\\ &\nabla_{\lambda}L=\frac{a^p}{p}+\frac{b^q}{q}-k=0\end{aligned}\right. $$

由方程组解得$L$有唯一驻点$(k^{\frac1p},k^{\frac1q},-1)$,于是易见该点为极大值 (最大值) 点,因此$ab\leqslant k^{\frac1p}k^{\frac1q}=k=\frac{a^p}{p}+\frac{b^q}{q}$,证毕。

Young不等式在卷积中亦有体现,卷积形式的Young不等式常见的证明是利用Hölder不等式进行的。设$f\in L^1(\mathbb{R}^n)$,$g\in L^p(\mathbb{R}^n)$($1\lt p<+\infty$),则

$$ \Vert f\ast g\Vert_p\leqslant\Vert f\Vert_1\cdot\Vert g\Vert_p $$

Hölder不等式

Hölder不等式可以视为柯西不等式的推广,在泛函分析中有重要意义;通常将Young不等式作为证明Hölder不等式的引理。

当$1\leqslant p\leqslant+\infty$、$1\leqslant q\leqslant+\infty$且$\frac{1}{p}+\frac{1}{q}=1$(称为Hölder共轭),若$f\in L^p(\mu)$、$g\in L^q(\mu)$,则$f\cdot g\in L^1(\mu)$,且:

$$ \Vert fg\Vert_1\leqslant\Vert f\Vert_p\cdot\Vert g\Vert_q $$

离散形式:

$$ \sum^n_{i=1}\big|a_ib_i\big|\leqslant\left(\sum^n_{i=1}|a_i|^p\right)^{\frac{1}{p}}\cdot\left(\sum^n_{i=1}|b_i|^q\right)^{\frac{1}{q}} $$

积分形式:

$$ \int^a_b\big|f(x)g(x)\big|\mathrm{d}x\leqslant\left(\int_{\mathbb{R}}\big|f(x)\big|^p\mathrm{d}x\right)^{\frac{1}{p}}\left(\int_{\mathbb{R}}\big|g(x)\big|^q\mathrm{d}x\right)^{\frac{1}{q}} $$$$ \Vert fg\Vert_1\leqslant\Vert f\Vert_p\cdot\Vert g\Vert_q $$

注:当$p=1$时则$q=\infty$,反之同理;其中$\Vert f\Vert_{\infty}=\mathrm{ess}\sup|f|=\inf\big\{a\in\mathbb{R}:\mu\big(f^{-1}(a,+\infty)\big)=0\big\}$,这里的$a$实质上是$f$的上界,即无穷范数是本性上确界,等于上界构成集合的下确界;本性上确界可以认为是取上界集的子集、子集与上界集至多相差零测集情况下,该子集的下确界,因为受“外界影响”更小,更“稳定”。

特别地,当$p=q=2$,Hölder不等式等价于柯西不等式。

如果$p,q\in(1,+\infty)$,则Hölder不等式取等当且仅当$|f|^p$与$|g|^q$在$L^1(\mu)$中线性相关,即存在不全为的$\alpha,\beta\in\mathbb{R}$,使得$\alpha|f|^p\xlongequal{\text{a.s.}}\beta|g|^q$。

Hölder

这里利用Young不等式简单证明一下积分形式的Hölder不等式,如果$f(x)\equiv0$或$g(x)\equiv0$则不等式显然成立,所以只考虑$f,g$均不恒为$0$的情况。有$f,g$不恒为$0$,所以有$\displaystyle{\int^b_a\big|f(x)\big|^p\mathrm{d}x>0}$与$\displaystyle{\int^b_a\big|g(x)\big|^q\mathrm{d}x>0}$。根据Young不等式,有

$$ \frac{|f(x)|\cdot|g(x)|}{\left(\int^b_a\big|f(x)\big|^p\mathrm{d}x\right)^{\frac1p}\cdot\left(\int^b_a\big|g(x)\big|^q\mathrm{d}x\right)^{\frac1q}}\leqslant\frac{\big|f(x)\big|^p}{p\cdot\int^b_a\big|f(x)\big|^p\mathrm{d}x}+\frac{\big|g(x)\big|^q}{q\cdot\int^b_a\big|g(x)\big|^q\mathrm{d}x} $$

对不等式两端同时取$[a,b]$上的定积分,有

$$ \frac{\int^b_a|f(x)g(x)|\mathrm{d}x}{\left(\int^b_a\big|f(x)\big|^p\mathrm{d}x\right)^{\frac1p}\cdot\left(\int^b_a\big|g(x)\big|^q\mathrm{d}x\right)^{\frac1q}}\leqslant\frac1p+\frac1q=1 $$

整理后即得$\displaystyle{\int^a_b\big|f(x)g(x)\big|\mathrm{d}x\leqslant\left(\int^a_b\big|f(x)\big|^p\mathrm{d}x\right)^{\frac{1}{p}}\left(\int^a_b\big|g(x)\big|^q\mathrm{d}x\right)^{\frac{1}{q}}}$,证毕。

Minkowski不等式

当$1\leqslant p\leqslant\infty$且$f,g\in L^p(E)$时,有

$$ \Vert f+g\Vert_p\leqslant\Vert f\Vert_p+\Vert g\Vert_p $$

Minkowski不等式可以被视为范数的三角不等式在$L^p(\mu)$空间之推广,利用Hölder不等式可以简洁地证明该不等式:

$$ \begin{align} \Vert f+g\Vert^p_p&=\Vert (f+g)^{p-1}(f+g)\Vert_1\\ &\leqslant\Vert (f+g)^{p-1}f\Vert_1+\Vert (f+g)^{p-1}g\Vert_1\ \ \ \ \ \ \ \ ^{\ast}\,\text{三角不等式}\\ &\leqslant\Vert (f+g)^{p-1}\Vert_p\big(\Vert f\Vert_p+\Vert g\Vert_p\big)\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ ^{\ast}\,\text{Hölder不等式}\\ &=\Vert f+g\Vert^{p-1}_p\big(\Vert f\Vert_p+\Vert g\Vert_p\big)\end{align} $$

整理结果,不等式两边消去$\Vert f+g\Vert^{p-1}_p$即得$\Vert f+g\Vert_p\leqslant\Vert f\Vert_p+\Vert g\Vert_p$,证毕。

除此之外,还有广义Minkowski不等式,这里只给出不等式形式,不加证明:设$f(x,y)$是$\mathbb{R}^n\times\mathbb{R}^n$上的可测函数,若对几乎处处的$y\in\mathbb{R}^n$,$f(x,y)\in L^p(\mathbb{R}^n)$($1\leqslant p<+\infty$),且有

$$ \int_{\mathbb{R}^n}\left(\int_{\mathbb{R}^n}\big|f(x,y)\big|^p\mathrm{d}x\right)^{\frac1p}\mathrm{d}y=M<+\infty $$

$$ \left(\int_{\mathbb{R}^n}\left|\int_{\mathbb{R}^n}f(x,y)\mathrm{d}y\right|^p\mathrm{d}x\right)^{\frac1p}\leqslant\int_{\mathbb{R}^n}\left(\int_{\mathbb{R}^n}\big|f(x,y)\big|^p\mathrm{d}x\right)^{\frac1p}\mathrm{d}y $$

当在$\mathbb{R}\times[0,2]$上作二元函数$f(x,y)=\left\{\begin{aligned}&f(x),&&0\leqslant y<1\\&g(x),&&1\leqslant y\leqslant2\end{aligned}\right.$,其中$f,g\in L^p(\mathbb{R})$时,广义Minkowski不等式便化为通常的Minkowski不等式。

Carlson不等式

Carlson不等式也是柯西不等式的推广,和Hölder不等式是等价的,二者结合起来可以导出更一般的不等式。

Carlson不等式可以与矩阵关联,是关于几何平均数的不等式:对于$m\times n$的非负实数阵$\boldsymbol{A}$,$n$个列上,列和的几何平均数不小于$m$个行中,行的几何平均数之和,即:

$$ \begin{align}&\sqrt[n]{(a_{11}+a_{21}+\cdots a_{m1})(a_{12}+a_{22}+\cdots a_{m2})\cdots(a_{1n}+a_{2n}+\cdots a_{mn})}\\&\ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \ \geqslant\sqrt[n]{a_{11}a_{12}\cdots a_{1n}}+\sqrt[n]{a_{21}a_{22}\cdots a_{2n}}+\cdots+\sqrt[n]{a_{m1}a_{m2}\cdots a_{mn}}\end{align} $$

其中,矩阵$\boldsymbol{A}$的形状为:

$$ \boldsymbol{A}=\left[\begin{matrix}a_{11}&a_{12}&\cdots&a_{1n}\\a_{21}&a_{22}&\cdots&a_{2n}\\\vdots&\vdots&&\vdots\\a_{m1}&a_{m2}&\cdots&a_{mn}\\\end{matrix}\right] $$

当至少一列完全为$0$或所有的行之间均成比例时取等。$n=2$时正是柯西不等式的情况。

Gronwall不等式

Gronwall不等式有多种变形,比较常见的有:

  1. 对区间$[a,b]$上的连续非负实值函数$u(t)$与$v(t)$,如果有$\displaystyle{u(t)\leqslant K+\int^t_au(s)v(s)\mathrm{d}s}$,其中$K$是任意常数,则在$[a,b]$上成立不等式 $$ u(t)\leqslant A\cdot e^{\int^t_av(s)\mathrm{d}s} $$

这种Gronwall不等式的证明可以参考:Gronwall 不等式的几种证明,作者给出了四种证法,在此不再赘述。

  1. 设$f(t),g(t)$和$y(t)$均为$[a,b]$上的连续实值函数,$f(t)>0$且$\displaystyle{y(t)\leqslant g(t)+\int^t_af(\tau)y(\tau)\mathrm{d}\tau}$,则在$[a,b]$上成立不等式 $$ \displaystyle{y(t)\leqslant g(t)+\int^t_af(\tau)g(\tau)e^{\int^t_{\tau}f(s)\mathrm{d}s}\mathrm{d}\tau} $$
  2. 此外Gronwall不等式还有一些推广,这就不在本文的讨论范围之内了。

Gronwall不等式在常微分方程、偏微分方程中都有极其重要的意义,同样地他也有相应的离散形式,在此不做赘述,而只证明第二种变形的积分形式。以下证明过程非常具有代表性,是证明微分不等式的一种较为泛用的方法。

记$\displaystyle{R(t)=\int^t_af(\tau)y(\tau)\mathrm{d}\tau}$,则根据条件有$y(t)-g(t)\leqslant R(t)$。注意到$R'(t)=f(t)y(t)$与被积式中包含的式子$e^{\int^t_{\tau}f(s)\mathrm{d}s}$,这启发了我们可以考虑利用微分方程来证明不等式。

由$f(t)>0,R'(t)=f(t)y(t)\Rightarrow y(t)=\frac{R'(t)}{f(t)}$,设有$\displaystyle{y(t)=g(t)+R(t)}$成立,也就是把已知的、条件中的不等式改为等式并令其成立,则结合二式有

$$ \frac{R'(t)}{f(t)}=g(t)+R(t) $$

这是一阶变系数非齐次的线性微分方程,解得

$$ R(t)=e^{\int^t_{a}f(s)\mathrm{d}s}\left(C+\int^t_af(\tau)g(\tau)e^{-\int^{\tau}_af(s)\mathrm{d}s}\mathrm{d}\tau\right) $$

将$C$与其他式子分离,得

$$ C=R(t)e^{-\int^t_{a}f(s)\mathrm{d}s}-\int^t_af(\tau)g(\tau)e^{\int^a_{\tau}f(s)\mathrm{d}s}\mathrm{d}\tau $$

所以做辅助函数$\displaystyle{F(t)=R(t)e^{-\int^t_{a}f(s)\mathrm{d}s}-\int^t_af(\tau)g(\tau)e^{\int^a_{\tau}f(s)\mathrm{d}s}\mathrm{d}\tau}$,对$F$求导得

$$ \begin{align} F'(t)&=e^{\int^a_tf(s)\mathrm{d}s}\big[R'(t)-f(t)R(t)\big]-f(t)g(t)e^{\int^a_tf(s)\mathrm{d}s}\\ &\leqslant e^{\int^a_tf(s)\mathrm{d}s}\big\{R'(t)-f(t)[y(t)-g(t)]-f(t)g(t)\big\}\ \ \ \ \ \ ^{\ast}\,\text{注意}f(t)>0\\ &=e^{\int^a_tf(s)\mathrm{d}s}\big[R'(t)-R'(t)\big]\\ &=0\end{align} $$

因此$F(t)$是单调递减的,$\forall t\in[a,b]$,$F(t)\leqslant F(a)=0$,所以$\forall t\in[a,b]$,有$\displaystyle{R(t)e^{-\int^t_{a}f(s)\mathrm{d}s}\leqslant\int^t_af(\tau)g(\tau)e^{\int^a_{\tau}f(s)\mathrm{d}s}\mathrm{d}\tau}$,即

$$ \begin{align}\forall t\in[a,b],\ \,\int^t_af(\tau)y(\tau)\mathrm{d}\tau&\leqslant e^{\int^t_{a}f(s)\mathrm{d}s}\int^t_af(\tau)g(\tau)e^{\int^a_{\tau}f(s)\mathrm{d}s}\mathrm{d}\tau\\&=\int^t_af(\tau)g(\tau)e^{\int^t_{\tau}f(s)\mathrm{d}s}\mathrm{d}\tau\end{align} $$

综上,在$t\in[a,b]$内成立$\displaystyle{y(t)\leqslant g(t)+\int^t_af(\tau)y(\tau)\mathrm{d}\tau\leqslant g(t)+\int^t_af(\tau)g(\tau)e^{\int^t_{\tau}f(s)\mathrm{d}s}\mathrm{d}\tau}$,证毕。

说一个题外话,证明微分方程解的唯一性的另一个引理是“设$f(x)$在$[0,+\infty]$上可导,$f(0)=0$,且存在常数$k>0$使得$\big|f'(x)\big|\leqslant k\big|f(x)\big|$在$[0,+\infty]$上成立,则在$(0,+\infty)$内$f\equiv0$”。对此黄哥给了两种证明方法:

微分方程解唯一性引理

杂例

  • Muirhead不等式

  • 反Hölder不等式;

  • 反Minkowski不等式;

  • Hanner不等式;

  • Clarkson不等式;

  • Bessel不等式;

  • Hardy不等式;

上述本文未介绍的不等式,一般情况下没有本文所提到的不等式常用,因此不再此处赘述,但不能说明他们并不重要,只不过本文主要方向是高等数学(分析);轻击便会跳转到相应的详解文章,可供参阅。

多元不等式证明法 (“全导数”)

通常来说,证明不等式可以认为是在证明极值(最值),也可以认为是“放缩的艺术”;不等式和分析学的关系是密不可分的,这说明了不等式的重要性。对于无条件不等式,直接求导和利用现成不等式构造并放缩是最常见的做法,在此介绍另外一种可以逐渐将变量个数较多的一个多元不等式转化为容易处理的多个变量个数较少的不等式的方法。

有人将这种方法称为“全导数”,个人觉得这个称呼不是十分适合,因为和全微分的定义没有太大联系。这个方法的思想在一般的动力系统(主要是ODE)教材中肯定是有所提及的,并不是新鲜事物。

首先对任意可微函数$h(x_1,x_2,\cdots,x_n)$,记$D(h)=\sum\limits^n_{i=1}\frac{\partial h}{\partial x_i}$(即所谓“全导数”);接着,如果某多元不等式是$f(x_1,x_2,\cdots,x_n)\geqslant g(x_1,x_2,\cdots,x_n)$的形式,其中$\forall i,x_i\geqslant0$,则当满足如下条件时:

  • 恒有$D(f)\geqslant D(g)$;
  • 当$x_1x_2\cdots x_n=0$时,恒有$f\geqslant g$;

此时必然有$f(x_1,x_2,\cdots,x_n)\geqslant g(x_1,x_2,\cdots,x_n)$成立。

考虑到不少不等式具有轮换对称性,即各个变量的“地位”是相等的,这种情况下对于第二个条件只需要任取一个$x_i=0$,若式子仍成立即可,而不需要考虑所有情况。

该方法的证明极其简单:已知$D(f)\geqslant D(g)$与当$x_1x_2\cdots x_n=0$时恒有$f\geqslant g$,要证对任意非负实元均有$f\geqslant g$等价于证明对任意非负实元均有$h(x_1,x_2,\cdots,x_n)=f-g\geqslant0$,不妨令$x_n$是$x_1,x_2,\cdots,x_n$中最小的非负实数,设$t\in[0,x_n]$,令$y_i=x_i-x_n\geqslant0$与$p(t)=h(y_1+t,y_2+t,\cdots,y_n+t)$,则有$p'(t)=D(h)\geqslant0$,从而有$p(x_n)\geqslant p(0)\geqslant0$,等价于$h(x_1,x_2,\cdots,x_n)\geqslant h(x_1-x_n,x_2-x_n,\cdots,0)\geqslant0$,证毕。

一元不等式

一元不等式更“特殊”,例如琴生不等式和$x>1$时$\frac{x}{1+x}<\ln(1+x)\lt x$的区别。

不等式原理:泰勒公式

利用在 part Ⅰ 中的泰勒公式,以拉格朗日余项作为不等式的误差,基本上可以证明任何一元可微函数的不等式。方法略过,这是比较直观的。

涉及三角函数的不等式

  • $\sin x\lt x<\tan x,\ \ x\in\big(0,\frac{\pi}2\big)$;在$x=0$处取等,$x\in\big(-\frac{\pi}2,0\big)$时不等号反向。
  • $0<\sin(\cos x)<\cos x<\cos(\sin x),\ \ x\in\big(0,\frac{\pi}2\big)$

涉及对数的不等式

  • $\frac{x}{1+x}\leqslant\ln(1+x)\leqslant x,\ \ x\geqslant0$;仅在$x=0$处取等,在$x\in(0,1)$时放缩程度小于下式。
  • $\frac{x}{1+x}\leqslant\ln(1+x)\leqslant\sqrt{x},\ \ x\geqslant0$,并且在$x$较大时放缩程度相对较小,$\sqrt{x}-\ln(1-x)$除点$x=1$外是严格凹函数。
  • $\frac{b-a}b<\ln\frac ba<\frac{b-1}a$,其中$0\lt a\lt b$。

涉及指数的不等式

  • $1+x\leqslant e^x$;仅在$x=0$处取等,事实上根据泰勒公式可以把这个不等式的左端部分写到任意次多项式。

常微分方程

本文不做任何关于微分方程理论上的推导,只给出常见微分方程的解法。

这里给出通解的定义,注意通解不一定等价于所有解:把含有$n$个独立的任意常数$\{C_1,C_2,\cdots,C_n\}$的解$y=\varphi(x,C_1,\cdots,c_n)$称为$n$阶微分方程$F=(x,y,\frac{\mathrm{d}y}{\mathrm{d}x},\cdots,\frac{\mathrm{d}^ny}{\mathrm{d}x^n})=0$的通解,其中解对常数的独立性是指,对$\varphi$及其$n-1$阶偏导数关于$n$个常数$\{C_1,C_2,\cdots,C_n\}$的雅可比行列式不为$0$。有时又把微分方程的解称为积分曲线。

还有所谓的积分方程,一般解法是等号两端求导化为微分方程再求解。

一个微分方程,将等式两端微分倾向于增加解,原来的解也是微分后新方程的解;如果对两端同时积分,倾向于减少解,原来的解中的一部分是新方程的解。

一阶微分方程的通解

一阶微分方程的一般形式是$\frac{\mathrm{d}y}{\mathrm{d}x}=f(x,y)$,可以形象地视为用函数$f(x,y)$规定了积分曲线的变化率。

可分离变量的方程

若微分方程能被分解为$y'=f(x)g(y)$的形式,则称为可分离变量的方程;“可分离变量方程”名称中的“可分解”体现在$x$、$y$可以分别被移至等式的两侧:$\frac{\mathrm{d}y}{g(y)}=f(x)\mathrm{d}x$,他的通解为:

$$ f(x)=\int f(x)\mathrm{d}x=\int\frac{1}{g(y)}\mathrm{d}y $$

齐次方程

称$y'=f\big(\frac yx\big)$形式的微分方程为齐次方程,“齐次”一词源自于$\frac yx$,这是一个零次齐次函数。欲求出这类微分方程的通解,可令$u=\frac yx$、$y=ux$使原式转化为可分离变量的方程$(ux)'=u+xu'=f(u)$($x\neq0$),再按上文所述分离变量求解、代回变量即可。例如解方程$\frac{\mathrm{d}y}{\mathrm{d}x}=\frac yx+\frac x{2y}$,首先令$u=\frac yx$、$y=ux$,有$\boldsymbol{\frac{\mathrm{d}y}{\mathrm{d}x}=\frac{\mathrm{d}y}{\mathrm{d}u}\frac{\mathrm{d}u}{\mathrm{d}x}=u+x\frac{\mathrm{d}u}{\mathrm{d}x}}$,于是$u+x\frac{\mathrm{d}u}{\mathrm{d}x}=u+\frac1{2u}$,分离变量得到$2u\mathrm{d}u=\frac{\mathrm{d}x}x$,两边同时取积分,得$u^2=\ln|x|+C$,最后代回$u=\frac yx$,最终得到$y^2=x^2(\ln|x|+C)$。

一阶非齐次变系数线性方程

称$y'+P(x)y=Q(x)$形式的微分方程为一阶线性方程,其中$P$、$Q$可以是任何连续函数。

$$ \text{通解公式:}f(x)=e^{-\int P(x)\mathrm{d}x}\left[\int Q(x)e^{\int P(x)\mathrm{d}x}\mathrm{d}x+C\right] $$

要强调的是,通解公式中只有一个未定系数。尽管该式包含了三个不定积分,但均为任取一个原函数即可。

该公式若一时想不起,也可以很容易地进行推导。联系到 part Ⅰ 在微分中值定理证明题中针对$f'(\xi)+g(\xi)f(\xi)=0$问题的处理——构造辅助函数$F(x)=e^{\int g(x)\mathrm{d}x}f(x)$的思想,故而在此有$y'+P(x)y=Q(x)\Leftrightarrow\big(ye^{\int P(x)\mathrm{d}x}\big)'=Q(x)e^{\int P(x)\mathrm{d}x}$,即原式两端同乘$e^{\int P(x)\mathrm{d}x}$后左边凑微分。接着,式子两边(对$x$)积分,便得$ye^{\int P(x)\mathrm{d}x}+C_1=\displaystyle{\int}Q(x)e^{\int P(x)\mathrm{d}x}\mathrm{d}x$。

一般来说通解$\neq$所有解。但是对于线性微分方程而言,通解等价于所有解,且只有$n$簇。


示例 1:解微分方程$\displaystyle{(xy^2-1)\frac{\mathrm{d}y}{\mathrm{d}x}+y^3=0}$,注意到

$$ \frac{\mathrm{d}y}{\mathrm{d}x}=-\frac{y^3}{xy^2-1}=\frac1{-\frac{x}{y}+\frac1{y^3}} $$

所以有

$$ \frac{\mathrm{d}x}{\mathrm{d}y}+\frac1y\cdot x=\frac1{y^3} $$

所以$y$的通解为

$$ y=e^{-\int\frac{\mathrm{d}y}y}\left[\int\frac1{y^3}e^{\int\frac{\mathrm{d}y}y}\mathrm{d}y+C\right]=\frac{Cy-1}{y^2} $$

解这个微分方程时用到了将自变量与因变量关系倒换的小技巧,如果不这么做,这个方程是很难直接解出来的。


示例 2:解微分方程$y'+1=e^{-y}\sin x$,先对等式两边同乘$e^y$得$e^yy'+e^y=\sin x$,注意到$(e^y)'=e^yy'$,因此原方程等价于

$$ (e^y)'+e^y=\sin x $$

将$e^y$视为一个整体应用一阶非齐次变系数线性方程的通解公式(可令$t=e^y$,先对$t$求通解再代回$t=e^y$,这样会更直观一点),可以得到通解

$$ e^y=e^{-\int\mathrm{d}x}\left[\int\sin xe^{\int\mathrm{d}x}+C\right]=\frac{\sin x-\cos x}2+Ce^{-x} $$

解这个微分方程所用的方法实质上是换元思想的体现,或者说是“将某个函数视为一个抽象整体从而把未知的问题 (非线性方程) 转化为已知问题 (一阶线性方程)”,这也是常用解法之一。

*** 伯努利方程

称$y'+P(x)y=Q(x)y^{\alpha}$为伯努利方程,其中$\alpha\neq1$。伯努利方程通解的一般解法是做代换$u=y^{1-\alpha}$后将原式化为线性方程,再利用通解公式求解。如此代换的原因是原式两端同除$y^{\alpha}$后右边消去了$y$项,而左边$y$的幂正是$1-\alpha$。

*** 全微分方程

称$\mathrm{d}F(x,y)=P(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y=0$为全微分方程,通解为$F(x,y)=C$。

  • 判定微分方程为全微分方程:当$P(x,y)$、$Q(x,y)$在单连通区域内连续可微时,方程$P(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y=0$是全微分方程的充要条件是$\frac{\partial P}{\partial y}=\frac{\partial Q}{\partial x}$;
  • 断定方程为全微分方程后,寻找$F$的解法:
    1. 偏积分;
    2. 凑微分;
    3. 线积分。

其他方法

若给出的一阶微分方程不属于上述任何形式,首先考虑将$x$、$y$的映射关系对调,判断新方程的类型;或者换元将方程化为上述标准形式求解。为方便求解,在此给出结论:

  • $\displaystyle{\frac{\mathrm{d}x}{\mathrm{d}y}=\frac1{\frac{\mathrm{d}y}{\mathrm{d}x}}=\frac1{y'}}$(反函数求导)
  • $\displaystyle{\frac{\mathrm{d}^2x}{\mathrm{d}y^2}=\frac{\mathrm{d}}{\mathrm{d}y}\left(\frac1{y'}\right)\cdot\frac{\mathrm{d}x}{\mathrm{d}y}=-\frac{y''}{y'^3}}$

*** 降阶的高阶方程

一般的高阶微分方程没有容易求得的通解(二阶就没有了),但对特殊的高阶方程可以降阶求解。

  • $y^{(n)}=f(x)$型,这是最简单的一类高阶微分方程,直接两边不断积分即可降阶求解。

接下来以二阶微分方程为例,二阶微分方程的一般形式是$y''=f(x,y,y')$。核心观点是想办法让方程只含有两种未知项以方便降阶,因为含有三种未知项的微分方程是难以直接计算的。

  • $y''=f(x,y')$型,这类方程不直接包含$y$项,令$u=y'$、$\frac{\mathrm{d}u}{\mathrm{d}x}=y''$将原式化为$\frac{\mathrm{d}u}{\mathrm{d}x}=f(x,u)$,这是一个关于$u$与$x$的一阶方程,求解即可得到$y'$,再积分得到$y$。
  • $y''=f(y,y'')$型,这类方程不直接包含$x$项,令$u=y'$、$u\frac{\mathrm{d}u}{\mathrm{d}y}=y''$(注意与前文处理方法的异同),原式化为$u\frac{\mathrm{d}u}{\mathrm{d}y}=f(y,u)$。

对于更高阶的微分方程,也可以如此降阶。

*** 线性微分方程组

常微分方程:(第五章)线性微分方程组

高阶线性微分方程与欧拉方程

无论是$n$阶常系数的齐次或非齐次线性常微分方程还是$n$阶变系数的齐次或非齐次线性常微分方程,他们的通解中都包含$n$个自由常数$\{C_i\}$,这是线性方程通解的结构。

线性微分方程的叠加原理

If u1 and u2 are solutions of linear PDE in some function space R, then u = c1u1 + c2u2 with any constants c1 and c2 are also a solution of that PDE in the same function space.

变系数线性微分方程

研究高阶线性微分方程,需要研究线性微分方程的解的结构,这一点和高等代数中基础解系内容是相通的。

   标准$n$阶变系数齐次线性方程:$\frac{\partial^ny}{\partial x^n}+\sum\limits^{n-1}_{k=0}P_k(x)\frac{\partial^ky}{\partial x^k}=0$

   标准$n$阶变系数非齐次线性方程:$\frac{\partial^ny}{\partial x^n}+\sum\limits^{n-1}_{k=0}P_k(x)\frac{\partial^ky}{\partial x^k}=f(x)$

重要定理 1:如果$y_1(x)$与$y_2(x)$是同一齐次微分方程的两个 线性无关 特解,则$y=C_1y_1(x)+C_2y_2(x)$是该齐次微分方程的通解。

重要定理 2:如果$y^{\ast}(x)$是非齐次方程的一个特解、$y_1(x)$与$y_2(x)$是相应的齐次方程的两个线性无关特解,则$y=C_1y_1(x)+C_2y_2(x)+y^{\ast}(x)$是该非齐次微分方程的通解。

重要定理 3:如果$y^{\ast}_1(x)$与$y^{\ast}_2(x)$是非齐次方程的两个特解,则$y^{\ast}_1(x)-y^{\ast}_2(x)$是相应的齐次方程的一个解。

重要定理 4:以二阶齐次线性微分方程为例,如果$y^{\ast}_1(x)$与$y^{\ast}_2(x)$分别是方程$y''+P(x)y'+Q(x)y=f_1(x)$与$y''+P(x)y'+Q(x)y=f_2(x)$的特解,则$y^{\ast}_1(x)+y^{\ast}_2(x)$是方程$y''+P(x)y'+Q(x)y=f_1(x)+f_2(x)$的一个特解。

截至到今日,对一般的高阶变系数线性方程的求解仍然没有比较通用的理论,但是部分变系数线性方程可以通过巧妙的换元化为常系数线性方程,通过将未知的问题转化为已知的问题求解。例如,欲求方程$y''\cos x-2y'\sin x+3y\cos x=e^x$的通解,应作换元$u=y\cos x$,则原方程化为$u''+4u=e^x$,不难解得$u=C_1\cos2x+C_2\sin2x+\frac15e^x$,从而原方程的通解为$y\cos x=C_1\cos2x+C_2\sin2x+\frac15e^x$。

常系数线性微分方程

普通方法(公式法)

简便起见,首先讨论常系数齐次线性微分方程$y''+py'+qy=0$。

特征方程:以二阶方程为例,称$r^2+pr+q=0$为二阶次线性微分方程$y''+py'+qy=0$的特征方程。

设$r_1$、$r_2$是特征方程的两个根:

  1. 当$r_1$与$r_2$为两不等实根时$r_1\neq r_2$,通解为$y=C_1e^{r_1x}+C_2e^{r_2x}$,$e^{r_1x}$与$e^{r_2x}$是该齐次微分方程的两个线性无关特解;

  2. 当$r_1$与$r_2$为相等实根时$r_1=r_2=r$,通解为$y=e^{rx}(C_1+xC_2)$,$e^{rx}$与$xe^{rx}$是方程的两个线性无关特解;

  3. 当$r_1$与$r_2$互为共轭复根,记作$r_{1,2}=\alpha\pm i\beta$,通解为$y=e^{\alpha x}(C_1\cos\beta x+C_2\sin\beta x)$。

    事实上他们均为$\scriptsize{y=e^{\alpha x}\big[(C_{1,1}+C_{1,2}x+\cdots+C_{1,n}x^{n-1})\cos\beta x+(C_{2,1}+C_{2,2}x+\cdots+C_{2,n}x^{n-1})\sin\beta x\big]}$的特例,下文会有一般方程通解的完整形式。

对于二阶常系数非齐次线性微分方程,其一般形式为$y''+py'+qy=f(x)$。

  • 当$f(x)=P_m(x)e^{\lambda x}$,其中$P_m$为$m$次多项式,考虑待定系数法。令$y^{\ast}=x^kQ_m(x)e^{\lambda x}$,其中$k$是$\lambda$作为齐次方程的特征方程$r^2+pr+q=0$根的重数($\lambda$不是根时取$k=0$)、$Q_m$是一个一般的$m$次多项式,然后将含待定系数的$y^{\ast}$代入原式,找到$Q_m(x)$,于是得到确切的特解$y^{\ast}$,进而得到通解。

  • 当$f(x)=e^{\alpha x}[P_l(x)\cos\beta x+P_n(x)\sin\beta x]$,也是考虑待定系数法。取$m=\max\{l,n\}$,令$y^{\ast}=x^k e^{\alpha x}[R^{(1)}_m(x)\cos\beta x+R^{(2)}_m(x)\sin\beta x]$,这里$k$不再是$\lambda$作为齐次方程的特征方程的根重数,而是$\alpha+i\beta$作为特征方程的根重数,然后代入含待定系数的$y^{\ast}$便能找到确切的特解$y^{\ast}$,进而得到通解。

高阶的线性常微分方程,类似处理。

线性方程

上图中给出了针对特征方程解为一对$k$重共轭复根情况下原微分方程的通解;如果特征方程计算出有$n$对不重复的共轭复根,其中第$j$对的重数为$k_j$,则分别计算出第$j$对共轭复根对应的第$j$个“子通解”,最后将全部的“子通解”相加便得到原微分方程的通解。

算子法求特解

在这里只列出算子法计算特解常用的公式,完整内容稍后再介绍。

记$D$为微分算子$\frac{\mathrm{d}}{\mathrm{d}x}$,$D^k=\frac{\mathrm{d}^k}{\mathrm{d}x^k}$,同时规定$\frac1{D}$为积分,则微分方程可以写为$F(D)y=f(x)$,其中$F(D)$是$D$的一个多项式,从而特解可以写为$y^{\ast}=\frac1{F(D)}f(x)$,接下来分类讨论一些常见的$f(x)$对应的特解。

  • 当$f(x)=e^{ax}$,即$\displaystyle{y^{\ast}=\frac1{F(D)}e^{ax}}$,包括$f(x)=k$,因为取$a=0$即可:

    • 若$F(D)\Big|_{D=a}\neq0$,则$\displaystyle{y^{\ast}=\frac1{F(D)}e^{ax}=\frac{1}{F(D)\Big|_{D=a}}e^{ax}}$
    • 若$F(D)\Big|_{D=a}=0$,但$F'(D)\Big|_{D=a}\neq0$,则$\displaystyle{y^{\ast}=\frac1{F(D)}e^{ax}=\frac{\color{#836FFF}{\boldsymbol{x}}}{F'(D)\Big|_{D=a}}e^{ax}}$
    • 若$F(D)\Big|_{D=a}=0$、$F'(D)\Big|_{D=a}=0$,但$F''(D)\Big|_{D=a}\neq0$,则$\displaystyle{y^{\ast}=\frac1{F(D)}e^{ax}=\frac{\color{#836FFF}{\boldsymbol{x^2}}}{F''(D)\Big|_{D=a}}e^{ax}}$
    • $\dots$

    例如求$y''-2y'+y=e^x$的特解,令$F(D)=D^2-2D+1$,计算得$F(D)\Big|_{D=1}=0$,$F'(D)\Big|_{D=1}=0$,$F''(D)\Big|_{D=1}=2\neq0$,因此

    $$ y^{\ast}=\frac{x^2}{F''(D)\Big|_{D=1}}e^{x}=\frac{x^2}2e^x $$
  • 对于$\displaystyle{y^{\ast}=\frac1{F(D^2)}\cos\beta x}$或$\displaystyle{y^{\ast}=\frac1{F(D^2)}\sin\beta x}$,其中特别约定$F(D^2)=D^2+q$,$q$是一个常数(即$F(D)$中不包含一阶微分算子$D$):

    • 若$F(D^2)\Big|_{D=i\beta}\neq0$,则

      $$ y^{\ast}=\frac1{F(D^2)}\cos\beta x=\frac{1}{F(D^2)\Big|_{D=i\beta}}\cos\beta x $$$$ y^{\ast}=\frac1{F(D^2)}\sin\beta x=\frac{1}{F(D^2)\Big|_{D=i\beta}}\sin\beta x $$
    • 若$F(D^2)\Big|_{D=i\beta}=0$,则

      $$ y^{\ast}=\frac1{F(D^2)}\cos\beta x=\frac{\color{#836FFF}{\boldsymbol{x}}}{[F(D^2)]'}\cos\beta x $$$$ y^{\ast}=\frac1{F(D^2)}\sin\beta x=\frac{\color{#836FFF}{\boldsymbol{x}}}{[F(D^2)]'}\sin\beta x $$

    例如求$y''+4y=\sin2x$的特解,令$F(D^2)=D^2+4$,计算得$F(D^2)\Big|_{D=2i}=0$,因此

    $$ y^{\ast}=\frac{x}{(D^2+4)'}\sin2x=\frac{x}2\frac{1}{D}\sin2x=\frac{x}2\int\sin2x\mathrm{d}x=-\frac{x\cos2x}4 $$
  • 对于一般的$\displaystyle{y^{\ast}=\frac1{F(D)}\cos\beta x}$或$\displaystyle{y^{\ast}=\frac1{F(D)}\sin\beta x}$(即$F(D)$中包含一阶微分算子$D$),处理方法是基于上一种情况的,但解起来相对麻烦一点。

    直接以求$y''-3y'+2y=-\frac12\cos2x$特解为例,令$F(D)=D^2-3D+2$,则$y^{\ast}=\frac1{D^2-3D+2}\left(-\frac12\cos2x\right)$,先直接代入$\boldsymbol{D^2=(2i)^2=-4}$,后续再做讨论

    $$ \begin{align} y^{\ast}&=\frac1{(D^2-3D+2)\big|_{D^2=-4}}\left(-\frac12\cos2x\right)\\ &=\frac12\frac1{3D+2}\cos2x\\ &=\frac12\frac{3D-2}{9D^2-4}\cos2x\\ &=\frac12\frac{2-3D}{40}\cos2x\\ &=-\frac{3}{80}D\cos2x+\frac1{40}\cos2x\\ &=\frac3{40}\sin2x+\frac1{40}\cos2x \end{align} $$
  • 当$f(x)=x^k+a_1x^{k-1}+\cdots+a_{k-1}x+a_k$,即$y^{\ast}=\frac1{F(D)}(x^k+a_1x^{k-1}+\cdots+a_{k-1}x+a_k)$,利用泰勒级数$\frac1{1-x}=1+x+x^2+\cdots$将$F(D)$展开即可。

    例如求$y''+y'=x^2+1$的特解,令$F(D)=D^2+D$,则

    $$ \begin{align}y^{\ast}&=\frac1{F(D)}(x^2+1)\\&=\frac1D\frac1{1+D}(x^2+1)\\&=\frac1D(1-D+D^2-D^3+\cdots)(x^2+1)\\&=\left(\frac1D-1+D-D^2+\cdots\right)(x^2+1)\\&=\int(x^2+1)\mathrm{d}x-(x^2+1)+(2x)+0\\&=\frac{x^3}3-x^2+3x-1\end{align} $$
  • 推广:当$f(x)=e^{ax}g(x)$,即$\displaystyle{y^{\ast}=\frac1{F(D)}e^{ax}g(x)}$,其中$g(x)$是任意一个实函数,有

    $$ \color{#990066}{\textbf{重要公式:}\boldsymbol{y^{\ast}=\frac1{F(D)}\Big(e^{ax}g(x)\Big)=e^{ax}}\cdot\boldsymbol{\left(\frac1{F(D+a)}g(x)\right)}} $$

    利用该公式消掉分母的$D^2$、$D$或常数项后,将$\frac1{F(D+a)}g(x)$视为整体,于是按上文情况处理即可。

    例如求$y''+4y'+5y=e^{-2x}\sin x$的特解,

    $$ \begin{align} y^{\ast}&=\frac1{D^2+4D+5}e^{-2x}\sin x\\ &=e^{-2x}\cdot\boxed{\frac1{(D-2)^2+4(D-2)+5}\sin x}\\ &=e^{-2x}\cdot\boxed{\frac1{D^2+1}\sin x}\ \ \ \ \ast\text{注意到代入}D^2=(1i)^2\text{有}i^2+1=0\\ &=e^{-2x}\cdot\frac{x}{[D^2+1]'}\sin x\\ &=e^{-2x}\cdot\frac{x}2\int\sin x\mathrm{d}x\\ &=-\frac{xe^{-2x}\cos x}2+C \end{align} $$

    又例如求$y''-3y'+2y=2xe^x$的特解,

    $$ \begin{align} y^{\ast}&=\frac1{D^2-3D+2}2xe^x\\ &=2e^x\cdot\boxed{\frac1{(D+1)^2-3(D+1)+2}x}\\ &=2e^x\cdot\boxed{\frac1{D(D-1)}x}\\ &=2e^x\cdot\frac1D\left(-1-D-D^2-\cdots\right)x\\ &=2e^x\cdot\frac1D\left(-x-1\right)\\ &=2e^x\left(-\frac{x^2}2-x\right) \end{align} $$

    要特别注意微分算子$D$的作用对象,虽然$P(D)$与$Q(D)$之间有交换律、分配律等运算法则成立,但是当$D$作用于函数时切不可随意颠倒次序,一定要以作用函数为起点,从右往左逐个计算导数算子或积分算子,例如最后一个例子中,$\frac1{D(D-1)}x$的运算只能是

    $$ \frac1D\left[(-1-D-D^2-\cdots)x\right]=\frac1D(-x-1)=-\frac{x^2}2-x $$

    而不可以是

    $$ \left[\frac1D(-1-D-D^2-\cdots)\right]x=(-\frac1D-1-D-\cdots)x=-\frac{x^2}2-x-1 $$

    这样只会得到错误的结果。虽然很多情况下为书写的简便起见没有写明表运算顺序的括号,但在计算时一定要从右往左逐个计算。

完整的算子法收纳了起来,如有需要可以展开下面这篇论文。

展开/收起算子法论文算子法1 算子法2 算子法3 算子法4 算子法5 算子法6 算子法7 算子法8 算子法9

反推微分方程

给定通解,如何反推微分方程?我将方法总结如下,称之为“观察”与“求导”。

以式子$xy=c_1e^x+c_2e^{2x}$为例,设该式是某二阶齐次线性微分方程的通解,试求这个微分方程。

  • 方法“观察”,顾名思义,就是观察通解的形式。可以发现,式子$xy=c_1e^x+c_2e^{2x}$本身并不是任何一个二阶常系数微分方程的通解,因为将$x,y$分离后得$y=\frac{c_1}xe^x+\frac{c_2}xe^{2x}$——这不满足一般二阶常系数微分方程通解的形式(如果满足的话,我们可以干净利落地给出特征方程,然后直接得到原方程)。

    显然,对于二阶与高阶常系数微分方程我们很好处理,但二阶与高阶变系数微分方程就没有很好的方法应对了,可这里的式子又显然不是常系数微分方程的解,怎么办呢?我们可以想办法尝试着把这里的变系数问题转化成一个常系数问题。细心观察可以发现,式子$xy=c_1e^x+c_2e^{2x}$等号右边的那部分正是一个标准的二阶常系数微分方程通解,所以可以作换元$z=xy$,把原式化为$z=c_1e^x+c_2e^{2x}$并将式子视为$x$与$z(x)$的微分方程,易见这时的特征方程为$(\lambda-2)(\lambda-1)=\lambda^2-3\lambda+2$,因此原方程为

    $$ \frac{\mathrm{d}^2z}{\mathrm{d}x^2}-3\frac{\mathrm{d}z}{\mathrm{d}x}+2z=0 $$

    代回$z=xy$,得

    $$ \frac{\mathrm{d}y}{\mathrm{d}x}+\frac{\mathrm{d}y}{\mathrm{d}x}+x\frac{\mathrm{d}^2y}{\mathrm{d}x^2}-3y-3x\frac{\mathrm{d}y}{\mathrm{d}x}+2xy=0 $$

    整理得

    $$ xy''+(2-3x)y'+(2x-3)y=0 $$

    这是一个变系数微分方程,但我们通过巧妙的换元,将一个未知的问题(还原变系数微分方程)转变为了已知的问题(还原常系数微分方程),类似的思想充斥着数学的各个领域。

  • 方法“求导”,其实也就是直接对给出的式子求导,联立方程求解。直接对等式$xy=c_1e^x+c_2e^{2x}$两端求导,有

    $$ \big(xy=c_1e^x+c_2e^{2x}\big)'\Leftrightarrow y+xy'=c_1e^x+2c_2e^{2x} $$$$ \big(xy=c_1e^x+c_2e^{2x}\big)''\Leftrightarrow2y'+xy''=c_1e^x+4c_2e^{2x} $$

    由以上二式解得

    $$ c_1e^x=2xy'+2y-xy''-2y' $$$$ c_2e^{2x}=\frac12xy''-\frac12xy'-\frac12y+y' $$

    将$c_1e^x,c_2e^{2x}$的表达式代回$xy=c_1e^x+c_2e^{2x}$,整理得

    $$ xy''+(2-3x)y'+(2x-3)y=0 $$

    这一方法可能没有上一方法“优雅”,但至少也是可行的。

*** 欧拉方程

欧拉方程$x^ny^{(n)}+a_1 x^{n-1}y^{(n-1)}+\cdots+a_{n-1}xy'+a_ny=f(x)$是特殊的线性变系数微分方程,求解的思路是将欧拉方程化为线性常系数方程,令$x=e^t$,原式化为$x^ky^{(k)}=\frac{\mathrm{d}}{\mathrm{d}t}(\frac{\mathrm{d}}{\mathrm{d}t}-1)\cdots(\frac{\mathrm{d}}{\mathrm{d}t}-k+1)y$,即一个线性常系数方程。

*** 幂级数解法

可以解决勒让德方差与贝塞尔方程,略。

*** 首次积分

常微分方程学习笔记(11)

一阶差分方程

差分这一概念在统计学中较为常用,例如时间序列中的AR模型。某种意义上,可以把差分看作“数列的导数”,这也是为何差分方程的解和微分方程有相似之处。

对于序列$y_0,y_1,\cdots,y_x,\cdots$,称$\Delta y_x=y_{x+1}-y_x$为一阶差分,称$\Delta^2y_x=\Delta(\Delta y_x)=\Delta y_{x+1}-\Delta y_x=y_{x+2}-2y_{x+1}+y_x$为二阶差分,以此类推。

  • 一阶常系数线性齐次差分方程:$y_{x+1}+ay_x=0$,通解为$y_c(x)=y_0(-a)^x=C(-a)^x$,其中$y_0$是初值,在初值未知的情况下考虑用待定系数$C$代替;

  • 一阶常系数线性非齐次差分方程:$y_{x+1}+ay_x=f(x)$,通解为$y_x=y_c(x)+y^{\ast}_x$,其中$y_c(x)$是$y_{x+1}+ay_x=0$的解、$y^{\ast}_x$是特解,因此只需要找出特解,就可以给出一阶线性非齐次差分方程的通解。下面列出常见情况下的特解,其中$k,k_0,k_1,\cdots,k_n$均为待定系数:

    • 当$f(x)=R_n(x)$,其中$R_n$是$n$阶多项式:

      • 若$a\neq1$,则特解为$y^{\ast}_x=k_0+k_1x+\cdots+x_nx^n=\sum\limits^n_{j=0}k_jx^j$
      • 若$a=1$,则特解为$y^{\ast}_x=x\big(k_0+k_1x+\cdots+x_nx^n\big)=x\sum\limits^n_{j=0}k_jx^j$
    • 当$f(x)=\lambda^x R_n(x)$,其中$R_n$是$n$阶多项式:

      • 若$a\neq\lambda$,则特解为$y^{\ast}_x=(k_0+k_1x+\cdots+x_nx^n)\lambda^x=\lambda^x\sum\limits^n_{j=0}k_jx^j$
      • 若$a=\lambda$,则特解为$y^{\ast}_x=x\big(k_0+k_1x+\cdots+x_nx^n\big)\lambda^x=x\lambda^x\sum\limits^n_{j=0}k_jx^j$
    • 当$f(x)=b_1\cos\omega x+b_2\sin\omega x$,其中$\omega\neq0$、$b_1,b_2$不同时为$0$,记$D=\left|\begin{matrix}a+\cos\omega&\sin\omega\\-\sin\omega&a+\cos\omega\end{matrix}\right|$:

      • 若$D\neq0$,则特解为$y^{\ast}_x=k_1\cos\omega x+k_2\sin\omega x$
      • 若$D=0$,则特解为$y^{\ast}_x=x(k_1\cos\omega x+k_2\sin\omega x)$

    部分特例:

    • 当$f(x)=\lambda$,

      • 若$a\neq1$,则特解为$y^{\ast}_x=k$
      • 若$a=1$,则特解为$y^{\ast}_x=kx$
    • 当$f(x)=\lambda b^x$,

      • 若$a\neq b$,则特解为$y^{\ast}_x=kb^x$
      • 若$a=b$,则特解为$y^{\ast}_x=kxb^x$
    • 当$f(x)=\lambda xb^x$,

      • 若$a\neq b$,则特解为$y^{\ast}_x=(k_1t+k_0)b^x$
      • 若$a=b$,则特解为$y^{\ast}_x=t(k_1t+k_0)b^x$

对于一些二阶差分方程的解,可以参考:差分方程基本理论

级数理论

阿贝尔定理略。

阿贝尔变换

称阿贝尔变换为“离散的分部积分”是不为过的,他的确十分强大。阿贝尔变换之于差分,正如分部积分之于微分。

$$ \sum^n_{i=1}a_ib_i=\sum^{n-1}_{i=1}b_i(a_i-a_{i+1})+\sum^n_{i=1}b_ia_n $$

阿贝尔变换可以求出$\sum\limits^n_{k=1}k^2=\frac{2n^3+3n^2+n}6$,当然这只是一种方法,还是一种相对繁琐的方法。

数项级数

数项级数值的计算往往要借助幂级数的和函数,这部分内容见后文幂级数部分。

数项级数敛散性

级数$\sum\limits^{\infty}_{n=1}a_n$收敛的必要条件是$\lim\limits_{n\to\infty}a_n=0$,因此:

  • 若$\lim\limits_{n\to\infty}a_n\neq0$,则级数必发散;

尽管逐项求导/求积不改变收敛半径,但可以证明:

  • 为数项级数加上括号会增强收敛性;
  • 将数项级数括号去掉会削弱收敛性;
  • 绝对收敛的数项级数,加上或去掉括号,即任意改变运算先后次序,结果均绝对收敛。

给级数加上小括号改变运算顺序,会增强收敛性:原本收敛的级数加上括号后一定收敛,加上括号后发散的级数一定发散。

级数$\sum a_n$与平方和$\sum a^2_n$的关系:

  • 若$\sum a_n$收敛,不一定有$\sum a^2_n$收敛,例如$\sum\frac{(-1)^n}n$;

    但如果$\sum a_n$是绝对收敛的,或$\sum a_n$是正项级数,则由$\lim\limits_{n\to\infty}a_n=0$可知$\sum a^2_n$绝对收敛,因为存在$N$使得当$n>N$时有$|a_n|>a^2_n$

  • 若$\sum a^2_n$收敛,不一定有$\sum a_n$收敛,例子是容易想到的,例如$\sum\frac1{n^2}$

  • 若$\sum a^2_n$收敛,则$\sum\frac{a_n}n$绝对收敛,因为$\left|\frac{a_n}n\right|\leqslant\frac12\left(a^2_n+\frac1{n^2}\right)$

凡是收敛的级数,无论怎样增添删减括号,结果仍是一个收敛的级数,且新级数的收敛值等于原级数的收敛值,即使原级数仅仅是条件收敛的。

但如果要调整级数项的次序,则在级数绝对收敛的条件下才能$100\%$保证调整顺序后的级数仍是收敛的,且不改变收敛的数值。

  • $\sum\limits^{\infty}_{n=1}(a_n-a_{n+1})\text{ 收敛}=\lim\limits_{n\to\infty}a_n\text{ 存在}$
展开/收起1道级数收敛性例题
  • 设$a_1=2$,$a_{n+1}=\frac12\left(a_n+\frac1{a_n}\right)$($n\in\mathbb{N}^+$),证明级数$\sum\limits^{\infty}_{n=1}\left(\frac{a_n}{a_{n+1}}-1\right)$收敛;

    证:观察$\frac{a_n}{a_{n+1}}-1=\frac{a_n-a_{n+1}}{a_{n+1}}$,等号右边式子的分子部分$a_n-a_{n+1}$可以联系到$\lim\limits_{n\to\infty}a_n$,因为如果$\lim\limits_{n\to\infty}a_n$存在,则$\sum\limits^{\infty}_{n=1}(a_n-a_{n+1})$收敛。由基本不等式,有$a_{n+1}=\frac12\left(a_n+\frac1{a_n}\right)\geqslant1$,所以$\frac{a_n-a_{n+1}}{a_{n+1}}\leqslant a_n-a_{n+1}$。如果$a_n>a_{n+1}$,则$\sum\limits^{\infty}_{n=1}\frac{a_n-a_{n+1}}{a_{n+1}}$与$\sum\limits^{\infty}_{n=1}(a_n-a_{n+1})$均为正项级数,根据正项级数的比较判别法,当后者收敛时前者也收敛。

    理清了思路后就可以着手证明了。先证极限$\lim\limits_{n\to\infty}a_n$存在,$a_{n+1}-a_n=\frac12\left(\frac1{a_n}-a_n\right)\leqslant0$(因为上文已经由基本不等式导出了$\forall n,\ \,a_{n+1}\geqslant1$),所以$\{a_n\}$是单调递减数列,又$\{a_n\}$有下界$1$,根据单调有界定理,$\lim\limits_{n\to\infty}a_n$存在,进一步地对题干条件的方程两边同时取极限,还可以知道$\lim\limits_{n\to\infty}a_n=1$,不过这里只需要推出极限存在就足够了。

    接下来证级数$\sum\limits^{\infty}_{n=1}(a_n-a_{n+1})$收敛,记部分和$S(k)=\sum\limits^k_{n=1}(a_n-a_{n+1})=a_1-a_{k+1}$,由于$\lim\limits_{n\to\infty}a_n$存在,所以

    $$ \sum^{\infty}_{n=1}(a_n-a_{n+1})=\lim_{k\to\infty}S(k)=a_1-\lim_{k\to\infty}a_{k+1}=1 $$

    从而级数$\sum\limits^{\infty}_{n=1}(a_n-a_{n+1})$收敛,所以

    $$ \sum^{\infty}_{n=1}\left(\frac{a_n}{a_{n+1}}-1\right)\leqslant\sum^{\infty}_{n=1}(a_n-a_{n+1})=1 $$

    因此,作为正项级数,$\sum\limits^{\infty}_{n=1}\left(\frac{a_n}{a_{n+1}}-1\right)$收敛。

    这道题并不是什么难题,但其中蕴含的将$\lim\limits_{n\to\infty}a_n$与$\sum\limits^{\infty}_{n=1}(a_n-a_{n+1})$相联系的技巧是十分重要的。

基本重要数项级数类

下文的判断数项级数的敛散性方法,常常需要通过与一些基本的数项级数进行对比方能得以讨论。

$p$级数

$\sum\limits^{\infty}_{n=1}\frac{1}{n^p}$ 在 $p>1$ 时收敛,在 $p\leqslant1$ 时发散;当 $p=1$ 时为调和级数。

几何级数(等比级数):当$a,q>0$,

$\sum\limits^{\infty}_{n=1}aq^n$ 在 $q<1$ 时收敛,在 $q\geqslant1$ 时发散。

级数敛散性判别法

正项级数

  • 由单调有界定理知,正项级数的部分和$S_n$有界的充要条件是级数收敛。

  • 比较原则(控制收敛),常配合放缩技巧使用:设$a_n\leqslant b_n$,则

    1. $\sum\limits^{\infty}_{n=1}b_n$收敛$\ \Rightarrow\sum\limits^{\infty}_{n=1}a_n$收敛;
    2. $\sum\limits^{\infty}_{n=1}a_n$发散$\ \Rightarrow\sum\limits^{\infty}_{n=1}b_n$发散;
  • 比较原则极限形式:设$\lim\limits_{n\to\infty}\frac{a_n}{b_n}=c$,

    • 若$0\lt c<+\infty$,则$\sum\limits^{\infty}_{n=1}a_n$与$\sum\limits^{\infty}_{n=1}b_n$同敛散;
    • 若$c=0$,则当$\sum\limits^{\infty}_{n=1}b_n$收敛时$\sum\limits^{\infty}_{n=1}a_n$收敛,当$\sum\limits^{\infty}_{n=1}a_n$发散时$\sum\limits^{\infty}_{n=1}b_n$发散;
    • 若$c=+\infty$,则当$\sum\limits^{\infty}_{n=1}a_n$收敛时$\sum\limits^{\infty}_{n=1}b_n$收敛,当$\sum\limits^{\infty}_{n=1}b_n$发散时$\sum\limits^{\infty}_{n=1}a_n$发散;
  • 比值判别法,达朗贝尔判别法:对于正项级数$\sum a_n$,假设存在某正数$N_0$与正常数$\rho$,

    1. 若对一切$n>N_0$,成立不等式$\frac{a_{n+1}}{a_n}\leqslant\rho<1$,则级数$\sum a_n$收敛;
    2. 若对一切$n>N_0$,成立不等式$\frac{a_{n+1}}{a_n}\geqslant1$,则级数$\sum a_n$发散。
  • 比式判别法极限形式,涉及$n!$、$n^n$时极为有效:设$\lim\limits_{n\to\infty}\frac{a_{n+1}}{a_n}=\rho$,则

    $\sum\limits^{\infty}_{n=1}a_n\ \left\{\begin{aligned}&\text{收敛},&&\rho<1\\&\text{发散},&&\rho>1\\&\text{敛散性未知},&&\rho=1\end{aligned}\right.$

    • 推广:

      若$\varlimsup\limits_{n\to\infty}\frac{a_{n+1}}{a_n}=\rho<1$,则级数收敛;

      若$\varliminf\limits_{n\to\infty}\frac{a_{n+1}}{a_n}=\rho>1$,则级数发散。

  • 根式判别法,柯西判别法:对于正项级数$\sum a_n$,假设存在某正数$N_0$与正常数$\rho$,

    1. 若对一切$n>N_0$,成立不等式$\sqrt[n]{a_n}\leqslant\rho<1$,则级数$\sum a_n$收敛;
    2. 若对一切$n>N_0$,成立不等式$\sqrt[n]{a_n}\geqslant1$,则级数$\sum a_n$发散。
  • 根式判别法极限形式,涉及$[f(n)]^n$时极为有效:设$\lim\limits_{n\to\infty}\sqrt[n]{a_n}=\rho$,则

    $\sum\limits^{\infty}_{n=1}a_n\ \left\{\begin{aligned}&\text{收敛},&&\rho<1\\&\text{发散},&&\rho>1\\&\text{敛散性未知},&&\rho=1\end{aligned}\right.$

    • 推广:

      记$\varlimsup\limits_{n\to\infty}\sqrt[n]{a_n}=\rho$,结论同上。

  • 积分判据,尤其针对$p$级数的推广$\displaystyle{\sum\frac{1}{n^{\alpha}\ln^{\beta}n}}$形级数敛散性判定极为有效:

    设$f(x)$是$[1,+\infty]$上单调递减的非负连续函数,则$\displaystyle{\sum\limits^{\infty}_{n=n_0}f(n)}$与$\displaystyle{\int^{+\infty}_{n_0}f(x)\mathrm{d}x}$同敛散,这是充要的。

    • $\displaystyle{\int^b_0\frac{1}{x^{\alpha}\ln^{\beta}x}\mathrm{d}x\ \ }\left\{\begin{aligned}&\alpha<1\text{或}\alpha=1\text{、}\beta>1,&&\text{收敛}\\&\text{Otherwise},&&\text{发散}\end{aligned}\right.$
    • $\displaystyle{\int^{+\infty}_a\frac{1}{x^{\alpha}\ln^{\beta}x}\mathrm{d}x\ \ }\left\{\begin{aligned}&\alpha>1\text{或}\alpha=1\text{、}\beta>1,&&\text{收敛}\\&\text{Otherwise},&&\text{发散}\end{aligned}\right.$
    • 如果分母包含有多个项,则只要有一个项满足收敛条件,积分就收敛,事实上根据比较判别法的极限形式这点是显然的。例如,对于无穷积分$\displaystyle{\int^{+\infty}_1\frac1{x^2+x^{\frac12}}\mathrm{d}x}$,虽然$\frac12<1$,但$2>1$,所以积分收敛;同理,瑕积分$\displaystyle{\int^1_0\frac1{x^2+x^{\frac12}}\mathrm{d}x}$也是收敛的,进而导出$\displaystyle{\int^{+\infty}_0\frac1{x^2+x^{\frac12}}\mathrm{d}x}$也是收敛的。

    所以直接把无穷积分$\displaystyle{\int^{+\infty}_a\frac{1}{x^{\alpha}\ln^{\beta}x}\mathrm{d}x}$的判据照搬来级数$\displaystyle{\sum\frac{1}{n^{\alpha}\ln^{\beta}n}}$即可。

  • $p$级数推广再推广:$\displaystyle{\sum^{\infty}_{n=k}\frac1{n(\ln^{[m]}n)^p\prod\limits^{m-1}_{i=1}\ln^in}}$在$p\leqslant1$时发散,在$p>1$时收敛。其中,$\ln^{[m]}n:=\ln\big(\ln(\ln\cdots(\ln n))\big)$,嵌套$m$次。

  • 柯西凝聚判别法:设$\{a_n\}$是单调递减的正项数列,则正项级数$\sum\limits^{\infty}_{n=1}a_n$收敛的充要条件是凝聚项级数$\sum\limits^{\infty}_{n=0}2^na_{2^n}$收敛。这一方法可以解决$p-$级数的收敛性问题,也可以解决$\sum\frac{1}{n^{\alpha}\ln^{\beta}n}$收敛性问题(尽管积分判据似乎更便捷)。

  • 拉贝判别法:对于正项级数$\sum a_n$,假设存在某正数$N_0$与正常数$\rho$,

    1. 若对一切$n>N_0$,成立不等式$n\left(1-\frac{a_{n+1}}{a_n}\right)\geqslant\rho>1$,则级数$\sum a_n$收敛;
    2. 若对一切$n>N_0$,成立不等式$n\left(1-\frac{a_{n+1}}{a_n}\right)\leqslant1$,则级数$\sum a_n$发散。
  • 拉贝判别法极限形式:设$\lim\limits_{n\to\infty}n\left(1-\frac{a_{n+1}}{a_n}\right)=\rho$,则

    $\sum\limits^{\infty}_{n=1}a_n\ \left\{\begin{aligned}&\text{收敛},&&\rho>1\\&\text{发散},&&\rho<1\\&\text{敛散性未知},&&\rho=1\end{aligned}\right.$

交错级数

  • 莱布尼茨判别法:对于交错级数 $\sum\limits^{\infty}_{n=1}(-1)^{n+1}a_n$(不妨令$a_n>0$),若满足:

    1. $a_n$单调递减;
    2. $\lim\limits_{n\to\infty}a_n=0$

    则交错级数$\sum\limits^{\infty}_{n=1}(-1)^{n+1}a_n$收敛。

莱布尼茨判别法的条件乍一看似乎有些许过分的强了,但这些条件其实都是十分必要的。例如,根据莱布尼茨判别法不难知道级数$\sum\limits^{\infty}_{n=1}\frac{(-1)^n}{\sqrt{n}}$是收敛的,事实上

$$ \sum^{\infty}_{n=1}\frac{(-1)^n}{\sqrt{n}}=(\sqrt{2}-1)\zeta\left(\frac12\right)\approx-0.6048986434216 $$

与此同时,级数$\sum\limits^{\infty}_{n=2}\frac{(-1)^n}{\sqrt{n}+(-1)^n}$却是一个实打实的发散级数——尽管我们真真切切只改变了分母极其微小的一部分。以下是用$R$语言计算的该级数和函数的前 $10,000,000$ 项图像:

diverge

即使这个级数发散得很慢,和函数在第一千万项时也不过才区区$-16$左右,但起码他的确是发散的。进一步地,我们可以从理论上证明该级数发散且发散的速度应当同调和级数$\sum\limits^{\infty}_{n=1}\frac1n$一致,因为

$$ \begin{align} \frac{(-1)^n}{\sqrt{n}+(-1)^n}&=\frac{(-1)^n}{\sqrt{n}}\left(1+\frac{(-1)^n}{\sqrt{n}}\right)^{-1}\\ &=\frac{(-1)^n}{\sqrt{n}}\left(1-\frac{(-1)^n}{\sqrt{n}}+\mathcal{o}\Big(\frac1{\sqrt{n}}\Big)\right)\\ &=-\frac1n+\frac{(-1)^n}{\sqrt{n}}+\mathcal{o}\Big(\frac1{\sqrt{n}}\Big)\end{align} $$

其中,$\frac{(-1)^n}{\sqrt{n}}$是收敛的成分(上文已经给出了其级数数值约为$-0.6$),而$-\frac1n$却是典型的发散的成分,所以级数$\sum\limits^{\infty}_{n=2}\frac{(-1)^n}{\sqrt{n}+(-1)^n}$发散,而且与调和级数有相同的发散速度。换句话说,级数$\sum\limits^{\infty}_{n=2}\frac{(-1)^n}{\sqrt{n}+(-1)^n}$的发散是由$-\frac1n$控制与决定的。

由于调和级数的和函数近似对数函数($\sum\limits^k_{n=1}\frac{1}{n}=\ln k+\gamma+\varepsilon_k$),我们也可以用对数函数来侧面印证上述的理论分析:

$$ -\ln(10,000,000)\approx-16.118095650958 $$

这个值的确符合我们绘制出的图像,即第一千万项的和函数值在$-16$左右。

由此可见,即使只改变了很渺小的一部分,也可能导致级数发散。所以在试图运用莱布尼茨判别法判定级数收敛时,一定要确保级数满足莱布尼茨判别法所要求的所有条件。

任意项级数

  • 个人认为,最好使的办法是等价极限替代,将复杂式子替代成$p$级数、几何级数等基本级数,结果就容易判别了。这其实就是比较原则的极限形式之一运用,而这种泛用方法的可行性是可以证明的,对任意项级数有效。要注意的是同数列极限、函数极限的等价极限替换一样,只能对式子整体的乘除因子替换,不可随意对加减各项替换,这一原理通过泰勒公式是容易理解的。

  • 级数收敛的柯西准则:级数$\sum a_n$收敛的充要条件是$\forall\varepsilon>0$,$\exists N\in\mathbb{N}^+$,$s.t.$ $\forall m>N$与$p\in\mathbb{N}^+$,都有$\left|\sum\limits^{m+p}_{i=1}a_{m+i}\right|<\varepsilon$

  • Weierstrass优级数判别法(控制收敛):设$\sum b_n$是收敛的正项级数,若存在$N$,使得任意$n>N$都有$|a_n|\lt b_n$,则$\sum a_n$绝对收敛。

  • 阿贝尔判别法:若$\{a_n\}$为单调有界数列,且级数$\sum b_n$收敛,则级数$\sum a_nb_n$收敛。

  • 迪利克雷判别法:若数列$\{a_n\}$单调递减且$\lim\limits_{n\to\infty}a_n=0$,又级数$\sum b_n$的部分和数列有界,则级数$\sum a_nb_n$收敛。

绝对收敛与条件收敛

$^{\ast}$ 如果要求判断级数绝对收敛、条件收敛还是发散,应当首先判断绝对值级数列的收敛性。尤其是运用上文中的比式极限判别法与根式极限判别法判别绝对收敛性时,结论可改写为:设$\lim\limits_{n\to\infty}\left|\frac{a_{n+1}}{a_n}\right|=\rho$或$\lim\limits_{n\to\infty}\sqrt[n]{|a_n|}=\rho$,则:

$\ \ \ \ \sum\limits^{\infty}_{n=1}a_n\ \left\{\begin{aligned}&\text{绝对收敛},&&\rho<1\\&\text{发散},&&\rho>1\\&\text{敛散性未知},&&\rho=1\end{aligned}\right.$

意即当且仅当$\rho=1$时有可能条件收敛。

绝对收敛是比较强的条件,绝对收敛的级数本身必然收敛。收敛的正项级数都是绝对收敛的。

  • 绝对收敛的级数具有可交换性;
  • 柯西定理:两绝对收敛级数,所有项按两级数间两两的乘积,按任意顺序排列得到的级数也绝对收敛,且和为原本两级数收敛值的积。

第一条性质也可以被理解为:绝对收敛的级数重排仍然是收敛到原来的值的,但条件收敛级数随意重排后不能保证仍收敛(即使收敛,也不一定收敛到原来的值)。所以我认为绝对收敛是种“本质收敛”,而条件收敛仅是“恰好在当前排列下收敛”。

对于条件收敛级数,

  • 条件收敛的级数经过适当的重排,可以收敛到任何指定的数;

  • 条件收敛的级数的所有正项或负项构成的级数一定发散;

  • 条件收敛级数逐项与另一条件收敛级数相加仍然收敛,但新级数可能条件收敛,可能绝对收敛。

函数列、函数项级数(暂略)

暂略

幂级数

幂级数与泰勒公式紧密相联。

可证明,若$f$在收敛域内任意阶可导,则$f$在$x=x_0$处的幂级数展开式$f(x)=\sum\limits^{\infty}_{n=0}a_n(x-x_0)^n$唯一,且$a_n=\frac{f^{(n)}(x_0)}{n!}$,称该级数为泰勒级数;在$x_0=0$处做展式的称麦克劳林级数。幂级数在收敛域内均连续。

** 处理幂级数敛散性两大法宝,一是讨论通项极限性质的极限判别法,二是柯西-阿达马定理 **

幂级数的收敛性

这里暂时先考虑最基本的幂级数$\sum\limits^{\infty}_{n=0}a_nx^n$;

阿贝尔定理

  1. 若幂级数$\sum\limits^{\infty}_{n=0}a_nx^n$在$x=x_0\neq0$处收敛,则对$\forall x\ \ s.t.\ |x|<|x_0|$幂级数绝对收敛;
  2. 若幂级数$\sum\limits^{\infty}_{n=0}a_nx^n$在$x=x_0\neq0$处发散,则对$\forall x\ \ s.t.\ |x|>|x_0|$幂级数发散;

记幂级数$\sum\limits^{\infty}_{n=0}a_nx^n$的收敛域区间长度为$2R$,则称$R$为幂级数收敛半径、$(-R,R)$为收敛区间,即$R=\sup\{x_0:\text{幂级数对}\forall x\ s.t.\ |x|<|x_0|\text{收敛}\}$,易见收敛区间只衡量范围不考虑端点的敛散性,而考虑端点敛散性后得到的那个“级数收敛的区间”则称为收敛域(不要搞混淆了!!!)注意,$R$可以为$0$也至少为$0$;也可以为$+\infty$,此时幂级数在$\mathbb{R}$上均绝对收敛。

阿贝尔定理可以推广到复变函数中。

幂级数在收敛区间上的任何闭区间内一致收敛,即内闭一致收敛,进而可以逐项求积、逐项求导,但端点处仍需单独处理。

在幂级数内闭一致收敛的收敛区间内,和函数必然连续;如果幂级数在收敛区间的左或右端点处收敛,则和函数也相应地在该点右或左连续。进一步地,在收敛区间内和函数的任意阶导数均存在,而且在展开处$k$阶导数的值可以通过泰勒级数的形式求出。

计算收敛半径的方法

  • $\lim\limits_{n\to\infty}\sqrt[n]{|a_n|}=\rho:=\frac1R$,当$\rho=0$收敛半径$R=+\infty$,当$\rho=+\infty$收敛半径$R=0$,其余情况($0<\rho<+\infty$)收敛半径$R=\frac{1}{\rho}$,下同,不再赘述;
  • $\lim\limits_{n\to\infty}\frac{|a_{n+1}|}{|a_n|}=\rho:=\frac1R$;
  • 柯西-阿达马定理:$\varlimsup\limits_{n\to\infty}\sqrt[n]{|a_n|}=\rho:=\frac1R$(在$\mathbb{C}$上仍有效,对幂级数$\sum a_n(x-x_0)^n$仍有效),如果缺项则对$x$做换元即可得到正确的收敛半径,例如对于只有偶次幂项的幂级数,收敛半径等于$\frac1{\sqrt{\rho}}$;
  • 放缩,其合理性由阿贝尔定理所保证;
  • 一些同处理数项级数敛散性的方法,例如比较审敛法的极限形式等,同样适用于幂级数。这些方法实际上并不能方便地计算收敛半径具体数值,但适合用来推导两个幂级数之间的敛散性关系。

注意,由于上极限总是存在的,所以柯西-阿达马定理可以被视为幂级数收敛半径$R$的“充要条件”,在证明一些问题时该定理大有帮助;这也说明,任何幂级数都有收敛半径$R$,尽管可能为$0$。

  1. 针对缺项幂级数,例如$\sum\limits^{\infty}_{n=1}\frac{x^{2n}}{n-3^{2n}}$,收敛半径仍可计算,不过这种情况下不可直接套用上述计算方法,而是用的“原始”的、针对数项级数收敛性问题的方法(将整个通项都带入计算公式,而不只是系数),即:由于$\lim\limits_{n\to\infty}\sqrt[n]{\frac{x^{2n}}{|n-3^{2n}|}}=\frac{x^2}{9}$,由数项级数敛散性判别法知当$\frac{x^2}{9}<1$时级数收敛,因此$|x|<3$,再单独判断$x=\pm3$的敛散性即可。

    当然这种问题也可以直接使用威力无穷的柯西-阿达马定理,如果幂级数的每一项可以写作$c_nx^{an+b}$,先照常用柯西-阿达马定理计算收敛半径$\frac1{R'}=\rho'=\varlimsup\limits_{n\to\infty}\sqrt[n]{|c_n|}$,接着取$\displaystyle{R=\sqrt[a]{R'}}$,$R$即为幂级数$\sum c_nx^{an+b}$的收敛半径。其中,$b$不影响收敛半径,因为完全可以把它“提”出来,使级数变为$x^b\sum c_nx^{an}$,从而只需要考虑$a$。

  2. 当幂级数的形式为$\sum a_n(x-x_0)^n$,可以先计算$\sum a_nx^n$的收敛域,再通过简单的换元得到结果。不过我喜欢“直接”一点,和上文中对缺项幂级数的处理一样,直接对幂级数包含$x$的通项利用判别法求解,不用“绕弯弯”。

请注意,端点处敛散性需要单独讨论。

值得一提的是,尽管对于有明确通项的幂级数或许各类极限判别法计算收敛半径更为方便,但比较原则仍然是大有用处的,尤其是对较为抽象的递推通项幂级数(证明收敛半径不小于某数)。典型如当$a_n$为斐波那契数列时(以$a_1$作为首项),证明$\sum\limits^{\infty}_{n=1}a_nx^{n-1}$在$|x|<\frac12$内必收敛并求其和函数。事实上,只需要注意到$a_{n+1}=a_n+a_{n-1}<2a_n<2^2a_{n-1}<\cdots<2^{n-1}$,于是$\sum\limits^{\infty}_{n=1}|a_nx^{n-1}|\leqslant\sum\limits^{\infty}_{n=1}|2x|^{n-1}$,由于不等号右边的级数必定于$-\frac12\lt x<\frac12$内收敛,因此$\sum\limits^{\infty}_{n=1}a_nx^{n-1}$在$x\in(-\frac12,\frac12)$内绝对收敛。至于其和函数$S(x)$,可以通过寻找$S(x)$自身的联系,最后解方程得到。在本例中,有

$$ S(x)=\sum\limits^{\infty}_{n=1}a_nx^{n-1}=1+x+\sum\limits^{\infty}_{n=3}(a_{n-1}+a_{n-2})x^{n-1}=1+x+x[S(x)-1]+x^2S(x) $$

最后解得$S(x)=\frac{1}{-x^2-x+1}$。有时这一步也可以与逐项求导与微分方程联系起来,例如当$a_0=1$、$a_1=0$以及$a_{n+1}=\frac{na_n+a_{n-1}}{n+1}$时,欲证明幂级数$\sum\limits^{\infty}_{n=0}a_nx^n$的收敛半径不小于$1$并解出和函数$S(x)$的表达式;首先前者仿照上例放缩后通过比较原则是容易证明的,而后者需要注意到$(1-x)S'(x)-xS(x)=0$并解出这个微分方程。

幂级数的四则运算

设$\sum\limits^{\infty}_{n=0}a_nx^n$的收敛半径为$R_a$、$\sum\limits^{\infty}_{n=0}b_nx^n$的收敛半径为$R_b$,记$R=\min\{R_a,R_b\}$,则有:

  • $\forall\lambda\in\mathbb{R},\ \ \lambda\sum\limits^{\infty}_{n=0}a_nx^n=\sum\limits^{\infty}_{n=0}\lambda a_nx^n$,$|x|\lt R_a$

  • $\sum\limits^{\infty}_{n=0}a_nx^n\pm\sum\limits^n_{n=0}b_nx^n=\sum\limits^{\infty}_{n=0}(a_n\pm b_n)x^n$,$|x|\lt R$

  • $\left(\sum\limits^{\infty}_{n=0}a_nx^n\right)\cdot\left(\sum\limits^{\infty}_{n=0}b_nx^n\right)=\sum\limits^{\infty}_{n=0}c_nx^n=a_0b_0+(a_0b_1+a_1b_0)x+(a_0b_2+a_1b_1+a_2b_0)x^2+\cdots$,即$c_n=\sum\limits^n_{k=0}a_kb_{n-k}$,$|x|\lt R$

  • $\displaystyle{\frac{\sum\limits^{\infty}_{n=0}a_nx^n}{\sum\limits^{\infty}_{n=0}b_nx^n}}=\textstyle\sum\limits^{\infty}_{n=0}q_nx^n$,系数$q_n$由$\left(\sum\limits^{\infty}_{n=0}b_nx^n\right)\cdot\left(\sum\limits^{\infty}_{n=0}q_nx^n\right)=\sum\limits^{\infty}_{n=0}a_nx^n$确定

注意,$\sum\limits^{\infty}_{n=0}(a_n\pm b_n)x^n$的收敛半径是可以大于$R$的,但$\sum\limits^{\infty}_{n=0}a_nx^n\pm\sum\limits^n_{n=0}b_nx^n=\sum\limits^{\infty}_{n=0}(a_n\pm b_n)x^n$只在$|x|\lt R$时必然成立。事实上,若$R_a\neq R_b$,则$\sum\limits^{\infty}_{n=0}(a_n\pm b_n)x^n$的收敛半径为$R$;若$R_a=R_b$,则只能断言$\sum\limits^{\infty}_{n=0}(a_n\pm b_n)x^n$的收敛半径大于或等于$R$。

一致收敛性与逐项求导 / 求积

重要定理:若幂级数收敛半径$R=0$,则在$(-R,R)$上内闭一致收敛;若幂级数在$x=R$(或$x=-R$)上也收敛,则在$[0,R]$(或$[-R,0]$)上一致收敛。

在一致收敛区间上(至少在收敛域上),幂级数可进行逐项求导、逐项求积,这些操作不会改变收敛半径。

尽管逐项求导/求积不改变收敛半径,但可以证明:

  • 逐项求积会增强端点处的收敛性;
  • 逐项求导会增强端点处的发散性。

这意味着,尽管逐项求积/求导不改变收敛半径,但可能改变端点处敛散性,典型如$\frac{1}{1+x^2}$的幂级数在$x=\pm1$处发散,而他的一个不定积分$\arctan x$却在$x=\pm1$处均收敛。该现象可以被进一步具体解释为:

  1. 若幂级数在一端点处收敛,则逐项求积仍收敛;若幂级数在一端点处发散,则逐项求积后可能收敛
  2. 同理,若幂级数在一端点处发散,则逐项求导仍发散;若幂级数在一端点处收敛,则逐项求导后可能发散

这是否与对级数加括号会增强其收敛性的结论,有点相同呢?

泰勒级数与幂级数和函数

由于在 高等数学工具 PartⅠ 中为了提供更完整的处理函数极限的工具,已经给出了所有常见函数的泰勒公式,事实上也一并给出了他们的泰勒级数及收敛域(麦克劳林级数),这里就不再重复了,只作引用。

常用泰勒公式

泰勒公式的一般形式是:若$f(x)$在点$a$处存在直到$n$阶的导数,则$\displaystyle{f(x)=\sum^n_{k=0}\frac{f^{(k)}(a)}{k!}(x-a)^k}+\mathcal{o}\left((x-a)^n\right)$,这里取皮亚诺余项,如果取拉格朗日余项则条件需要加强至$f(x)$在含点$a$的某个开区间内存在直到$n+1$阶的导数。

$\text{1. }\displaystyle{\sin x=\sum\limits^{\infty}_{n=0}\frac{(-1)^n}{(2n+1)!}x^{2n+1}=x-\frac{x^3}{3!}+\frac{x^5}{5!}-\frac{x^7}{7!}+\cdots\ \ \ \ for\ \ x\in\mathbb{R}}$

$\text{2. }\displaystyle{\cos x=\sum\limits^{\infty}_{n=0}\frac{(-1)^n}{(2n)!}x^{2n}=1-\frac{x^2}{2!}+\frac{x^4}{4!}-\frac{x^6}{6!}+\cdots\ \ \ \ for\ \ x\in\mathbb{R}}$

$\text{3. }\displaystyle{\tan x=x+\frac{x^3}{3}+\frac{2x^5}{15}+\frac{17x^7}{315}+\frac{62x^9}{2835}+\cdots\ \ \ \ for\ \ x\neq\frac{\pi}{2}+k\pi}$

$$ \begin{align*} \text{4. }\arcsin x&=\sum\limits^{\infty}_{n=0}\prod\limits^{n}_{k=1}\Big(1-\frac{1}{2k}\Big)\frac{x^{2n+1}}{2n+1}\\&=x+\sum^{\infty}_{n=1}\frac{(2n-1)!!}{(2n)!!(2n+1)}x^{2n+1}\\&=x+\frac{x^3}{6}+\frac{3x^5}{40}+\frac{5x^7}{112}+\frac{35x^9}{1152}+\cdots\ \ \ \ for\ \ \vert x\vert<1 \end{align*} $$

  计算$\arcsin x$的泰勒公式可以考虑对其导数$(1-x^2)^{-\frac12}$展开;

  由此可以得到$\ \left\{\begin{aligned}&(\arcsin x)^{(2n)}\big|_{x=0}=0,&&n\in\mathbb{N}\\&(\arcsin x)'\big|_{x=0}=1\\&(\arcsin x)^{(2n+1)}\big|_{x=0}=[(2n-1)!!]^2,&&n\in\mathbb{N}^+\end{aligned}\right.$

$\text{5. }$注意到$\displaystyle{\arcsin x+\arccos x=\frac{\pi}{2}}$,故$\displaystyle{\arccos x=\frac{\pi}{2}-x-\frac{x^3}{6}-\frac{3x^5}{40}-\frac{5x^7}{112}-\cdots\ \ \ \ \vert x\vert\leqslant1}$

$\text{6. }\displaystyle{\arctan x=\sum\limits^{\infty}_{n=0}\frac{(-1)^nx^{2n+1}}{2n+1}=x-\frac{x^3}{3}+\frac{x^5}{5}-\frac{x^7}{7}+\cdots\ \ \ \ for\ \ \vert x\vert\leqslant1}$

$\text{7. }\displaystyle{e^x=\sum\limits^{\infty}_{n=0}\frac{x^n}{n!}=1+x+\frac{x^2}{2!}+\frac{x^3}{3!}+\frac{x^4}{4!}+\cdots\ \ \ \ for\ \ x\in\mathbb{R}}$

$\text{8. }$推论:$\displaystyle{a^x=e^{x\ln a}=\sum\limits^{\infty}_{n=0}\frac{(x\ln a)^n}{n!}=1+x\ln a+\frac{x^2\ln^2a}{2!}+\frac{x^3\ln^3a}{3!}+\cdots\ \ \ \ for\ \ x\in\mathbb{R}}$

$\text{9. }\displaystyle{\ln(1+x)=\sum\limits^{\infty}_{n=1}(-1)^{n+1}\frac{x^n}{n}=x-\frac{x^2}{2}+\frac{x^3}{3}-\frac{x^4}{4}+\cdots\ \ \ \ for\ \ x\in(-1,1]}$

  特别地,$\displaystyle{-\ln(1-x)=\sum\limits^{\infty}_{n=1}\frac{x^n}{n}\ \ \ \ for\ \ x\in[-1,1)}$,注意对数前的负号;

  注意利用好 $\ln\prod=\sum\ln$ 的性质,例如$\ln\frac{1-x}{1+x}=\ln\left[1+\left(\frac{1-x}{1+x}-1\right)\right]$不便直接展开,

  但$\ln\frac{1-x}{1+x}=\ln(1-x)-\ln(1+x)$的泰勒公式$-2\sum\limits^n_{k=1}\frac{x^{2k-1}}{2k-1}+\mathcal{O}(x^{2k+1})$却十分简洁

$\text{10. }$推论:在$(-1,1]$内利用换底公式$\log_a(1+x)=\frac{\ln(1+x)}{\ln a}=\frac{1}{\ln a}\sum\limits^{\infty}_{n=1}(-1)^{n+1}\frac{x^n}{n}$,即

$$ \log_a(1+x)=\frac{x}{\ln a}-\frac{x^2}{2\ln^2a}+\frac{x^3}{3\ln^3a}-\frac{x^4}{4\ln^4a}+\cdots\ \ \ \ for\ \ x\in(-1,1] $$

  再利用上式,有$\displaystyle{a^x=e^{x\ln a}=\sum\limits^{\infty}_{n=0}\frac{(x\ln a)^n}{n!}=1+x\ln a+\frac{(x\ln a)^2}{2!}+\cdots\ \ \ \ for\ \ x\in\mathbb{R}}$

$$ \begin{align*}\text{11. }(1+x)^{\alpha}&=\sum\limits^{\infty}_{n=0}\frac{\alpha(\alpha-1)\cdots(\alpha-n+1)}{n!}x^n\\&=1+\alpha x+\frac{\alpha(\alpha-1)}{2!}x^2+\frac{\alpha(\alpha-1)(\alpha-2)}{3!}x^3+\cdots\ \ \ \ \\&when\left\{\begin{aligned}&\alpha\leqslant-1,\ \vert x\vert<1\\&-1<\alpha<0,\ x\in(-1,1]\\&\alpha>0,\ \vert x\vert\leqslant1\end{aligned}\right.\ \ \ \ \text{tip: 二项式定理的推广}\end{align*} $$

  注意$(1+x)^{\frac1x}$直接用$(1+x)^{\alpha}$的泰勒公式是解不出来的,虽然形式相近;

  正确做法应该是先处理幂指函数,再利用$e^x$的泰勒公式:

$$ \begin{align} (1+x)^{\frac1x}&=e^{\frac1x\ln(1+x)}=e^{\frac1x\big(x-\frac{x^2}2+\frac{x^3}{3}-\frac{x^4}{4}+\mathcal{o}(x^4)\big)}\\ &=e^{1-\frac x2+\frac{x^2}3-\frac{x^3}4+\mathcal{o}(x^3)}=e\cdot e^{-\frac x2+\frac{x^2}3-\frac{x^3}4+\mathcal{o}(x^3)}\\ &=e\scriptstyle{\left[1+\left(-\frac x2+\frac{x^2}3-\frac{x^3}4\right)+\frac1{2!}\left(-\frac x2+\frac{x^2}3-\frac{x^3}4\right)^2+\frac{1}{3!}\left(-\frac x2+\frac{x^2}3-\frac{x^3}4\right)^3+\mathcal{o}(x^3)\right]}\\ &=e-\frac e2x+\frac{11e}{24}x^2-\frac{7}{16}x^3+\mathcal{o}(x^3) \end{align} $$

$\text{12. }$推论 1:$\displaystyle{\frac{1}{1-x}=\sum\limits^{\infty}_{n=0}x^n=1+x+x^2+x^3+\cdots\ \ \ \ for\ \ \vert x\vert<1}$

$\text{13. }$推论 2:$\displaystyle{\frac{1}{1+x}=\sum\limits^{\infty}_{n=0}(-x)^n=1-x+x^2-x^3+\cdots\ \ \ \ for\ \ \vert x\vert<1}$

$\text{14. }\displaystyle{\csc x=\frac{1}{x}+\frac{1}{6}x+\frac{7}{360}x^3+\frac{31}{15120}x^5+\frac{127}{604800}x^7+\cdots\ \ \ \ for\ \ x\in(0,\pi)}$

$\text{15. }\displaystyle{\sec x=1+\frac{1}{2}x^2+\frac{5}{24}x^4+\frac{61}{720}x^6+\cdots\ \ \ \ for\ \ \vert x\vert<\frac{\pi}{2}}$

  $\sec x$的泰勒公式求法至少有以下两种方法,其他函数如$\tan x$依此类推:

  • 直接计算在$0$处各阶导数的值,注意到$\sec x=\frac1{\cos x}$是偶函数,因此奇数阶泰勒多项式系数值为 $0$,故只需计算偶数阶导数值。有$\sec0=0$,$\sec'x=\tan x\sec x$,$\sec''0=\tan^20\sec0+\sec^30=1$,$\sec'''x=\tan x\sec x(\tan^2x+5\sec^5x)$,$\sec^{(4)}0=(\sec'''x)'|_{x=0}=\sec0(\tan^40+5\sec^40+18\tan^20\sec^20)=5$,所以:

    $$ \begin{align} \sec x&=\sec0+\frac{\sec''0}{2!}x^2+\frac{\sec^{(4)}}{4!}x^4+\mathcal{o}(x^4)\\ &=1+\frac12x^2+\frac5{24}x^4+\mathcal{o}(x^4) \end{align} $$
  • 利用$\cos x$的泰勒公式,有

    $$ \sec x=\frac1{\cos x}=\frac1{1-\frac1{2!}x^2+\frac1{4!}x^4+\mathcal{O}(x^5)}=\sec0+ax+bx^2+cx^3+dx^4+\mathcal{O}(x^5) $$

    也就是说

    $$ (\sec0+ax+bx^2+cx^3+dx^4)\left(1-\frac1{2!}x^2+\frac1{4!}x^4\right)=1+\mathcal{o}(x^4) $$

    对比系数,考察$x$项系数有$a=0$,考察$x^2$项系数有$b-\frac12=0$,考察$x^3$项系数有$c-\frac12a=0$,考察$x^4$项系数有$d-\frac12b+\frac1{4!}=0$,综上所述有$a=c=0$,$b=\frac12$,$d=\frac5{24}$,所以

    $$ \sec x=1+\frac12x^2+\frac5{24}x^4+\mathcal{o}(x^4) $$

$\text{16. }\displaystyle{\cot x=\frac{1}{x}-\frac{x}{3}-\frac{1}{45}x^3-\frac{2}{945}x^5-\cdots\ \ \ \ for\ \ x\in(0,\pi)}$

利用好奇函数的泰勒级数只有奇数幂、偶函数的泰勒级数只有偶数幂的结论,做选择题确认无穷小阶时往往能事半功倍!

44个函数的泰勒级数展开式

我们来更自然地推导泰勒公式!

$\arctan x$的泰勒级数有一个很有趣的推导,由于较容易想到和人尽皆知,为不影响观感为此列在最后:

$$ \begin{align} for\ \ \vert x\vert<1,\ \arctan x&=\int^x_0\frac{\mathrm{d}t}{1+t^2}\\ &=\int^x_0\sum^{\infty}_{n=0}(-t^2)^n\mathrm{d}t\\ &=\sum^{\infty}_{n=0}(-1)^n\int^x_0t^{2n}\mathrm{d}t\\ &=\sum\limits^{\infty}_{n=0}\frac{(-1)^nx^{2n+1}}{2n+1} \end{align} $$

积分号与累和号次序交换的可行性由逐项可积定理保证:$\big\{\frac{(-1)^nx^{2n+1}}{2n+1}\big\}^{\infty}_{n=0}$处处可微,因此在复数域内均解析,所以在收敛半径内均一致收敛,故而可以逐项积分;此外,可测集上的非负可测函数列也是逐项可积的,但在这里并不适用。

一些常用的幂级数补充:

  • 补 $\text{1. }\displaystyle{\frac1{(1-x)^2}=\sum^{\infty}_{n=0}(n+1)x^n\ \ \ \ for\ \ |x|<1}$
  • 补 $\text{2. }\displaystyle{\frac2{(1-x)^3}=\sum^{\infty}_{n=0}(n+2)(n+1)x^n\ \ \ \ for\ \ |x|<1}$
  • 补 $\text{3. }\displaystyle{\frac{e^x-e^{-x}}2=\sum^{\infty}_{n=0}\frac{x^{2n+1}}{(2n+1)!}\ \ \ \ for\ \ x\in\mathbb{R}}$
  • 补 $\text{4. }\displaystyle{\frac{e^x+e^{-x}}2=\sum^{\infty}_{n=0}\frac{x^{2n}}{(2n)!}\ \ \ \ for\ \ x\in\mathbb{R}}$
  • 补 $\text{5. }\displaystyle{\frac12\ln\frac{1+x}{1-x}=\sum^{\infty}_{n=0}\frac{x^{2n+1}}{2n+1}\ \ \ \ for\ \ |x|<1}$

通常而言,求幂级数的和函数有两种常用的方法:

  • 利用逐项求积 / 求导与泰勒公式 / 麦克劳林级数,通过分析,或者说“凑”,还原出和函数;
  • 利用逐项求积 / 求导,通过寻找一个关于和函数的微分方程,解出微分方程以求得和函数。

对于一些形式稍稍复杂的幂级数,求其和函数往往需要在一定条件下灵活运用逐项求导定理和逐项积分定理,这个过程可能还涉及微分方程问题等。

例如求级数$\sum\limits^{\infty}_{n=1}\frac{n-1}{n!}x^n$的和函数$S(x)$,我们可以分别用以上两种方法来处理。

  1. 注意到我们逐项求导后可以消掉每一项分子中的$n-1$,即$S'(x)=\sum\limits^{\infty}_{n=2}\frac1{(n-2)!}x^{n-1}$,所以

    $$ S'(x)=x\sum^{\infty}_{n=0}\frac1{n!}x^{n}=xe^x $$

    从而

    $$ S(x)=\int S'(x)\mathrm{d}x=e^x(x-1)+C_1 $$

    由$S(0)=0$确认不定系数$C_1=1$,所以$S(x)=xe^x-e^x+1$,收敛域为$\mathbb{R}$。如果在还原的过程中经历了多次逐项求积 / 求导,得到的式子中含有多个不定系数,这时仅由$S(0)$便无法确定所有的不定系数,还需要$S'(0)$、$S''(0)$等值来共同确认多个不定系数。

  2. 注意到,

    $$ S'(x)-S''(x)=\sum^{\infty}_{n=2}\frac1{(n-2)!}x^{n-1}-\sum^{\infty}_{n=2}\frac{n-1}{(n-2)!}x^{n-2}=-\sum^{\infty}_{n=1}\frac{x^n}{n!}=-e^x $$

    这是一个非齐次二阶线性微分方程,可以解得$S(x)=xe^x-e^x+1$。

不少数项级数值的计算需要借助幂级数的和函数,例如交错级数$\displaystyle{\sum^{\infty}_{n=1}\frac{(-1)^n}{n}}$,虽然由莱布尼茨判别法容易知道该级数条件收敛,但莱布尼茨判别法并没有说这个数项级数的值到底是多少,这时就需要通过观察“变”出$x$项来,将数项级数转写为幂级数。在这个例子中,注意符号是交错的且系数绝对值为$\frac1n$,立刻联想到$\displaystyle{\ln(1+x)=\sum\limits^{\infty}_{n=1}(-1)^{n+1}\frac{x^n}{n}},\ x\in(-1,1]$,经分析,$\displaystyle{\sum^{\infty}_{n=1}\frac{(-1)^n}{n}}$可以视为$-\ln(1+x)$的麦克劳林级数取值$x=1$时的情况($\forall n\in\mathbb{N}^+,\ 1^n=1$),从而$\displaystyle{\sum^{\infty}_{n=1}\frac{(-1)^n}{n}=-\ln(1+x)\big|_{x=1}=-\ln2}$。

利用幂级数求高阶微分

在$f(x)$的幂级数展式的收敛区域内,$f(x)$的任意阶导数均存在,换句话说$f(x)$在这一区域内是解析的。注意讨论的是收敛区域而非收敛域,即收敛域的所有内点。

因此,在收敛域内函数均无穷可导。借助此,可以方便地通过幂级数求函数的高阶微分。

例如对于函数$f(x)=\frac{\sin x}{x}$补充定义$f(0)=1$,求$f^{(n)}(0)$;首先容易知道$f(x)$在补充定义后在$\mathbb{R}$上连续,于是有:

$$ \begin{align} \frac{\sin x}x=\sum\limits^{\infty}_{n=0}\frac{(-1)^n}{(2n+1)!}x^{2n}=1-\frac{x^2}{3!}+\frac{x^4}{5!}-\frac{x^6}{7!}+\cdots\end{align} $$

该级数在$x=0$处收敛到$f(0)=1$,因此该级数在$\mathbb{R}$上收敛至$f(x)$,所以$f(x)$在$\mathbb{R}$上任意阶导数存在。将级数等价转写为$\sum\limits^{\infty}_{n=0}a_n$,其中在$n$为奇数时$a_n=0$,$n$为偶数时$a_n=\frac{(-1)^\frac n2(n+1)!}{x^n}$,所以

$$ f^{(n)}(0)=\frac{x^n}{n!}a_n=\left\{\begin{aligned}&0,&&\text{当}n\text{为正奇数}\\&(-1)^{\frac n2}n,&&\text{当}n\text{为非负偶数}\end{aligned}\right. $$

这和复变函数中的解析函数的性质非常相似,读者不妨思考思考他们的内在联系。

和函数问题与展开式问题

由于可行的处理方法较多、技巧的运用较灵活,导致这类问题中的一些常用技巧和方法难以用文字的形式总结,所以这里选取了一些比较有代表性的题目作为范例,读者可以从作者给出的解析中了解到作者处理这类问题的主要思想和方法。


展开/收起3道幂级数的和函数问题在前文已经给出了和函数问题的通法:

通常而言,求幂级数的和函数有两种常用的方法:

  • 利用逐项求积 / 求导与泰勒公式 / 麦克劳林级数,通过分析,或者说“凑”,还原出和函数;
  • 利用逐项求积 / 求导,通过寻找一个关于和函数的微分方程,解出微分方程以求得和函数。

前文中也给出了用这两种方法分别解决问题的简单例子,这里就主要聚焦于针对特殊级数的细节处理。

  • 求幂级数$\sum\limits^n_{n=1}\frac{[2+(-1)^n]^n}nx^n$的和函数$S(x)$;

    首先计算收敛域,这个级数的形式似乎不那么好计算收敛半径——如果不用柯西-阿达马定理的话。虽然由柯西-阿达马定理能直接计算得收敛半径为$\frac1{\varlimsup\limits_{n\to\infty}\sqrt[n]{\left|\frac{[2+(-1)^n]^n}n\right|}}=\frac13$,但这里可以不使用柯西-阿达马定理。

    容易观察到,$\sum\limits^n_{n=1}\frac{[2+(-1)^n]^n}nx^n$的奇数项和偶数项分别的形式其实是比较简单的,只不过合在一起后才变得不那么直观,所以做分解:

    $$ \sum^n_{n=1}\frac{[2+(-1)^n]^n}nx^n=\sum^{\infty}_{n=0}\frac{x^{2n+1}}{2n+1}+\sum^{\infty}_{n=1}\frac{3^{2n}}{2n}x^{2n} $$

    不难计算,奇数项$\sum\limits^{\infty}_{n=0}\frac{x^{2n+1}}{2n+1}$的收敛域为$(-1,1)$,偶数项$\sum\limits^{\infty}_{n=1}\frac{3^{2n}}{2n}x^{2n}$的收敛半径为$\left(-\frac13,\frac13\right)$,所以整个级数$\sum\limits^n_{n=1}\frac{[2+(-1)^n]^n}nx^n$的收敛域应该为$\left(-\frac13,\frac13\right)$;确认了收敛域剩下的工作就很简单了,逐项求导得$S'(x)=\sum\limits^{\infty}_{n=0}x^{2n}+\sum\limits^{\infty}_{n=1}3^{2n}x^{2n-1}=\frac1{1-x^2}+\frac{9x}{1-9x^2}$,所以$S(x)=\ln\sqrt{\left|\frac{1+x}{(1-x)(1-9x^2)}\right|}$,$x\in\left(-\frac13,\frac13\right)$。

  • 求幂级数$\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}(4n^2+2)}{(2n-1)(2n+1)}x^{2n+1}$的和函数$S(x)$;

    解:先求收敛域,

    $$ \lim_{n\to\infty}\frac{\frac{(-1)^{n}\big(4(n+1)^2+2\big)}{(2n+1)(2n+3)}}{\frac{(-1)^{n+1}(4n^2+2)}{(2n-1)(2n+1)}}=1 $$

    所以收敛半径为$\sqrt{\frac11}=1$,又$x=\pm1$时$\lim\limits_{n\to\infty}\pm\frac{(-1)^n(4n^2+2)}{(2n-1)(2n+1)}$不存在(或$\lim\limits_{n\to\infty}\left|\frac{(4n^2+2)}{(2n-1)(2n+1)}\right|=1\neq0$),所以级数在$x=\pm1$处不收敛,从而收敛域为$(-1,1)$。

    接下来对$S(x)=\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}(4n^2+2)}{(2n-1)(2n+1)}x^{2n+1}$做分解,这一点是不难想到的,因为他每一项系数的形式都是$n$的有理分式:

    $$ \begin{align} \sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}(4n^2+2)}{(2n-1)(2n+1)}x^{2n+1}&=x\sum^{\infty}_{n=0}(-1)^{n+1}x^{2n}+3\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}}{(2n-1)(2n+1)}x^{2n+1}\\ &=-\frac{x}{1+x^2}+3\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}}{(2n-1)(2n+1)}x^{2n+1} \end{align} $$

    针对$3\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}}{(2n-1)(2n+1)}x^{2n+1}$可以通过逐项求导来处理掉系数(注:思考一下,这里是否有比逐项求导计算量更小的解法呢?):

    $$ \left(3\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}}{(2n-1)(2n+1)}x^{2n+1}\right)'=3\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}}{(2n-1)}x^{2n}=3+3x\sum\limits^{\infty}_{n=1}\frac{(-1)^{n+1}}{(2n-1)}x^{2n-1} $$$$ \left(\sum\limits^{\infty}_{n=1}\frac{(-1)^{n+1}}{(2n-1)}x^{2n-1}\right)'=\sum^{\infty}_{n=1}(-1)^{n+1}x^{2n-2}=\frac1{1+x^2} $$

    所以

    $$ \begin{align}3\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}}{(2n-1)(2n+1)}x^{2n+1}&=\int\left(3+3x\sum\limits^{\infty}_{n=1}\frac{(-1)^{n+1}}{(2n-1)}x^{2n-1}\right)\mathrm{d}x\\&=\int\left(3+3x\int\left(\frac1{1+x^2}\right)\mathrm{d}x\right)\mathrm{d}x\\&=\int\big(3+3x\arctan x\big)\mathrm{d}x\ \ \ \ \ ^{\ast}\text{分部积分即可}\\&=\frac{3x}2+\left(\frac{3x^2-3}2\right)\arctan x\end{align} $$

    综上,

    $$ \begin{align}\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}(4n^2+2)}{(2n-1)(2n+1)}x^{2n+1}&=-\frac{x}{1+x^2}+3\sum\limits^{\infty}_{n=0}\frac{(-1)^{n+1}}{(2n-1)(2n+1)}x^{2n+1}\\&=\frac{x+3x^3}{2(1+x^2)}+\frac{3(1+x^2)}2\arctan x,\ \ \ \ \,|x|<1\end{align} $$
  • 求幂级数$\sum\limits^{\infty}_{n=0}\frac{x^{4n}}{(4n)!}$的和函数$S(x)$;

    解:首先容易确定收敛域为$\mathbb{R}$,因为$\lim\limits_{n\to\infty}\frac{\left|\frac{x^{4n+4}}{(4n+4)!}\right|}{\left|\frac{x^{4n}}{(4n)!}\right|}=\lim\limits_{n\to\infty}\frac{(4n)!}{(4n+4)!}x^4=0$;

    接着对$S(x)$进行多次逐项求导,有

    1. $\displaystyle S'(x)=\sum^{\infty}_{n=1}\frac{x^{4n-1}}{(4n-1)!}$
    2. $\displaystyle S''(x)=\sum^{\infty}_{n=1}\frac{x^{4n-2}}{(4n-2)!}$
    3. $\displaystyle S^{(3)}(x)=\sum^{\infty}_{n=1}\frac{x^{4n-3}}{(4n-3)!}$
    4. $\displaystyle S^{(4)}(x)=\sum^{\infty}_{n=1}\frac{x^{4n-4}}{(4n-4)!}=S(x)$

    解四阶齐次线性微分方程$S^{(4)}(x)-S(x)=0$,得通解

    $$ S(x)=C_1e^x+C_2e^{-x}+C_3\cos x+C_4\sin x $$

    依次代入初值$S(0)=1,\ S'(0)=S''(0)=S^{(3)}(0)=0$,解得$C_1=C_2=\frac14$,$C_3=\frac12$,$C_4=0$,所以和函数为

    $$ S(x)=\frac14(e^x+e^{-x})+\frac12\cos x,\ \ x\in\mathbb{R} $$

展开/收起4道幂级数的展开式问题(多种方法示例)
  • 求$f(x)=\arctan\frac{1+x}{1-x}$的$x$幂级数展式及收敛域;

    解:由于多数读者对反三角函数没那么熟悉,因此若对这个问题如果没有经验,欲解出正确结果就需要很强的观察力了。注意到,

    $$ f'(x)=\frac1{1+x^2} $$

    这说明,$f(x)$与$\arctan x$在$(-1,1)$上仅相差一个常数,这个常数为$f(0)-\arctan0=\frac{\pi}4$,故$f(x)$的幂级数展式为$\sum\limits^{\infty}_{n=0}\frac{(-1)^nx^{2n+1}}{2n+1}$;当注意该级数收敛区间不可能与$\arctan x$一样为$[-1,1]$,因为$x=1$时$f(x)$没有定义,而$x=-1$处的敛散性根据莱布尼茨判别法是容易知道为收敛的。

    有些时候如果函数本身难以处理,可以尝试对其求导或求积,可能他的导函数或原函数是容易处理的。

  • 求$f(x)=\frac1{(x+2)^2}$在$x=-1$处的幂级数展式及其收敛域;

    • 法一:直接考虑二项式幂的幂级数展开式;

      注意到$\frac1{[(x+1)+1]^2}=\left(1+(x+1)\right)^{-2}$是一个二项式的幂的形式,因此利用麦克劳林级数$(1+x)^{\alpha}=\sum\limits^{\infty}_{n=0}\frac{\alpha(\alpha-1)\cdots(\alpha-n+1)}{n!}x^n$,有

      $$ \begin{align}\left(1+(x+1)\right)^{-2}&=\sum\limits^{\infty}_{n=0}\frac{-2(-2-1)\cdots(-2-n+1)}{n!}(x+1)^n\\&=1-2(x+1)+\frac{-2(-2-1)}{2!}(x+1)^2+\frac{-2(-2-1)(-2-2)}{3!}(x+1)^3+\cdots\\&=\sum^{\infty}_{n=0}(-1)^n(n+1)(x+1)^n\end{align} $$

      由于幂$-2\leqslant-1$,因此收敛域为$|x+1|<1$,即$x\in(-2,0)$。

    • 法二:利用逐项求导 / 积分定理;

      注意到$f(x)=\left(\frac{1}{x+2}\right)'=\left(\frac{1}{1+(x+1)}\right)'$,因此

      $$ \begin{align}\left(\frac{1}{1+(x+1)}\right)'&=\left(\sum^{\infty}_{n=1}(-1)^{n+1}(x+1)^n\right)'\\&=\sum^{\infty}_{n=1}(-1)^{n+1}n(x+1)^{n-1}\end{align} $$

      由于$\frac1{x+2}$的收敛域为$|x+1|<1$,而求导只会加强端点处的发散性,因此$f(x)$幂级数展开式收敛域与之相同,亦为$-2\lt x<0$;代入$x=-2$与$x=0$也是容易验证的。综上,$f(x)=\sum\limits^{\infty}_{n=1}(-1)^{n+1}n(x+1)^{n-1}$,$x\in(-2,0)$。

  • 求$f(x)=-\frac{\ln(1-x)}{1+x}$在$x=0$处的幂级数展开式及其收敛域;

    • 法一:利用泰勒级数的定义与莱布尼茨公式计算高阶导数;

      按泰勒级数的定义,有$f(x)=\sum\limits^{\infty}_{n=0}\frac{f^{(n)}(x_0)}{n!}(x-a)^n$,所以我们只要能计算出$f^{(k)}(0)$就好了。易见有

      1. $[-\ln(1-x)]'=\frac1{1-x}$
      2. $\left(\frac1{1-x}\right)^{(m)}=m!$
      3. $\left(\frac1{1+x}\right)^{(m)}=(-1)^mm!$

      于是,按莱布尼茨公式有

      $$ \begin{align}f^{(n)}(0)&=\left.\sum^n_{k=0}\big[-\ln(1-x)\big]^{(k)}\left(\frac1{1+x}\right)^{(n-k)}\right|_{x=0}\\&=\sum^n_{k=1}\binom{n}{k}\times(k-1)!\times(-1)^{n-k}(n-k)!\\&=\sum^n_{k=1}(-1)^{n-k}\frac{n!}k\end{align} $$

      所以

      $$ f(x)=\sum\limits^{\infty}_{n=0}\frac{\sum\limits^n_{k=1}(-1)^{n-k}\frac{n!}k}{n!}(x-a)^n=\sum^{\infty}_{n=0}\sum^n_{k=1}\frac{(-1)^{n-k}}kx^n $$

      又$\sum\limits^n_{k=1}\frac{(-1)^{n-k}}k\leqslant\left|\sum\limits^n_{k=1}\frac{(-1)^{k}}k\right|\to\ln2\ \ \ (n\to\infty)$,从而$\lim\limits_{n\to\infty}\sqrt[n]{\left|\sum\limits^n_{k=1}\frac{(-1)^{n-k}}k\right|}=1$,故$\sum\limits^{\infty}_{n=0}\sum\limits^n_{k=1}\frac{(-1)^{n-k}}kx^n$的收敛半径为$1$;当$x=\pm1$时易见不收敛,因为$\lim\limits_{n\to\infty}\left|\sum\limits^n_{k=1}\frac{(-1)^{n-k}}k\right|=\ln2\neq0$。综上所述,$f(x)=-\frac{\ln(1-x)}{1+x}$在$x=0$处的幂级数展开式为$\sum\limits^{\infty}_{n=0}\sum\limits^n_{k=1}\frac{(-1)^{n-k}}kx^n$,收敛域为$|x|<1$。

    • 法二:直接展为两个级数的乘积;

      由于$f(x)=-\frac{\ln(1-x)}{1+x}=-\ln(1+x)\times\frac1{1+x}$,而我们知道:

      1. $-\ln(1-x)=\sum\limits^{\infty}_{n=1}\frac{x^n}n\ \ \ \ for\ \ x\in[-1,1)$
      2. $\frac{1}{1+x}=\sum\limits^{\infty}_{n=0}(-x)^n\ \ \ \ for\ \ \vert x\vert<1$

      所以$f(x)=\left(\sum\limits^{\infty}_{n=1}\frac{x^n}n\right)\cdot\left(\sum\limits^{\infty}_{n=0}(-x)^n\right)$,收敛域为$|x|<1$。若记$f(x)=\sum\limits^{\infty}_{n=0}a_nx^n$,可以观察到$a_n$是有规律的(多项式的积),其中

      $$ a_n=\frac1n-\frac1{n-1}+\frac1{n-2}-\frac1{n-3}+\cdots+(-1)^{n-2}\frac12+(-1)^{n-1} $$
  • 将幂级数$\sum\limits^{\infty}_{n=0}(-1)^n(2n+1)(2x-1)^n$的和函数展为$x-1$的幂级数;

    解:这个题的常规做法是先解出和函数,再将和函数展开,但在实际处理的过程中可以适当“偷懒”,即不写出和函数的最终形式,直接用微分与积分将和函数表示为$(x-1)$的函数,最后再将其展为$x-1$的幂级数。

    容易计算出收敛域为$(0,1)$,于是

    $$ \begin{align} \sum^{\infty}_{n=0}(-1)^n(2n+1)(2x-1)^n&=\sum^{\infty}_{n=0}(-1)^n2(n+1)(2x-1)^n-\sum^{\infty}_{n=0}(-1)^n(2x-1)^n\\ &=\left(\sum^{\infty}_{n=0}(-1)^n(2x-1)^{n+1}\right)'-\frac1{1+(2x-1)}\\ &=\left(\frac{2x-1}{1+(2x-1)}\right)'-\frac1{1+(2x-1)}\\ &=\left(1-\frac12\frac1{1+(x-1)}\right)'-\frac12\frac1{1+(x-1)}\\ &=-\frac12\sum^{\infty}_{n=0}(-1)^n\frac{\mathrm{d}}{\mathrm{d}x}(x-1)^n-\frac12\sum^{\infty}_{n=0}(-1)^n(x-1)^n\\ &=-\frac12\left(\sum^{\infty}_{n=0}(-1)^{n+1}(n+1)(x-1)^n+\sum^{\infty}_{n=0}(-1)^n(x-1)^n\right)\\ &=\frac12\sum^{\infty}_{n=0}(-1)^nn(x-1)^n,\ \ \ \ \ \ \ x\in(0,1) \end{align} $$

最后,个人建议,在计算和函数时如非必要则尽量不要逐项积分与逐项求导(即使逐项积分与逐项求导的确是一个强大且有效的方法),除非万不得已(也应注意某些情况下逐项积分与逐项求导或微分方程反而是最简便甚至唯一可行的方法)。这是因为,来回积分与求导的计算量是很大的,而一般对幂级数进行了逐项积分后需要对和函数求导才能得到原幂级数的和函数,对幂级数进行了逐项求导后也需要对和函数积分才能得到原幂级数的和函数,这期间伴随着凑补$x$的幂,会让计算变得复杂;微分方程则毋需多言,也是有一定计算量的方法。

如果是笔算的话,毕竟我们是自然人而不是计算机,因此算的步骤越多,难免错的概率越大,所以如果能直接凑成已知的泰勒级数,就没必要来回求导和求积。

注:即便如此,在前文折叠起来的幂级数例题中,我所给出的解法步骤仍然大量使用了逐项求导与逐项求积的方法,这主要是于我个人而言对这种方法较为熟悉。

以一个简单的幂级数作为例子说明这一建议的缘由,譬如求$\sum\limits^{\infty}_{n=2}\frac{x^n}{n+1}$的和函数,如果一定要用逐项求导的方法,可以先将分子凑成$n+1$次再求导,即$\sum\limits^{\infty}_{n=2}\frac{x^n}{n+1}=\frac1n\sum\limits^{\infty}_{n=2}\frac{x^{n+1}}{n+1}$,而$\frac{\mathrm{d}}{\mathrm{d}x}\left(\sum\limits^{\infty}_{n=2}\frac{x^{n+1}}{n+1}\right)=\sum\limits^{\infty}_{n=2}\frac{\frac{\mathrm{d}}{\mathrm{d}x}x^{n+1}}{n+1}=\sum\limits^{\infty}_{n=2}x^n=\frac1{1-x}-1-x$,因此$\sum\limits^{\infty}_{n=2}\frac{x^n}{n+1}=\frac1x\displaystyle\int\textstyle\big(\frac1{1-x}-1-x\big)\mathrm{d}x=-\frac1x\ln(1-x)-1-\frac{x}2+C\frac1x$,最后通过$\left.\left(\sum\limits^{\infty}_{n=2}\frac{x^n}{n+1}\right)'\right|_{x=0}=0$确认$C=0$,综上$\sum\limits^{\infty}_{n=2}\frac{x^n}{n+1}=-\frac{\ln(1-x)}x-1-\frac{x}2$。

但仔细想想,这会不会过于繁琐了呢?注意到,$\sum\limits^{\infty}_{n=2}\frac{x^n}{n+1}=\frac1x\sum\limits^{\infty}_{n=3}\frac{x^n}{n}=\frac1x\big(-\ln(1-x)-x-\frac{x^2}2\big)$——这里只用了一步就直接解出了和函数为$-\frac{\ln(1-x)}x-1-\frac{x}2$。虽然这个例子十分浅显,但蕴含的道理是很有意义的:减少不必要的计算。只有这样,当面对复杂的幂级数时才能够尽可能减少计算时间与计算错误的可能。


上文已经给出了”尽量少使用逐项求导与逐项求积的解法“的思想,这里负责说明对具体的幂级数,如何分析才能达到少使用逐项求导与逐项求积、减少计算量以减小错误率的目的。

  • 针对$\sum R(n)x^n$型的幂级数($R(n)$是$n$的多项式),首先给出以下三个常用幂级数,证明是平凡的:

    $$ \left\{\begin{aligned} &\frac{1}{1-x}=\sum\limits^{\infty}_{n=0}x^n&&for\ \ \vert x\vert<1\\ &\frac1{(1-x)^2}=\sum^{\infty}_{n=0}(n+1)x^n&&for\ \ |x|<1\\ &\frac2{(1-x)^3}=\sum^{\infty}_{n=0}(n+2)(n+1)x^n&&for\ \ |x|<1 \end{aligned}\right. $$

    以幂级数$\sum\limits^{\infty}_{n=0}(n+1)(n+3)x^n$为例,由于

    $$ (n+1)(n+3)=\underbrace{(n+2)(n+1)}_{\text{凑}n^2\text{项}}\ +\ \underbrace{(n+1)}_{\text{凑}n\text{项}}\ +\underbrace{0}_{\text{凑常数项}} $$

    因此$\sum\limits^{\infty}_{n=0}(n+1)(n+3)x^n=\frac2{(1-x)^3}+\frac1{(1-x)^2}$,收敛域为$|x|<1$。

  • 针对$\sum\frac{R(n)}{(n+k)!}x^n$型的幂级数(即系数中含有阶乘部分的幂级数),类似处理$\sum R(n)x^n$型幂级数的思想,将系数$\frac{R(n)}{(n+k)!}$用$\frac{k_1}{(n+k)!}$、$\frac{k_2(n+k)}{(n+k)!}$与$\frac{k_3(n+k)(n+k-1)}{(n+k)!}$等表示出来,也可以达到减少计算量的目的。

    以幂级数$\sum\limits^{\infty}_{n=0}\frac{(-1)^nn^2}{(n+1)!}x^n$为例,由于

    $$ \frac{n^2}{(n+1)!}=\frac{(n+1)n}{(n+1)!}-\frac{n+1}{(n+1)!}+\frac1{(n+1)!} $$

    $$ \sum^{\infty}_{n=0}\frac{(n+1)n}{(n+1)!}(-x)^n=\sum^{\infty}_{n=1}\frac1{(n-1)!}(-x)^n=-x\sum^{\infty}_{n=0}\frac1{n!}(-x)^n=-xe^{-x} $$$$ \sum^{\infty}_{n=0}\frac{n+1}{(n+1)!}(-x)^n=\sum^{\infty}_{n=0}\frac1{x!}(-x)^n=e^{-x} $$$$ \sum^{\infty}_{n=0}\frac1{(n+1)!}(-x)^n=-\frac1x\sum^{\infty}_{n=1}\frac1{n!}(-x)^n=-\frac1xe^{-x}+\frac1x $$

    因此$\sum\limits^{\infty}_{n=0}\frac{(-1)^nn^2}{(n+1)!}x^n=e^{-x}(-x-1-\frac1x)+\frac1x$,在$x=0$处补充定义和函数取$0$,收敛域为$x\in\mathbb{R}$。

  • 针对$\sum\frac{R_1(n)}{R_2(n)}x^n$型的幂级数,同样做分解、凑成已知的麦克劳林级数即可。除了上文已经给出的一些基本函数的麦克劳林级数,这里还需要补充一个常见幂级数$\frac12\ln\frac{1+x}{1-x}=\sum\limits^{\infty}_{n=0}\frac{x^{2n+1}}{2n+1}$,收敛域为$|x|<1$。

部分特殊级数

等差数列 $a_n=a_{n-1}+d$,有 $S_n=\frac{n(a_1+a_n)}{2}=n\cdot a_1+n(n-1)d$

↑ 有趣的是,当$a_1=1$、$d=2$时,在数值上恰有$S_n=n^2$

等比数列 $b_n=q\cdot b_{n-1}$,有 $S_n=\frac{b_1(1-q^n)}{1-q}=\frac{b_1}{1-q}-\frac{b_1}{1-q}\cdot q^n$

$\frac{\pi}{4}=\sum\limits^{\infty}_{n=0}(-1)^{n}\frac{1}{2n+1}=1-\frac{1}{3}+\frac{1}{5}-\frac{1}{7}+\cdots$

↑ 该级数又称莱布尼茨级数,可通过$\arctan x$的幂级数取$x=1$直接得到

$\frac{\pi^2}{6}=\zeta(2)=\sum\limits^{\infty}_{n=1}\frac{1}{n^2}=1+\frac{1}{4}+\frac{1}{9}+\cdots$

$\frac{\pi^2}{8}=\sum\limits^{\infty}_{n=0}\frac{1}{(2n+1)^2}=1+\frac{1}{9}+\frac{1}{25}+\cdots$

↑ 欧拉通过对比$\cos x$的泰勒级数系数于1735年不严谨地“证明”了上式

↑ 稍后将利用傅里叶级数严谨地证明以上级数

$\frac{\pi^4}{90}=\zeta(4)=\sum\limits^{\infty}_{n=1}\frac{1}{n^4}=1+\frac{1}{16}+\frac{1}{81}+\cdots$

调和级数$\sum\limits^{\infty}_{n=1}\frac{1}{n}=\zeta(1)$发散,欧拉常数$\gamma\approx0.5772\text{,}$

$$ \sum\limits^k_{n=1}\frac{1}{n}=\int^1_0\frac{1-x^k}{1-x}\mathrm{d}x=\psi(k+1)+\gamma=\ln k+\gamma+\varepsilon_k $$

$\sum\limits^n_{k=1}k^j$一定是一个$n$次的$j+1$次多项式,这类数列和的求法可参考:1²+2²+…+n²求和公式的推导有哪些方法?,这里有很齐全很多样的各种推导,或严谨,或有趣,或巧妙,或标准。

傅里叶级数

傅里叶级数与正交三角函数系,构成一个函数的希尔伯特空间。

傅里叶级数的收敛定理

若$f(x)$在周期区间$[-l,l]$上按段光滑(在$[-l,l]$上$f$至多有限个第一类间断点、$f'$至多有限点外连续),则$f$的傅里叶级数在$\forall x\in[-l,l]$上均收敛于$f$在$x$处左右极限的算术平均值。

傅里叶级数系数计算:

$$ f(x)\sim\frac{a_0}{2}+\sum^{\infty}_{n=1}\big(a_n\cos\frac{n\pi x}{l}+b_n\sin\frac{n\pi x}{l}\big) $$

其中:

  • $\displaystyle{a_n=\frac1{l}\int^{l}_{-l}f(x)\cos\frac{n\pi x}{l}\mathrm{d}x}$
    • 特别地在$[-\pi,\pi]$上:$\displaystyle{a_n=\frac1{\pi}\int^{\pi}_{-\pi}f(x)\cos{nx}\mathrm{d}x}$;
  • $\displaystyle{b_n=\frac1{l}\int^{l}_{-l}f(x)\sin\frac{n\pi x}{l}\mathrm{d}x}$
    • 特别地在$[-\pi,\pi]$上:$\displaystyle{b_n=\frac1{\pi}\int^{\pi}_{-\pi}f(x)\sin{nx}\mathrm{d}x}$;
  • 其中,$\displaystyle{a_0=\frac1{l}\int^{l}_{-l}f(x)\mathrm{d}x}$
    • 特别地在$[-\pi,\pi]$上:$\displaystyle{a_0=\frac1{\pi}\int^{\pi}_{-\pi}f(x)\mathrm{d}x}$;

可以将$\displaystyle{\int^l_{-l}}$替换为$\displaystyle{\int^{x_0+l}_{x_0-l}}$,没有本质区别;

容易知道,奇函数的傅里叶级数只有$\sin$项(正弦级数),偶函数的傅里叶级数只有$\cos$项(余弦级数)。

当函数被要求展开的区间不对称时,应当进行解析延拓;这其中最特殊的是在$[0,l]$上将$f(x)$展为傅里叶级数,奇延拓即令$f(x)=-f(-x)$、偶延拓即令$f(x)=f(-x)$,两种延拓都能将$f$从$[0,l]$拓展到$[-l,l]$,从而区间对称、可以展为傅里叶级数。奇延拓后的傅里叶级数为正弦级数,偶延拓后的傅里叶级数为余弦级数,这是容易理解的,因为$\sin$是奇函数、$\cos$是偶函数。

将$[0,l]$上的$f(x)$通过延拓展为傅里叶级数:

  • 奇延拓,正弦级数:$a_n=0$,$\displaystyle{b_n=\frac2{l}\int^{l}_0f(x)\sin\frac{n\pi x}{l}\mathrm{d}x}$;
  • 偶延拓,余弦级数:$\displaystyle{a_n=\frac2{l}\int^{l}_0f(x)\cos\frac{n\pi x}{l}\mathrm{d}x}$,$b_n=0$;

其余情况以此类推;也可以做周期延拓。请注意,当函数本身便是奇函数或偶函数,可以视为相应的延拓,直接按给出的延拓公式计算即可:因为按标准公式算出来结果是一致的。


在这里,将通过傅里叶级数证明前文所提到的$\sum\limits^{\infty}_{n=1}\frac1{n^2}=\frac{\pi^2}6$与$\sum\limits^{\infty}_{n=0}\frac1{(2n+1)^2}=\frac{\pi^2}8$:

首先将$f(x)=2+|x|$在$[-1,1]$上、以$2$为周期展为傅里叶级数,计算傅里叶系数:

$$ \left\{ \begin{aligned} &a_n=2\int^1_0(2+x)\cos(n\pi x)\mathrm{d}x=\frac{2(\cos n\pi-1)}{n^2\pi^2}\\ &b_n=0\ \ \ \ \ \ \ \ \ \text{Tip: 偶函数}\end{aligned} \right. $$

其中$a_0=2\displaystyle{\int^1_0(2+x)\mathrm{d}x=5}$,因此在$[-1,1]$上,有

$$ \begin{align}f(x)&=\frac52+\sum^{\infty}_{n=1}\frac{2(\cos n\pi-1)}{n^2\pi^2}\cos(n\pi x)\\&=\frac52-\frac4{\pi^2}\sum^{\infty}_{n=0}\frac{\cos[(2n+1)\pi x]}{(2n+1)^2}\end{align} $$
  1. 取$x=0$,有$2=\frac52-\frac4{\pi^2}\sum\limits^{\infty}_{n=0}\frac1{(2n+1)^2}$,即$\sum\limits^{\infty}_{n=0}\frac1{(2n+1)^2}=\frac{\pi^2}8$;

  2. 注意到$\sum\limits^{\infty}_{n=1}\frac1{n^2}=\sum\limits^{\infty}_{n=0}\frac1{(2n+1)^2}+\sum\limits^{\infty}_{n=1}\frac1{(2n)^2}=\sum\limits^{\infty}_{n=0}\frac1{(2n+1)^2}+\frac14\sum\limits^{\infty}_{n=1}\frac1{n^2}$,故得到$\sum\limits^{\infty}_{n=1}\frac1{n^2}=\frac34\sum\limits^{\infty}_{n=0}\frac1{(2n+1)^2}=\frac{\pi^2}6$。

这只是计算这两个级数的一种利用傅里叶级数的解法,除此之外还可以通过Wallis公式、留数定理等方法解决。


Bessel不等式是证明收敛定理的关键之一:若函数$f$在$[-\pi,\pi]$上可积,则$\displaystyle{\frac{a^2_0}{2}+\sum\limits^{\infty}_{n=1}(a^2_n+b^2_n)\leqslant\frac1{\pi}\int^{\pi}_{-\pi}f^2(x)\mathrm{d}x}$。

黎曼引理对傅里叶级数连续性证明是至关重要的,但是由于已经在 高等数学工具 PartⅠ 提及,所以在此折叠。

展开/收起黎曼引理

任何两个互不相同的三角函数系函数乘积在$[-\pi,\pi]$上积分为零,即三角函数系是正交函数系;

$$ \int^{\pi}_{-\pi}\cos nx\mathrm{d}x=\int^{\pi}_{-\pi}\sin nx\mathrm{d}x=0 $$$$ \left\{ \ \begin{aligned} &\int^{\pi}_{-\pi}\sin(nx)\cos(mx)\mathrm{d}x=0\\ &\left.\begin{aligned}&\int^{\pi}_{-\pi}\sin(nx)\sin(mx)\mathrm{d}x=0\\ &\int^{\pi}_{-\pi}\cos(nx)\cos(mx)\mathrm{d}x=0\end{aligned}\ \right\}\ n\neq m \end{aligned} \right. $$

三角函数系中任何函数的平方在$[-\pi,\pi]$上积分都不为零,

$$ \int^{\pi}_{-\pi}\cos^2 nx\mathrm{d}x=\int^{\pi}_{-\pi}\sin^2 nx\mathrm{d}x=\pi $$

三角函数形式的黎曼-勒贝格定理(Riemann–Lebesgue lemma):若$f$黎曼可积,则

$$ \left\{ \begin{aligned} &\lim\limits_{n\to\infty}\int^{\pi}_{-\pi}f(x)\cos(nx)\mathrm{d}x=0\\ &\lim\limits_{n\to\infty}\int^{\pi}_{-\pi}f(x)\sin(nx)\mathrm{d}x=0 \end{aligned} \right. $$

推广:黎曼引理:若$f$在区间$[a,b]$上黎曼可积,则以下三式均成立且等价

$$ \left\{ \begin{aligned} &[1]\ \lim_{n\to\pm\infty}\int^b_af(x)\sin(nx)\mathrm{d}x=0\\ &[2]\ \lim_{n\to\pm\infty}\int^b_af(x)\cos(nx)\mathrm{d}x=0\\ &[3]\ \lim_{n\to\pm\infty}\int^b_af(x)e^{inx}\mathrm{d}x=0 \end{aligned} \right. $$

再推广:黎曼引理:若$f$在区间$[a,b]$上黎曼可积、$g$有最小正周期$T$且在$[0,T]$上黎曼可积,则

$$ \lim_{n\to\pm\infty}\int^b_af(x)g(nx)\mathrm{d}x=\frac1T\int^b_af(x)\mathrm{d}x\int^T_0g(x)\mathrm{d}x $$

黎曼引理证明的部分请参考这篇文章:大学数学竞赛#2-Riemann引理及其应用(积分极限、无穷级数)

黎曼引理相关推论请参考这篇文章:如何通俗易懂地理解黎曼引理?

利用下文的区间在现方法可导出:

$$ \left\{ \begin{aligned} &\ \int^\pi_0xf(\sin x)\mathrm{d}x=\frac{\pi}{2}\int^\pi_0f(\sin x)\mathrm{d}x\\ &\ \int^\pi_0xf(\cos x)\mathrm{d}x=\frac{\pi}{2}\int^\pi_0f(-\cos x)\mathrm{d}x \end{aligned} \right. $$

三角函数积分总结(一)~ sinx与cosx混合积分

三角函数积分总结(二)~ secx与tanx混合积分

傅里叶变换可以认为是“连续的傅里叶级数”,这里暂时不涉及傅里叶变换的内容。

多元函数的极限与连续

重极限与累次极限

设$f$是定义在$D\subset\mathbb{R}^2$上的二元函数,$P_0$是$D$的一个聚点、$A$是某个常实数。若$\forall\varepsilon>0$,总$\exists \delta>0$,$s.t.$当$P\in\mathring{U}(P_0;\delta)\cap D$时,都有$|f(P)-A|<\varepsilon$,则称$f$在$D$上当$P\to P_0$时以$A$为 (重) 极限,记作$\lim\limits_{p\to P_0\atop P\in D}f(P)=A$、$\lim\limits_{P\to P_0}f(P)=A$或$\lim\limits_{(x,y)\to(x_0,y_0)}f(P)=A$。

  1. 若任一累次极限和重极限均存在,则二者一定相等;
  2. 对于二元函数,若两个累次极限存在但不相等,则重极限一定不存在;
  3. 重极限和累次极限没有必然关系,累次极限不是重极限的一种“趋近方式”。因此若重极限存在,累次极限不一定存在;反之若累次极限均存在,重极限也不一定存在。

证明重极限不存在,可以任找一组$\{(x_n,y_n)\}$,证明当$(x_n,y_n)\to(x_0,y_0)$时,极限$\lim\limits_{(x_n,y_n)\to(x_0,y_0)}f(x,y)$不唯一即可。这里蕴含的原理是:若重极限存在,则以任意方式逼近,得到的极限应该都相等。

例如当$(x_n,y_n)\to(0,0)$时欲判断重极限不存在,最简单的做法是令$y=kt$、$x=t$(按需求取合适的变量即可,这里取的是过点$(0,0)$的直线),然后令$t\to0$,若极限的值与$t$取值有关,则重极限不存在。也可以取两个不同的$k$,说明结果不唯一。

多元函数连续性

设$f$是定义在$D\subset\mathbb{R}^2$上的二元函数,$P_0\in D$。若$\forall\varepsilon>0$,总$\exists \delta>0$,只要$P\in U(P_0;\delta)\cap D$时,就有$|f(P)-f(P_0)|<\varepsilon$,则称$f$关于集合$D$在点$P_0$连续。

一元函数极限的唯一性、局部有界性、保号性、四则运算、迫敛性和所谓等价无穷小,在多元函数极限均成立。

若函数$f$在有界闭域$D\subset\mathbb{R}^2$上连续,则:

  1. $f$在$D$上有界,且能取到最大值和最小值;
  2. $f$在$D$上一致连续;
  3. 介值性定理成立。

增量与偏增量

记$\Delta x=x-x_0$、$\Delta y=y-y_0$,称$\Delta z=\Delta f(x_0,y_0)=f(x,y)-f(x_0,y_0)=f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)$为函数$f$在点$P_0$的全增量,可以用增量描述连续性:当且仅当$\lim\limits_{(\Delta x,\Delta y)\to(0,0)\atop(x,y)\in D}\Delta z=0$时,函数$f$在点$P_0$连续。

当分别在全增量中取$\Delta y=0$与$\Delta x=0$,称相应的函数增量为偏增量,分别记为$\Delta_xz$与$\Delta_yz$。一般来说,全增量不等于两偏增量的和。

多元函数微分学

可微性

在点$P_0(x_0,y_0)$的某个邻域中,若$z=f(x,y)$有定义且在点$P_0$处的全增量$\Delta z$能被表示为$\Delta z=f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)=A\Delta x+B\Delta y+\mathcal{o}(\rho)$,则称$f$在点$P_0$可微,并称关于$\Delta x$、$\Delta y$的线性函数$A\Delta x+B\Delta y$为函数$f$在点$P_0$的全微分,记作$\mathrm{d}z\big|_{P_0}=\mathrm{d}f(x_0,y_0)=A\Delta x+B\Delta y$——即全微分$\mathrm{d}z$是全增量$\Delta z$的线性主部,其中$A$、$B$是仅与点$P_0$有关的常数,事实上他们分别是偏导数$f_x(x_0,y_0)$和$f_y(x_0,y_0)$;$\rho=\sqrt{\Delta x^2+\Delta y^2}$,而$\mathcal{o}(\rho)$是较$\rho$的高阶无穷小量。

当$|\Delta x|$与$|\Delta y|$充分小时,全微分为全增量的近似值,即$f(x,y)\approx f(x_0,y_0)+A(x-x_0)+B(y-y_0)$。

总结 1:因此,证明函数$f$在点$(x_0,y_0)$处可微,考察其全增量$f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)$,观察观察原式是否能写为$A\Delta x+B\Delta y+g(\Delta x,\Delta y)$的形式即可,其中$\frac{|g(\Delta x,\Delta y)|}{\rho}\to0\ \ (\rho\to0)$;

等价地说,只需要验证极限式

$$ \color{#CD0000}{\boldsymbol{\lim\limits_{\rho\to0}\frac{[f(x_0+\Delta x,y_0+\Delta y)-f(x_0,y_0)]-[f_x(x_0,y_0)\Delta x+f_y(x_0,y_0)\Delta y]}{\rho}=0}} $$

是否成立即可。

总结 2:证明不可微,实际上是在证明一个重极限不存在,因此说明$(\Delta x,\Delta y)$沿着不同的方向趋于$(0,0)$时极限结果不唯一即可。

上文中$A$与$B$分别为$f$关于$x$与$y$在点$(x_0,y_0)$处的偏导数,根据定义,有:

$$ \left\{\begin{aligned} &A=\left.\frac{\partial f}{\partial x}\right|_{(x_0,y_0)}=\lim\limits_{\Delta x\to0}\frac{\Delta_xf(x_0,y_0)}{\Delta x}=\lim\limits_{\Delta x\to0}\frac{f(x_0+\Delta x,y_0)-f(x_0,y_0)}{\Delta x}\\ &B=\left.\frac{\partial f}{\partial y}\right|_{(x_0,y_0)}=\lim\limits_{\Delta y\to0}\frac{\Delta_yf(x_0,y_0)}{\Delta y}=\lim\limits_{\Delta y\to0}\frac{f(x_0,y_0+\Delta y)-f(x_0,y_0)}{\Delta y}\end{aligned}\right. $$

总结 3:所以,欲计算分段函数$f$在点$(x_0,y_0)$处的偏导数(或验证偏导数是否存在),计算上述极限即可。

总结 4:明确$f$在点$(x_0,y_0)$处有一阶连续偏导数的情况下,若需计算偏导数在该点的具体值,则可以将该点分量的值代入无关变量后再求导,避免了直接使用繁复的定义,大大简化了计算。这种方法显然可行,因为偏导的极限定义式中不涉及非偏导变量以外的增量。例如求$f(x,y)=\frac{2x+3y}{1+xy\sqrt{x^2+y^2}}$在$(0,0)$处对$x$偏导数的值$f_x(0,0)$,有$\frac{\partial f(x,y)}{\partial x}\Big|_{(x,y)=(0,0)}=\frac{\mathrm{d}f(x,0)}{\mathrm{d}x}\Big|_{x=0}=\frac{\mathrm{d}}{\mathrm{d}x}2x\Big|_{x=0}=2$,将偏导问题转为一元函数导数问题,极大减小了计算量。即使需要求高阶混合偏导的值,也可以如此操作。

  • 可微必要条件:函数在某点可微的必要条件是函数在该点对每个自变量的偏导数均存在。
  • 可微充分条件 (连续可微):若函数的对每个分量的偏导数在$(x_0,y_0)$的某个邻域内均存在、点$(x_0,y_0)$处均连续,则函数在该点可微。使用该充分条件时需要注意,$f$是$x_1,x_2,\cdots$的函数,偏导数也是$x_1,x_2,\cdots$的函数;如果偏导数都只对其中一个分量连续,是推不出函数可微的。
  • 连续可微的条件可进一步减弱,对于二元实函数,若在某点对其中一自变量的偏导存在,而对令一自变量的偏导连续,则函数在该点可微。证明思路是利用拉格朗日中值定理,不妨设$f_x(x_0.y_0)$存在而$f_y(x,y)$在$(x_0,y_0)$处连续,则:
连续可微
  • 即使在某点处偏导数存在,多元函数也不一定在这一点连续。

  • 补充:对于在点$x=a$的某邻域内有定义的函数$f$,函数$f(x)|x-a|$在$x=a$处可导的充要条件是$f(a)=0$!

    该定理可以推广到多元的情形,以二元为例,对于在点$(a,b)$的某邻域内有定义的二元函数$f(\cdot,\cdot)$,函数$f(x,y)\big|(x-a)-(y-b)\big|$在点$(a,b)$处偏导数存在的充要条件是极限$\lim\limits_{x\to a}f(x,b)$、$\lim\limits_{y\to b}f(a,y)$存在且$\lim\limits_{x\to a}f(x,b)=\lim\limits_{y\to b}f(a,y)=0$。

此外,若$P(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y$是某函数的全微分,且$P$、$Q$关于$x$与$y$都有一阶连续偏导数,则一定满足:

$$ \boldsymbol{\frac{\partial P}{\partial y}=\frac{\partial Q}{\partial x}} $$

这实际上是混合偏导可交换的充分条件“若$f_{xy}(x,y)$与$f_{yx}(x,y)$均在点$(x_0,y_0)$处连续,则$f_{xy}(x_0,y_0)=f_{yx}(x_0,y_0)$”的一个推论,但实在大有用处。

展开/收起1道混合偏导问题

计算不光滑点处的导数或偏导数,无论对象是一元函数、二元函数还是多元函数,通常都依赖于利用定义求导。

  • 设$f(x,y)=\left\{\begin{aligned}&\frac{x^2y}{x^2+y^2},&&x^2+y^2\neq0\\&0,&&x^2+y^2=0\end{aligned}\right.$,试判断$f_{xy}(0,0)$与$f_{yx}(0,0)$的存在性;

    解:要判断混合偏导的存在性,首先要计算一阶偏导。一方面,如果一阶偏导都不存在,二阶的混合偏导当然也不存在;另一方面,在通过定义计算二阶偏导时,也需要用到一阶偏导的值。

    根据定义,有

    $$ \left\{\begin{aligned}&f_x(0,0)=\lim_{x\to0}\frac{f(x,0)-f(0,0)}x=\lim_{x\to0}0=0\\&f_y(0,0)=\lim_{y\to0}\frac{f(0,y)-f(0,0)}y=\lim_{y\to0}0=0\end{aligned}\right. $$

    故在$(0,0)$点处一阶偏导存在且均为$0$,接着计算当$x,y\neq0$时的偏导数:

    $$ \left\{\begin{aligned}&f_x=\frac{\partial}{\partial x}\frac{x^2y}{x^2+y^2}=\frac{2xy^3}{(x^2+y^2)^2},&&x^2+y^2\neq0\\&f_y=\frac{\partial}{\partial y}\frac{x^2y}{x^2+y^2}=\frac{x^4-x^2y^2}{(x^2+y^2)^2},&&x^2+y^2\neq0\end{aligned}\right. $$

    接下来就可以按定义计算点$(0,0)$处的混合偏导以判断其存在性了:

    $$ f_{xy}(0,0)=\lim_{y\to0}\frac{f_x(0,y)-f_x(0,0)}y=\lim_{y\to0}0\cdot\frac1y=0 $$$$ f_{yx}(0,0)=\lim_{x\to0}\frac{f_y(x,0)-f_y(0,0)}x=\lim_{x\to0}\frac{x^3}{x^4}=\infty $$

    综上所述,$f_{xy}(0,0)$存在且值为$0$,$f_{yx}(0,0)$不存在。

    这类问题按定义逐步分析即可。

一阶全微分的形式不变性:对于可微多元函数$z=f(u,v)$,其中$\left\{\begin{aligned}&u=\varphi(x,y)\\&v=\psi(x,y)\end{aligned}\right.$,有

$$ \begin{align} \mathrm{d}z&=\frac{\partial z}{\partial x}\mathrm{d}x+\frac{\partial z}{\partial y}\mathrm{d}y\\ &=\left(\frac{\partial z}{\partial u}\frac{\partial u}{\partial x}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial x}\right)\mathrm{d}x+\left(\frac{\partial z}{\partial u}\frac{\partial u}{\partial y}+\frac{\partial z}{\partial v}\frac{\partial v}{\partial y}\right)\mathrm{d}y\\ &=\frac{\partial z}{\partial u}\left(\frac{\partial u}{\partial x}\mathrm{d}x+\frac{\partial u}{\partial y}\mathrm{d}y\right)+\frac{\partial z}{\partial v}\left(\frac{\partial v}{\partial x}\mathrm{d}x+\frac{\partial v}{\partial y}\mathrm{d}y\right)\\ &=\frac{\partial z}{\partial u}\mathrm{d}u+\frac{\partial z}{\partial v}\mathrm{d}v\end{align} $$

多元函数一阶全微分的形式不变性可视为一元函数的一阶微分形式不变性的推广。

复合函数微分法

多元复合函数的求导较为麻烦,需要考虑所有中间变量。一般地,复合函数$f\big(g_1(x_1,\cdots,x_n),\cdots,g_m(x_1,\cdots,x_n)\big)$关于自变$x_i$的导数为$\frac{\partial f}{\partial x_i}=\sum\limits^m_{k=1}\frac{\partial f}{\partial g_k}\frac{\partial g_k}{\partial x_i}$,按此准则,按照链式法则即可完成复合函数求导。

多元函数微分

从“图 17-5”可以看出,如此绘出分支图后,只需要找出从$z$出发的、所有最终指向偏导变量的路径。

以一个简单的题目为例,如果方程$F(\frac xz,\frac zy)$可唯一确定函数$z=z(x,y)$,试求偏导数$\frac{\partial z}{\partial x}$。首先做图:

$$ \begin{aligned} &\ \ \ \ \ \,\,\,\,\,F\\ &\ \ \ \,\ \ \ \ /\backslash\\ &\ \ \ \ \frac xz\ \ \ \frac zy\\ &\ \ \ \ /\backslash\ \ \ \,/\backslash\\ &\ \ \,z\ \ \,x\ \,z\ \ \,y\\ &\ \,/\backslash\ \ \ \,\,/\backslash\\ &x\ \ \,y\ \,\,x\ \ \,y\end{aligned} $$

可知,从$F$到$x$一共有三条“路径”,分别是$F\to\frac xz\to z\to x$、$F\to\frac xz\to x$和$F\to\frac zy\to z\to x$,又分别有$4$、$3$与$4$“层”。对每条路径,分别逐个用本层变量对下一层变量求偏导并按链式法则相乘,最后将三条路径的结果相加,可以得到:

$$ 0=\frac{\partial F}{\partial x}=F_1\left(-\frac{x}{z^2}\frac{\partial z}{\partial x}+\frac1z\right)+F_2\frac1y\frac{\partial z}{\partial x} $$

最后将该式化简,可得$\frac{\partial z}{\partial x}=\frac{yzF_1}{xyF_1-z^2F_2}$。如果要进一步求二阶甚至高阶偏导,计算会变得异常复杂,因为$F_1$、$F_2$作为$F$的偏导数,也是$\frac xz$和$\frac zy$的函数;而$\frac{\partial z}{\partial x}$作为$z$对$x$的偏导数,也是$x$和$y$的函数,必须将他们也考虑进二阶偏导过程之中。

用另一个例子演示说明如何计算二阶偏导,高阶偏导以此类推即可。设$u=f(\xi,\eta)$具有二阶偏导数,其中$\xi=\xi(x,y)$、$\eta=\eta(x,y)$,下计算$\frac{\partial^2u}{\partial x^2}$。

$$ \begin{align} &\ \ \ \ \ \frac{\partial^2u}{\partial x^2}\\ &=\frac{\partial}{\partial x}\left(\frac{\partial u}{\partial \xi}\frac{\partial \xi}{\partial x}+\frac{\partial u}{\partial \eta}\frac{\partial \eta}{\partial x}\right)\\ &=\frac{\partial\left(\frac{\partial u}{\partial \xi}\right)}{\partial x}\frac{\partial \xi}{\partial x}+\frac{\partial u}{\partial \xi}\frac{\partial\left(\frac{\partial \xi}{\partial x}\right)}{\partial x}+\frac{\partial\left(\frac{\partial u}{\partial \eta}\right)}{\partial x}\frac{\partial \eta}{\partial x}+\frac{\partial u}{\partial \eta}\frac{\partial\left(\frac{\partial \eta}{\partial x}\right)}{\partial x}\\ &=\left(\frac{\partial^2u}{\partial \xi^2}\frac{\partial \xi}{\partial x}+\frac{\partial^2u}{\partial \xi\partial\eta}\frac{\partial \eta}{\partial x}\right)\frac{\partial \xi}{\partial x}+\frac{\partial u}{\partial \xi}\frac{\partial^2\xi}{\partial x^2}+\left(\frac{\partial^2u}{\partial \eta^2}\frac{\partial \eta}{\partial x}+\frac{\partial^2u}{\partial \eta\partial\xi}\frac{\partial \xi}{\partial x}\right)\frac{\partial \eta}{\partial x}+\frac{\partial u}{\partial \eta}\frac{\partial^2\eta}{\partial x^2}\end{align} $$

显而易见,二阶偏导已经有非常大的计算量了。作为符号计算,计算时是容易出错的。

如果只需要计算部分点的二阶或高阶偏导,并不需要将各阶偏导数的表达式完全求出来,例如已求出一阶偏导$f_x$与$f_y$并且已知二阶偏导均连续的情况下,需要计算$f$在$(x_0,y_0)$处二阶偏导的具体值,则有

$$ \left\{\begin{aligned} &\left.\frac{\partial^2f}{\partial x^2}\right|_{(x_0,y_0)}=\frac{\partial}{\partial x}f_x(x,y_0)\\ &\left.\frac{\partial^2f}{\partial y^2}\right|_{(x_0,y_0)}=\frac{\partial}{\partial y}f_y(x_0,y)\\ &\left.\frac{\partial^2f}{\partial x\partial y}\right|_{(x_0,y_0)}=\frac{\partial}{\partial y}f_x(x_0,y)\end{aligned}\right. $$

这一“提前代入”的方法在前文可微性部分中是有提到过的,该方法理论支持源于偏导数的定义。


一阶全微分具有形式不变性,指对于函数$z=f(x,y)$和复合函数$\left\{\begin{aligned}&x=\varphi(u,v)\\&y=\psi(u,v)\\&z=f(x,y)\end{aligned}\right.$,若$z=f(x,y)$可微且$\varphi$、$\psi$是可微函数,则复合函数$z=f\big(\varphi(u,v),\psi(u,v)\big)$可微,而且他们全微分在形式上都等于$\mathrm{d}z=\frac{\partial z}{\partial x}\mathrm{d}x+\frac{\partial z}{\partial y}\mathrm{d}y$,这大大简化了求解复杂复合函数一阶全微分的计算量。值得注意的是,二阶全微分不再具有形式不变性。例如欲求解$z=e^{xy}\sin(x+y)$的全微分,记$s=xy$、$t=x+y$,有

$$ \mathrm{d}s=y\mathrm{d}x+x\mathrm{d}y $$$$ \mathrm{d}t=\mathrm{d}x+\mathrm{d}y $$

又$z=e^s\sin t$,利用一阶全微分形式不变性得

$$ \mathrm{d}z=z_s\mathrm{d}s+z_t\mathrm{d}t=e^s\sin t\mathrm{d}s+e^s\cos t\mathrm{d}t $$

联立以上三式,化简得

$$ \begin{align}\mathrm{d}z&=e^s\sin t(y\mathrm{d}x+x\mathrm{d}y)+e^s\cos t(\mathrm{d}x+\mathrm{d}y)\\&=e^{xy}[y\sin(x+y)+\cos(x+y)]\mathrm{d}x+e^{xy}[x\sin(x+y)+\cos(x+y)]\mathrm{d}y\end{align} $$

极值问题与泰勒公式

首先规定记号,切勿混淆:

$$ \frac{\partial}{\partial y}\left(\frac{\partial^2z}{\partial x^2}\right):=\frac{\partial^3z}{\partial x^2\partial y}:=f_{x^2y}(x,y) $$

混合偏导数不一定相等,但是有$f_{xy}(x_0,y_0)$与$f_{yx}(x_0,y_0)$相等的充分条件:$f_{xy}(x,y)$与$f_{yx}(x,y)$均在点$(x_0,y_0)$处连续。

多元函数的泰勒公式使用梯度和黑塞矩阵最多写到二阶,再往上需要用到张量。不过对于二元函数,是可以用混合偏导写出泰勒公式的。

泰勒定理 (二元函数):若函数$f$在点$P_0(x_0,y_0)$的某邻域$U(P_0)$上有直到$n+1$阶的连续偏导数,则对$U(P_0)$上任一点$(x_0+h,y_0+k)$,存在相应的$\theta\in(0,1)$,使得

$$ \begin{aligned}f(x_0+h,y_0+k)&=\textstyle f(x_0+y_0)+\left(h\frac{\partial}{\partial x}+k\frac{\partial}{\partial y}\right)f(x_0,y_0)+\frac1{2!}\left(h\frac{\partial}{\partial x}+k\frac{\partial}{\partial y}\right)^2f(x_0+y_0)+\cdots\\&\ \ \ \ +\textstyle\frac1{n!}\left(h\frac{\partial}{\partial x}+k\frac{\partial}{\partial y}\right)^nf(x_0,y_0)+\frac1{(n+1)!}\left(h\frac{\partial}{\partial x}+k\frac{\partial}{\partial y}\right)^{n+1}f(x_0+\theta h,y_0+\theta k)\end{aligned} $$

上式被称为二元函数$f$在点$P_0$的$n$阶泰勒公式,其中

$$ \left(h\frac{\partial}{\partial x}+k\frac{\partial}{\partial y}\right)^mf(x_0,y_0)=\sum^m_{i=1}\binom{m}{i}\frac{\partial^m}{\partial x^i\partial y^{m-i}}f(x_0,y_0)h^ik^{m-i} $$

极值的必要条件:若$f$在某点存在关于每个自变量的偏导数,则在该点取得极值的必要条件是在该点关于每个自变量的偏导数值为$0$。称满足该必要条件的点为稳定点。

记二元函数的黑塞矩阵为$\boldsymbol{H}_f(P_0)$,可以认为是梯度$\textbf{grad}$的“导数”、多元函数的“二阶导数”,即:

$$ \boldsymbol{H}_f(P_0)=\left[\begin{matrix}f_{xx}&f_{xy}\\f_{yx}&f_{yy}\\\end{matrix}\right]_{P_0} $$

则可以给出二元函数极值的充分条件:设二元函数$f$在点$P_0(x_0,y_0)$的某邻域$U(P_0)$上具有二阶连续偏导数,且$P_0$是$f$的稳定点,则:

  1. 当$\boldsymbol{H}_f(P_0)$正定,$f$在点$P_0$取得极小值;
  2. 当$\boldsymbol{H}_f(P_0)$负定,$f$在点$P_0$取得极大值;
  3. 当$\boldsymbol{H}_f(P_0)$不定,$f$不在点$P_0$取极值;
  4. 当$\boldsymbol{H}_f(P_0)$半正定或半负定时,无法断言。

对于第四点,可以确定的是当$\boldsymbol{H}_f(P_0)$半正定,至少$f$不可能在点$P_0$取得极大值;当$\boldsymbol{H}_f(P_0)$半负定,至少$f$不可能在点$P_0$取得极小值。无法断言的只是在该点是否取到极值。

注意:对于二阶方阵$(a_{ij})$而言,

  • 矩阵正定或负定的充要条件是行列式大于$0$,其中$a_{11}>0$则正定,$a_{11}<0$则负定(一阶顺序主子式);

    或等价地在行列式大于$0$时$a_{22}>0$则正定,$a_{22}<0$则负定;

  • 矩阵半正定或半负定的充要条件是行列式等于$0$;

  • 矩阵不定的充要条件是行列式小于$0$。

有时无法解出二阶偏导,甚至连二阶偏导存在性都不能确定,这种情况需要从极值定义入手。

展开/收起1道极值问题
  • 设$f(x,y)$在点$(0,0)$处连续且有 $\displaystyle{\lim\limits_{x\to0\atop y\to0}\frac{f(x,y)-xy}{(x^2+y^2)^2}=1}$,问点$(0,0)$是否是$f$的极值点,若是解出极值点类型。

    这道题显然不能使用极值的充分条件判断,因为不能确认$f$的二阶偏导。首先注意到应有$f(0,0)$,否则根据$f$的连续性,设$\lim\limits_{x\to0\atop y\to0}f(x,y)=A\neq0$,极限$\displaystyle{\lim\limits_{x\to0\atop y\to0}\frac{f(x,y)-xy}{(x^2+y^2)^2}=\lim\limits_{x\to0\atop y\to0}\frac{A-\mathcal{o}(\rho)}{\mathcal{o}(\rho)}=\infty}$,矛盾(其中$\rho=\sqrt{x^2+y^2}$)。

    接下来设$\frac{f(x,y)-xy}{(x^2+y^2)^2}=1+\varepsilon_{x,y}$,有$\lim\limits_{x\to0\atop y\to0}\varepsilon_{x,y}=0$,于是$f$可以被等价地表为:

    $$ f(x,y)=xy+(1+\varepsilon_{x,y})(x^2+y^2)^2 $$

    令$x=y=t$,则有$f(t,t)=t^2+4(1+\varepsilon_{t,t})t^4=t^2+\mathcal{o}(t^2)$;

    再令$x=t$、$y=-t$,则有$f(t,t)=-t^2+4(1+\varepsilon_{t,-t})t^4=-t^2+\mathcal{o}(t^2)$;

    故而总是有一个点$(0,0)$的邻域$U\subset\mathbb{R}^2$,必然$\exists (x_1,y_1),(x_2,y_2)\in U$,$s.t.\ f(x_1,y_1)\lt f(0,0)=0\lt f(x_2,y_2)$,因此$f$一定不可能在$(0,0)$处取到极值。

条件极值 / 约束优化

以下方法求到的解可能只是最优解的必要条件,实际上所得到的只是可行解(局部最优,只有凸优化问题中才等价于全局最优)。

等式约束

可微等式约束$h_i(x_1,x_2,\cdots,x_n)=c,\ i=1,2,\cdots,l$下的连续可微函数优化问题$\arg\min f(x_1,x_2,\cdots,x_n)$可以转化为无约束优化的拉格朗日函数$L$:

$$ L(x_1,x_2,\cdots,x_n;\lambda_1,\cdots,\lambda_l)=f(x_1,x_2,\cdots,x_n)+\sum^l_{i=1}\lambda_i\big(h_i(x_1,x_2,\cdots,x_n)-c\big) $$

最后求$L$的稳定点即可,即要求

$$ \left\{\begin{aligned} &\frac{\partial L}{\partial x_k}=f_{x_k}+\sum^l_{j=1}\lambda_j{(h_j)}_{x_k}=0,\ \ k=1,2,\cdots,n\\ &\frac{\partial L}{\partial \lambda_i}=h_i(x_1,x_2,\cdots,x_n)-c=0,\ \ i=1,2,\cdots,l\end{aligned}\right. $$

该方法称为拉格朗日乘子法。记梯度$\textbf{grad}(L)$为$\nabla L(\boldsymbol{x},\boldsymbol{\lambda})$,则以上二式可以合并为一个向量式:

$$ \nabla L(\boldsymbol{x},\boldsymbol{\lambda})=\boldsymbol0 $$

最优解包含在满足上述等式的解中。

如果可微函数$f$的优化问题中约束包含了部分不等式,且满足这些不等式的点构成一个闭域,那么可以将不等式约束优化问题转变为等式约束优化问题。步骤是:

  1. 首先求出区域内部的驻点并计算这些驻点的值,方法直接对$f$求偏导,寻找偏导数均为$0$的点(可以进一步判断驻点是极大值点、极小值点还是非极值点,非极值点就不用在后续考虑了);
  2. 接着在区域界点集上解出极值,方法是将不等式约束改为相应地等式约束,直接运用等式约束的拉格朗日乘子法即可求解,最后对比$f$在边界与内部的极值大小即可。
  3. 如果函数不是处处可微的,还要额外考虑偏导数不存在点的值。

当然,直接考虑KKT条件或许是更简洁的,不过这给KKT条件的互相松弛条件提供了一种直观解释。

不等式约束

可微不等式约束$\left\{\begin{aligned}&h_i(\boldsymbol{x})=0,&&i=1,2,\cdots,p\\&g_j(\boldsymbol{x})\leqslant0,&&j=1,2,\cdots,q\end{aligned}\right.$ 下的连续可微函数优化问题$\arg\min f(\boldsymbol{x})$同样可以转化为无约束优化的拉格朗日函数$L$:

$$ L(\boldsymbol{x},\boldsymbol{\lambda},\boldsymbol{\mu})=f(\boldsymbol{x})+\sum^q_{j=1}\lambda_jg_j(\boldsymbol{x})+\sum^p_{i=1}\mu_ih_i(\boldsymbol{x}) $$

令$L$的梯度等于$\boldsymbol{0}$,可得到KKT条件,可认为是拉格朗日乘子法的推广:

  1. 稳定性条件:$\nabla_{\boldsymbol{x}}L(\boldsymbol{x},\boldsymbol{\lambda},\boldsymbol{\mu})=\boldsymbol0$
  2. 原问题可行性条件1:$\nabla_{\boldsymbol{\mu}}L(\boldsymbol{x},\boldsymbol{\lambda},\boldsymbol{\mu})=h_i(\boldsymbol{x})=0,\ \ \ \ i=1,2,\cdots,p$
  3. 原问题可行性条件2:$\nabla_{\boldsymbol{\lambda}}L(\boldsymbol{x},\boldsymbol{\lambda},\boldsymbol{\mu})=g_j(\boldsymbol{x})\leqslant0,\ \ \ \ j=1,2,\cdots,q$
  4. 对偶问题可行性条件:$\lambda_i\geqslant0,\ \ \ \ i=1,2,\cdots,p$
  5. 互相松弛条件:$\lambda_ig_i(\boldsymbol{x})=0,\ \ \ \ i=1,2,\cdots,p$

支持向量机(SVM)的数学推导中,“松弛变量”一名就来自这里。

记可行域为$\mathbb{D}$,则拉格朗日对偶问题的对偶优化函数定义为$\Gamma(\boldsymbol{\lambda},\boldsymbol{\mu})=\inf\limits_{x\in\mathbb{D}}(\boldsymbol{x},\boldsymbol{\lambda},\boldsymbol{\mu})$,如果问题的KKT条件给出的方程难以解出,可以先考虑对偶问题。如果对这部分内容感兴趣,可以深入研究最优化理论。SVM的数学推导,就完全依赖于这些优化方法。

多元函数导数的几何应用

尽管这部分内容很有趣,但在此从略。

如果以后考虑写空间解析几何方面的文章,在做更新吧。

隐函数定理及其应用

隐函数

隐函数

在此补充一些隐函数求导法,通过一个例子加以说明。设$F(x,y,z)$是一阶偏导数连续的隐函数,$z=z(x,y)$由方程$F(x,y,z)=0$唯一确定,此时求$z$关于自变量的偏导有两种方法。

  • 第一种方法是对等式两边直接求偏导,在此不妨对$x$求偏导,可以知道隐函数$F$既被$x$直接影响,也被$x$通过中间变量$z$间接影响(直观上说$F(x,y,z)=F\big(x,y,f(x,y)\big)$),故根据链式法则有$\frac{\partial F}{\partial x}=\frac{\partial F}{\partial x}+\frac{\partial F}{\partial z}\frac{\partial z}{\partial x}=0$,即$F_x+F_z\frac{\partial z}{\partial x}=0$。$z$对$y$的偏导数求法同理,可以总结为下述公式:

    $$ \color{#990066}{\left\{\begin{aligned}&\frac{\partial z}{\partial x}=-\frac{F_x}{F_z}\\&\frac{\partial z}{\partial y}=-\frac{F_y}{F_z}\end{aligned}\right.} $$

    上式对复合函数仍有效,例如隐函数$z=z(x,y)$由方程$F(\frac xz,\frac zy)$确定,按公式,仍有$\frac{\partial z}{\partial x}=-\frac{\frac1zF_1}{-\frac x{z^2}F_1+\frac1yF_2}$。

    这个公式比较重要,需要掌握。

  • 第二种方法是利用一阶全微分的形式不变性,有

    $$ F_x\mathrm{d}x+F_y\mathrm{d}y+F_z\mathrm{d}z=0 $$

有时需要解可微复合函数$u=f(x,y,z)$的全微分$\mathrm{d}u$,其中$z$是关于$x$和$y$的函数,而$z=z(x,y)$是通过某个隐函数确定的(注:这种写法一般是默认了$u=u(x,y)$,否则$u(\cdot)\equiv f(\cdot)$,会使后文对$u=f(x,y,z)$的偏导结果改变)。相对“笨拙”的办法是直接按定义求解,即先对隐函数等式两端求$x$与$y$的偏导得到由$\frac{\partial z}{\partial x}$和$\frac{\partial z}{\partial y}$表出的$\frac{\partial u}{\partial x}$与$\frac{\partial u}{\partial y}$(对$x$偏导得到$\frac{\partial u}{\partial x}=\frac{\partial f}{\partial x}+\frac{\partial f}{\partial z}\frac{\partial z}{\partial x}$,对$y$偏导同理),再分别求出$z$关于$x$与$y$的偏导,最后代入。

相对简洁的方法是利用一阶全微分的形式不变性,立刻有

$$ \mathrm{d}u=\frac{\partial f}{\partial x}\mathrm{d}x+\frac{\partial f}{\partial y}\mathrm{d}y+\frac{\partial f}{\partial z}\mathrm{d}z $$

只需要通过$z=z(x,y)$解出$\mathrm{d}z$(等式两边同时取微分),最后就能得到用偏微分$\mathrm{d}x$和$\mathrm{d}y$表出的全微分$\mathrm{d}u$。

隐函数组

隐函数组

针对通过隐函数组定义的多个隐函数的情况,如果需要计算其中一个隐函数的导数(注意,这里并不是计算偏导),则需要结合隐函数与隐函数组的方法。

例如,设有满足隐函数组定理的隐函数组$\left\{\begin{aligned}&F(x,y,z)=0\\&G(x,y,z)=0\end{aligned}\right.$,当$\frac{\partial(F,G)}{\partial(y,z)}=\left|\begin{matrix}\frac{\partial F}{\partial y}&\frac{\partial F}{\partial z}\\\frac{\partial G}{\partial y}&\frac{\partial G}{\partial z}\end{matrix}\right|\neq0$时,可以唯一地确定两个以$x$为自变量的隐函数$\left\{\begin{aligned}&y=y(x)\\&z=z(x)\end{aligned}\right.$,而且有

$$ \frac{\mathrm{d}y}{\mathrm{d}x}=-\frac{\frac{\partial(F,G)}{\partial(x,z)}}{\frac{\partial(F,G)}{\partial(y,z)}}=-\frac{\left|\begin{matrix}\frac{\partial F}{\partial x}&\frac{\partial F}{\partial z}\\\frac{\partial G}{\partial x}&\frac{\partial G}{\partial z}\end{matrix}\right|}{\left|\begin{matrix}\frac{\partial F}{\partial y}&\frac{\partial F}{\partial z}\\\frac{\partial G}{\partial y}&\frac{\partial G}{\partial z}\end{matrix}\right|} $$$$ \frac{\mathrm{d}z}{\mathrm{d}x}=-\frac{\frac{\partial(F,G)}{\partial(x,y)}}{\frac{\partial(F,G)}{\partial(z,y)}}=-\frac{\left|\begin{matrix}\frac{\partial F}{\partial x}&\frac{\partial F}{\partial y}\\\frac{\partial G}{\partial x}&\frac{\partial G}{\partial y}\end{matrix}\right|}{\left|\begin{matrix}\frac{\partial F}{\partial z}&\frac{\partial F}{\partial y}\\\frac{\partial G}{\partial z}&\frac{\partial G}{\partial y}\end{matrix}\right|} $$

注:$\left|\begin{matrix}\frac{\partial F}{\partial y}&\frac{\partial F}{\partial z}\\\frac{\partial G}{\partial y}&\frac{\partial G}{\partial z}\end{matrix}\right|=-\left|\begin{matrix}\frac{\partial F}{\partial z}&\frac{\partial F}{\partial y}\\\frac{\partial G}{\partial z}&\frac{\partial G}{\partial y}\end{matrix}\right|$,也就是说对雅可比行列式有$\frac{\partial(F,G)}{\partial(y,z)}=-\frac{\partial(F,G)}{\partial(z,y)}$。从初等变换与行列式的角度看,$\left(\begin{matrix}\frac{\partial F}{\partial z}&\frac{\partial F}{\partial y}\\\frac{\partial G}{\partial z}&\frac{\partial G}{\partial y}\end{matrix}\right)$相当于是$\left(\begin{matrix}\frac{\partial F}{\partial y}&\frac{\partial F}{\partial z}\\\frac{\partial G}{\partial y}&\frac{\partial G}{\partial z}\end{matrix}\right)$调换第一列与第二列的结果,这一初等变换对应的行列式为$-1$。

隐函数导数的几何应用

尽管这部分内容很有趣,但在此从略。

如果以后考虑写空间解析几何方面的文章,在做更新和深入剖析吧。

重积分

Fubini定理与重积分换元法

Fubini定理 (可积函数情形)     若$f\in L(\mathbb{R}^n)$、$(x,y)\in\mathbb{R}^n=\mathbb{R}^p\times\mathbb{R}^q$,则:

  1. 对于几乎处处的$x\in\mathbb{R}^p$,$f(x,y)$是$\mathbb{R}^q$上的可积函数;
  2. 积分$\displaystyle{\int_{\mathbb{R}^q}f(x,y)\mathrm{d}y}$是$\mathbb{R}^p$上的可积函数;
  3. 有$\displaystyle{\int_{\mathbb{R}^n}f(x,y)\mathrm{d}x\mathrm{d}y}=\displaystyle{\int_{\mathbb{R}^p}\mathrm{d}x\int_{\mathbb{R}^q}f(x,y)\mathrm{d}y}=\displaystyle{\int_{\mathbb{R}^q}\mathrm{d}y\int_{\mathbb{R}^p}f(x,y)\mathrm{d}x}$。

Fubini定理的证明通常用Tonelli定理作引理,Tonelli定理可以被认为是针对非负可测函数的Fubini定理。值得注意的是,Fubini定理为重积分的计算与累次积分积分号的交换提供了理论保证,但即使$f(x,y)$的两个累次积分存在且相等,$f(x,y)$在$\mathbb{R}^n$上也可能不可积。

重积分变量变换     重积分的换元法可以认为是一元积分中第二类还原法的推广。设变换$T:x_i=x_i(y_1,y_2,\cdots,y_n),\ i=1,2,\cdots,n$把$n$维的$y_1y_2\cdots y_n$空间区域$V'$一对一地映射成$n$维的$x_1x_2\cdots x_n$空间中的区域$V$,且在$V'$上的Jocobian

$$ J=\frac{\partial(x_1,x_2,\cdots,x_n)}{\partial(y_1,y_2,\cdots,y_n)}=\left|\begin{matrix}\frac{\partial x_1}{\partial y_1}&\frac{\partial x_1}{\partial y_2}&\cdots&\frac{\partial x_1}{\partial y_n}\\\frac{\partial x_2}{\partial y_1}&\frac{\partial x_2}{\partial y_2}&\cdots&\frac{\partial x_2}{\partial y_n}\\\vdots&\vdots&&\vdots\\\frac{\partial x_n}{\partial y_1}&\frac{\partial x_n}{\partial y_2}&\cdots&\frac{\partial x_n}{\partial y_n}\end{matrix}\right| $$

恒不为零,则有:

$$ \begin{align} &\ \ \ \ \ \ \overbrace{\mathop{\int\cdots\int}_V}^{n-\text{fold}}f(x_1,x_2,\cdots,x_n)\mathrm{d}x_1\mathrm{d}x_2\cdots\mathrm{d}x_n\\ &=\overbrace{\mathop{\int\cdots\int}_{V'}}^{n-\text{fold}}f\big(x_1(y_1,\cdots,y_n),\cdots,x_n(y_1,\cdots,y_n)\big)|J|\mathrm{d}y_1\cdots\mathrm{d}y_n\end{align} $$

为Jocobian加上绝对值是很常见的操作,之所以如此,是为了避免繁琐地讨论符号的问题。但不给Jocobian加上绝对值是完全可行的,只不过要留意变换后符号究竟为正还是负。以一元积分情形举例,如果换元$x=g(t)$时不给Jocobian加绝对值,则$\mathrm{d}x=\mathrm{d}g(t)=g'(t)\mathrm{d}t$,积分上限与积分下限分别按$t$与$x$的关系“更新”即可,但这可能导致变换后的新的关于$t$的积分上限小于积分下限,这种情况下若希望积分上限大于积分下限则需要通过取负使积分上下限互换;但若一开始就给Jocobian加上绝对值,即令$\mathrm{d}x=|g'(t)|\mathrm{d}t$,则不需要加以关心符号问题:直接将变换后的两个积分限取较大的一个作为积分上限、取较小的一个作为积分下限即可,这样便不再需要考虑符号。

特别地,对于极坐标变换$\left\{\begin{aligned}&x=r\cos\theta\\&y=r\sin\theta\end{aligned}\right.$,其雅可比矩阵(过渡矩阵)为:

$$ \left[\begin{matrix}\cos\theta&-r\sin\theta\\\sin\theta&r\cos\theta\end{matrix}\right] $$

该矩阵的行列式正是$r$,所以做二重积分的极坐标换元时,只需要将$x$、$y$代换后式子整体乘上$r$,相应地求出新的积分区域即可。特别地,令$r=1$则得到旋转变换的矩阵表示,即

$$ \left(\begin{matrix}x'\\y'\end{matrix}\right)=\left(\begin{matrix}\cos\theta&-\sin\theta\\\sin\theta&\cos\theta\end{matrix}\right)\left(\begin{matrix}x\\y\end{matrix}\right) $$

许多时候,如果重积分不好直接计算,且化为累次积分再试着换序后还是难以处理,不妨试试重积分的换元法。但在换元时应当注意不要仅仅局限在极坐标变换、球面坐标变换等,这是一个比较常见的问题——由于平时用到了太多极坐标换元和球面坐标换元,导致面对需要作其他换元才能求解的积分时被“禁锢”住了想法,联想不到其他换元。换元时应当观察被积式和积分区域,选择一个合适的变换,而不是不管三七二十一,先代个极坐标变换再说。

二重积分

二重积分$\displaystyle{\iint\limits_Df(x,y)\mathrm{d}\sigma}$的定义可以类比一重黎曼积分的定义,视为可数(可列)个在小区域$\{\triangle\sigma_i\}$上、以$f(x_i,y_i)$为高的柱体的体积之和,因此二重积分在$f(x,y)\geqslant0$时,可以认为其值代表了以积分域$D$为底、以曲面$z=f(x,y)$为曲顶的曲顶柱体体积。除了序的性质与一重积分相同,当$f$在$D$上连续时,还有积分中值定理:$\displaystyle{\iint\limits_Df(x,y)\mathrm{d}\sigma=f(\xi,\eta)S}$,其中$(\xi,\eta)\in D$、$S=m(D)$,为$D$的面积。

$$ \iint\limits_Df(x,y)\mathrm{d}x\mathrm{d}y=\lim_{\Vert T\Vert\to0}\sum^n_{i=1}f(\xi_i,\eta_i)\Delta\sigma_i $$

可证明,如果$f(x,y)$在有界闭域$D$上有界且不连续点集$E$为为零面积集(零测集),则$f(x,y)$在$D$上是可积的。

利用Fubini定理,二重积分可转为累次积分轻松解决(按转写前后定义域应相同为原则即可);需要特别指出的是二重积分转为极坐标累次积分,作极坐标变换

$$ T:\left\{\begin{aligned} &x=r\cos\theta\\ &y=r\sin\theta\end{aligned}\right.\ \ ,\ \ \ \ 0\leqslant r<+\infty,\ 0\leqslant\theta\leqslant2\pi $$

可以得到结果:

$$ \iint\limits_Df(x,y)\mathrm{d}\sigma=\int^{\alpha}_{\beta}\mathrm{d}\theta\int^{\varphi_2(\theta)}_{\varphi_1(\theta)}r\,f(r\cos\theta,r\sin\theta)\mathrm{d}r $$

↑ 这一公式在下文“定积分的几何应用”章节下的“二重积分计算面积”部分有可视化。一般来说,当被积函数可以被写为$f(\sqrt{x^2+y^2})$、$f(\frac{x}{y})$,或是积分域为圆$x^2+y^2\leqslant R$、同心圆、椭圆$x^2+y^2\leqslant 2ax\ \;or\ \;2by$时,将重积分转写为极坐标下的累次积分计算较为方便。

通常,利用好对称性对重积分的计算有极大帮助:

  • 注意奇偶性;
  • 注意对称性;
  • 注意轮换对称性。

二重积分在转化为二次积分发现难以计算时,换序后可能就会变得容易处理得多。

三重积分

类比二重积分。

类似二重积分的极坐标变换,三重积分也有一些常用的坐标变换。不妨设一个三重积分为$\displaystyle{\iiint\limits_Vf(x,y,z)\mathrm{d}x\mathrm{d}y\mathrm{d}z}$:

  • 柱面坐标变换

    $$ T:\left\{\begin{aligned} &x=r\cos\theta,&&0\leqslant r<+\infty\\ &y=r\sin\theta,&&0\leqslant\theta\leqslant2\pi\\ &z=z,&&-\infty\lt z<+\infty \end{aligned}\right. $$$$ \begin{align}\iiint\limits_Vf(x,y,z)\mathrm{d}x\mathrm{d}y\mathrm{d}z&=\iiint\limits_{V'}rf(r\cos\theta,r\sin\theta,z)\mathrm{d}r\mathrm{d}\theta\mathrm{d}z\\&=\iint\limits_D\mathrm{d}x\mathrm{d}y\int^{z_2(x,y)}_{z_1(x,y)}f(x,y,z)\mathrm{d}z\end{align} $$

    其中$V'$是$V$在柱面坐标变换下的原象,$D$是$V$在$xy$平面上的投影区域,即$V=\{(x,y,z)|z_1(x,y)\leqslant z\leqslant z_2(x,y),(x,y)\in D\}$。

  • 球坐标变换

    $$ T:\left\{\begin{aligned} &x=r\sin\varphi\cos\theta,&&0\leqslant r<+\infty\\ &y=r\sin\varphi\sin\theta,&&0\leqslant\varphi\leqslant\pi\\ &z=r\cos\varphi,&&0\leqslant\theta\leqslant2\pi \end{aligned}\right. $$$$ \begin{align}\iiint\limits_Vf(x,y,z)\mathrm{d}x\mathrm{d}y\mathrm{d}z&=\iiint\limits_{V'}r^2\sin\varphi f(r\sin\varphi\cos\theta,r\sin\varphi\sin\theta,r\cos\varphi)\mathrm{d}r\mathrm{d}\varphi\mathrm{d}\theta\\&=\int^{\theta_2}_{\theta_1}\mathrm{d}\theta\int^{\varphi_2(\theta)}_{\varphi_1(\theta)}\mathrm{d}\varphi\int^{r_2(\varphi,\theta)}_{r_1(\varphi,\theta)}r^2\sin\varphi f(r\sin\varphi\cos\theta,r\sin\varphi\sin\theta,r\cos\varphi)\mathrm{d}r\end{align} $$

    其中$V'$是$V$在球坐标变换下的原象,$V=\{(r,\varphi,\theta)|r_1(\varphi,\theta)\leqslant r\leqslant r_2(\varphi,\theta),\varphi_1(\theta)\leqslant\varphi\leqslant\varphi_2(\theta),\theta_1\leqslant\theta\leqslant\theta_2\}$。

重积分的中值定理

设$D$是平面有界闭区域,$f(x,y)$与$g(x,y)$都在$D$上连续且$g(x,y)$在$D$上不变号,则存在$(\xi,\eta)\in D$,使得

$$ \iint\limits_Df(x,y)g(x,y)\mathrm{d}\sigma=f(\xi,\eta)\iint\limits_Dg(x,y)\mathrm{d}\sigma $$

推论:设$D$是平面有界闭区域,$f(x,y)$在$D$上连续,则存在$(\xi,\eta)\in D$,使得$\displaystyle{\iint\limits_Df(x,y)\mathrm{d}\sigma=f(\xi,\eta)S}$,其中$S$是$D$的面积,即$S=\displaystyle{\iint\limits_D1\mathrm{d}\sigma}$。

重积分的应用 (几何应用)

下述积分的不定积分是可以求出来的,但是从圆、椭圆的面积公式来看,也有:

  • $\displaystyle{\int^a_0\sqrt{a^2-x^2}}\mathrm{d}x=\frac{\pi}4a^2$;
  • $\displaystyle{\int^a_0\sqrt{2ax-x^2}}\mathrm{d}x=\frac{\pi}4a^2$;
  • $\displaystyle{\int^{2a}_0\sqrt{2ax-x^2}}\mathrm{d}x=\frac{\pi}2a^2$

积分计算函数平均数

可积函数$f$在区间$[a,b]$上的平均数被定义为

$$ average=\frac1{b-a}\int^b_af(x)\mathrm{d}x $$

由此可以把离散形式的均值不等式推广到连续的积分形式,这在文首已给出。

同样地,利用重积分,对多元函数也可以类似定义平均数。

计算一元积分

一些难以直接计算的一元定积分、反常积分,通过“升维”到二重积分或利用含参量积分,计算可能会容易许多。一些含参量积分也可以联系到二重积分,二者没有本质上的区别。

最经典的例子莫过于无穷积分之欧拉-泊松积分$\displaystyle{\int_{\mathbb{R}}e^{-x^2}\mathrm{d}x}$了,要解出正态分布概率密度函数的确切形式,就不得不讨论这个积分的值。直接求解固然困难,但巧妙地利用二重积分,便可以化繁为简:

$$ \int_{\mathbb{R}}e^{-x^2}\mathrm{d}x=\sqrt{\iint_{\mathbb{R}^2}e^{-(x^2+y^2)}\mathrm{d}\sigma}=\sqrt{\int^{2\pi}_0\mathrm{d}\theta\int^1_0re^{-r^2}\mathrm{d}r}=\sqrt{\pi} $$

再者如含参量积分$\displaystyle\int^1_0\frac{x^b-x^a}{\ln x}\mathrm{d}x$,其中$a,b>0$,有

$$ \begin{align} \int^1_0\frac{x^b-x^a}{\ln x}\mathrm{d}x&=\int^1_0\mathrm{d}x\int^b_ax^t\mathrm{d}t\\ &=\int^b_a\mathrm{d}t\int^1_0x^t\mathrm{d}x\\ &=\int^b_a\frac1{t+1}\mathrm{d}t\\ &=\ln\left(\frac{b+1}{a+1}\right)\end{align} $$

二重积分计算平面面积

将$f(x,y)$视为密度 / 高度,于是二重积分等价于求区域上一个几何体的质量 (平面几何体) / 体积 (立体几何体);特别地,当被积函数为$f(x,y)=1$时,在其定义域上二重积分可以视为求平面上定义域图形的面积。

求面积的二重积分可以转化为二次积分,如某平面域$D$是由上曲线$f(x)$与下曲线$g(x)$与$x=a$、$x=b$包围而成的,则其面积为:

$$ S=\iint\limits_D1\mathrm{d}\sigma=\int^b_a\mathrm{d}x\int^{f(x)}_{g(x)}1\mathrm{d}y=\int^b_a\big[f(x)-g(x)\big]\mathrm{d}x $$

若平面域$D$是由曲线$r=r(\theta)$、$\theta=\alpha$、$\theta=\beta$所包围而成的(如下图),则其面积为:

$$ S=\iint\limits_D1\mathrm{d}\sigma=\int^{\beta}_{\alpha}\mathrm{d}\theta\int^{r(\theta)}_0r\mathrm{d}r=\frac12\int^{\beta}_{\alpha}r^2(\theta)\mathrm{d}\theta $$

二重积分计算面积

实际上,更一般的标准欧式正交基下的二重积分与极坐标二重积分之间可以相互转换:

$$ \iint\limits_Df(x,y)\mathrm{d}\sigma=\int^{\alpha}_{\beta}\mathrm{d}\theta\int^{\varphi_2(\theta)}_{\varphi_1(\theta)}r\,f(r\cos\theta,r\sin\theta)\mathrm{d}r $$

可以推广为三重积分计算体积,元密度为$1$(即假设空间体体积均匀分布)。正如下文所述,二重积分也能计算体积,因此积分式能代表什么,关键在于如何看待被积式。

展开/收起1道利用积分计算面积例题

其实用二重积分计算平面面积与用定积分计算平面面积相比别无二致,因为如果用二重积分计算平面面积则被积式为$1$,这里重积分可以等价为二次积分,接着对第一次积分应用牛顿-莱布尼茨定理即得到定积分。

  • 求曲线$y=e^{-x}\sin x$在$[0,+\infty)$上与$x$轴所围的面积$S$;

    解:唯一要注意的是不能将式子写为$\displaystyle S=\int^{+\infty}_0e^{-x}\sin x\mathrm{d}x$,因为$y$在$[0,+\infty)$上是不断变号的,这个问题的正确计算应该是

    $$ \begin{align} S&=\int^{+\infty}_0|e^{-x}\sin x|\mathrm{d}x\\ &=\sum^{\infty}_{n=0}(-1)^n\int^{(n+1)\pi}_{n\pi}e^{-x}\sin x\mathrm{d}x\\ &\xlongequal{x=n\pi+t}\sum^{\infty}_{n=0}e^{-n\pi}\int^{\pi}_0e^{-t}\sin t\mathrm{d}t \end{align} $$

    对于定积分$\displaystyle I=\int^{\pi}_0e^{-t}\sin t\mathrm{d}t$,可以分别对$e^{-t}$与$\sin t$运用分部积分求解

    $$ I=\int^{\pi}_0e^{-t}\sin t\mathrm{d}t=-\int^{\pi}_0\sin t\mathrm{d}e^{-t}=0+\int^{\pi}_0e^{-t}\cos t\mathrm{d}t $$$$ I=\int^{\pi}_0e^{-t}\sin t\mathrm{d}t=-\int^{\pi}_0e^{-t}\mathrm{d}\cos t=e^{-\pi}+1-\int^{\pi}_0e^{-t}\cos t\mathrm{d}t $$$$ \Rightarrow\ \ \ \ I=\frac{I+I}2=\frac{e^{-\pi}+1}2 $$

    所以

    $$ S=\frac{e^{-\pi}+1}2\sum^{\infty}_{n=0}e^{-n\pi}=\frac{e^{-\pi}+1}2\lim_{n\to\infty}\frac{1-e^{-n\pi}}{1-e^{-\pi}}=\frac{e^{-\pi}+1}{2(1-e^{-\pi})} $$

二重积分计算曲面面积

二重积分计算曲面面积

二重积分计算旋转体体积

欲求平面域$D$饶直线$L:\,ax+by+c=0$旋转产生的旋转体体积$V$,可以在$D$中选取一面积为$\mathrm{d}\sigma$的子区域,设$(x,y)$为子区域上的任意一点,记$r(x,y)$为点$(x,y)$到直线$L$的距离,即

$$ r(x,y)=\frac{|ax+by+c|}{\sqrt{a^2+b^2}} $$

则该子区域绕直线$L$旋转所得环状体的近似值为

$$ \mathrm{d}V=2\pi\,r(x,y)\mathrm{d}\sigma $$

因此,一般地有

$$ \boldsymbol{V=2\pi\iint\limits_Dr(x,y)\mathrm{d}\sigma} $$

特别地,设区域$D$是由曲线$y=f(x)\geqslant0$、$x=a$、$x=b$与$y$轴所围成的,则:

  • $D$绕$x$轴旋转一周($r(x,y)=y$)产生的旋转体体积:

    $$ V_x=2\pi\iint\limits_Dy\mathrm{d}\sigma=2\pi\int^b_a\mathrm{d}x\int^{f(x)}_0y\mathrm{d}y=\pi\int^b_af^2(x)\mathrm{d}x $$
  • $D$绕$y$轴旋转一周($r(x,y)=x$)产生的旋转体体积:

    $$ V_y=2\pi\iint\limits_Dx\mathrm{d}\sigma=2\pi\int^b_a\mathrm{d}x\int^{f(x)}_0x\mathrm{d}y=2\pi\int^b_axf(x)\mathrm{d}x $$
  • $D$绕$x=x_0$旋转一周产生的旋转体体积:

    $$ V_{x=x_0}=2\pi\iint\limits_D(x_0-x)\mathrm{d}\sigma=2\pi\int^b_a\mathrm{d}x\int^{f(x)}_0(x_0-x)\mathrm{d}y $$
  • $D$绕$y=y_0$旋转一周产生的旋转体体积:

    $$ V_{y=y_0}=2\pi\iint\limits_D(y_0-y)\mathrm{d}\sigma=2\pi\int^b_a\mathrm{d}x\int^{f(x)}_0(y_0-y)\mathrm{d}y $$

如果曲线的上下界线分别是$f_1$与$f_2$,不妨记$f_1>f_2$,则第一个公式修改为$\displaystyle{2\pi\int^b_a\mathrm{d}x\int^{f_1(x)}_{f_2(x)}y\mathrm{d}y}$,其余公式以此类推。

但个人认为以上公式没必要硬记,他们都只是$\displaystyle{V=2\pi\iint\limits_Dr(x,y)\mathrm{d}\sigma}$的特殊变体。

举个具体的例子,求由曲线$y=x^2$与直线$y=x$所围成的区域$D$绕直线$y=x$旋转一周所得旋转体的体积,直接代入公式有:

$$ \begin{align} V_{y=x}&=2\pi\iint\limits_D\frac{|y-x|}{\sqrt2}\mathrm{d}\sigma\\ &=\frac{2\pi}{\sqrt2}\int^1_0\mathrm{d}x\int^x_{x^2}(x-y)\mathrm{d}y\\ &=\frac{\sqrt2\pi}{60}\end{align} $$

若已知横截面面积系数$S(x)$(体积“密度”),则直接积分$\displaystyle{V=\int^b_aS(x)\mathrm{d}x}$即可。

展开/收起1道有趣的计算例子

在利用二重积分计算旋转体体积的时候,有时可以利用一些有趣的计算技巧。

  • 例如,设函数$y(x)$在$x\in[0,+\infty)$上由隐函数$y^3+xy-8=0$所确定,求由曲线$y=y(x)$、直线$x=7$和两个坐标轴所围成的曲边梯形绕$x$轴旋转一周所得旋转体的体积$V$。

    1. 可以直接代入公式计算,即直接对区域作分割。

      由于题目给出的是一个隐函数,而$y(x)$的具体形式又难以求解,故$x$型区域是难以表示的;但很容易注意到$x=\frac{8-y^3}y$,所以可以尝试将区域表示为$y$型区域。

      根据隐函数可微性定理,可以知道$y'(x)$存在且$y'(x)=-\frac{y}{3y^2+x}<0$(其中$y$恒正),即$y(x)$在$[0,+\infty]$上恒正且单调递减,又$x=0$时$y=3$、$x=7$时$y=1$,所以用$y$型区域表示积分区域的话,就是一个矩形加上一个小直角曲边梯形(画出来会更直观),记题干描述的区域 (大曲边梯形) 为$D$,即

      $$ \begin{align}V&=2\pi\iint\limits_Dr(x,y)\mathrm{d}\sigma\\&=2\pi\int^2_1\mathrm{d}y\int^{\frac{8-y^3}y}_0y\mathrm{d}x+2\pi\int^1_0\mathrm{d}y\int^7_0y\mathrm{d}x\\&=\frac{31}2\pi\end{align} $$
    2. 但我们有更精妙的方法。

      因为要计算的是曲边梯形绕$x$轴旋转一周所得旋转体的体积,

      $$ V=2\pi\int^7_0\mathrm{d}x\int^{y(x)}_0y\mathrm{d}x=\pi\int^7_0\big[y(x)\big]^2\mathrm{d}x $$

      所以我们只要能求出$y^2\mathrm{d}x$的表达式就可以了,而不需要求$y(x)$。

      由$y^3+xy-8=0$,两边取微分得$3y^2\mathrm{d}y+y\mathrm{d}y+x\mathrm{d}x=0$,即$y\mathrm{d}x=-(3y^2+x)\mathrm{d}y$,进而$y^2\mathrm{d}x=-(3y^3+xy)\mathrm{d}y$;又回到$y^3+xy-8=0$,有$xy=8-y^3$,将其代入$y^2\mathrm{d}x$,得$y^2\mathrm{d}x=-2(y^3+4)\mathrm{d}y$,所以

      $$ V=\pi\int^7_0\big[y(x)\big]^2\mathrm{d}x=\pi\int^1_2-2(y^3+4)\mathrm{d}y=\frac{31}2\pi $$

曲线弧长与旋转体侧面积

曲线弧长

  1. 设曲线段$C$由直角坐标方程$y=y(x)$($a\leqslant x\leqslant b$)给出,其中$y(x)$在$[a,b]$上有一阶连续导数,则这一段曲线段的弧长为

    $$ s=\int^b_a\sqrt{1+{y'}^2}\,\mathrm{d}x $$
  2. 设曲线段$C$由参数方程$\left\{\begin{aligned}&x=\varphi(t)\\&y=\psi(t)\end{aligned}\right.\ ,\ \ \ t\in[\alpha,\beta]$给出,其中$\varphi(t),\psi(t)$在$[\alpha,\beta]$上有一阶连续导数,则这一段曲线段的弧长为

    $$ s=\int^{\beta}_{\alpha}\sqrt{[\varphi'(t)]^2+[\psi'(t)]^2}\,\mathrm{d}t $$
  3. 特别地,设曲线段$C$由极坐标方程$r=r(\theta)$($\alpha\leqslant\theta\leqslant\beta$)给出,其中$r(\theta)$在$[\alpha,\beta]$上有一阶连续导数,则这一段曲线段的弧长为

    $$ s=\int^{\beta}_{\alpha}\sqrt{r^2(\theta)+{r'}^2(\theta)}\,\mathrm{d}\theta $$

注意,根据解析几何知识,拥有直角坐标方程的曲线一定也有参数方程,但反之不一定。一般而言,直角坐标方程都是通过可求解的参数方程解出来的。

旋转体侧面积

由曲线$y=f(x)$($f(x)\geqslant0$)和直线$x=a,\,x=b$($0\leqslant a\lt b$)及$x$轴所围成的区域绕$x$轴旋转所得旋转体的侧体积为

$$ S=2\pi\int^b_af(x)\sqrt{1+{f'}^2(x)}\mathrm{d}x $$

赋值问题

类似于已知$\displaystyle{\int^x_{a}f(x,t)\mathrm{d}t=g(x)}$而求$\displaystyle{\int^b_af(x)\mathrm{d}x}$这类的问题,老黄将其称为“赋值问题”,这里沿用他的称呼。

  • 首先,可以考虑取个别值代入,观察能否导出结论;
  • 如不能,则可以考虑综合个别值,取平均值,试试能不能求解;
  • 如若仍没有进展,则考虑在等式两边对$x$积分,即取连续平均值,得到一个二重积分,试着通过二重积分求解。要注意观察换序是否可以化繁为简,如果可以那么应当换序;
  • 最后,如果连续平均(直接积分)还是不能解决,可以考虑加权平均,即$\displaystyle{\int^c_d\mathrm{d}x\int^x_{a}p(x)f(x,t)\mathrm{d}t}$,其中$p(x)$是权重函数,其积分应为$1$。

以一道具体的题目为例,设$f(x)$是非负连续函数,有$\displaystyle{\int^{\frac{\pi}2}_xf(t-x)f(t)\mathrm{d}t=\cos^4x}$,求积分$\displaystyle{\int^{\frac{\pi}2}_0f(x)\mathrm{d}x}$。

可以发现,直接代入$x=0$是得不到$\displaystyle{\int^{\frac{\pi}2}_0f(x)\mathrm{d}x}$相关的结果的,所以考虑连续平均,即二次积分。对等式两端进行对$x$的积分,得:

$$ \int^{\frac{\pi}2}_0\mathrm{d}x\int^{\frac{\pi}2}_xf(t-x)f(t)\mathrm{d}t=\int^{\frac{\pi}2}_0\cos^4x\mathrm{d}x=\frac34\times\frac12\times\frac{\pi}2=\frac{3\pi}{16} $$

由于积分$\displaystyle{\int^{\frac{\pi}2}_xf(t-x)f(t)\mathrm{d}t}$不好处理,所以考虑积分换序,

换序

记$\displaystyle{F(x)=\int^x_0f(t)\mathrm{d}t}$,有

$$ \begin{align}\int^{\frac{\pi}2}_0\mathrm{d}x\int^{\frac{\pi}2}_xf(t-x)f(t)\mathrm{d}t&\xlongequal{\text{换序}}\int^{\frac{\pi}2}_0\mathrm{d}t\int^t_0f(t-x)f(t)\mathrm{d}x\\&\xlongequal[u=t-x]{\text{换元}}\int^{\frac{\pi}2}_0f(t)\mathrm{d}t\int^0_{t}-f(u)\mathrm{d}u\\&=\int^{\frac{\pi}2}_0f(t)F(t)\mathrm{d}t\\&=\frac12F^2\Big(\frac{\pi}2\Big)-\frac12F^2(0)\end{align} $$

综上,有$\displaystyle{\frac12F^2\Big(\frac{\pi}2\Big)=\frac12\left[\displaystyle{\int^{\frac{\pi}2}_0f(x)\mathrm{d}x}\right]^2=\frac{3\pi}{16}}$,又$f(x)$是非负函数,所以$\displaystyle{\int^{\frac{\pi}2}_0f(x)\mathrm{d}x}=\frac{\sqrt{6\pi}}4$。

三大积分&极限换序定理

这里只给出命题,而不加证明。比如DCT证明起来就非常麻烦,证明方法可以参考任何一本《实变函数论》教材。

  1. Fatou’s Lemma,Fatou引理

    设$\big\{f_n(x)\big\}$是可测集$E$上的可测函数列,则

    $$ \int_E\varliminf_{n\to\infty}f_n(x)\mathrm{d}x\leqslant\varliminf_{n\to\infty}\int_Ef_n(x)\mathrm{d}x $$

    注意:

    • 当存在$E$上的非负可积函数$g(x)$,使得对$\forall n\in\mathbb{N}^+$有$f_n(x)\geqslant g(x)\ \,a.e.$成立,则可以将Fatou引理适用范围拓展至值域为扩展实数轴的$\big\{f_n(x)\big\}$
    • 假设函数列几乎处处收敛到$f$或依测度收敛到$f$,命题仍然成立,这时$\varliminf\limits_{n\to\infty}f_n=f$,即$\displaystyle\int_Ef(x)\mathrm{d}x\leqslant\varliminf_{n\to\infty}\int_Ef_n(x)\mathrm{d}x$

    类似地,我们有反向的Fatou引理。设$\big\{f_n(x)\big\}$是可测集$E$上的值域为扩展实数域的可测函数列,若存在$E$上的非负可积函数$g(x)$,使得对$\forall n\in\mathbb{N}^+$有$f_n(x)\geqslant g(x)\ \,a.e.$成立,则

    $$ \int_E\varlimsup_{n\to\infty}f_n(x)\mathrm{d}x\geqslant\varlimsup_{n\to\infty}\int_Ef_n(x)\mathrm{d}x $$
  2. MCT,Monotone Convergence Theorem

    $\ast$ 在部分中文文献中也被称为Beppo Levi非负渐升列积分定理

    设定义在可测集$E$上非负可测渐升函数列$\big\{f_n(x)\big\}$满足$f_1(x)\leqslant f_2(x)\leqslant\cdots\leqslant f_k(x)\leqslant\cdots$,且对$x\in E\ \ a.e.$有$\lim\limits_{n\to\infty}f_n(x)=f(x)$,则

    $$ \lim_{n\to\infty}\int_Ef_n(x)\mathrm{d}x=\int_Ef(x)\mathrm{d}x $$

    类似地,我们有非负可积渐降列积分定理,但注意:针对非负渐升列仅仅要求函数可测即可,而对非负渐降列则进一步要求可积(非负可积函数是几乎处处有限的)。对于可测集$E$上非负可测渐降函数列$\big\{f_n(x)\big\}$,如果在$E$上还是可积的,且对$x\in E\ \ a.e.$有$\lim\limits_{n\to\infty}f_n(x)=f(x)$,则

    $$ \lim_{n\to\infty}\int_Ef_n(x)\mathrm{d}x=\int_Ef(x)\mathrm{d}x $$
  3. DCT,Dominated Convergence Theorem

    $\ast$ 在部分中文文献中也被称为Lebesgue控制收敛定理

    设$f_n\in L^1(E),\ n\in\mathbb{N}^+$,且对于$x\in E\ \ a.e.$有$\lim\limits_{n\to\infty}f_n(x)=f(x)$,若存在$E$上的可积函数$F(x)$使得$\big|f_n(x)\big|\leqslant F(x),\ \ a.e.\ x\in E$,$n\in\mathbb{N}^+$,则$f_n(x)$在$E$上依$L^1$意义收敛于$f$,这意味着

    $$ \lim_{n\to\infty}\int_Ef_n(x)\mathrm{d}x=\int_Ef(x)\mathrm{d}x $$

    以上是在几乎处处收敛意义下的控制收敛定理。此外我们还有依测度收敛的控制收敛定理,设$f_n\in L^1(\mathbb{R}^k)$,$n\in\mathbb{N}^+$,且$f_n$在$\mathbb{R}^k$上依测度收敛到$f$,若存在$\mathbb{R}^k$上的可积函数$F(x)$使得$\big|f_n(x)\big|\leqslant F(x),\ \ a.e.\ x\in\mathbb{R}^k$,$n\in\mathbb{N}^+$,则$f_n(x)$在$\mathbb{R}^k$上依$L^1$意义收敛于$f$,同样可以导出

    $$ \lim_{n\to\infty}\int_{\mathbb{R}^k}f_n(x)\mathrm{d}x=\int_{\mathbb{R}^k}f(x)\mathrm{d}x $$

    在证明实数域上点态收敛的DCT时时,可以考虑先证明依测度收敛的DCT,再简洁地得到实数域上的点态收敛的DCT之推论。

    重要推论:对于一致有界且几乎处处收敛的函数列在有限测度集上的积分,其极限号与积分号可以交换次序,这被称为BCT,即Bounded Convergence Theorem

  4. DCT的推论——BCT的标准描述

    对于有限测度集$E$(即$\mu(E)<\infty$),设$f_n\in L^1(E),\ n\in\mathbb{N}^+$,且对于$x\in E\ \ a.e.$有$\lim\limits_{n\to\infty}f_n(x)=f(x)$,若存在$M\in\mathbb{R}$使得$\big|f_n(x)\big|\leqslant M,\ \ a.e.\ x\in E$,则

    $$ \lim_{n\to\infty}\int_Ef_n(x)\mathrm{d}x=\int_Ef(x)\mathrm{d}x $$

    BCT要求$E$具有有限测度,是因为若$E$的测度为无穷大,则常数$M$在其上的积分也为无穷大,我们便不可再令常数$M$作为“控制函数”。

换元注意事项

有一些细节问题我也不知道到底该归在哪一部分,那么就以一道例题的形式写下来吧。

设$f(x,y)$在单位圆域上有连续的偏导数,而且$f(x,y)$在单位圆上值恒为$0$,若设区域$D_{\varepsilon}:\varepsilon^2\leqslant x^2+y^2\leqslant1$,其中$0<\varepsilon<1$,求证

$$ \lim_{\varepsilon\to0^+}\iint\limits_{D_{\epsilon}}\frac{xf'_x+yf'_y}{x^2+y^2}\mathrm{d}\sigma=-2\pi f(0,0) $$

一个直观的想法是,这个问题可以用格林公式处理。

$$ \oint_{L^+}(P\mathrm{d}x+Q\mathrm{d}y)=\iint\limits_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right) $$

那如果不用格林公式呢?这就涉及了一些知识点。

首先,对于圆域很自然就会想到极坐标变换:

$$ \left\{\begin{aligned}&x=r\cos\theta\\&y=r\sin\theta\end{aligned}\ \ \right.\Leftrightarrow\ \ \left\{\begin{aligned}&r=\sqrt{x^2+y^2}\\&\theta=\arctan\frac yx\end{aligned}\right. $$

接下来需要计算$f_x'$与$f_y'$在极坐标变换下等于什么,根据链式法则,有

$$ xf'_x=x\frac{\partial f(x,y)}{\partial x}\xlongequal{\text{换元}}r\cos\theta\left(\frac{\partial f(r\cos\theta,r\sin\theta)}{\partial r}\frac{\partial r}{\partial x}+\frac{\partial f(r\cos\theta,r\sin\theta)}{\partial\theta}\frac{\partial\theta}{\partial x}\right) $$

注意在计算$\frac{\partial r}{\partial x}$时不能像一元积分那样把他处理为反函数的导数$\frac{\partial r}{\partial x}=\frac1{\frac{\partial x}{\partial r}}$,因为二元函数的偏导数只是一个方便的记号,并不是微商,所以$\frac{\partial r}{\partial x}$正确的计算方法是先对$x$求偏导,再代入$x=r\cos\theta$与$y=r\sin\theta$,即$\frac{\partial r}{\partial x}=\frac{\partial}{\partial x}\sqrt{x^2+y^2}=\frac{x}{\sqrt{x^2+y^2}}\xlongequal{\text{换元}}\cos\theta$。处理$\frac{\partial \theta}{\partial x}$同理,有$\frac{\partial\theta}{\partial x}=\frac{\partial}{\partial x}\arctan\frac yx=\frac{-\frac{y}{x^2}}{1+\frac{y^2}{x^2}}=-\frac{y}{x^2+y^2}\xlongequal{\text{换元}}-\frac{\sin\theta}{r}$。

综上所述,可以得到$\displaystyle{xf'_x=r\cos\theta\Big(f_r'\cos\theta-\frac{f_{\theta}'\sin\theta}{r}\Big)}$,对$yf'_y$做同样的操作,于是有:

$$ xf'_x+yf'_y=r\cos\theta\left(f_r'\cos\theta-\frac{f_{\theta}'\sin\theta}{r}\right)+r\sin\theta\left(f_r'\sin\theta+\frac{f_{\theta}'\cos\theta}r\right)=rf'_r $$

$\boldsymbol{xf'_x+yf'_y=rf'_r}$

所以原式经极坐标变换后,是:

$$ \begin{align} \lim_{\varepsilon\to0^+}\iint\limits_{D_{\epsilon}}\frac{xf'_x+yf'_y}{x^2+y^2}\mathrm{d}\sigma&\xlongequal{\text{极坐标变换}}\lim_{\varepsilon\to0^+}\int^{2\pi}_0\mathrm{d}\theta\int^1_{\varepsilon}r\,\frac{rf_r'(r\cos\theta,r\sin\theta)}{r^2}\mathrm{d}r\\ &=\lim_{\varepsilon\to0^+}\int^{2\pi}_0\mathrm{d}\theta\int^1_{\varepsilon}f_r'(r\cos\theta,r\sin\theta)\mathrm{d}r\\ &=\lim_{\varepsilon\to0^+}\int^{2\pi}_0f(r\cos\theta,r\sin\theta)\Big|^{r=1}_{r=\varepsilon}\mathrm{d}\theta\\ &=\int^{2\pi}_0f(\cos\theta,\sin\theta)\mathrm{d}\theta-\lim_{\varepsilon\to0^+}\int^{2\pi}_0f(\varepsilon\cos\theta,\varepsilon\sin\theta)\mathrm{d}\theta\end{align} $$

由于$f(x,y)$在单位圆上值恒为$0$,所以$f(\cos\theta,\sin\theta)=0$,进而$\displaystyle{\int^{2\pi}_0f(\cos\theta,\sin\theta)\mathrm{d}\theta=0}$;

对于$\displaystyle{\lim_{\varepsilon\to0^+}\int^{2\pi}_0f(\varepsilon\cos\theta,\varepsilon\sin\theta)\mathrm{d}\theta}$,注意到$0\leqslant|\varepsilon\cos\theta|\leqslant\varepsilon,\,0\leqslant|\varepsilon\sin\theta|\leqslant\varepsilon$,因此可以考虑重积分的中值定理 (对于重积分一定要想到中值定理),即

$$ \begin{align}\lim_{\varepsilon\to0^+}\int^{2\pi}_0f(\varepsilon\cos\theta,\varepsilon\sin\theta)\mathrm{d}\theta&=\lim_{\varepsilon\to0^+}f(\xi,\eta)\int^{2\pi}_0\mathrm{d}\theta,\ \ \text{其中}0\leqslant\xi^2+\eta^2\leqslant\varepsilon\\&=2\pi f(0,0)\end{align} $$

不过也可以考虑勒贝格控制收敛定理,由于$f(\varepsilon\cos\theta,\varepsilon\sin\theta)$可微,故而在积分区域内有界。根据勒贝格控制收敛定理,有界函数列在有限测度集上的积分一定可以与极限交换次序,所以:

$$ \begin{align}\lim_{\varepsilon\to0^+}\int^{2\pi}_0f(\varepsilon\cos\theta,\varepsilon\sin\theta)\mathrm{d}\theta&=\int^{2\pi}_0\lim_{\varepsilon\to0^+}f(\varepsilon\cos\theta,\varepsilon\sin\theta)\mathrm{d}\theta\\&=\int^{2\pi}_0f(0,0)\mathrm{d}\theta\\&=2\pi f(0,0)\end{align} $$

最常用的三大积分号与极限号换序定理,Levi非负渐升列积分定理、Fatou引理与Lebesgue控制收敛定理,实在是一把利器。初阶的数学分析教材一般会提到如果函数列一致收敛到函数,那么就可以换序,但一致收敛的条件还是太强了,所以Lebesgue控制收敛定理通常更常用。

含参量积分(暂略)

暂略

曲线积分

第一型曲线积分

第一型曲线积分,即依弧长的积分。第一型曲线积分与曲线的方向无关,这是因为弧长是无向的,这一点应当与第一型曲线积分辨别。

$$ \int_Lf(x,y)\mathrm{d}s=\lim_{\Vert T\Vert\to0}\sum^n_{i=1}f(\xi_i,\eta_i)\Delta s_i $$$$ \int_Lf(x,y,z)\mathrm{d}s=\lim_{\Vert T\Vert\to0}\sum^n_{i=1}f(\xi_i,\eta_i,\gamma_i)\Delta s_i $$

第一型曲线积分是定积分的推广,就像第一型曲面积分是二重积分的推广一样。类似于可以认为定积分代表着被积函数与直线$x$轴围成平面图形的面积,同样可以认为平面曲线的第一型曲线积分代表着以平面曲线$L$为投影、以$f(x,y)$为高度的曲线同$Oxy$平面围成柱面的面积。更严谨地说,当$L$是平面$Oxy$上分段光滑曲线且$f(x,y)$是定义在$L$上的非负连续函数时,$\displaystyle\int_Lf(x,y)\mathrm{d}s$就是以$L$为准线,且母线平行于$z$轴的柱面上截取$0\leqslant z\leqslant f(x,y)$部分的面积。

还可以将$f(x,y)$视为密度,那么$\displaystyle\int_Lf(x,y)\mathrm{d}s$也可以被视为平面曲线$L$的质量。类似地,$\displaystyle\int_Lf(x,y,z)\mathrm{d}s$可以被视为空间曲线$L$的质量。当$f(x,y)\equiv1$时,第一型曲线积分$\displaystyle\int_L\mathrm{d}s$在数值上等于曲线$L$的周长。

第一型曲线积分的计算:设有通过参数方程定义的光滑曲线$L$,

$$ L:\left\{\begin{aligned}&x=\varphi(t)\\&y=\psi(t)\end{aligned}\right.\ ,\ \ \ t\in[\alpha,\beta] $$

$f(x,y)$是定义在$L$上的连续函数,其中$\varphi(t),\psi(t)$在$[\alpha,\beta]$上均具有一阶连续导数,则有

$$ \color{#C80032}{\int_Lf(x,y)\mathrm{d}s=\int^{\beta}_{\alpha}f\big(\varphi(t),\psi(t)\big)\sqrt{[\varphi'(t)]^2+[\psi'(t)]^2}\,\mathrm{d}t} $$

推导是容易的,只需要注意到$L$上由$t=t_{i-1}$到$t=t_i$的弧长为

$$ \Delta s_i=\int^{t_i}_{t_{i-1}}\sqrt{[\varphi'(t)]^2+[\psi'(t)]^2}\,\mathrm{d}t $$

再考虑积分中值定理,接着按第一型曲线积分的定义作推导即可。

  • 特别地,当曲线$L$由方程$y=y(x)$($x\in[a,b]$)表示时,计算公式成为

    $$ \color{#C80032}{\int_Lf(x,y)\mathrm{d}s=\int^b_af\big(x,y(x)\big)\sqrt{1+{y'}^2(x)}\,\mathrm{d}x} $$
  • 当曲线$L$由方程$x=x(y)$($y\in[c,d]$)表示时,计算公式成为

    $$ \color{#C80032}{\int_Lf(x,y)\mathrm{d}s=\int^b_af\big(x(y),y\big)\sqrt{1+{x'}^2(y)}\,\mathrm{d}y} $$

第二类曲线积分

第二型曲线积分,即依坐标的积分。在物理学中,涉及变力做功这样的矢量积分问题,就可能是第二型曲线积分的应用场景。第二型曲线积分与有向曲线$\overset{\,\frown}{AB}$的方向有关,如果朝着相反的方向积分,则结果为相反数,这一点应与第一型曲线积分辨析。

$$ \int_{\overset{\,\frown}{AB}}P(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y\ =\lim_{\Vert T\Vert\to0}\sum^n_{i=1}P(\xi_i,\eta_i)\Delta x_i\ +\lim_{\Vert T\Vert\to0}\sum^n_{i=1}Q(\xi_i,\eta_i)\Delta y_i $$$$ \begin{aligned}\int_{\overset{\,\frown}{AB}}P(&x,y,z)\mathrm{d}x+Q(x,y,z)\mathrm{d}y+R(x,y,z)\mathrm{d}z\\&=\textstyle\lim\limits_{\Vert T\Vert\to0}\sum^n\limits_{i=1}P(\xi_i,\eta_i,\gamma_i)\Delta x_i\ +\lim\limits_{\Vert T\Vert\to0}\sum^n\limits_{i=1}Q(\xi_i,\eta_i,\gamma_i)\Delta y_i\ +\lim\limits_{\Vert T\Vert\to0}\sum^n\limits_{i=1}R(\xi_i,\eta_i,\gamma_i)\Delta z_i\end{aligned} $$

当$L=\overset{\,\frown}{AB}$为封闭有向曲线时,任选一点作为曲线起点即可(同时这一点也作为曲线终点),积分可以写为

$$ \oint_LP(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y $$

可见,第二型曲线积分没有考虑圆弧,而是考虑针对坐标分量分别积分。

第二型曲线积分的计算:设有通过参数方程定义的光滑有向曲线$L=\overset{\,\frown}{AB}$,

$$ L:\left\{\begin{aligned}&x=\varphi(t)\\&y=\psi(t)\end{aligned}\right.\ ,\ \ \ t\in[\alpha,\beta] $$

$f(x,y)$是定义在$L$上的连续函数,其中$\varphi(t),\psi(t)$在$[\alpha,\beta]$上均具有一阶连续导数,则有

$$ \color{#C80032}{\int_LP(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y=\int^{\beta}_{\alpha}\Big[P\big[\varphi(t),\psi(t)\big]\varphi'(t)+Q\big[\varphi(t),\psi(t)\big]\psi'(t)\Big]\mathrm{d}t} $$
  • 当曲线$L$由方程$y=y(x)$($x\in[a,b]$)表示时,计算公式成为

    $$ \color{#C80032}{\int_LP(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y=\int^{\beta}_{\alpha}\Big[P\big[x,y(x)\big]+Q\big[x,y(x)\big]y'(x)\Big]\mathrm{d}x} $$
  • 当曲线$L$由方程$x=x(y)$($y\in[c,d]$)表示时,计算公式成为

    $$ \color{#C80032}{\int_LP(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y=\int^{\beta}_{\alpha}\Big[P\big[x(y),y\big]x'(y)+Q\big[x(y),y\big]\Big]\mathrm{d}y} $$

两类曲线积分的联系

以$(\widehat{\boldsymbol{t},x}),\ (\widehat{\boldsymbol{t},y})$分别表示切线方向$\boldsymbol{t}$与$x$轴和$y$轴正向的夹角,则在曲线上的 每一点的切线方向余弦是

$$ \frac{\mathrm{d}x}{\mathrm{d}s}=\cos(\widehat{\boldsymbol{t},x}),\ \ \frac{\mathrm{d}y}{\mathrm{d}s}=\cos(\widehat{\boldsymbol{t},y}) $$

于是,有

$$ \begin{align} &\ \ \ \ \ \int_LP(x,y)\mathrm{d}x+Q(x,y)\mathrm{d}y\\ &=\int^l_0\Big[P\big[x(s),y(s)\big]\cos(\widehat{\boldsymbol{t},x})+Q\big[x(s),y(s)\big]\cos(\widehat{\boldsymbol{t},y})\Big]\mathrm{d}s\\ &=\int_L\big[P(x,y)\cos(\widehat{\boldsymbol{t},x})+Q(x,y)\cos(\widehat{\boldsymbol{t},y})\big]\mathrm{d}s\end{align} $$

同理,有

$$ \int_LP\mathrm{d}x+Q\mathrm{d}y+R\mathrm{d}z=\int_L\big[P(x,y,z)\cos(\widehat{\boldsymbol{t},x})+Q(x,y,z)\cos(\widehat{\boldsymbol{t},y})+R(x,y,z)\cos(\widehat{\boldsymbol{t},z})\big]\mathrm{d}s $$

运用这一性质,有的时候可以帮助我们简化积分计算。例如,试计算$\displaystyle\oint_{L^+}y\mathrm{d}x+z\mathrm{d}y+x\mathrm{d}z$,其中$L$是$x^2+y^2+z^2=1$和$x+y+z=1$的交线,从$x$轴正向看去取逆时针方向。

首先,从曲线$L$的描述中可以知道$L$正切向的方向余弦为$\frac1{\sqrt2}(z-y,x-z,y-x)$,于是

$$ \begin{align} I&=\oint_{L^+}y\mathrm{d}x+z\mathrm{d}y+x\mathrm{d}z\\ &=\oint_{L^+}\frac1{\sqrt2}[y(z-y)+z(x-z)+x(y-x)]\mathrm{d}s\\ &=-\frac1{\sqrt2}\oint_{L^+}\mathrm{d}s\end{align} $$

由于交线是一个半径为$\sqrt{\frac23}$的圆,故而$\displaystyle\oint_{L^+}\mathrm{d}s=2\sqrt{\frac23}\cdot\pi$,因此

$$ I=-\frac1{\sqrt2}\oint_{L^+}\mathrm{d}s=-\frac{2\sqrt3\pi}3 $$

格林公式与积分路径无关性

格林公式:若函数$P(x,y),\,Q(x,y)$在闭区域$D$上连续且有连续的一阶偏导数,则有

$$ \boxed{\iint\limits_D\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)\mathrm{d}\sigma=\oint_{L^+}P\mathrm{d}x+Q\mathrm{d}y} $$

其中$L$是区域$D$的分段光滑的有向边界曲线,方向取正方向。这一公式就被称为格林公式。

格林公式告诉我们,当区域$D$是单连通区域时,如果$P(x,y),\ Q(x,y)$在$D$内连续且具有一阶连续的偏导数,则曲线积分的值与路径无关,只与起点和终点有关。在上述条件下,以下四个命题是等价的:

  1. 沿$D$内任一按段光滑封闭曲线$L$,有

    $$ \oint_LP\mathrm{d}x+Q\mathrm{d}y=0 $$
  2. 对$D$中任一按段光滑曲线$L$,曲线积分$\displaystyle\int_LP\mathrm{d}x+Q\mathrm{d}y$与路线无关,只与$L$的起点和重点有关。

  3. $P\mathrm{d}x+Q\mathrm{d}y$是$D$内某一函数$u(x,y)$的全微分,即在$D$内$\exists u$,$s.t.\ \mathrm{d}u=P\mathrm{d}x+Q\mathrm{d}y$

  4. 在$D$内处处成立

    $$ \frac{\partial P}{\partial y}=\frac{\partial Q}{\partial x} $$

其中$D$是单连通区域这一条件是十分必要的。所谓单连通,直观上就是指没有“洞”的区域,与之相对的是复连通区域。严格地讲,单连通区域是使得区域上任一封闭曲线均可以不经过区域以外的点而连续收缩与属于该区域中某一点的区域。


一个经典的例子是计算$\displaystyle\oint_L\frac{x\mathrm{d}y-y\mathrm{d}x}{x^2+y^2}$,其中曲线$L$的方程为$x^2+y^2=R^2$($R>0$),方向为逆时针方向。记被封闭曲线$L$围成的闭区域为$D$,易见$P(x,y)=-\frac{y}{x^2+y^2}$,$Q(x,y)=\frac{x}{x^2+y^2}$,这两个函数在点$(0,0)\in D$的偏导数不存在,不能直接应用格林公式。考虑利用$L$的方程$x^2+y^2=R^2$化简曲线积分,有

$$ \oint_L\frac{x\mathrm{d}y-y\mathrm{d}x}{x^2+y^2}=\frac1{R^2}\oint_Lx\mathrm{d}y-y\mathrm{d}x $$

这样就可以应用格林公式了,有

$$ \frac1{R^2}\oint_Lx\mathrm{d}y-y\mathrm{d}x=\frac1{R^2}\iint\limits_D[1-(-1)]\mathrm{d}x\mathrm{d}y=\frac2{R^2}\cdot\pi R^2=2\pi $$

事实上,分别按$P,Q$在$(0,0)$处是否存在偏导数分类讨论,不难证明,只要曲线$L$是一条不过原点的分段光滑的简单闭曲线,取方向为逆时针方向,那么就有

$$ \oint_L\frac{x\mathrm{d}y-y\mathrm{d}x}{x^2+y^2}=2\pi $$

曲面积分

第一型曲面积分

如果说第一型曲线积分是定积分的推广,那么第一型曲面积分就可以被视为二重积分的推广。求曲面块的质心、转动惯量与引力等,都可以利用第一型曲面积分。

$$ \iint\limits_Sf(x,y,z)\mathrm{d}S=\lim_{\Vert T\Vert\to0}\sum^n_{i=1}f(\xi_i,\eta_i,\gamma_i)\Delta S_i $$

当$f(x,y,z)\equiv1$时,第一型曲面积分$\displaystyle\iint\limits_S\mathrm{d}S$在数值上等于曲面块$S$的面积。

第一型曲面积分的计算:通常会化为二重积分以方便计算。设有光滑曲面

$$ S:z=z(x,y),\ (x,y)\in D $$

$f(x,y,z)$是定义在$S$上的连续函数,则有

$$ \color{#C80032}{\iint\limits_Sf(x,y,z)\mathrm{d}S=\iint\limits_Df\big(x,y,z(x,y)\big)\sqrt{1+z^2_x+z^2_y}\,\mathrm{d}x\mathrm{d}y} $$

第二型曲面积分

类似第二型曲线积分要求曲线的方向,第二型曲面积分要求曲面的侧,即区分曲面是单侧曲面还是双侧曲面。这里就不细致介绍了,只给出计算方法。

第二型曲面积分的计算

两类曲面积分的联系

第二型曲面积分的计算

高斯公式与斯托克斯公式

格林公式联系了沿封闭曲线的曲线积分与二重积分的关系,高斯公式则联系了沿空间闭曲面的曲面积分与三重积分的关系,可以说,高斯公式是格林公式的“另一个版本”。

高斯公式:设空间区域$V$由分片光滑的双侧封闭曲面$S$围成,若函数$P,Q,R$在$V$上连续且具有一阶连续偏导数,则

$$ \iiint\limits_V\left(\frac{\partial P}{\partial x}+\frac{\partial Q}{\partial y}+\frac{\partial R}{\partial z}\right)\mathrm{d}x\mathrm{d}y\mathrm{d}z= \oiint\limits_{S} P\mathrm{d}y\mathrm{d}z+Q\mathrm{d}z\mathrm{d}x+R\mathrm{d}x\mathrm{d}y $$
曲面S取外侧

与之对应地,斯托克斯公式则建立了沿空间双侧曲面$S$的曲面积分与沿$S$的边界曲线$L$的曲线积分间的关系。

斯托克斯公式:设光滑曲面$S$的边界$L$是按段光滑的连续函数,若函数$P,Q,R$在$S$连同$L$上连续且具有一阶连续偏导数,则

$$ \iint\limits_S\textstyle\left(\frac{\partial R}{\partial y}-\frac{\partial Q}{\partial z}\right)\mathrm{d}y\mathrm{d}z+\left(\frac{\partial P}{\partial z}-\frac{\partial R}{\partial x}\right)\mathrm{d}z\mathrm{d}x+\left(\frac{\partial Q}{\partial x}-\frac{\partial P}{\partial y}\right)\mathrm{d}x\mathrm{d}y=\displaystyle\oint_LP\mathrm{d}x+Q\mathrm{d}y+R\mathrm{d}z $$

向量函数微分学(暂略)

暂略

补充例题

  • 设函数$\displaystyle{f(x)=-x\int^1_0e^{-x^2t^2}\mathrm{d}t}$,则当$0\lt a\lt x\lt b$时,有( )

    A. $xf(x)>af(a)$

    B. $bf(b)>xf(x)$

    C. $xf(a)>af(x)$

    D. $xf(b)>bf(x)$

    解:题目给出的$f(x)$形式很难做进一步讨论,应当通过换元将其改写为变限积分的形式:

    $$ f(x)=-x\int^1_0e^{-x^2t^2}\mathrm{d}t=-\int^1_0e^{-(xt)^2}\mathrm{d}(xt)\xlongequal{xt=u}-\int^x_0e^{-u^2}\mathrm{d}u $$

    易见在$x\in(0,b)$上有$f(x)<0$,$f'(x)=-e^{-x^2}<0$,$f''(x)=2xe^{-x^2}>0$,函数本身的性质研究完毕,接下来讨论各个选项(毕竟是选择题,留意观察选项,“给什么用什么”)。

    对于A、B选项,式中都出现了$xf(x)$,所以可以考虑构造辅助函数$F(x)=xf(x)$;对$F$求导得$F'(x)=f(x)+xf'(x)<0$,因此$F$严格单调递减,A、B选项均是错误的。

    对于C、D选项,本着“参变分离”的思想,将其分别改写为“C. $\frac{f(a)}a>\frac{f(x)}x$”、“D. $\frac{f(b)}b>\frac{f(a)}a$”,易见应当构造辅助函数$G(x)=\frac{f(x)}x$;对$G$求导得$G'(x)=\frac{xf'(x)-f(x)}{x^2}$,似乎$G$的单调性无法直接求得。

    但是注意到$G'$的分子$xf'(x)-f(x)$是$f$和$f'$的关系,为进一步讨论$G$的单调性,应当联想到中值定理:

    $$ G'(x)=\frac{xf'(x)-f(x)}{x^2}=\frac{xf'(x)-\big[f(x)-f(0)\big]}{x^2}\xlongequal{\text{拉格朗日中值定理}}\frac{f'(x)-f'(\xi)}{x} $$

    其中$f(0)=0$、$\xi\in(0,x)$,这样一来就能用上二阶导数大于零的信息——$f'$单调递增,所以$f'(x)>f'(\xi)$,进而$G'(x)>0\Rightarrow G(x)$单调递增,因此C选项错误,D选项是正确答案。

    重要的是“给什么用什么”,多加注意题目中可能的提示,毕竟大部分题目都是被人为设计出来的。

  • 设函数$f(x)$在$[-2,2]$上二阶可导、$|f(x)|\leqslant1$且有$\displaystyle{\frac{\big[f'(0)\big]^2}2+\big[f(0)\big]^3>\frac32}$,求证存在一点$\xi\in(-2,2)$,使得$f''(\xi)+3\big[f(\xi)\big]^2=0$。

    证:按“给什么用什么”的思路,根据条件“$\frac{\big[f'(0)\big]^2}2+\big[f(0)\big]^3>\frac32$”想到可能需要设辅助函数$F(x)=\frac{\big[f'(x)\big]^2}2+\big[f(x)\big]^3$,观察到$F'(x)=f'(x)\big[f''(x)+3f^2(x)\big]$,所以似乎这个问题可以使用罗尔定理解决,但我们并不能知道在端点处函数$f$的值,所以不便使用罗尔定理。

    既然暂时没有什么头绪,那就研究一下由题目给出的三个点:$-2,0,2$。首先对于两个端点我们无法探究更多,因为他们只是满足了可导和$|f(x)|\leqslant1$。转而讨论$x=0$,题目给出了条件$F(0)>\frac32$,在罗尔定理难以运用时应当考虑费马定理,所以问题转而变成了证明$F(x)$一定在$(-2,2)$内取得最值。由于$F(0)>\frac32$,所以如果可以证明在$(-2,2)$上存在分别位于$x=0$左右的两个点使得$F$在其上的值小于$\frac32$,这个问题自然也就迎刃而解了。

    现在我们也没有别的办法,只能朝着这个方向,尝试在$[-2,0]$和$[0,2]$上对$f$使用拉格朗日中值定理。尽管,事实上函数$F$联系了$f$与$f'$,我们也本应该联想到拉格朗日中值定理。

    由于$f$在$[-2,2]$上可导,利用拉格朗日中值定理、绝对值与条件$|f(x)|\leqslant1$,分别有:

    • $|f'(\alpha)|=\left|\frac{f(0)-f(-2)}{0-(-2)}\right|=\frac{|f(0)|+|f(-2)|}2\leqslant1$,其中$\alpha\in(-2,0)$
    • $|f'(\beta)|=\left|\frac{f(2)-f(0)}{2-0}\right|=\frac{|f(2)|+|f(0)|}2\leqslant1$,其中$\beta\in(0,2)$

    进一步地,有

    • $F(\alpha)=\frac{\big[f'(\alpha)\big]^2}2+\big[f(\alpha)\big]^3\leqslant\frac12+1=\frac32$
    • $F(\beta)=\frac{\big[f'(\beta)\big]^2}2+\big[f(\beta)\big]^3\leqslant\frac12+1=\frac32$

    由于$F$二阶可导与$F(0)>\frac32\geqslant F(\alpha)$、$F(0)>\frac32\geqslant F(\beta)$,因此$F$的一阶导函数连续、在区间$[\alpha,\beta]$内一定存在最大值,而且该最大值必然在$(\alpha,\beta)$内取得,否则会出现$F(\alpha)\geqslant F(0)$或$F(\beta)\geqslant F(0)$,与已知矛盾。综上所述,不妨设$F$在$x_0\in(\alpha,\beta)$处取得区间$(\alpha,\beta)\subset(-2,2)$上的最大值,易见该点同时也是极大值点,由费马定理知$x=x_0$必然是$F$的驻点,所以有$F'(x_0)=f''(x_0)+3\big[f(x_0)\big]^2=0$,最后取$\xi=x_0$即可,证毕。

    以上过程中我们没有直接在$[-2,0]$和$[0,2]$上直接对$F$使用拉格朗日中值定理,这样子是证不出来的,而是通过在$[-2,0]$和$[0,2]$上对$f$使用拉格朗日中值定理找出了另外两个点$\alpha,\beta$,再在$(\alpha,\beta)$上使用费马定理,这是该解法的巧妙之处。

  • 设函数$f(x)$在区间$[0,1]$上连续且$\displaystyle{a=\int^1_0f(x)\mathrm{d}x\neq0}$,求证区间$(0,1)$内至少存在不同的两点$\xi_1,\xi_2$使得$\frac1{f(\xi_1)}+\frac1{f(\xi_2)}=\frac2a$。

    证:由于$f(x)$在$[0,1]$上连续,记其一个原函数为$\displaystyle{F(x)=\int^x_0f(t)\mathrm{d}t}$,有$F(0)=0$、$F(1)=a\neq0$,又$F$连续,由介值定理,存在一点$\eta\in(0,1)$使得$F(\eta)=\frac{a}2$。

    由于$F$在$[0,1]$上可导(导数为$[0,1]$上的连续函数$f$),所以分别在$[0,\eta]$和$[\eta,1]$上运用拉格朗日中值定理,有

    • $\frac{F(\eta)-F(0)}{\eta-0}=\frac{a}{2\eta}=f(\xi_1)$,其中$\xi_1\in(0,\eta)$
    • $\frac{F(1)-F(\eta)}{1-\eta}=\frac{a}{2(1-\eta)}=f(\xi_2)$,其中$\xi_2\in(\eta,1)$

    易见$\xi_1,\xi_2$是两个不同的点,且$\frac1{f(\xi_1)}+\frac1{f(\xi_2)}=\frac{2(\eta+1-\eta)}a=\frac2a$,证毕。

  • 设$f(x)$在$[a,b]$上有二阶导数且$f(a)=f(b)=0,f''(x)<0$,证明当$x\in(a,b)$时,$f(x)<\displaystyle\frac2{b-a}\int^b_af(t)\mathrm{d}t$。

    证:易见$f(x)$是凹函数,实际上还能得到$f(0)>0,\ x\in(a,b)$。对于任取定的一点$x_0\in(a,b)$,在$x=x_0$处对$f(x)$应用带拉格朗日余项的一阶泰勒公式,得

    $$ f(x)=f(x_0)+f'(x_0)(x-x_0)+\frac{f''(\xi)}{2!}(x-x_0)^2\lt f(x_0)+f'(x_0)(x-x_0) $$

    在不等式两端同时对$\mathrm{d}x_0$做$a$到$b$上的定积分——为过程整洁,不妨用$t$代替$x_0$,得到

    $$ \begin{align} \int^b_af(x)\mathrm{d}t=f(x)(b-a)&<\int^b_af(t)\mathrm{d}t+\int^b_af'(t)(x-t)\mathrm{d}t\\ &=\int^b_af(t)\mathrm{d}t+xf(t)\Big|^{t=b}_{t=a}-\int^b_at\mathrm{d}f(t)\\ &=\int^b_af(t)\mathrm{d}t+xf(b)-xf(a)-tf(t)\Big|^{t=b}_{t=a}+\int^b_af(t)\mathrm{d}t\\ &=2\int^b_af(t)\mathrm{d}t \end{align} $$

    移项,即

    $$ f(x)<\frac2{b-a}\int^b_af(t)\mathrm{d}t $$

    证毕。

    将参数$b$变量化以讨论构造函数的单调性是一个好方法,可惜在这里并不适用。

  • 设$\displaystyle{f(x)=\int^x_0e^{t^2}\mathrm{d}t},\ x>0$,

    1. 证明$f(x)=xf'\big(x\cdot\theta(x)\big)$,其中$\theta(x)\in(0,1)$且唯一
    2. 计算$\lim\limits_{x\to0^+}\theta(x)$

    解:这个题目不是难题,但是比较典型。这里$\theta(x)$实际上表示的是比例,是$\frac{\xi_x-a}{b-a}$,所以有$\theta\in(0,1)$。

    由于$f$在$(0,+\infty)$上任意阶可导,故在$[0,x]$上利用拉格朗日中值定理,有$\frac{f(x)-f(0)}{x-0}=\frac{f(x)}{x}=f'(\xi)$,其中$\xi\in(0,x)$,再令$\xi=x\cdot\theta(x)$即有$f(x)=xf'\big(x\cdot\theta(x)\big)$。下证$\theta(x)$的唯一性。

    假设还有$\theta^{\ast}(x)$也使得$f(x)=xf'\big(x\cdot\theta^{\ast}(x)\big)$成立,则$f(x)-f(x)=x\big[f'\big(x\cdot\theta(x)\big)-f'\big(x\cdot\theta^{\ast}(x)\big)\big]=0$,由于$x>0$,所以$f'\big(x\cdot\theta(x)\big)=f'\big(x\cdot\theta^{\ast}(x)\big)$,再使用拉格朗日中值定理得$\frac{f'\big(x\cdot\theta(x)\big)-f'\big(x\cdot\theta^{\ast}(x)\big)}{x[\theta(x)-\theta^{\ast}(x)]}=f''(\eta)=0$,而$f''(x)=2xe^{x^2}>0$,故而$x\cdot\theta(x)=x\cdot\theta^{\ast}(x)\Rightarrow \theta(x)=\theta^{\ast}(x)$,这样便证明了$\theta(x)$具有唯一性。

    接下来求极限$\lim\limits_{x\to0^+}\theta(x)$,由已证明的等式$f(x)=xf'\big(x\cdot\theta(x)\big)$知$\displaystyle{\int^x_0e^{t^2}\mathrm{d}t=xe^{x^2\theta^2(x)}}$,所以$\theta(x)=\displaystyle{\frac1x\sqrt{\ln\frac{\int^x_0e^{t^2}\mathrm{d}t}x}}$,易见$\lim\limits_{x\to0^+}\frac{\int^x_0e^{t^2}\mathrm{d}t}x=1$,所以

    $$ \lim\limits_{x\to0^+}\theta(x)=\lim\limits_{x\to0^+}\frac1x\sqrt{\ln\frac{\int^x_0e^{t^2}\mathrm{d}t}x}=\lim\limits_{x\to0^+}\frac1x\sqrt{\frac{\int^x_0e^{t^2}\mathrm{d}t}x-1}=\frac{\sqrt3}3 $$
  • 设$f(x)=\arctan x$,若$f(x)=xf'(\xi)$,求$\lim\limits_{x\to0}\frac{\xi^2}{x^2}$。

    解:和上一题类似,题干所给出的条件“$f(x)=xf'(\xi)$”其实就是间接告诉了我们比例$\theta(x)$。

    由于$f$在$(0,+\infty)$上任意阶可导,因此当$x>0$时在$(0,x)$上使用拉格朗日中值定理,有$\frac{f(x)-0}{x-0}=f'(\xi)=\frac1{1+\xi^2}$,所以$\xi^2=\frac{x}{\arctan x}-1$,从而$\lim\limits_{x\to0^+}\frac{\xi^2}{x^2}=\lim\limits_{x\to0^+}\frac{\frac{x}{\arctan x}-1}{x^2}=\frac13$。$x<0$时同理,最终有$\lim\limits_{x\to0}\frac{\xi^2}{x^2}=\frac13$。

  • 设$y=f(x)$二阶可导且有$f(0)=f'(0)=0$、$f''(0)\neq0$,记$u$为曲线在点$P(x,y)$处切线在$x$轴上的截距,求$\lim\limits_{x\to0}\frac{f(u)}{f(x)}$。

    解:容易求得曲线上的点$(x_0,y_0)$处切线的表达式是$y=f'(x_0)x-f'(x_0)x_0+f(x_0)$,因此$u=x-\frac{f(x)}{f'(x)}$,接下来的问题就是如何处理极限$\lim\limits_{x\to0}\frac{f(u)}{f(x)}$。

    注意到,对$\frac{f(u)}{f(x)}$分子分母的函数同时在$x=0$处使用带皮亚诺余项的泰勒公式(不要用拉格朗日余项等具体余项),有

    $$ \frac{f(u)}{f(x)}=\frac{f(0)+f'(0)u+\frac{f''(0)}{2!}u^2+\omicron(u^2)}{f(0)+f'(0)x+\frac{f''(0)}{2!}x^2+\omicron(x^2)}=\frac{u^2+\omicron(u^2)}{x^2+\omicron(x^2)} $$

    所以

    $$ \begin{align}\lim\limits_{x\to0}\frac{f(u)}{f(x)}&=\lim\limits_{x\to0}\frac{u^2}{x^2}=\lim\limits_{x\to0}\left(\frac{x-\frac{f(x)}{f'(x)}}{x}\right)^2\\&=\lim\limits_{x\to0}\left(1-\frac{f(0)+f'(0)x+\frac{f''(0)}{2!}x^2+\omicron(x^2)}{x\big[f'(0)+f''(0)x+\omicron(x)\big]}\right)^2\\&=\frac14\end{align} $$
  • 已知$f(x)$为二阶可导的正值函数,$f(0)=f'(0)=1$,$f(x)f''(x)\geqslant[f'(x)]^2$,则( )

    A. $f(2)\leqslant e^2\leqslant\sqrt{f(1)f(3)}$

    B. $e^2\leqslant f(2)\leqslant\sqrt{f(1)f(3)}$

    C. $\sqrt{f(1)f(3)}\leqslant e^2\leqslant f(2)$

    D. $\sqrt{f(1)f(3)}\leqslant f(2)\leqslant e^2$

    解:按“给什么用什么”的规律,需要构造的辅助函数一定是能联系到条件“$f(x)f''(x)\geqslant[f'(x)]^2$”的。通常而言辅助函数不会特别复杂,如果真的复杂到了一定程度,通常题干会以某种方式直接给出。

    常见的简单辅助函数,无外乎$e^gf$型、$fg$型、$\frac{f}g$型、$f^k$型、$x^{\pm n}f$型($g$通常是简单的幂函数或者$f$的导数、积分)。看到“$f(x)f''(x)\geqslant[f'(x)]^2$”一定要迅速联想到这是$\frac{f'(x)}{f(x)}$的导数的分子,同时务必注意到$\frac{f'(x)}{f(x)}$本身是$\ln f(x)$的导数,这是一个十分关键的点。即使第一时间没有观察出来,逐个考虑所有可能的简单辅助函数形态,也能发现只有$\frac{f'}f$可以联系到给出的条件“$f(x)f''(x)\geqslant[f'(x)]^2$”。

    综上所述,做辅助函数$F(x)=\ln f(x)$,有$F''(x)=\frac{f''(x)f(x)-[f'(x)]^2}{f^2(x)}\geqslant0$,因此$F(x)$是正值下凸函数,故而有$\frac{F(1)+F(3)}{2}\geqslant F(2)$,即$\ln\sqrt{f(1)f(3)}\geqslant\ln f(2)\Rightarrow f(2)\leqslant\sqrt{f(1)f(3)}$。

    那么如何分析$e^2$与$F$的关系呢?从凸性入手直接分析可能稍显繁琐,考虑在$x=0$处展开的带拉格朗日余项的二阶泰勒公式,由于$F''(x)\geqslant0$,所以有$F(x)=F(0)+F'(0)x+\frac{F''(\xi)}{2!}x^2\geqslant x$,因此$F(2)=\ln f(2)\geqslant 2\Rightarrow f(2)\geqslant e^2$,从而有$e^2\leqslant f(2)\leqslant\sqrt{f(1)f(3)}$。综上,B选项是正确的。

  • 设正项数列$\{a_n\},\{b_n\}$满足$a_n=\ln\big(a_n+e^{b_n}\big),\ \,n\in\mathbb{N}^+$,判断下述命题是否正确,并说明理由:

    1. 若$\sum\limits^{\infty}_{n=1}a_n$收敛,则$\sum\limits^{\infty}_{n=1}b_n$收敛
    2. 若$\sum\limits^{\infty}_{n=1}a_n$发散,则$\sum\limits^{\infty}_{n=1}b_n$发散

    解:第一个命题正确,第二个命题错误,下分别说明其理由。

    对于第一个命题,这种讨论两正项数列敛散性的问题,应当优先讨论两数列的大小关系,这是一个极其重要的突破口。由原式变形得$e^{a_n}-e^{b_n}=a_n>0$($\{a_n\}$为正项数列),根据指数函数$e^x$单调性知$a_n>b_n>0$,因此由正项级数的比较审敛法可知,如果$\sum\limits^{\infty}_{n=1}a_n$收敛,则必有$\sum\limits^{\infty}_{n=1}b_n$收敛,从而命题成立。无论是像这里两数列关系涉及对数函数、指数函数,还是涉及三角函数、多项式函数,都应该优先观察两数列之间的大小关系。

    对于第二个命题,取$a_n=\frac1n$即可,有$b_n=\ln\big(e^{a_n}-a_n\big)=\ln\left(e^{\frac1n}-\frac1n\right)$,考察函数$\ln(e^x-x)$在$x=0$附近的性质,有

    $$ \ln(e^x-x)\ \sim\ e^x-x-1\ \sim\ \frac{x^2}2+\mathcal{o}\left(\frac{x^2}2\right) $$

    因此有$\displaystyle\lim_{n\to\infty}\frac{\ln\left(e^{\frac1n}-\frac1n\right)}{\frac1{n^2}}=\frac12$,根据正项级数的比较原则极限形式可知,此时$\sum\limits^{\infty}_{n=1}b_n$收敛,故命题不成立。

  • 设平面区域$D=\{(x,y):x+y\leqslant1,x\geqslant0,y\geqslant0\}$,试计算$\displaystyle{\iint\limits_D\frac{e^{-(x+y)}}{\sqrt{xy}}\mathrm{d}\sigma}$

    这个二重积分难以直接计算,所以想到换元以消掉分母的根号。

    法一:做积分换元:

    $$ \left\{\begin{aligned}&x=u^2,&&x\geqslant0\\&y=v^2 ,&&y\geqslant0\end{aligned}\ \ \ \ \ \ \ \ \ \ \ \ \ \right.\Leftrightarrow\ \ \ \ \ \ \ \ \ \ \ \ \ \left\{\begin{aligned}&u=\sqrt{x}\\&v=\sqrt{y}\end{aligned}\right. $$

    这样换元的好处是不仅能消掉分母的根号,还将积分区域化为了圆域,记$D_1=\{(u,v):u^2+v^2\leqslant1,u\geqslant0,v\geqslant0\}$,有

    $$ \iint\limits_D\frac{e^{-(x+y)}}{\sqrt{xy}}\mathrm{d}\sigma=\iint\limits_{D_1}\frac{e^{-(u^2+v^2)}}{uv}\left|\begin{matrix}2u&0\\0&2v\end{matrix}\right|\mathrm{d}\sigma=4\iint\limits_{D_1}e^{-(u^2+v^2)}\mathrm{d}\sigma $$

    积分$\displaystyle{4\iint\limits_{D_1}e^{-(u^2+v^2)}\mathrm{d}\sigma}$通过简单的极坐标换元即可解出,可以计算出结果为$\pi-\frac{\pi}e$。

    法二:除了上述换元,注意到原式被积式中关于积分变量的式子只有$x+y$和$xy$,所以还可以做下述线性变换:

    $$ \left\{\begin{aligned}&x=u-v\\&y=v\end{aligned}\ \ \right.\Leftrightarrow\ \ \left\{\begin{aligned}&u=x+y\\&v=x\end{aligned}\right. $$

    记新积分区域为$D_2$,有

    $$ \iint\limits_D\textstyle\frac{e^{-(x+y)}}{\sqrt{xy}}\mathrm{d}\sigma=\displaystyle\iint\limits_{D_2}\textstyle\frac{e^{-u}}{\sqrt{v(u-v)}}\left|\begin{matrix}1&-1\\0&1\end{matrix}\right|\mathrm{d}\sigma=2\displaystyle\int^1_0e^{-u}\textstyle\left.\left(\arctan\frac{\sqrt{v}}{\sqrt{u-v}}\right)\right|^u_0\mathrm{d}u=\pi-\frac{\pi}e $$

    这个换元显然就没有第一种换元的计算那么简便了。

    法三:还可以直接对原式做极坐标代换:

    $$ \begin{align} \iint\limits_D\frac{e^{-(x+y)}}{\sqrt{xy}}\mathrm{d}\sigma&=\int^{\frac{\pi}2}_0\mathrm{d}\theta\int^{\frac1{\sin\theta+\cos\theta}}_0\frac{e^{-r(\sin\theta+\cos\theta)}}{\sqrt{\sin\theta\,\cos\theta}}\mathrm{d}r\\ &=\int^{\frac{\pi}2}_0-\frac1{(\sin\theta+\cos\theta)\sqrt{\sin\theta\cos\theta}}\cdot\left(\frac1e-1\right)\mathrm{d}r\\ &=(1-\frac1e)\int^{\frac{\pi}2}_0\frac{\mathrm{d}\tan\theta}{(1+\tan\theta)\sqrt{\tan\theta}}\mathrm{d}\theta\\ &\xlongequal{t=\tan\theta}(1-\frac1e)\int^{+\infty}_0\frac{2\mathrm{d}\sqrt{t}}{1+(\sqrt{t})^2}\mathrm{d}t\\ &=\pi-\frac{\pi}e \end{align} $$

    然而这样换元的结果是计算过程变得更加繁复了,不推荐。这也说明,应当选取合适的换元,事半功倍。

  • 设$\forall n\in\mathbb{N}^+, \ a_n\lt b_n$,若级数$\sum\limits^{\infty}_{n=1}a_n$与$\sum\limits^{\infty}_{n=1}b_n$均收敛,试证$\sum\limits^{\infty}_{n=1}a_n$绝对收敛是$\sum\limits^{\infty}_{n=1}b_n$绝对收敛的充要条件。

    • 法一:由$a_n\lt b_n$与级数$\sum\limits^{\infty}_{n=1}a_n$、$\sum\limits^{\infty}_{n=1}b_n$收敛知$\sum\limits^{\infty}_{n=1}(b_n-a_n)$是收敛的正项级数,自然也是绝对收敛的。

      注意到有如下的三角不等式

      $$ \left\{\begin{aligned} &|b_n|=|b_n-a_n+a_n|\leqslant|b_n-a_n|+|a_n|\\ &|a_n|=|a_n-b_n+b_n|\leqslant|b_n-a_n|+|b_n| \end{aligned}\right. $$

      因此,如果$\sum\limits^{\infty}_{n=1}a_n$绝对收敛,由于$|b_n|\leqslant|b_n-a_n|+|a_n|$,由比较原则知$\sum\limits^{\infty}_{n=1}b_n$绝对收敛,必要性成立;

      如果$\sum\limits^{\infty}_{n=1}b_n$绝对收敛,由于$|a_n|\leqslant|b_n-a_n|+|b_n|$,由比较原则知$\sum\limits^{\infty}_{n=1}a_n$绝对收敛,充分性成立,证毕。

    • 法二:也可以通过构造级数分开证明必要性与充分性。

      先证必要性,这里会利用级数$\sum\limits^{\infty}_{n=1}\frac{|b_n|-b_n}2$。注意到当$b_n\geqslant0$时$|a_n|\geqslant\frac{|b_n|-b_n}2=0$,当$a_n\lt b_n<0$时$|a_n|\geqslant|b_n|=\frac{|b_n|-b_n}2$,所以恒有$|a_n|\geqslant\frac{|b_n|-b_n}2$成立,由比较原则知正项级数$\sum\limits^{\infty}_{n=1}\frac{|b_n|-b_n}2$绝对收敛,又由于

      $$ \sum^{\infty}_{n=1}|b_n|=\sum^{\infty}_{n=1}\left[2\left(\frac{|b_n|-b_n}2\right)+b_n\right]=2\sum^{\infty}_{n=1}\frac{|b_n|-b_n}2+\sum^{\infty}_{n=1}b_n $$

      其中$\sum\limits^{\infty}_{n=1}\frac{|b_n|-b_n}2$绝对收敛、$\sum\limits^{\infty}_{n=1}b_n$收敛,所以$\sum\limits^{\infty}_{n=1}|b_n|$收敛,即$\sum\limits^{\infty}_{n=1}b_n$绝对收敛。

      再证充分性。充分性是比较直观的,不妨记$\{a_n\}$的负项子列为$\{\alpha_{n_k}\}$、非负项子列为$\{\beta_{n_k}\}$,对于非负项子列,因为$\beta_{n_k}\lt b_{n_k}$,而$\sum\limits^{\infty}_{n=1}b_n$绝对收敛$\Rightarrow\sum\limits^{\infty}_{k=1}b_{n_k}$收敛,从而$\sum\limits^{\infty}_{k=1}\beta_{n_k}$收敛;对于负项子列,因为$\sum\limits^{\infty}_{n=1}a_n$收敛,所以$\sum\limits^{\infty}_{n=1}a_n-\sum\limits^{\infty}_{k=1}\beta_{n_k}=\sum\limits^{\infty}_{k=1}\alpha_{n_k}$收敛,等价于$-\sum\limits^{\infty}_{k=1}\alpha_{n_k}$收敛,从而$\sum\limits^{\infty}_{n=1}|a_n|=-\sum\limits^{\infty}_{k=1}\alpha_{n_k}+\sum\limits^{\infty}_{k=1}\beta_{n_k}$收敛,于是$\sum\limits^{\infty}_{n=1}a_n$绝对收敛,证毕。

  • 设$f(x)$在$[0,1]$上可导且$f'(x)>0$,求极限$\displaystyle\lim_{x\to0^+}\frac{\displaystyle\int^x_0f(t)\mathrm{d}t-xf(0)}{xf(x)-xf(0)}$

    解:这个问题本身比较简单,但其中蕴含的一些思想是极为重要的,我将其称为

    1. “无中生有”,例如将$\frac{f(x)-f(0)}{g(x)}$改写为$\frac{f(x)-f(\xi)+f(\xi)-f(0)}{g(x)}=\frac{f(x)-f(\xi)}{g(x)}+\frac{f(\xi)-f(0)}{g(x)}$
    2. “承上启下”,例如将$\frac{f(x)}{g(x)}$改写为$\frac{f(x)}{h(x)}\!\cdot\!\frac{h(x)}{g(x)}$

    这两种技巧在数学的各个领域中都是非常常见的,是需要掌握的基本方法。对于这个极限问题就需要用到“承上启下”的思路,因为题干没有提到是否有$f(x)$二阶可导,故不能一直使用洛必达法则,这时便需要用一些技巧凑出极限:

    $$ \begin{align} \lim_{x\to0^+}\frac{\displaystyle\int^x_0f(t)\mathrm{d}t-xf(0)}{xf(x)-xf(0)}&=\lim_{x\to0^+}\frac{\displaystyle\int^x_0f(t)\mathrm{d}t-xf(0)}{x^2}\cdot\frac{x^2}{xf(x)-xf(0)}\\ &=\lim_{x\to0^+}\frac{f(x)-f(0)}{2x}\cdot\frac{x}{f(x)-f(0)}\\ &=\frac12f'(0)\frac1{f'(0)}\\ &=\frac12 \end{align} $$

    这里之想到“承上启下”的原因是为了凑$f'(0)=\lim\limits_{x\to0^+}\frac{f(x)-f(0)}{x-0}$。

  • 设函数$y=f(x)$由方程$e^y+x=e\cos (xy)$确定,计算极限$\displaystyle\lim_{n\to\infty}\left[f\left(\frac1n\right)\right]^{\frac1{n\left(1-\cos\frac1n\right)}}$

    解:对于这类不能写出显式初等表达式的隐函数,计算其极限往往需要$y(x_0)$或$y$的各阶导数在$x_0$处的值,因为这是我们唯一可以获得的有效信息——毕竟这个方程本身作为一个隐函数没办法直接代入极限式中。

    不难想到将极限式化为幂指函数再作讨论,因为底数和幂都是$\frac1n$的函数:

    $$ \begin{align} \lim_{n\to\infty}\left[f\left(\frac1n\right)\right]^{\frac1{n\left(1-\cos\frac1n\right)}}&=\lim_{n\to\infty}e^{\frac1{n\left(1-\cos\frac1n\right)}\ln f\left(\frac1n\right)}\\ &=e^{\lim\limits_{n\to\infty}2n\ln f\left(\frac1n\right)} \end{align} $$

    现在想办法计算$\lim\limits_{n\to\infty}2n\ln f\left(\frac1n\right)$即可,首先出计算$f(0)$——不仅是经验告诉我们后续计算中很可能会用到$f(0)$的值,更重要的是如果$f(0)\neq1$,那么极限$\lim\limits_{n\to\infty}2n\ln f\left(\frac1n\right)$根本不存在。当然,容易知道$f(0)$确为$1$。

    接下来有两种不同的思路可以选择:

    思路一:利用$\ln(1+x)\sim x$,有

    $$ \begin{align} \lim_{n\to\infty}2n\ln f\left(\frac1n\right)&=\lim_{n\to\infty}2n\left[f\left(\frac1n\right)-1\right]\\ &=\lim_{n\to\infty}2\cdot\frac{f\left(\frac1n\right)-f(0)}{\frac1n-0}\\ &=2f'(0) \end{align} $$

    由方程$e^y+x=e\cos (xy)$知

    $$ f'(0)=-\left.\frac{\frac{\mathrm{d}}{\mathrm{d}x}\big(e^y+x-e\cos(xy)\big)}{\frac{\mathrm{d}}{\mathrm{d}y}\big(e^y+x-e\cos(xy)\big)}\right|_{x=0}=-\frac1e $$

    从而$\displaystyle\lim_{n\to\infty}\left[f\left(\frac1n\right)\right]^{\frac1{n\left(1-\cos\frac1n\right)}}=e^{-\frac2e}$;注意到$\ln f(0)=\ln 1=0$,也有一种不使用等价无穷小的办法。

    思路二:和上面的方法没有本质区别,按定义直接凑$\ln f\left(\frac1n\right)$的导数,有

    $$ \begin{align} \lim_{n\to\infty}2n\ln f\left(\frac1n\right)&=\lim_{n\to\infty}2\cdot\frac{\ln f\left(\frac1n\right)-\ln f(0)}{\frac1n-0}\\ &=2\left.\frac{\mathrm{d}}{\mathrm{d}x}\ln f(x)\right|_{x=0}\\ &=2\frac{f'(0)}{f(0)} \end{align} $$

    同样能计算得$\displaystyle\lim_{n\to\infty}\left[f\left(\frac1n\right)\right]^{\frac1{n\left(1-\cos\frac1n\right)}}=e^{-\frac2e}$。以上两种方法虽然思考过程不同,但最终殊途同归。

  • 曲线$x^{\frac32}+y^{\frac32}=1$($x>0,y>0$)上任意一点处的切线在两坐标轴上的截距之和为$l$,试求$l$的最大值。

    解:这类涉及曲线切线与坐标轴交点的问题,都应该使用点斜式表示切线,如果用斜截式表示则会非常麻烦。

    首先按点斜式写出切线方程:$Y-y=y'(X-x)$,接着对原方程两端同时对$x$求导,得$\frac32x^{\frac12}+\frac32y^{\frac12}y'=0$,即$y'=-\big(\frac{x}y\big)^{\frac12}$。

    接下来是如何化简截距之和方程$l$的问题,否则就要求解一个四次方程了。这道题本身不难,关键是要留意截距之和方程$l$是可以化简的。直接对切线方程$Y-y=y'(X-x)$分别代入$Y=0$、$X=0$,得到两个截距

    $$ X=-\frac{y}{y'}+x $$$$ Y=-xy'+y $$

    将$y'=-\big(\frac{x}y\big)^{\frac12}$代入上式,一定要注意到结果是可以通过原曲线方程$x^{\frac32}+y^{\frac32}=1$化简的

    $$ X=-\frac{y}{-\big(\frac{x}y\big)^{\frac12}}+x=\frac{y^{\frac32}}{x^{\frac12}}+x=\frac{\boxed{y^{\frac32}+x^{\frac32}}}{x^{\frac12}}=\frac1{\sqrt{x}} $$$$ Y=-x\left[-\left(\frac{x}y\right)^{\frac12}\right]+y=\frac{x^{\frac32}}{y^{\frac12}}+y=\frac{\boxed{x^{\frac32}+y^{\frac32}}}{y^{\frac12}}=\frac1{\sqrt{y}} $$

    所以$l=X+Y=\frac1{\sqrt{x}}+\frac1{\sqrt{y}}$,问题就转化成了在约束$x^{\frac32}+y^{\frac32}=1$下求$l=\frac1{\sqrt{x}}+\frac1{\sqrt{y}}$极值的约束优化问题。最后,简单利用拉格朗日乘子法即可知道$x=y=\frac1{2^{\frac23}}$是拉格朗日函数的唯一驻点,因此$l_{\max}=2^{\frac13}+2^{\frac13}=2^{\frac43}$。

    这道题给了我们一个启示,那就是不仅在曲线积分、曲面积分中可以用曲线方程或曲面方程化简被积式,在优化问题中有时同样需要用原方程化简目标函数,否则计算会变得十分复杂。一定要多观察、多留意。

  • 设$D=\Big\{(x,y):0\leqslant x\leqslant2,0\leqslant y\leqslant\sqrt{2x-x^2}\Big\}$,计算二重积分$\displaystyle{I=\iint\limits_D|x+y-2|\mathrm{d}\sigma}$

    解:这是一道很好的二重积分计算题,有很多可以降低计算量的小窍门。

    设$D_1=\Big\{(x,y):0\leqslant x\leqslant2,0\leqslant y\leqslant\sqrt{2x-x^2},y\geqslant -x+2\Big\}$,无论采取什么方法都避不开分割区域$D$。

    法一,直接计算:这是最常见的做法,计算上相比法二会繁琐一点。第一步当然是去掉绝对值,易见

    $$ I=\underbrace{-\iint\limits_D(x+y-2)\mathrm{d}\sigma}_{I_1}+\underbrace{2\iint\limits_{D_1}(x+y-2)\mathrm{d}\sigma}_{I_2} $$

    分别计算$I_1,I_2$即可,先算$I_1$,对半圆域上的二重积分$I_1$做极坐标换元处理:

    $$ \begin{align} I_1&=-\int^{\frac{\pi}2}_0\mathrm{d}\theta\int^{2\cos\theta}_0\Big(r^2(\cos\theta+\sin\theta)-2r\Big)\mathrm{d}r\\ &=-\int^{\frac{\pi}2}_0\big(\frac83\cos^4\theta+\frac83\cos^3\theta\sin\theta-4\cos^2\theta\big)\mathrm{d}\theta\\ &=-\frac83\times\frac34\times\frac12\times\frac{\pi}2+\frac23\cos^4\theta\Big|^{\frac{\pi}2}_0+4\times\frac12\times\frac{\pi}2\\ &=-\frac23+\frac{\pi}2 \end{align} $$

    再算$I_2$,由于$I_2$做极坐标变换后计算上更为复杂,所以不做换元:

    $$ \begin{align} I_2&=2\int^2_1\mathrm{d}x\int^{\sqrt{2x-x^2}}_{-x+2}(x+y-2)\mathrm{d}y\\ &=2\int^2_1(x-2)\Big(\sqrt{2x-x^2}\Big)\mathrm{d}x+2\int^2_1(-x+2)\mathrm{d}x\\ &\xlongequal{x-1=\sin t}2\int^{\frac{\pi}2}_0(\sin t-1)\cos^2t\,\mathrm{d}t+1\\ &=-2\cdot\frac13\cos^3t\Big|^{\frac{\pi}2}_0-2\times\frac12\times\frac{\pi}2+1\\ &=\frac53-\frac{\pi}2 \end{align} $$

    综上所述,$I=I_1+I_2=1$。这是最常规的做法,唯一要提醒的是简单的积分换元最好一步到位,不要分多次代换,这会大大增加计算量——计算步骤越多,错误概率越大。这里做换元$x-1=\sin t$是很容易处理的,首先$x=\sin t+1$,所以$\mathrm{d}x=\cos t\,\mathrm{d}t$,$(x-2)=(\cos t-2)$,$\sqrt{2x-x^2}=\sqrt{1-(x-1)^2}=\cos t$,于是$\displaystyle{\int^2_1(x-2)\Big(\sqrt{2x-x^2}\Big)\mathrm{d}x=\int^{\frac{\pi}2}_0(\sin t-1)\cos^2t\,\mathrm{d}t}$。而我起初的思路是首先处理根式$\sqrt{2x-x^2}$,也就是先换元$t^2=2x-x^2$以消去根式,观察式子出现了新的根式$\sqrt{1-t^2}$,于是再换元$t=\sin z$——这样做大大增加了计算量。明明只需要一步的事,我硬是做成了两步,硬生生徒增了许多计算量。

    法二,利用条件化简,“偷懒”:注意到区域$D$是关于$x=1$对称的一个半圆,这意味着

    $$ \iint\limits_D(x-1)\mathrm{d}\sigma=0 $$

    由二重积分的几何应用知,$\displaystyle{\iint\limits_D\mathrm{d}\sigma}$正是半圆的面积,所以

    $$ \iint\limits_Dk\mathrm{d}\sigma=k\cdot S_D=\frac{k\pi}2,\ \ \ \ \ k\in\mathbb{R} $$

    因此

    $$ -I_1=\iint\limits_{D}\Big((x-1)+y-1\Big)\sigma=-\frac{\pi}2+\iint\limits_Dy\mathrm{d}\sigma\xlongequal{\text{极坐标变换积分}}-\frac{\pi}2+\frac23 $$

    接下来处理$I_2$,首先在几何上可以看出$S_{D_2}=\frac{S_D}4$,因此

    $$ I_2=2\iint\limits_D(x+y)\mathrm{d}\sigma-\pi+2 $$

    在继续计算$I_2$时,相较于法一中先积$\mathrm{d}y$再积$\mathrm{d}x$的做法,换序后先积$\mathrm{d}x$再积$\mathrm{d}y$会更容易,即

    $$ \begin{align}I_2&=2\int^1_0\mathrm{d}y\int^{1+\sqrt{1-y^2}}_{2-y}(x+y)\mathrm{d}x-\pi+2\\&=2\int^1_0(y\sqrt{1-y^2}+\sqrt{1-y^2}+y-1)\mathrm{d}y-\pi+2\\&=\frac53-\frac{\pi}2\end{align} $$

    其中,对$\displaystyle{\int^1_0y\sqrt{1-y^2}\mathrm{d}y}$可以直接凑微分,对$\displaystyle{\int^1_0\sqrt{1-y^2}\mathrm{d}y}$可以直接由单位圆面积的定积分表示得到(当然也可以用牛顿-莱布尼茨公式,但没有必要),基本不需要什么计算——起码相对于法一而言。

    可以看出,法二几乎没有什么计算量。有时,“偷懒”是有必要的,毕竟计算得越多,越可能出错。

    彻底了解如何“偷懒”后(尤其是涉及绝对值与圆域的二重积分),读者可以尝试一下这道题,检验检验是否真的懂了“怎样偷懒”:设$D=\big\{(x,y):x^2+y^2\leqslant1,0\leqslant x\leqslant1\big\}$,计算二重积分$\displaystyle{I=\iint\limits_D\Big||x+y|-1\Big|\mathrm{d}x\mathrm{d}y}$。这个二重积分最后计算得的正确结果应该是$\frac53-\frac{2\sqrt2}3$,如果选择“硬算”,要处理太多的项,这既浪费时间,又增大错误的风险。