前言
本文介绍Taylor公式以及几种余项。
一元函数的Taylor公式
一元函数的Taylor公式相信大家都很熟悉了,其出发点很简单:在某一点复杂函数不好研究,我们期望在该点上用一个高次多项式函数来近似这个复杂函数。
设有函数$f(x),x\in\mathbb{R}$,若$f$是$n$阶可微的,则记$f\in\boldsymbol{D}^{(n)}$。设有$n$阶多项式:
$$ T_n(f,x_0;x)=\sum_{k=1}^n a_k(x-x_0)^k,a_n\neq 0,n>0 $$
我们期望有:
$$ f(x_0)=T_n(f,x_0;x)+R_n(x_0)\tag{1} $$
其中 $n$ 次多项式$T_n(f,x_0;x)$ 用来近似原函数 $f(x_0)$, $R_n(x_0)$ 是近似后“剩下的”误差部分,称为余项。我们希望 $R_n(x_0)$ 越接近0越好,这说明我们近似地越精准。那么在一个点周围,怎么样近似一个函数呢?这个答案也是显而易见的,就是该点的各阶导数值相等——0阶导数相等意味着在这一点函数值一样;1阶导数相等意味着这一点函数值的变化快慢相等;2阶导数相等意味着函数1阶导数值的变化快慢相等,以此类推…这些导数值携带着函数的信息,越低阶的导数携带的信息越直接、重要,因此我们的近似思路就是从低到高尽可能让它们相等,至于具体相等到几阶,则根据实际需要的精度决定。所以,不妨设$f\in\boldsymbol{D}^{(n)}$我们有:
$$ \begin{align} &f^{(k)}(x_0)=T^{(k)}_n(f,x_0;x),\forall k=0,\cdots,n\tag{2}\\ &T^{(k)}_n(f,x_0;x)=0,\forall k\geq n+1\tag{3} \end{align} $$
由(2)(3)我们知道,$T_n(f,x_0;x)$一定具有形式:
$$ T_n(f,x_0;x)=\sum_{k=0}^n \frac{1}{k!} f^{(k)}(x_0)(x-x_0)^k\tag{4} $$
而对于余项,我们可以直接得出:
$$ \begin{align} &R_n^{(k)}(x_0)=f^{(k)}(x_0)-T^{(k)}_n(f,x_0;x)=0,\ \forall k = 0,\ldots,n\tag{5}\\ &R_n^{(k)}(x_0)=f^{(k)}(x_0),\ \forall k \geq n+1\tag{6} \end{align} $$
不妨进一步假设$f\in\boldsymbol{D}^{(n+1)}$,我们可以得出满足(5)(6)的一种余项形式:
$$ R_n(x_0) = \underbrace{\int_{x_0}^{x} \int_{x_0}^{t_n} \cdots \int_{x_0}^{t_1}} _{n+1个} {f^{(n+1)}(t_0)} \, \underbrace{ {\rm d}t_0 {\rm d}t_1 \cdots {\rm d}t_n }_{n+1个} \tag{7} $$
其中:$t_n>t_{n-1}>\cdots>t_1>t_0$,注意到最里层的被积函数 ${f^{(n+1)}(t_0)}$ 只和 $t_0 $有关,容易想到如果将最内侧的两个积分换序,就可以消掉一个积分号。换序时一定注意积分上下限的变化:
$$ \begin{align} \int_{x_0}^{t_2}\int_{x_0}^{t_1} {f^{(n+1)}(t_0)} \,{\rm d}t_0 {\rm d}t_1 &= \int_{x_0}^{t_2} {f^{(n+1)}(t_0)} \,{\rm d}t_0\int_{t_0}^{t_2} {\rm d}t_1\\ &= \int_{x_0}^{t_2} {f^{(n+1)}(t_0)(t_2-t_0)} \,{\rm d}t_0 \tag{8} \end{align} $$
以此类推,我们有:
$$ \begin{align} R_n(x_0) &= \underbrace{\int_{x_0}^{x} \cdots \int_{x_0}^{t_3}\int_{x_0}^{t_2}}_{n个} {f^{(n+1)}(t_0)(t_2-t_0)} \, \underbrace{ {\rm d}t_0 {\rm d}t_2 \cdots {\rm d}t_n }_{n个} \\&=\frac1{n!}\int_{x_0}^{x} {f^{(n+1)}(t_0)(x-t_0)^n} \,{\rm d}t_0\tag{9} \end{align} $$
我们称具有式(9)所示形式的余项为积分余项。同时,若应用积分中值定理,立刻有:
$$ \begin{align} R_n(x_0) &= \frac1{n!}\int_{x_0}^{x} {f^{(n+1)}(t)(x-t)^n} \,{\rm d}t \\ &= \frac1{n!} f^{(n+1)}(\xi) \int_{x_0}^{x} {(x-t)^n} \,{\rm d}t,\ \xi\in(x_0,x) \\ &= \frac1{n!} f^{(n+1)}(\xi) \frac1{n+1}(x-x_0)^{n+1} \\ &= \frac{f^{(n+1)}(\xi)}{(n+1) !}(x-x_0)^{n+1}\tag{10} \end{align} $$
我们称具有式(10)所示形式的余项为Lagrange余项。此外,如果将被积函数$f^{(n+1)}(t)(x-t)^n$看做$1\cdot f^{(n+1)}(t)(x-t)^n$,再应用积分中值定理,则有:
$$ R_n(x_0)=\frac{f^{(n+1)}(\xi)}{n!}(x-\xi)^n(x-x_0)\tag{11} $$
我们称具有式(11)所示形式的余项为Cauchy余项。综合(4)(9)(10)(11),我们有定理:
定理1:一元函数的Taylor公式
设$f\in\boldsymbol{D}^{(n+1)}$,则:
$$ \begin{align} &f(x)=T_n(f,x_0;x)+R_n(x_0) \\ &T_n(f,x_0;x)=\sum_{k=0}^n \frac{1}{k!} f^{(k)}(x_0)(x-x_0)^k\\ &R_n(x_0)=(积分余项)\frac1{n!}\int_{x_0}^{x} {f^{(n+1)}(t_0)(x-t_0)^n} \,{\rm d}t_0\\ &R_n(x_0)=(Lagrange余项)\frac{f^{(n+1)}(\xi)}{(n+1) !}(x-x_0)^{n+1}\\ &R_n(x_0)=(Cauchy余项)\frac{f^{(n+1)}(\xi)}{n!}(x-\xi)^n(x-x_0)\\ \end{align} $$
此外,若只有$f\in\boldsymbol{D}^{(n)}$,则$R_n(x_0)=o((x-x_0)^n)$,这时称余项为Peano余项。
多元函数的Taylor公式
在介绍多元函数的Taylor公式之前,我们先来看一个引理:
定理2:
设两个正整数$k,n$,则有:
$$ (x_1+\cdots+x_n)^k=\sum_{\alpha_1+\cdots+\alpha_n=k} \frac{k!}{\alpha_1!\cdots\alpha_n!}x_1^{\alpha_1}\cdots x_n^{\alpha_n}\tag{12} $$
其中$\alpha_1,\cdots,\alpha_n$为非负整数。上式对$n$做数学归纳法易证。特别地,当$n=2$时,上式就是我们所熟知的二项式定理。
为了定理2看起来更加简洁,我们引入下面的记号。将指标$\alpha_1,\cdots,\alpha_n$记为$\boldsymbol{\alpha}=(\alpha_1,\cdots,\alpha_n)$,同时记:
$$ \begin{align} |\boldsymbol{\alpha}|&=\alpha_1+\cdots+\alpha_n\\ \boldsymbol{\alpha}!&=\alpha_1!\cdots\alpha_n!\\ \boldsymbol{x}^{\boldsymbol{\alpha}}&=x_1^{\alpha_1}\cdots x_n^{\alpha_n} \end{align} $$
所以,式(12)可以写做:
$$ (x_1+\cdots+x_n)^k=\sum_{|\boldsymbol{\alpha}|=k}\frac{k!}{\boldsymbol{\alpha}!}\boldsymbol{x}^{\boldsymbol{\alpha}}\tag{13} $$
同时,我们引入算子:
$$ \boldsymbol{\text D}^{\boldsymbol{\alpha}}=\frac{\partial ^{\alpha_1+\cdots+\alpha_n}}{\partial x_1^{\alpha_1}\cdots\partial x_n^{\alpha_n}} $$
那么我们有定理:
定理3:
设有函数$f:\mathbb{R}^n\to\mathbb{R}$,且其$m+1$阶可微。则$\exists \theta\in(0,1)$,使得:
$$ f(\boldsymbol{x}+\boldsymbol{h})=\sum_{k=0}^m \sum_{|\boldsymbol{\alpha}|=k} \frac{\boldsymbol{\text D}^{\boldsymbol{\alpha}}f(\boldsymbol{x})}{\boldsymbol{\alpha}!} \boldsymbol{h}^{\boldsymbol{\alpha}}+\boldsymbol{R}_m(\boldsymbol{x})\tag{14} $$
其中,$\boldsymbol{R}_m(\boldsymbol{x})$称为Lagrange余项,具体为:
$$ \boldsymbol{R}_m(\boldsymbol{x})=\sum_{|\boldsymbol{\alpha}|=m+1}\frac{\boldsymbol{\text D}^{\boldsymbol{\alpha}}f(\boldsymbol{\alpha}+\theta\boldsymbol{h})}{\boldsymbol{\alpha}!}\boldsymbol{h}^{\boldsymbol{\alpha}}\tag{15} $$
事实上定理3的证明并不复杂,我们考虑$[0,1]$上的一元函数:$\phi(t)=f(\boldsymbol{x}+t\boldsymbol{h})$,显然$\phi$关于$t$也是$m+1$阶可微的,由定理1易知:
$$ \phi(1)=\phi(0)+\phi'(0)+\frac{1}{2!}\phi''(0)+\cdots+\frac{1}{m!}\phi^{(m)}(0)+\frac{1}{(m+1)!}\phi^{(m+1)}(\theta)\tag{16} $$
其中$\theta\in(0,1)$。同时,我们有:
$$ \begin{align} \phi'(t)&=\sum_{k=1}^n h_k\frac{\partial f(\boldsymbol{x}+t\boldsymbol{h})}{\partial x_k}\\ &=\left(\sum_{k=1}^n h_k\frac{\partial }{\partial x_k}\right)^1 f(\boldsymbol{x}+t\boldsymbol{h})\\ &\cdots\\ \phi^{(m)}(t)&=\left(\sum_{k=1}^n h_k\frac{\partial }{\partial x_k}\right)^m f(\boldsymbol{x}+t\boldsymbol{h})\\ 代入(13)&=\sum_{|\boldsymbol{\alpha}|=m}\frac{m!}{\boldsymbol{\alpha}!}\boldsymbol{\text D}^{\boldsymbol{\alpha}}f(\boldsymbol{x}+t\boldsymbol{h})\cdot\boldsymbol{h}^{\boldsymbol{\alpha}} \end{align} $$
同时,$\phi(1)=f(\boldsymbol{x}+\boldsymbol{h}),\phi(0)=f(\boldsymbol{x}),\phi^{(k)}(0)=\sum\limits_{|\boldsymbol{\alpha}|=k}\frac{k!}{\boldsymbol{\alpha}!}\boldsymbol{\text D}^{\boldsymbol{\alpha}}f(\boldsymbol{x})\cdot\boldsymbol{h}^{\boldsymbol{\alpha}}$,代入(16)则定理3得证。
类似于一元函数的情况,若$f$只是$m$阶可微的,则(14)退化为:
$$ f(\boldsymbol{x}+\boldsymbol{h})=\sum_{k=0}^m \sum_{|\boldsymbol{\alpha}|=k} \frac{\boldsymbol{\text D}^{\boldsymbol{\alpha}}f(\boldsymbol{x})}{\boldsymbol{\alpha}!} \boldsymbol{h}^{\boldsymbol{\alpha}}+o(||\boldsymbol{h}||_2^m)\tag{17} $$
当然在实际情况中我们不可能用到特别高阶的Taylor展开式,多元函数我们用的最多的即是带Lagrange余项的1阶展开:
$$ f(\boldsymbol{x}) = f(\boldsymbol{x}_0) + \left\langle \nabla f(\boldsymbol{x}_0),\boldsymbol{x}-\boldsymbol{x}_0 \right\rangle + \frac12\left\langle \nabla^2 f(\boldsymbol{\xi}) (\boldsymbol{x}-\boldsymbol{x}_0),\boldsymbol{x}-\boldsymbol{x}_0 \right\rangle $$
其中$\boldsymbol{\xi}=\boldsymbol{x}+\theta\boldsymbol{x}_0,\theta\in(0,1)$,此外还有带Peano余项的2阶展开:
$$ f(\boldsymbol{x}) = f(\boldsymbol{x}_0) + \left\langle \nabla f(\boldsymbol{x}_0),\ \boldsymbol{x}-\boldsymbol{x}_0 \right\rangle + \frac12\left\langle \nabla^2 f(\boldsymbol{x}_0) (\boldsymbol{x}-\boldsymbol{x}_0),\ \boldsymbol{x}-\boldsymbol{x}_0 \right\rangle + \mathcal{o}(\|\boldsymbol{x}-\boldsymbol{x}_0\|_2^2) $$
还有带积分余项的1阶展开:
$$ \begin{align} f(\boldsymbol{x}) =& f(\boldsymbol{x}_0) + \left\langle \nabla f(\boldsymbol{x}_0),\ \boldsymbol{x}-\boldsymbol{x}_0 \right\rangle \\&+ \left\langle \int_{0}^{1} \nabla^2 f(\boldsymbol{x}_0+\theta(\boldsymbol{x}-\boldsymbol{x}_0))(1-\theta) {\rm d}\theta\ (\boldsymbol{x}-\boldsymbol{x}_0),\ \boldsymbol{x}-\boldsymbol{x}_0 \right\rangle \end{align} $$
References
- 简单粗暴地推导Taylor公式的各种形式 - 知乎
- 《数学分析教程 第三版 上册》,常庚哲、史济怀,中科大出版社