你敢相信 $\sum\limits^{\infty}_{i=0}2^i = -1$ 吗?数论中一个长相奇怪的定理到底有什么直观意义?牛顿迭代法作为常用的数值方法,和p进数又会有什么联系?
上面的几个问题似乎毫不相关,我当时分别听说这几个知识的时候也没有发现它们之间的联系。可是这几天偶然了解到有关p进数(p-adic)的一套理论,我顿时感觉如同醍醐灌顶:换一种角度看问题,它们之间的联系居然如此简单明了!下面我就来介绍一下我认识的这几个知识的联系吧。
这一块内容有很多涉及代数数论甚至泛函分析的相关内容,我都没有太深入的了解,可能会出不少问题,也希望大家能给我进行一些补充吧。
TL;DR
(Too long; Don’t read)
(这是简述,看完简述剩下的就可以不看了)
简而言之,这篇文章数论中一个形式古怪的提高模数次数的定理(Hensel定理,2.1中有定义描述与证明)说起,目的是阐明它的直观意义,即说明与牛顿迭代法的相似性:
一方面,从定理形式的表面出发,这个定理的变形之后和牛顿迭代法是极为相似的
另一方面,从更深层次的意义来说,它解决的问题是在p进度量下用有理数逼近多项式的零点的过程。
第一点在2.2会有解释,而第二点则更为关键。本质上说,牛顿迭代法那样在绝对值度量下用有理数估计多项式零点,用的是是从数位高的地方向数位低的地方逼近的方法,即类似$1,1.4,1.41,1.414,\cdots$ 的过程。可是Hensel定理是从恰恰相反的方向逼近的,即从数位低的地方向数位高的地方递进的,如在7-adic下逼近 $\sqrt{2}$,则逼近的数列是这样的: ${3, (13)_7, (213)_7,\cdots}$ 。
这么做靠谱吗?怎么感觉都没有任何收敛的感觉呢,简直玄学!可是你为什么说这个数列不收敛?你会说,因为相邻两项之间的距离,即差的绝对值,越来越大了呗。但是你说的这个距离为什么就是差的绝对值?如果我巧妙定义另一套距离,说不定我就可以说这个数列是逐步收敛的了。这就引出了一套有趣的数学理论,即p进度量和p进数 。
首先,我们定义了有理数集上一种独特的范数和距离
然后,我们引入完备的概念。在绝对值度量下,比如数列$1,1.4,1.41,1.414,\cdots$ ,这个数列存在极限(因为单调有界),并且数列每一项都是有理数,但是这个极限就不在有理数集里。因此我们称有理数集是不完备的,称这样的数列就是在对无理数进行逼近。
从这个观点来看, Hensel引理相当于在p进度量下,给出了用有理数逼近多项式零点的数列的构造。
牛顿迭代法给出了在绝对值度量下用有理数逼近多项式零点的数列的构造。
因此从目的的角度看来,牛顿迭代和Hensel引理是在不同度量下,解决同一个问题,因此形式相似。这可真的是殊途同归啊!这不得不赞叹数学的魅力了。
P.S. 强烈推荐3blue1brown的这个视频,讲的是p进数:3blue1brown的视频 非常直观易懂,让大家瞬间能对p进数有个概念。可以先看视频,再看本文。
Hensel引理
一切的一切,都要从潘承洞、潘承彪《初等数论》第186页的一个定理说起。(第四章第四节)
如果你求出了一个整系数多项式同余方程 $f(x)\equiv 0 \pmod p$ 的一些解 $x\equiv c_1,c_2,\cdots\pmod p$ ,但是我要求你再求出 $\mod {p^2}$ 的解,你该怎么做呢?直接重新求一遍?太麻烦了吧!有什么简单方法吗?这个定理给出了答案。只是。。。这个定理的形式有点诡异,无法直观理解:
定理的描述与证明
定理描述
定理 设 $p$ 是素数,整系数多项式 $f(x)=a_n x^n+a_{n-1}x^{n-1} +\cdots + a_1x+a_0, \ \ n \geq 2$ ;再设整数$\alpha \geq 2$, $c$ 是同余方程 $f(x) \equiv 0 \pmod {p^{\alpha-1}}$ 的解,那么,同余方程 $f(x) \equiv 0 \pmod{p^\alpha}$ 满足 $x\equiv c\pmod{p^{\alpha-1}}$ 的解是形式一定是$x\equiv c+y_j p^{\alpha - 1}, j=1,2,\cdots, l$ ,这里$y\equiv y_1,\cdots,y_l \pmod p$ 是关于 $y$ 的一次同余方程:
$$
f’(c) \cdot y\equiv -f(c) \cdot p^{1-\alpha} \pmod p \tag{1}
$$
的全部解,其中 $f’(x)$ 即表示 $f(x)$ 的导函数。
(这个定理据说是代数数论重要定理Hensel引理的初等描述。)
一些解释与思考
这个定理好诡异啊!到底是什么意思呢?我们一步一步来。首先 $x\equiv c\pmod{p^{\alpha-1}}$ 这个解在模数升幂之后的形式一定是 $x\equiv c+y p^{\alpha - 1} \pmod{p^\alpha}$ ,这一点可以理解,因为如果把 $x$ 写成 $p$ 进制数,那么 $x$ 的后$\alpha - 1$ 位(从个位开始数)已经确定为 $c$ ,只有第 $\alpha$ 位这一个位置可以任取,不妨设这一位的数是 $y $,( $0\leq y< p$ ),则解的形式就是 $x\equiv c+y\cdot p^{\alpha -1}$ 。
可能有同学会问:为什么拓展之后的解形式中 $y$ 还要分这么多种?这是因为同余方程 (1) 是一次同余方程,根据 $f’(c)$ 和 $-f(c)\cdot p^{1-\alpha}$ 是否模 $p$ 余 $0$ 进行讨论的话,可能有一个解,可能无解,也可能任何 $0\leq y<n$ 的数都是解,即:拓展之后可能有 $0,1$ 或 $p$ 个解,这么写是一种不失一般性的写法。
然后。。。就到了最鬼畜的(1)式了。这里怎么莫名出现了导数?为什么它的形式如此诡异?二潘在书里也给出了一个初等的证明,但同样无法让人感受这个定理的直观意义。
定理证明
证明 将拓展之后的解的形式 $x\equiv c+y_j p^{\alpha - 1}$ 代入方程 $f(x) \equiv 0 \pmod{p^{\alpha}}$ :
$$
\begin{align}
f(x) & \equiv & a_n(c+p^{\alpha-1}y)^n + a_{n-1} (c+p^{\alpha-1}y)^{n-1} +\cdots+a_0\
& \equiv & f(c)+p^{\alpha-1}f’(c)y+A_2p^{2(\alpha-1)}
y^2+\cdots+A_n p^{n(\alpha-1)}y^n\
& \equiv & 0 \pmod {p^\alpha}
\end{align}
$$
其中 $A_2, A_3,\cdots,A_n$ 是整数,由于 $\alpha \geq 2$ ,从上式可知 $f(x) \equiv 0 \pmod{p^{\alpha}}$ 等价于:
$$
p^{\alpha-1} f’(c) y \equiv -f(c) \pmod{p^\alpha}
$$
由于 $f(c)$ 是 $p^{\alpha-1}$ 的倍数(因为 $f(c)\equiv 0 \pmod {p^{\alpha-1}}$),所以两边同时除以 $p^{\alpha - 1}$ 即可得到我们要证明的式子。
评论 说实话。。。这个证明也挺平凡的,并没有给我对于定理的直观感受。那么下面我们就从直观感觉出发,探究这个定理究竟是在解决什么问题。
与牛顿迭代法形式上的相似之处
其实,式 (1) 和牛顿迭代法本质是完全相同的。
先做一个约定,这里的牛顿迭代法为了和Hensel引理相对应,采用非常狭义的定义。要求初始值为有理数,而求零点的函数也是多项式函数,这样迭代的每一步也都是有理数了。
我们知道,在求连续函数 $f(x)$ 的零点时,牛顿迭代法的递推公式是:
$$
c’ = c - \frac{f(c)}{f’(c)} \tag{2}
$$
而我们的式 (1) 也可以写作(假设只有一个拓展后的解):
$$
c’ \equiv c-\big(\frac{f(c)/p^{k-1}}{f’(c)} \bmod p\big) \cdot p^{k-1} \pmod{p^k}
$$
如果不严格地把取模号全部丢弃,我们会发现这个式子和 (2) 是完全一样的。事实上,在同余运算下因为有取模操作,式 (1) 已经做到和牛顿迭代保持最大程度的相似了。
那么我们来考虑这两者在目的上有什么相似之处:牛顿迭代实际上在不断逼近一个使得函数值为0的点,这里的“逼近”指的是迭代值和真实值的距离(即差的绝对值)逐渐缩小,是一个收敛的过程;而Hensel引理的让幂次升高的迭代是否也是在”逼近“某个数呢?不过这里的逼近好像会导致迭代值之间差的绝对值越来越大,这个过程是还能是收敛的吗?
事实上,这就引出了有理数的另一种度量:$p$ 进度量(或 $p$ 进赋值)。
$p$ 进数
$p$ 进制数
首先明确一点的是 $p$ 进数中的 $p$ ,指的是素数,因为素数情况下的性质比较优雅。
什么是 $p$ 进数(p-adic)?我们先从 $p$ 进制数一步一步说起。
我们都熟悉十进制数,我们可以类似十进制表示法那样,写出 $p$ 进制数的形式:
$$
\begin{align}
x&=&\cdots\alpha_i \alpha_{i-1}\cdots\alpha_1\alpha_0.\alpha_{-1}\cdots\alpha_{-k+1}\alpha_{-k}\
& = & \cdots + \alpha_i p^i+\cdots + \alpha_1p +\alpha_0 + \frac{\alpha_{-1}}{p} + \cdots\frac {\alpha_{-k}}{p_k}
\end{align}
$$
一些常见的结论就是,一个分母是 $p$ 的整数幂的分数在 $p$ 进制下为有限小数;其他有理数一定会是循环小数,无理数则是无限不循环小数。
在我们通常的认识中,如果 $x$ 是正数,那么 $x$ 小数点左边的数位越多,这个数就会越大(称为范数越大)。但是这一点是为什么呢?像刚才的问题,那我能不能定义右数字越多,这个数越大呢?
为了探寻上面数论定理的意义,我们采用这种反着来定义范数的方法,可是我们还需要做一些准备工作,即我的这种定义需要满足距离的性质。
范数与度量
范数是绝对值概念的推广。由上面的例子看出,范数也是需要公理化的。那么范数需要有哪些性质呢?
若 $X$ 是数域上的线性空间,泛函 $\left| \cdot \right|:X \rightarrow R$ 满足:
(1) 正定性:$\left|x\right|\geq0$,且 $\left|x\right|=0\Leftrightarrow x=0$;
(2) 正齐次性: $\left|cx\right|=|c|\left|x\right|$;
(3) 次可加性(三角不等式):$\left|x+y\right|\leq \left|x\right|+\left|y\right|$ ;
那么,$\left|\cdot\right|$ 称为 $X$ 上的一个范数。
我们定义 $v_p(x)=\max {\alpha \in N: p^\alpha \mid x } $,则 $|x|_p = p^{-v_p(x)}$ 就可以作为正整数域 $N^*$ 的一个范数(注意指数上的符号!这就是上面小数点后数字越多,数越大的体现)。这个概念还可以推广到有理数域 $\mathbb{Q}$。定义 $|\frac ab|_p = \frac{|a|_p}{|b|_p}$ 即可。
有了范数的概念,定义距离就是很显然的了。$d(x,y)=\left|x-y\right|$ 。
例如,$p=3$ 时
$$
d(5, \frac 59) = p^{-v_p(\frac {40}{9})}=p^{-2}=\frac 19
$$
$$
d(6,735) = p^{-v(729)} = p^{-6} = \frac{1}{729}
$$
因此,最开头说的这个式子在2-adic的左边就不再是那么不可理解了:
$$
\sum_{i=0}^\infty 2^i = -1
$$
在绝对值度量下,我们认为“越来越小”的数组成的级数可能收敛,可是在这里不也一样吗?在2-adic下,$2^i$ 随着 $i$ 的增大,不就是在减小吗?还有一个问题,右边为什么是 $-1$?这就要思考在 2-adic 下怎么表示负数了。 这确实又引出了问题。
和绝对值度量一样,我们从大到小考虑这个p进数的每一位进行近似。这里要注意,$p$ 是比 $p^2$ 大的,因此从大到小就是对应这一个升幂的过程。
以 $x=-1$ 的表示为例,首先考虑第0位。这一位应当满足:
$$
x\equiv -1 \pmod 2
$$
显然这一位是1。然后考虑第一位后这个数一定是 $1+t\cdot2$形式的,那么:
$$
1+t\cdot 2\equiv -1 \pmod {2^2}
$$
由此, $t\equiv 1 \pmod 2$ 。那么考虑第二位。这个数现在变成了 $1+2+t\cdot2^2$形式,然后我们要解:
$$
1+2+t\cdot 2^2\equiv -1 \pmod{2^3}
$$
逐渐进行下去,我们发现这里的每一位都是 $1$ ,因此 $-1$ 在2-adic下的表示就是 $\sum\limits_{i=0}^\infty 2^i$
这个例子是不是很有启发性?这个过程是不是和上面的定理很相似?
像这样,我们可以利用p进度量求得 p-adic 下所有的有理数 $\frac ab$ 的表示。我们只需要将方程 $bx\equiv a\pmod{p^k}$ 不断用类似的过程升幂,而升幂的过程就是一个渐进的过程。
有理数域的完备化
还有更疯狂的呢!如果我对 $x^2\equiv 2\pmod {7^k}$ 不断升幂,那我又能得到什么呢?我甚至能得到 $\sqrt{2}$ 在7-adic下的表示!这可是一件了不起的事情!我们的p进度量可没办法处理无理数啊!在无理数中怎么谈 $v_p(x)$ 这个函数呢?可是无理数就这样能够在p进数中出现了。
实际上这种过程就是一个将有理数域完备化的过程。
设 $x_n$ 是距离空间 $X$ 中的点列,如果对于任意的 $\epsilon>0$,存在自然数 $N$,当 $m,n>N$ 时,$|x_n−x_m|<\epsilon$,称 ${x_n}$ 是一个 Cauchy 列。
完备空间或者完备度量空间是具有下述性质的空间:空间中的任何柯西序列都收敛在该空间之内。
有理数集就不是完备的,因为在绝对值度量下, $\sqrt{2}$ 的有限位小数表示 ${1,1.4,1.41,1.414,1.4142,\cdots}$ 是一个柯西序列,但是其极限 $\sqrt{2}$ 不在有理数集内;而我们的例子相当于说在7-adic度量下的序列 ${3, (13)_7, (213)_7}$ 也是一个柯西序列,但是极限 $\sqrt{2}$ 不在有理数集中。
将不完备集合中添加元素使之完备的过程称为完备化。所有将有理数集按照绝对值完备化,即可得到实数集;而按照p进赋值完备化就得到了p进数。
殊途同归!
现在我们可以讨论最开始的定理的意义了。总结一下:
- 首先,我们定义了一种与绝对值恰恰相反的范数:p进赋值
- 由此,我们也定义了有理数集的两种不同的距离
- 然后,我们发现,对于这两种距离,有理数集都不是完备的,都能存在柯西序列,使得序列的极限不在有理数集中。
- 按照绝对值距离,有理数集拓展为了实数集;按照p进赋值,有理数集完备化为p进数集。
我们上面说有理数集直接就“完备化”了,可是还没说到底怎么趋近一个这样的无理数呢。考虑特殊的情况:对于整系数多项式零点的寻找。正好,相对应的,两种度量方式给出了两种逼近方式:
- 绝对值度量给出了牛顿迭代法,逐渐使得答案精确的小数点位数增多。
- p进度量给出了Hensel引理,逐渐给答案升幂。
因此,解决的问题都相同,解决的方式也相同。在截然不同的两种度量下,它们最终的公式居然能够完全一致,这不得不赞叹数学的魅力了。
注
- 事实上,在有理数域上定义范数只有上面两种本质不同的不平凡定义方式。这个结论成为奥斯特洛夫斯基定理(Ostrowski’s theorem)
- 实际上由于p 进数是完备的,甚至可以继续在p进数上定义微积分!
还未搞清楚的问题
- 牛顿迭代法的几何意义是切线,可是Hensel引理有没有几何意义呢?
- 网上有人说LTE引理(升幂引理)和 p 进数有关系,有什么关系呢?
- Hensel定理的代数数论表述如何理解?
- 都说p进数集是被实数集所包含的,这是为什么?哪些实数不能被p进估计?
相关推荐
推荐的视频资料:
3blue1brown的视频 (这个在开头已经推荐过了)很清晰易懂,非常有启发性。
Hensel引理与p-adic(youtube) 这个视频专业性更强一些,和本文的内容更是息息相关。这个视频的uploader,Harpreet Bedi 是个专业数学知识的科普作者,他上传的视频往往是有关深刻的数学知识的。