來自人人上王怡的日志 鄙人稍作修改
2013.8.23 張益唐先生報告之證明概要
23號下午張益唐先生受邀到校做了名為《Bounded gaps between primes and relevant problems》的報告,對他證明“存在無窮多對間隔小於7000萬的素數”的思路做了大概講述。我有幸前去聽了這場報告。這篇日志里寫的東西,有些我是懂的,有些不明所以,但我都盡量寫清楚了,也做了一點補充。
關於張益唐先生及間隔有限的素數對的介紹,請見季理真教授的《素數不再孤單——孿生素數和一個執着的數學家張益唐的傳奇》。
關於肖boss的發言以及一些美的體會請見陳張弛gg日志《【整理】素數不孤單——張益唐素數結論之肖傑表述》。
(張益唐先生說,由於在場有不少本科生,還有大一的同學,所以他不能講得過於專業化。數論很有意思,其中很多問題,就連小學生都知道是什么,但它們的證明非常困難。另外,他建議我們有問題要經常思考,即便有些問題不一定能想出來,但要保持這個狀態。)
下面開始。
1.人們(例如Goldstone, Pintz, Yildirim)在研究孿生素數猜想時已用了這樣的概念:設一個有限非負整數集
\[\mathcal{H}=\{h_1,h_2,h_3\cdots,h_k\}\]
稱$\mathcal{H}$是"可允許的”(admissible),如果對任意素數$p$,存在正整數$n$,使得$p$與$P(n):=(n+h_1)(n+h_2)\cdots(n+h_k)$互素。
(這樣的$n+h_1,n+h_2\cdots n+h_k$會有比較好的性質)
例如,$\{2,3\}$不是可允許的,因為對$p=2$不滿足;$\{0,2,4\}$不是可允許的,因為對$p=3$不滿足;但$\{0,2\},\{0,2,6\}$都是可允許的。
2.1920年左右Hardy和Littlewood提出了這樣的猜想:對於一串可允許的$\mathcal{H}$,存在無窮多個n使得$n+h_1,n+h_2\cdots n+h_k$都是素數,而孿生素數猜想正是這個猜想的特殊情況。
3.張益唐證明了如下定理:
設$\mathcal{H}=\{h_1,h_2,h_3\cdots,h_n\}$是可允許的,且若其個數$k\ge 3.5\times 10^6$,那么存在無窮個$n$使得$n+h_1,n+h_2\cdots n+h_k$中至少有兩個素數。
注:由這個定理就可以推出\[\liminf_{n\to\infty}(p_{n+1}-p_n)<7\times 10^7\]
也即存在無窮多對素數,其差小於7000萬(有限!)。 推導過程我放在后面的“補充”里。
4.怎么切入3中定理呢?
張益唐采用解析數論的辦法。解析數論通常會處理有限和,其側重點是怎么算這個和。有時候會用一些定義在自然數集上的“算術函數”(arithmetic function)。例如設
\[\begin{eqnarray*}
f(n) =
\begin{cases}
1 & \mbox{if }n\mbox{ is a prime} \\
0 & \mbox{ otherwise}
\end{cases}
\end{eqnarray*}\]
對於這樣的函數,一種最自然的想法就是求和。例如如上的函數求和就有
\[\pi(x)=\sum_{n\le x}f(n)\]
其中$\pi(x)$是小於等於$x$的素數個數。
5.為什么要研究這樣$f(n)$的和呢?因為我們想讓一個“可允許”的幾何中的素數個數大於1,也就是$\sum_{i=1}^{k} f(n+h_i)>1$對於無窮個$n$成立,這樣就能間接地說明$\mathcal{H}$這個集合中有兩個素數了,因為$f(n+h_k)$只能為整數。但是這樣簡潔明了的方法行不通,我們只好退而求其次。引入一個“權”函數$\varphi(x)$。
我們令$$S_1=\sum_{n\le x}\varphi(n),S_2=\sum_{n\le x}\left(\sum_{i=1}^k f(n+h_i)\right)\varphi(n)$$。並來研究 $\frac{S_2}{S_1}$的大小。比如我們就令$\varphi(n)\equiv 1$,那么如果我們證明出來 $S_2>S_1$成立,利用鴿籠原理,立刻就能得到存在一個$n$使得$\left(\sum_{i=1}^k f(n+h_i)\right)>1$,也就是存在一個$n$,讓$n+\mathcal{H}$這個集合中有兩個素數。
不過直接研究對於$\sum_{n\le x}$似乎不是一個好方法,因為說不定存在的那個$n$一直是個很小的數,所以有時候會利用$\sum_{x\le n\le 2x}\varphi(n)$進行求和。比如我們還是令
$$S_1=\sum_{x\le n\le 2x}\varphi(n),S_2=\sum_{x\le n\le 2x}\left(\sum_{i=1}^k f(n+h_i)\right)\varphi(n)$$
這時候我們令\[\begin{eqnarray*}
f(n) =
\begin{cases}
\log{n} & \mbox{if }n\mbox{ is a prime} \\
0 & \mbox{ otherwise}
\end{cases}
\end{eqnarray*}\]
那么如果$S_2>\log{(3x)} S_1$,就會有 $S_1=\sum_{i=1}^k f(n+h_i)>\log{3x}$對於某個$n$成立,這樣同樣可以看出,存在$i,j$使得$f(n+h_i)$與$f(n+h_j)$都是大於0。我們如下的結果都是要證明后面這樣一個$S_2>\log{(3x)} S_1$。
但是這些嘗試的結果都不盡如人意。有人令$\varphi(n)=n,n^2,n^3$,但是都沒有什么出眾的結果。這個問題有很長的歷史,在其中做出開拓性貢獻的是Selberg。
6.既然這樣一個$\varphi(n)$的權我們設為正的(如果是負的話,這些不等式估計就毫無意義了),那么我們就可以引入一個函數$\lambda(n)$,使得$\varphi(n)=\lambda(n)^2$,現在問題就轉變為尋找一個$\lambda(n)$,讓它能導出證明。
而從數論中篩法的角度,Goldston,Pintz,Yildirim三人引入一個這樣的$\lambda(n)$,即
\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|P(n),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell}\quad P(n):=(n+h_1)(n+h_2)\cdots(n+h_k)\]
其中$D=x^{\varepsilon},0<\varepsilon<\frac{1}{2}$,而$\mu(n)$為Möbius函數 ,新的常數$\ell$與$k$有關(論文中張選取了$\ell=180$)。
從Hardy、Littlewood到 Goldston、Pintz、Yildirim,80年來才找到這個比較有用的形式。
7.計算兩個和,即$$S_1=\sum_{x\le n\le 2x}\lambda(n)^2,S_2=\sum_{x\le n\le 2x}\left(\sum_{i=1}^k f(n+h_i)\right)\lambda(n)^2$$.
大致的計算結果是$S_1\approx T_1 (\log{x})^{k+2\ell},S_2\approx T_2 (\log{x})^{k+2\ell}+O(\mathcal{E})$,其中$O(\mathcal{E})$是誤差項。
Goldston等人得出了這樣的結果:即在(上述常數$D$中用到的)$\varepsilon<\frac{1}{4}$時,$S_2-(\log{3x})S_1$為負數,顯然不能滿足要求,但如果$\varepsilon=\frac{1}{4}+\varpi$,雖然$T_2>\log{(3x)} T_1$,但是這兩者相減的誤差項卻很難估計。所以他們三人就止步於此了。
(PS:即使“廣義黎曼假設”是對的,在這里也沒有幫助)
8.張益唐的想法是對$\lambda(n)$進行一些調整,在式子
\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|P(n),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell}\]
中,有些$d$對$\lambda(n)$的貢獻其實很小,所以很小的應該和很大的區分開來。考慮使$\mu(d)!=0$的數$d$,比如如果它有$>x^{1/10}$的因子,那么實際上它對整個序列的和的貢獻(即對$\lambda(n)$的貢獻)是很小的。我們可以把所有含有因子大於$x$的某個冪次的數“篩”掉,余下來的就是貢獻比較大的數了(也許你會問,沒篩掉不是會更大嗎?實際上,沒篩掉的話會對整個和每一項的估計都變少,從而影響整個數列的和)。
張益唐選取的是$\varpi=\frac{1}{1168}$,也就是$D=x^{\frac{1}{4}+\varpi}$,而且擁有大於$x^{\varpi}$的素因子的數將會被“篩”掉。
(張益唐這時提到了楊振寧先生說過的關於治學的話:“寧拙毋巧,寧朴勿華。”開始研究的時候寧願“笨拙”一點,Goldston等人在計算中采用了比較漂亮的辦法,而張益唐用了一些比較原始的辦法,算出了同樣的結果,同時有了更細致的觀察)
所以如上的$\lambda$也就變成了
\[\lambda(n)=\frac{1}{(k+\ell)!}\sum_{d|(P(n),\mathcal{P}),d<D}\mu(d)\left(\log\left(\frac{D}{d}\right)\right)^{k+\ell},\quad \mathcal{P}=\prod_{p<x^{\varpi}}p\]
9.而最關鍵的東西來了!現在對應的誤差項是可以估計出來的!假如$d$滿足$x^{\frac{1}{2}-\epsilon}<d<D^2,d|(P(n),\mathcal{P})$(其中$\epsilon$是一個很小的正常數),我們可以看出來它的素因子相當小,但是$d$又很大,所以它素因子個數很多。
我們再給定一個正常數$R<d$,對於$d = p_1\cdots p_b$,則存在$a$使得$r= p_1\cdots p_a \lt R$,且$p_1\cdots p_{a+1} \gt R$。這就給了$d$一個分解,即分解為$d=rq$,其中$r=p_1\cdots p_a$有$R/x^{\varpi}<r<R$
所以誤差項原來是$\mathcal{E}=\sum_{d|(P(n),\mathcal{P})}|\mathcal{E}_d|$,而現在有不等式估計
$$\mathcal{E}=\sum_{d|(P(n),\mathcal{P})}|\mathcal{E}_d|\le \sum_{R/x^{\varpi}<r<R}\sum_{q}|\mathcal{E}_{rq}|$$
10.接下來用到解析數論中另外一些典型的辦法,例如一些組合技巧,素數的數論函數和分解。又牽涉到一些新的參數,最后用到代數幾何中的一些深刻結果。總共把誤差項分為三類估計,前兩類用到了Weil’s bound for Kloosterman sums,第三類用到了更深刻的由Deligne證明的Weil猜想。
(兜了不少圈子,最終證出來后,張益唐發現一些辛苦證明的結果可以從已知的Heath-Brown恆等式推出來。可是一開始寧朴勿華吧,不要想着做得多現成多漂亮,寧願回到最原始的出發點上去,硬算一遍,以便看出很多東西。誤差的第三類估計,原先也是差一點點而過不去的,但適當用了d=rq的分解后,就解決了。這是他最滿意的一點。如果讀他的paper,建議看第5頁,上面把他的idea解釋了。他個人認為解析數論仍然很有前途。)
11.陶哲軒在他的博客上發布了一個PolyMath的項目 用張益唐的新方法對Bombieri-Friedlander-Iwaniec在1986年提出的猜想(似乎是對$\{n+H_1,n+H_2,\cdots n+H_m\}$為連續的素數,$H_m-H_1$的大小最小為多少進行的猜測)進行了檢驗,其中有的結果假設了Elliott-Halberstam猜想和Deligne定理.不過結果是喜人的。現在(2014年1月23日成果如下)
$m$ | BFI猜想預測 | 假設EH猜測 | 未假設EH | 未假設Deligne定理 |
$1$ | $2$ | $12$ | $270$ | $270$ |
$2$ | $6$ | $270$ | $395,122 $ | $474,266$ |
$3$ | $8$ | $52,116$ | $24,462,654 $ | $32,313,878$ |
$4$ | $12$ | $474,266$ | $1,497,901,734 $ | $2,186,561,568$ |
$5$ | $16$ | $4,137,854$ | $82,575,303,608 $ | $131,161,149,090$ |
$m$ | $\small(1+o(1))m\log{m}$ | $O(m e^{2m})$ | $O(m e^{(4-\frac{52}{283})m})$ | $O(m e^{(4-\frac{43}{283})m})$ |
補充
(1)利用3中定理
設$\mathcal{H}=\{h_1,h_2,h_3\cdots,h_n\}$是可允許的,且若其個數$k\ge 3.5\times 10^6$,那么存在無窮個$n$使得$n+h_1,n+h_2\cdots n+h_k$中至少有兩個素數。
可以證得\[\liminf_{n\to\infty}(p_{n+1}-p_n)<7\times 10^7\]
推導入下:
如果$\mathcal{H}=\{q_1,q_2\cdots q_k\}$是$k$個素數構成的集合,而且每個素數都比$k$來的大,那么$\mathcal{H}$就是可允許的,這是因為不在$\mathcal{H}$的素數,顯然沒法構成完全剩余系,而在$\mathcal{H}$中的素數,$\mathcal{H}$元素個數又比它來的少。
素數有無窮多個,因此可以讓$k\ge 3.5\times 10^6$,由3中定理可知,存在無窮多個$n$使得$n+q_1,n+q_2\cdots n+q_k$中至少有兩個素數。從而就有$|n+q_i-n+q_j|=|q_i-q_j|<\infty$即證明了其有有界的間隔。
而回憶$\pi(x)$的定義:
$\pi(x)$是小於等於$x$的素數個數。
計算機計算有
\[\pi(7\times 10^7)-\pi(3.5\times 10^6)=4,118,064-250,150=3,867,941>3.5\times 10^6\]
從而可以在$[3.5\times 10^6,7\times 10^7]$之間選擇$k\ge 3.5\times 10^6$個素數出來,其間隔自然小於7000萬了