渡久地 択
tnotes.com / notes
数論ノート  /  Collatz

4/3 という数字
シラキュース変数の特性関数を、
ただ見る

Collatz 予想の核心にある確率変数。その特性関数のピークが、どこに立つのか。n を 21 まで計算機で押し上げて、ただ眺めた記録。証明はない。観察があるだけ。

これは論文ではなく、ノートだ。

仕事の合間に、趣味で数論をいじっている。素数や Collatz のような、単純な顔をして誰にも解けない問題が好きで、休みの日に少しずつ計算機を回す。今回もそういう、いわば日曜大工だった。Tao 先生の証明の心臓部にある確率変数の特性関数を、ただ自分の目で見たくなって、n を 1 から上げていったら——気づけば n=21、70 億点の計算まで来てしまっていた。

見えたものが、思ったより綺麗だった。ピークの位置が、傾き 4/3 でまっすぐ歩いていく。せっかくなので観察を整理して、コードと数値データごと Zenodo に DOI 付きで置いた(下のリンク)。誰かが続きを計算したくなったとき、そのまま再現できるように。

証明は何もしていない。Collatz 予想にも寄与しない。ただ、覗いた中身が面白かったから、書き留めておく。

§ 01

まず、3N+1 の話から

正の整数を一つ選ぶ。偶数なら 2 で割る。奇数なら 3 倍して 1 足す。これを繰り返すと、どんな数から始めても、いつか 1 にたどり着く——のか?

これが Collatz 予想だ。1937 年から、誰も証明できていない。問いの形はこれ以上ないほど単純なのに、誰の手にも負えない。

2019 年、Terence Tao がこの問題に大きな風穴を開けた。「ほとんどすべての」軌道が、ほとんど有界な値に到達することを示したのだ。その証明の技術的な心臓部にあるのが、シラキュース確率変数(Syracuse random variable)と呼ばれる対象だった。

Syracuse random variable とは Collatz 写像の「奇数ステップだけ」を取り出して確率的に均(なら)した対象。各ステップで 2 が何回割れるかを幾何分布 Geom(2) で与え、その合成を ℤ/3n という有限の世界で見る。Tao の証明は、この変数が「よく散らばっている」(equidistribution)ことに依存していた。

よく散らばっている、とは何か。フーリエの言葉で言えば、特性関数(フーリエ変換)のピークが低いということだ。ピークが高ければ、その周波数に確率質量が偏っている。低ければ、平らに散っている。Tao は、このピークが n とともに「どんな多項式よりも速く」沈んでいくことを証明した。

Tao の上界は、ピークがどれだけ速く沈むかを言う。
だが、ピークがどこに立つかは言わない。
この「どこに」を、計算機で覗いてみた。それがこのノートの全部だ。
§ 02

2 は、3 の世界の母音である

特性関数のピークの「位置」を語るには、座標がいる。ここで効いてくるのが、初等整数論の古典的な事実だ。

2 は、すべての n について 3n を法とする原始根である。 つまり、3 で割り切れないすべての周波数 ξ は、2 の累乗 ξ = 2k mod 3n としてただ一通りに書ける。2 の冪を回していけば、3 と互いに素な周波数を全部、漏れなく一度ずつ踏む。

だから、周波数を ξ で見るのをやめて、指数 k で見る。これがこのノートの視点の全てだ。特性関数を k の関数として並べ直し、それを ψn(k) と呼ぶ。そして、その絶対値が最大になる kk*(n) と書く。

2 の冪が 3n の世界をひと巡りする(n=2, 法 9)
1 2 4 8 7 5 k : 0 1 2 3 4 5 2ⁿ : 1 2 4 8 7 5 ×2 を 6 回で、3 と素な 6 個の剰余を一巡して戻る。 → 周波数 ξ を、指数 k で 番号付けできる。
Fig.1 2 は法 3n の原始根。だから 3 と互いに素な周波数すべてに、指数 k という一次元の座標を入れられる。ピークの「位置」を語る言語が、これで手に入る。
§ 03

ピークは、傾き 4/3 で歩いていく

n を 1 から 21 まで上げながら、ψn を全領域で計算した。n=21 では定義域が 2·320 ≈ 70 億点に達する。各 n でピークの位置 k*(n) を記録して並べると——きれいに、ほぼ一直線に伸びていく。傾きは、4/3 のあたり。

k*(n) のドリフト ― 計算した 21 点すべて
0 5 10 15 20 25 k*(n) 1 5 10 15 20 n slope 4/3 18 20,21 k*(21)/21 = 4/3
Fig.2 黒丸が観測した k*(n)。青の破線は傾き 4/3 の参照線。朱の点は後で出てくる「外れ値」(n=2, 3, 18, 20, 21)。右端、n=21 でちょうど k*(21)/21 = 28/21 = 4/3 に乗る。
n = 4 から 21 まで、17 ステップで k* はちょうど 24 増えた。
24 ÷ 18 = 4/3。誤差ゼロで。
これは偶然では出ない種類の一致。
§ 04

14 回連続で当たった式が、18 で外れる

傾き 4/3 を、整数の予測式に落とすと ⌊4(n−1)/3⌋ という単純な床関数になる。これを並べてみると、最初は不気味なほどよく当たる。n=4 から 17 まで、14 連続で完全一致。一目見れば、構造的な恒等式だと思いたくなる。

ところが n=18 で、初めて外れた。予測 22 に対し、実測は 23。たった 1 のズレ。そして n=20 で +1、n=21 で +2。外れる n の集合は {2, 3, 18, 20, 21} ——範囲の端に固まっている。

予測 ⌊4(n−1)/3⌋ と実測 k*(n) のズレ
n=1 21 +1 +2 14 連続で完全一致 (n=4…17) 端に固まる外れ値
Fig.3n での k*(n) − ⌊4(n−1)/3⌋。青い細線はゼロ(完全一致)。朱のバーがズレ。n=4〜17 の 14 連続一致のあと、範囲の上端 18, 20, 21 で +1, +1, +2 と崩れる。一方 n=19 は一致に戻っている。

面白いのは、式が外れても、傾き 4/3 は壊れないことだ。n=21 でのズレは +2 だが、それでも k*(21)/21 = 4/3 はぴったり成り立つ。床関数の境界で +1 の「ゆらぎ」が出るだけで、根っこの線形性は保たれている。式は近似に過ぎないが、傾きは本物らしい。

誠実さについて 最初の草稿では、この床関数を「n ≥ 4 で常に成り立つ」と書きかけていた。n=18 を計算するまでは、そう見えたからだ。だが計算機は 23 を返した。予測は 22 だった。外れたという事実を消さずに残すことが、このノートを論文ではなく観察記録にしている。14 連勝のあとの 1 敗を隠さないことのほうが、14 連勝を誇るより良いかなと。
§ 05

ピークの高さは、どう沈むのか

位置だけでなく、高さも見た。ピークの値 Mn = max|ψn| を n に対してプロットすると、なめらかに減衰する。両対数で直線に乗せると、有限範囲(n=9〜21)では Mn ∼ C·n−2.1 という冪則でよく合う。

ただしこれは有限範囲の観察であって、漸近の主張ではない。Tao の上界は 超多項式減衰——どんな固定の冪 n−A よりも速い——を保証する。有限の窓で見た「実効的な冪 2.1」は、n が伸びれば少しずつ大きくなっていく可能性と矛盾しない。今の範囲では、そこまでは見えない。

ピーク値 Mn の減衰(両対数)
log Mₙ log n ∝ n⁻²·¹
Fig.4 ピーク値 Mn の両対数プロット。n=9 以降は傾き約 −2.1 の冪則によく乗る(朱の破線)。これは有限範囲の実効的な振る舞いであって、Tao が保証する超多項式減衰と整合する。漸近は、この範囲の先にある。
§ 06

数字そのもの

図にしたものの、生の表も置いておく。観察の全てがここにある。gn/Mn2 は、ピークが 2 番手をどれだけ引き離しているかの指標だ。

Table 1 | シラキュース変数の特性関数、n = 1…21
nMₙk*(n)⌊4(n−1)/3⌋gₙ/Mₙ²
15.7735e−100·
23.7792e−121+10.654
32.5224e−132+10.406
41.7700e−144·0.421
51.2927e−155·0.394
69.6106e−266·0.106
77.5870e−288·0.105
86.0891e−299·0.220
94.8026e−21010·0.119
103.8278e−21212·0.027
113.1944e−21313·0.133
122.6458e−21414·0.111
132.2052e−21616·0.025
141.9128e−21717·0.139
151.6284e−21818·0.014
161.4409e−22020·0.109
171.2511e−22121·0.023
181.1187e−22322+10.103
199.8157e−32424·0.009
208.8846e−32625+10.110
217.8721e−32826+20.012

すべて IEEE 754 倍精度複素演算。独立な実装(原空間の再帰 → 離散フーリエ変換)との突き合わせを n≤8 で行い、相対誤差 10−10 以下で一致を確認した。n=20, 21 は 961 GB メモリのクラウド機で計算。

§ 07

わからないこと

このノートに答えはない。観察を置いて、問いを開いたままにする。それこそが numerical open question

k*(n)/nn→∞ で収束するか。極限は本当に 4/3 か。n=21 で 28/21 = 4/3 ちょうどに乗ったが、18 点の観察では、4/3 と、たとえば 24/17 ≈ 1.412 のような近い値とを区別できない
外れ値 {2, 3, 18, 20, 21} に、構造的な理由はあるのか。(18, 20) は偶数で +1、21 は奇数で唯一の +2。偶然か、過渡的か、共通の算術的機構に支配されているのか。まだ見当もついていない
床関数 ⌊4(n−1)/3⌋ が正しい n は、密度 1 か、密度 0 か、その間か。14 連続一致のあと、範囲の最後の 4 つで 3 回外れた。この材料では、絵が描けない
減衰の正確な漸近指数は何か。Tao が示唆する exp(−cn) への移行は、直接計算で届く範囲で起きるのか。
n ≥ 22 へ計算を伸ばす。n=22 は一度試して、位相因子配列の構築中にメモリが尽きて落ちた。アルゴリズムを書き換えるか、もっと大きな機械がいる。

私はこの観察を、結論ではなく 記録 として残す。Collatz 予想そのものには、これは何も寄与しない。ただ、Tao 先生の証明の心臓部にある対象が、計算機の中でどう振る舞うかを、一度きちんと見ておきたかった。n を 21 まで押し上げると、ピークは傾き 4/3 で歩き、床関数は途中で 1 だけよろめいてから、 4/3 に戻ってくる。それが全部。

こんなようなことばかりしていると、、なぜこんなことをするのか、とたまに聞かれる。答えは単純で、単純な問いの奥に隠れている規則性を、自分の目で見たいから。何かの役に立つわけでもない。70 億点を計算して出てきたのが「4/3」という素朴な分数だった、という一点に、週末をいくつか使う価値があると思っている。ここからいつか得るものもあるかも知れないし、関連性のないと思われることの組み合わせが大きな発見につながるかも知れない。

もし n=22 から先を回せる人がいたら、ぜひ続きを見せてほしい。コードもデータも、そのために置いてある。

渡久地 択
論文: Numerical observations on extremal Fourier coefficients of the Syracuse random variable, 2026.
全データ・検証コードは MIT、本文は CC BY 4.0 で公開。再現可能。
図はすべて観測データから直接描画。装飾のための数字は一つもない。