確率論と幾何学の関係について








確率論と幾何学 の間には多岐に渡る不思議な関係があることが 知られています。

有名なものとしては、いわゆるスペクトル幾何の問題

「太鼓の音から太鼓の形がわかるか」

をあげることができるでしょう。 多様体上のラプラス作用素のスペクトルから多様体やその 境界の幾何学的性質がどの程度に決定されるかという問題意識から 研究が始められました。

ラプラス作用素は、 熱伝導を表す方程式の空間に対する作用の部分を定めていますが、 多様体だけでなくフラクタル図形上で熱伝導を 考えた場合においても研究されています。




まず幾何学について述べます。幾何学とは図形について考える学問です。 ある図形の性質は、その図形の上の関数全体が作る代数を調べることで 非常に多くのことが解明できます。

反対に、ある代数(群、環、非可換環など)が あったとき、その代数の表現を関数空間の上に作れるような図形は、 代数の性質を強く反映したものになっています。

(例)代数的集合とイデアル、多変数函数論、非可換多様体と作用素環


さらにまた、ある図形上の関数が作る代数の性質は、関数空間の 解析的な性質と不可分な関係を持つことも知られています。

(例)多項式近似定理、解析函数、佐藤超函数、代数的場の量子論


つまり、最もおおらかな気持ちになれば、幾何学とは代数学のことであり、解析学のことでも あります。「代数=幾何=解析」という等価性が、おおらかな気持ちの上では 成立しています。

(補遺)幾何学を研究するため、すなわち、図形の性質を調べるためには、 その図形に関する代数的な量を求めるか、 あるいは、解析的な量の計算を行うか、のどちらかが必要であって、たいがいの場合、 代数的な量を求めることは解析的な計算を行うことと等価になっていることが 多いということです(例:指数定理)。




以上は、幾何学の話でした。

一方、確率論は、おおらかな意味で等価であるところの「代数=幾何=解析」からは、 同じくらいに離れた所にあって、「代数=幾何=解析」を考察する視点を与える という側面を持っています。

つまり、数学的対象を確率的に揺らすことにより、「代数=幾何=解析」の中から重要な関係が 見えてくることがあるということです。

代数多様体や多様体やフラクタル図形や非可換多様体に、確率的な揺らぎを与えたとき、 あるいは、それらの上の確率過程があったとき、その揺らぎ、あるいは確率過程から、 代数多様体や多様体やフラクタル図形や非可換多様体について、どのような数学的な 特徴が見えるでしょうか。その特徴を見るためには、どんな方法が有効でしょうか。





「実関数とフーリエ解析(高橋 陽一郎著)」に

「漸近展開(注意)は、現代においてもなお、 不思議な側面を有している」

と書かれてありました。考察している数学的な 対象に確率的な揺らぎを与えて漸近展開を考えると、 その展開係数に幾何学的な量が出現して、そこから新しい定理が作られることが あるということを上記の言葉は述べているのではないかと思われます。

このような、確率論と「代数=幾何=解析」の不思議な関係については、数学において、 現在、活発に研究が行われているところであり、今後、さらに新しい発展があると 期待されています。

(注意)漸近展開は、解析関数の冪級数展開とは、非常に異なる性質を持っています。 解析関数の冪級数展開は、(1) 級数の和が存在し、(2) 関数と級数が局所的に 1対1に対応し、(3) 項別微分ができますが、 漸近展開は、(1) 級数の和は存在せず、(2) 関数と級数は局所的にも1対1ではなく、(3) 項別微分もできません。 漸近展開が意味を持つのは、あくまでも任意の有限和で打ち切ったときの値と元の関数との 相違が小さくできるというものであります。そのような微妙なものであるからこそ、 その展開係数には、不思議な幾何学的量が現れるのかも知れません。








以上のことは数学教室で学んでいる皆様は、よくご存知のことと思います。





さて、以下は情報工学の話です。

情報工学では、ランダム・サンプルから真の情報源について推測を 行うことがよく行われるのですが、 その際に推測の精度を表す量として、次の4つのものがあります。それは、

ベイズ汎化誤差。ギブス汎化誤差。ベイズ学習誤差。ギブス学習誤差。

この4つの量は、「推測した結果が真の情報源にどのくらい近いか」を表す量です。 学習誤差は得られたサンプルで測った誤差であり、汎化誤差は未来を予測した場合の 誤差を表しています。

二つの学習誤差はランダムサンプルから観測できますが、二つの汎化誤差は、 未来を予測したときの誤差なので直接に値を知ることはできません。

一般的な条件下で、 サンプルの個数が∞に近づくとき、4つの量は0に確率収束しますが、その 収束の早さを知りたい、つまり、ランダムサンプルの個数に関して、 4つのサンプルの漸近展開を行ったときの主要項が知りたい、という 要望が情報工学では多く存在します。

情報工学や生物工学では、真の情報源が「モデル集合の特異点」であるときに、 上記の4つの量がどのような挙動を持つかを求めるたくなることが多いのです(注意)。情報工学の 問題とは、数学風に述べれば、

「ランダム・サンプルから特異点の何がわかるだろうか」

という問いかけです。例えば代数多様体や解析的集合に確率的な揺らぎを与えたとき、特異点の幾何学的な 性質のうち、何がわかるでしょうか。

(注意)情報工学においては、情報を扱うソフトウエアの設計論、すなわち、 確率モデルの評価(Evaluation)、検定(Hypothesis test)、選択(model selection)などの 基礎的な操作において、真の情報源が特異点である場合の研究が重要になります。




最近、次のことがわかりました。

上記の4つの量を計算して、ランダム・サンプルの個数 n が ∞ に近づく極限における 漸近展開を行うと、
4つの量の主要項は、特異点の二つの不変量 λ(実対数閾値)とν(特異揺らぎ)の線形和で 表すことができます。

情報工学における大切な量を漸近展開すると、その展開係数として、 特異点の不変量が二つ出てくるのです。

上記の二つの不変量は特異点に強く依存していますが、 4つの線形方程式から二つの不変量を消去すると、二つの線形方程式が出てきます。その方程式は、 特異点に依存しないものになります。(4つの量について、 どんな特異点でも成り立つ方程式が二つ得られます)。

こうして得られた二つの方程式は、学習誤差から汎化誤差を、直接に、 求められることを述べています。すなわち、学習した結果から未来を予測したとき、どのくらい の精度で予測できるのかを、真の情報源を知らなくても予言することができます。

これは情報工学上、たいへん望ましい性質です。特異点が極大イデアルで表される場合、この 方程式は統計学において AIC と呼ばれる関係式と等価であることがわかります。

数学から遠く離れた実世界の中にある情報工学や生物工学において現れる量が特異点の幾何学的な性質で 表されるというのは、ちょっと不思議で面白いことではないかと思います。

数学教室で学ばれている皆様に、意外なところに数学が出てくることをご紹介できればと考えています。




(補遺)考察している対象に確率的な揺らぎを与えるという操作は、考察している対象の上で 物理現象を起こすということだと考えることもできます。「代数=幾何=解析」 の上で物理学を考えると、従来の方法では証明が困難であった定理の証明の糸口がみつかる 場合があります(例:ポアンカレ予想)。このため、現代では、強力な数学的体系を得るために、 考察している数学的対象の上で物理現象を起こすことを厳密に扱う手段が、 系統的に研究されるようになってきました(特に多様体論や位相幾何学において)。


数学は自然とともに。自然は数学とともに。その不思議な関係は、 現代においても変っていません。