確率変数







大学院の講義で「確率変数」を説明したのですが、理解できた人が 少ないように思うので、もう一度、説明します。確率変数は、非常に重要な概念なので 社会に出るまでに、必ず、理解してください。


(1) 実数の集合 R の上に確率密度関数 q(w) が定義されているとします。 q(w) を用いると「R の中の開区間 A の確率」である P(A) を積分を用いて 定義することができます。すなわち

P(A)=∫_{A} q(w) dw.



(2) 実数 w から実数 x への関数 x=X(w) が与えられたとき、この関数 X を「確率変数」と呼びます。確率変数とは、関数のことなのです。


(3) 確率密度関数 q(w) と関数 x=X(w) が与えられると、 x の確率密度関数 p(x) が決まります。具体的には

p(x)=∫δ(x-X(w)) q(w) dw.



(4) 以上の設定のもとで、

「確率変数 X は、確率密度関数 p(x) に従う」---@


と言います。

「確率変数 X の確率密度関数は p(x) である」---A


という言い方をする場合もあります。

(注意)記述@Aでは、q(w) についても、 X(w) についても、述べられていません。 つまり、@Aの記述は、「とにかく、何らかの q(w) と 何らかの X(w) があって、x=X(w) で定義される x が p(x) に従っている」 ということを述べています。


(5) q(w) と X(w) が分からなくても、p(x) さえわかれば、X の平均と分散を 計算することはできます。実際

E[X]=∫x p(x) dx

V[X]=∫(x-E[X])^{2} p(x) dx


このような計算では、確率変数は、ただ X とだけ標記されていることが 多く、X が関数であることは忘れていてもOKのような感じになります。


(6) しかしながら、q(w) と X(w) が必要なときもあります。例えば、確率変数の 数列 { Xn } が、ある確率変数 X に収束するかどうか、を考えたいときには、 q(w) と X(w) が必要です。このようなときには、 確率変数は Xn(w) や X(w) と標記されていることが多いです。このときは、 X が関数であることを使わなくてはなりません。


(7) つまり、二つの標記 X と X(w) は、ひとつのものを表しています。 これを「同一視」といいます。


初等確率論を習うとき、とりあえず、上のことを理解できれば十分です。 社会に出て実際の問題に出会うとき、確率変数は X と書いてあったり、 X(w) と書いてあったりしますので、混乱しないようにしてください。


(注意)「二つの確率変数 X と Y が等しい」というとき、それは「 関数である X(w) と Y(w) が等しい」という意味です。確率変数 X と Y が 等しいとき、X が従う確率密度関数と Y が従う確率密度関数は、もちろん、 一致します。しかしながら、二つの確率変数 X と Y が等しい確率分布に 従う場合であっても、確率変数 X と Y は、普通は等しくありません。 (この記述は、確率統計を理解している人には、あたりまえのことですが、 そうでない人にはあたりまえのことではないようです。注意してください)。


(注意)初等確率論では、実数の上に値をとる確率変数を習うのですが、 社会に出てから実務をする上で「関数空間の上に値を取る確率変数」が必要になります。 関数空間の上に値を取る確率変数のことを「確率過程」といいます。確率変数の 概念を正しく理解していないと、確率過程を習うときに、より一層の 混乱を感じることになります。今の段階で、確率変数の概念を 十分に把握してください。大学で習う学問は、実務においても、必須です。





以下では、発展的なことを述べます。以下の文章は、理解できなくても、 何を言っているかわからなくても、気にする必要はありません。 また、期末テストで、以下のことを聞いたりはしませんので安心してください。


「確率変数」は、言葉としては 【ランダムなもの】を表しています。


であるのに、なぜ、確率変数は、関数であるとして定義するのでしょうか。


本当は、確率変数を「ランダムに値を取るもの」と定義したいのです。 しかしながら、【ランダムに値を取ること】を明示的に 定義することは困難です。ランダムとは何かを 数学的に特徴づけることは非常に難しいからです。Kolmogorov が最後まで 挑戦していた課題です。


そこで、確率論では、【ランダムなもの】を、最初の段階の定義では 述べないことにしたというわけです。その代わりに、 まず密度だけを表すもの q(w) を定義しておき、 「q(w) が定義された集合」から実数への関数として確率変数を定義 したのです。


この結果、関数 x=X(w) における出力である x だけを見て、入力である w について 見ないことにすると、x は【ランダムなもの】と 考えても悪くはないもの、になります。もう少し、正確に 言うと、x は【ランダムなもの】としての十分性を満たしているかどうかは わからないが、【ランダムなもの】としての必要性を満たしていると 思われるものを定義することができました。そこでこれを「確率変数」と呼ぶことに したのです。


こうして【ランダムとは何か】という難しい問題を解決しなくても、 それを回避して、 ランダムなものと考えて差し支えないもの、 を定義することができるようになったのです。


(注意)物理学、情報学、経済学では、確率変数の概念を 用いることで、(つまりランダムとは何かが、わからなくても) 非常に多くの問題が記述できて解決することがわかっています。 量子力学や統計力学においては、ランダムとは何か、について 直接に答えることをしなくても、理論の定式化はできるのです(※)。


(参考)さて、本当のランダムを数学的に述べることはできるのか、 という問題が残っています。これは、 計算機で作られた擬似乱数の良さを測る方法とも関係があり、 とても大切な問題です。しかしながら、 これは、もはや、初等確率論を遥かに越えた問題です。 いつか機会があったら、説明を試みることにします。


(※)量子力学や統計力学の演習問題を解くとき、ランダムとは 何かを気にしなくても、波動関数を求め、 分配関数を計算すれば、問題は解決します。(慣れるまで練習は 必要です)。しかしながら、量子力学の観測の問題や、統計力学の 基礎の問題を考えるとき、私たちは、自然現象における ランダムとは何なのだろうかという問題にぶつかります。それは、 自然現象において「試行」とは何か、という問題です。
  • 量子力学における観測は、ふだんはブラックボックスのように述べられているが、 それは物理学的な現象であるはずである。「観測する」ということを 量子力学的現象として記述するためには、 どのような物理量とハミルトニアンを考えたらよいか。(という 問題を考えることに意味はあるか)。
  • 現実の系において、エルゴード定理が成り立つために必要な時間は、宇宙の年齢より 遥かに大きな無限大であることが多い。それにも関わらず、エルゴード定理から形式的に導出できる 統計力学が、現実の系においても正確に成り立つのはなぜか。 (これは数理的に何かから導出されることではなく、このことこそが統計力学における自然法則であるのか。)
これらの問題については、「正しい質問をするためには、 どのように問うたらいいのか」がわかっていないのではないか、と 思われますが、いかがでしょうか。

(余談)夜空を仰いで、星空を眺めると、137億光年も遠くの世界から、 私たちのいるところまで光が届くことがわかります。それは、 ものすごく小さな確率が実現されたということです。計算機で 宇宙のシミュレーションをしようと思っても、これほど小さな確率を 実現することは簡単にできることではありません。自然の世界では、どんなに小さな確率でも、 どこまでも精妙に実現されているのです。宇宙が出来た頃の世界と私たちの 暮らしている現在とを結んで、たったひとつの光子の波動関数が、完全に正確に 実現されているということです。宇宙の大きさや素粒子の小ささも私たちが感動する対象ですが、 このように小さな小さな確率が宇宙全体で実現されていることもまた、信じられない不思議さであると 思います。