統計的推測と学習








データが与えられたとき、そのデータを発生している確率分布を 推測することを統計的推測、情報論的学習、あるいは、単に「学習」といいます。

今日では、コンピュータやネットワークや様々な情報機器の 発達によって、あふれるほど多くのデータが存在するようになり、 学習に関する科学は、ますます重要性を増してきています。

また、データの高度化や複雑化に伴って、 学習について研究されるべき現実的課題も広く深くなってきています。

さらに、学習の理論においても、従来の統計学や情報科学では不明であった 新しい数学的な構造が発見され証明されつつあります。




(補足1) 「学習理論」とは、学習するシステムを表す確率変数の挙動が、 学習システムのどのような数学的な特徴によって定まるかを解明する理論のことです。 この問いかけは、情報システムにとって学習するとは如何なることであるか、を 明らかにする道につながっています。

(補足2) 統計的推測や情報論的学習の問題を考えるとき、「確率モデルの集合」の性質を 考察する必要が生じます。それは、すなわち、

(1) この集合の幾何学的な性質
(2) この集合の上に定義された関数全体の代数的な性質
(3) その関数全体の上の確率測度が従う性質

を考える必要があるということです。この3つの問題(1)(2)(3)は、 数学的には同じ問題を考えていることになります。

(補足3) このように数理的な理論が必要不可欠である一方で、 学習の問題は現実世界の問題解決に直結しています。特異点を持つ集合の上の 関数空間に定義された確率測度が従う一般的な性質が導出できると、そこから 具体的に与えられたワンセットのデータに関して、高度な認識や予測が可能になる という点にも統計的推測や情報論的学習というものの面白さがあるかも知れません。