確率と統計−情報学への架橋−










Probability and Statistics

確率と統計−情報学への架橋−は、情報学・人工知能・数理科学などの分野の研究者・技術者を目指す人の ためのコンパクトな入門書です。しかし無味乾燥ではなく、楽しんで読んでもらえるように いろいろな話題を提供しています。 Amazon .

渡辺澄夫(確率)
村田昇先生 (統計)。

大学1,2年のときに習う確率と統計の基礎的な内容が説明してあります。 また、 情報学・人工知能・数理科学などの分野で読者が将来出会う概念について、 そこへの架橋についても紹介してあります。

◎ 将来、アルゴリズム理論、計算機科学、情報理論、学習理論、人工知能、確率過程論、などの 分野をめざしている人に、ぜひとも、この本を楽しんで頂きたいと思います。

◎ 数学的に正しく記述してありますが、しかし抽象的になったり、式の計算を しすぎたりしないように配慮してあります。なお、証明については、全体が完全に演繹的に 導出されるようには構成してありません。(その理由は、注意↓を参照)。

◎ 各章の最後に「質問と解答」のコーナーがあります。この分野を講義される先生は、 学生のみなさんが、どのように素朴な疑問を持たれるかについて、どんな風に感じて いらっしゃいますでしょうか。素朴な質問を大歓迎します。学生のみなさんも、ぜひ、 次のような素朴な疑問を持ってください。

「正規分布に従う確率変数は X=a となる確率は0です(aは任意の実数)。しかし、試行の 結果、何かのaが実現されます。これはすなわち、確率が0の事象が起こったということでしょうか?」

「正規分布に従う確率変数 X が、集合 A の中の値をとる確率 Pr(A) は、どんな集合 Aに対しても 決定できそうな気がします。なぜなら、試行の結果は A に入るか入らないかのどちらかです。 それにも関わらず、Pr(A)が決定できないAが存在するのはなぜでしょうか?」




◎ 章末問題に、情報学における面白い問題が書かれています。 確率と統計は、情報学において必要になるのではなく、情報学そのものであると言って よいでしょう。情報学について考えてくださる方を大歓迎します。 「文字認識において 94.0%と94.1%の学習機械は違うと言えるでしょうか?」


(注意)本来、確率論は、3年生後半でルベーグ測度論を 習った後に習うべきで、そうすれば、完全に演繹的に、起承転結をクリアーに述べることができ、 また、確率過程論や確率微分方程式への土台が得られる のですが、しかし、情報学や物理学を専門とする人にとって、3年生後半でルベーグ測度論を 習った後というのは、確率統計を学ぶには遅すぎるという事情があります。 また、多くの場合、数学科以外ではルベーグ積分は重要であるにも関わらず、必修に なっていないことが多いようです(東工大では、1年生の初等微分積分と線形代数でさえ必修では ありません。必修でなくても履修しておくことを極めて強く推奨します。) そこで、まずは1,2年生のときに確率統計の概略を学んでおいて、ルベーグ積分を習ったら、 もういちど最初からしっかりと確率論を学ぶというのが良いでしょう。これは、2度手間には ならないと思います。それくらい、ルベーグ積分の概念と定理(単調収束の補題、優収束定理、Fubiniの定理など)は 強力であるということです。




◎ 前半は渡辺が書かせていただき、後半は村田昇先生に書いて頂きました。 文章のスタイルが違うのは、そのためです。同じでなくても、いいですよね? 渡辺の文章は「例」と「注」が多く、自明なことも含めて全て説明しています。 村田先生は、研究者として卓越されているだけでなく、文章の書き手としても 定評のある先生で、統計学というものの面白さや情報学における 考え方を平明にしかし楽しく解説してくださっています。

◎ 確率空間と確率変数について、説明を行なうべきかどうか、最後まで迷いましたが、 説明を行なうことにしました。 確率空間と確率変数の概念は、いますぐには必要なくても、将来、読者が必要とする ときがくると思ったからです。「若者よ、この概念をもってゆくがよい。いつか、 君が困ったとき、その概念が役立つときが来るだろう(☆)」。

☆ 志を持つ若者が旅立つとき、近所に住んでいた翁が何か奇妙なものを持ってゆけ、といって 手渡してくれるということがよくありますね? ただのマスコットか装飾品かなと思って 袋に入れておいたら、ずっと後になって決定的な場面で役立ったりするものです。




◎ この本は、一見すると、普通の確率統計の本のように見えるかも知れません。 もちろん、大学1年あるいは2年のときに習う確率統計の本として標準的な 内容が書かれており、普通の確率統計の本と同じ内容が書かれていますので、 専門家の先生には、普通の本との違いが、おわかり頂けないだろうと思います。

この本の特色は、専門家の先生が当り前のことだと思うことでも、 初めて習う人がつまづきやすい点については、わかりやすく、 具体的に、情報学との関連も含めて説明しているところにあります。例えば、

(1) なぜ、確率空間を設定するのか。なぜ、 シグマ加法族の 概念を定義する必要があるのか。確率空間を定義するということは、 情報学上、どういうことであるのか。

(2)確率変数は X と書くときと X(w) と書くときの両方があるが、この二つは同じなのか 違うものなのか。確率変数が等しいことと、確率変数が同じ分布に従うということは どのように違うことなのか。その違いは、情報学上、どのような意味があるのか。

(3)平均や分散はなぜ重要であるのか。平均や分散を情報学で扱うとき必要になる 基本的な不等式は、情報学上、なぜ重要なのか。

(4) 情報学とは条件つき確率の操作に他ならないということ。

(5) 特性関数と中心極限定理の重要性を感じ取るということは、 どのようなことであるのか。

(6) カルバック情報量(相対エントロピー)がアルゴリズムを導出するという重要性。 カルバック情報量の二つの代表的な使い方。 平均場近似の近似精度は、平均場近似の中では解析できないという認識。

これらのことは、専門家の先生には当り前のことですが、 初めて確率統計を習う人が理解しないまま通りすぎてしまいやすい所だと 思います。確率統計の講義をしていらっしゃる先生方は、ぜひ、 「なぜ、その数学的な定義が重要であるのか」を講義において御紹介して くださいますようお願い申し上げます。




この本の作成に当たってはコロナ社の新井明良さんに、たいへんご尽力いただきました。 本の冒頭に謝辞を書こうとしたところ、コロナ社では「本を作る仕事は会社の みんなが協力して出来ることであるから本の中に謝辞を載せることは辞退している」という ことでしたので、ここに記して感謝申し上げたいと思います。

正誤表

第1刷におけるミス


1. 5ページ、下から3行目

誤:(p+(1-p))^{n}
正:(a+(1-a))^{n}


2.30ページ上から2行目

誤:p^{*}(a^{2})a
正:2p^{*}(a^{2})a


3.30ページ上から5行め
誤:√の中身が 2/πx
正:√の中身が 1/2πx


以上は、第2刷以後では正しくなっています。


4。30ページ、例2。5

誤:p(x,y)=1 (|x|<=1, |y|<=1)
正:p(x,y)=1 (0<=x<=1,0<=y<=1)


5。45ページ、例3。7
誤:-log E(exp(g(X)) <= E(g(X))
正:log E(exp(g(X)) >= E(g(X))




6。36ページ、章末問題3
誤:cos Y, sin Y
正:cos(2πY), sin(2πY)




訂正の4、5、6はご指摘くださった方によるものです。 ありがとうございました。