広く使える情報量規準(WAIC)
このページをご覧いただき、ありがとうございます。
ここでは、情報量規準 WAIC を紹介しています。
ベイズ推測のための情報量規準(WAIC)が導出されました。
WAIC は(真の分布、確率モデル、事前分布)がどのような場合でも使う
ことができます。他の規準と異なり理論的な基盤を持っています。
(0) モデル選択やハイパーパラメータの最適化に使えます。
(1) 漸近的に汎化損失と同じ平均値と同じ分散を持ちます。
(2) WAIC は簡単に計算できます。
(3) 真の分布が確率モデルで実現可能でなくても使えます。事前分布が真の事前分布でなくても使えます。
(4) 平均対数損失を最小にするパラメータがユニークでなくても使えます。
平均対数損失を最小にするパラメータが特異点を含む解析的集合であっても
使えます(注1)。
(5) フィッシャー情報行列が正則でなくても使えます。
(6) 事後分布が正規分布で近似できなくても使えます。
(7) 事後分布が正規分布で近似できる場合でも従来の規準よりも正確です。
(8) クロスバリデーションと漸近等価です。その差は (1/n^{2}) のオーダーです。
事後分布が正規分布で近似できるときはその差は(1/n^{3})のオーダーです。
クロスバリデーションよりも少し分散が小さいことが多いです(数学的にはまだ証明はされていません)。
(9) AIC, TIC, BIC, MDL, DIC は構造を持つモデル(☆)では使えません。
WAICはいつでも使うことができます。
(10) 階層ベイズ法・ベイズネットワーク・深層学習の構造決定に用いることができます。
(11) WAIC は統計学の知識がない人でも誰でも使うことができます。
☆ 構造を持つモデルとは、混合正規分布、神経回路網、ベイズネットワーク、隠れマルコフモデル、
縮小ランク回帰、深層学習などの隠れた変数・階層構造・モジュール構造を持つモデルのことです。
AIC, TIC, BIC, MDL で、これらのモデルは評価できません。また
DIC でこれらのモデルの評価をするのは正しくないことが証明されています。
(計算機実験してみると DIC の平均値は汎化誤差の平均値と同じになりませんし、
その分散も正則性がない場合には汎化誤差のものよりも大きくなりますので、DICは実験上も適切では
ありません)。もともと DIC はその正しさのサポートがないことで有名でした。
なぜ統計学で理論上も実験上も正しくない規準が重要だとされて使われてきたのか、という
問題は大きな謎であり、統計学の歴史を考える際には重要かもしれません。
☆ 上記のように WAIC は事後分布が正規分布で近似できない場合を想定して作られたのですが,
事後分布が正規分布で近似できる場合でも従来の規準よりも(汎化誤差の漸近不偏推定量として)正確な値と
なるため,ベイズモデリングにおいて広く利用されるようになってきました。
階層ベイズ法やベイズネットワークの評価に用いることができます。統計学における
モデリングの評価には様々な方法がありますが,現実の問題で統計モデルや事前分布の適切性について
調べたい場合などにぜひ一度お試しいただければ幸いです。
☆ MCMC法によりベイズ事後分布に従うパラメータのサンプルができれば WAIC は容易に計算できます。
MCMC法を実現するソフトウエアとして Stan, Bugs, Jags, Laplacesdemon などが知られています。
論より証拠、実験してみる
論より証拠、証明してみる
印刷用PDFファイル
WAICについて必要なことは以上です。
以下の「続き」において追加事項を述べますが、
WAICの利用において必要なことではありませんので、お読みになる必要はありません。
以下のページに理解できないことが書いてあっても気にする必要はありません。
WAICの続きを読む
渡辺澄夫にもどる