ベイズの定理ってなんだ「図解」

◆確率の問題を図で考える

 今回は確率のお話です。

 他の記事でもご紹介させて頂いているハードウェアやソフトウェアを取り扱っていると時々数学が必要となります。今回は情報量やら情報エントロピーを計算するときに使用する確率の計算に登場するベイズの定理についてまとめました。

◆こんな問題

 交通違反をした時にキップを切られることを題材にします。

 駐車違反とスピード超過の2種類の違反をする人がいました。その人は駐車違反とスピード超過を6割、4割の確率でやらかいしています。駐車監視員制度ができたおかげで駐車違反をしたときは8割の確率でキップを切られてします。スピード超過の場合は2割の確率でキップを切られています。

 ここで問題です。ある時キップを切られてしまいました。駐車違反が原因である確率はいくらでしょうか?

◆原因→結果、結果→原因

 この問題を理解するポイントは、原因から結果を見るのか、結果から原因を見るのかを考えることです。問題文から読み取れることは、

駐車違反をした結果キップを切られた確率が8割 = 原因→結果

スピード超過をした結果キップを切られた確率が2割 = 原因→結果

でした。

 一方、問われていることは、

キップを切られた原因の確率 = 結果→原因

 です。

 この問題は結果に対する原因の確率を聞いています。

◆面積で考える

 この人が犯す違反を箱で考えましょう。

 違反は駐車違反とスピード超過の2種類しかありません。しかもその割合が分かっていますので、箱を6:4に分けましょう。駐車違反(左側)とスピード超過(右側)の箱ができました。

 さらに、駐車違反の8割はキップを切られますので駐車違反の箱を2:8に分けます。駐車違反→キップの箱を赤く塗りつぶします。同様に、スピード超過→キップの箱を水色に塗りつぶします。

 このように図化すると問題の全貌が直感的に理解できると思います。この図を使って、キップを切られたとき駐車違反である(キップ→駐車違反)確率を考えます。ますはキップ全体の面積に注目します。

キップ全体の面積=赤の面積+水色の面積

 ですね。

 ココまで来れば、図を見ながら少し考えると、キップ全体の面積に占める駐車違反の面積の割合が解答であることが分かるでしょう。

キップ→駐車違反の面積 = 赤の面積 ÷ キップ全体の面積

 となります。

◆計算してみる

 赤の面積(底辺×高さ) = 6 * 8 = 48

 水色の面積(底辺×高さ) = 4 * 2 = 8

 キップ全体の面積 = 48 + 8 = 56

 キップ→駐車違反の面積 = 48 ÷ 56 = 0.857

 となり、問題の答えは、0.857 となります。

◆教科書っぽく記号を使って書くと

駐車違反を起こす確率 P(A) = 0.6
スピード超過を起こす確率 P(B) = 0.4
駐車違反が原因でキップを切られる遷移確率 P(C|A) = 0.8
スピード超過が原因でキップを切られる遷移確率 P(C|B) = 0.2
キップを切られた原因が駐車違反である遷移確率 P(A|C) = ?
キップを切られる確率 P(C)
駐車違反を起こしキップを切られる同時確率 P(C,A)
スピード超過を起こしキップを切られる同時確率 P(C,B)

 ここで新しい言葉が出てきました。遷移確率と同時確率です。

 遷移確率とはある状態から次の状態へ変化するときの確率のことです。問題の例ですと、既に駐車違反状態にある人がキップを切られる状態へ遷移する場合の確率のことです。P(C|A)は上図の左側を対象にしたときの赤い部分の割合を指します。

 一方、同時確率とは2つの事象が同時に起こる確率です。駐車違反とキップが同時に起こる確率になります。P(C,A)は上図の箱全体を対象にしたときの赤い部分の割合を指します。

 ベイズの定理より計算を行います。

 P(A|C) = P(C,A) / P(C)

 P(C,A) = P(A) × P(C|A) = 0.6 × 0.8 = 0.48

 P(C,B) = P(B) × P(C|B) = 0.4 × 0.2 = 0.08

 P(C) = P(C,A) + P(C,B) = 0.56

 P(A|C) = P(C,A) / P(C) = 0.48 / 0.56 = 0.857

 ほほー、同じになりました。


Latest update at 2007/07/23