□技術メモ - ベイズの定理 ※管理人の個人的な技術メモです。 このページの内容は正確であることを保証しておりません。 ----------------------------------------------------------- ○ベイズの定理 対象とする事象をAとする。 また前提条件となる事象をBとする。 このとき、事象Bが起こる時に事象Aが発生する確率、 つまり条件付き確率P(A|B)は以下の式で表せる。 P(A|B) = P(A∧B)/P(B) ----(1) これをベイズの定理という。 教科書などでは上記の式を更に展開した式が表してあることが多いがここでは省略する。 -------- ○ベイジアン・アプローチ 対象となる事象Aが発生する確率をP(A)とする。 このとき、追加実験により事象Bが発生し、この条件の元で事象Aが発生したとする。 このとき、条件付き確率は上記のベイズの定理で表した式の値になる。 これは、確率P(A)が、新たな実験により、より正確な値P(A|B)を取得できたことを意味する。 この手法をベイジアン・アプローチという。 -------- ○モンティーホール問題 モンティ・ホール問題の概要は以下のとおり。 3つのカップ、a,b,cがあり、このどこかに景品が入っている。 プレイヤーは3つのカップから1つを選ぶ。 親は残った2つのカップのうち、ハズレを1つ選び、これをあける。 プレイヤーはあけるカップを変更することができるが、プレイヤーはカップを変更すべきだろうか? また、変更した先のカップがあたる確率はいくつだろうか? これはアメリカのゲームショー番組で、司会者モンティー・ホールが出題した問題として知られる。 多くの人が直感的に、確率は同じと答えるが、論理的に考えると変更した場合のアタリの確率は2/3となる。 直感で正しいと思える解答と、論理的に正しい解答が異なる問題の例として挙げられることが多い。 -------- 例題1-1 上記のモンティーホール問題で、変更した先のアタリの確率を場合分けにより求めなさい。 事象を洗い出してみると以下のとおりになる。 カップaが正解の場合: プレイヤーが最初にaを選択→親が残りのカップのうち1つをあける →プレイヤーがカップを変更→はずれ カップbが正解の場合: プレイヤーが最初にaを選択→親が残りのカップのうちcをあける →プレイヤーがカップを変更→あたり カップcが正解の場合: プレイヤーが最初にaを選択→親が残りのカップのうちbをあける →プレイヤーがカップを変更→あたり 従って変更した先があたりの確率は2/3になる。 -------- 例題1-2 上記のモンティーホール問題を、ベイズの定理を使用して求めなさい。 本来のモンティーホール問題は、親が必ず空のカップを開くとなっているが、 ベイズの定理を使う場合は、親がカップを開ける試行を追加実験と捕らえて、 親が空のカップを開ける確率をP(B)とする。 以下、場合分けして考える。 カップaが正解の場合: 必ず外れるので、プレイヤーがあたる確率は0 カップb,cが正解の場合: 親がハズレのカップを開く確率 = 1/2 その場合にプレイヤーがアタリを開く条件付き確率 = (1/2) * 1 = 1/2 したがってこれにベイズの定理を適用すると、 P(A∧B)/P(B) = (1/2) / (1/2) = 1 平均値の定義により、プレイヤーがアタリを開く確率は以下のとおり。 E(X) = (1/3) * 0 + (2/3) * 1 = 2/3 -------- 例題2-1 上記のモンティーホール問題で、カップの数が5個の場合について、 プレイヤーが変更した先のアタリの確率を場合分けにより求めなさい。 カップaが正解の場合: 必ず外れるので、プレイヤーがあたる確率は0 カップb,c,d,eが正解の場合: aは選択できない。また、残り4つのうち、ハズレのカップ1つを親が開けている。 従って選択可能な残りのカップは3つなので、プレイヤーがあたる確率は1/3。 平均値の定義により、プレイヤーがアタリを開く確率は以下のとおり。 E(X) = (1/5) * 0 + (4/5) * (1/3) = 4/15 -------- 例題2-2 上記のモンティーホール問題で、カップの数が5個の場合について、 プレイヤーが変更した先のアタリの確率をベイズの定理により求めなさい。 カップaが正解の場合: 必ず外れるので、プレイヤーがあたる確率は0 カップb,c,d,eが正解の場合: 親がハズレのカップを開く確率 = 3/4 その場合にプレイヤーがアタリを開く条件付き確率 = (3/4) * (1/3) したがってこれにベイズの定理を適用すると、 P(A∧B)/P(B) = (3/4) * (1/3) / (3/4) = 1/3 平均値の定義により、プレイヤーがアタリを開く確率は以下のとおり。 E(X) = (1/5) * 0 + (4/5) * (1/3) = 4/15 -------- 例題3 主人公X氏は、自宅から電車で、駅a,駅b,駅c,駅dで乗り換えて、自宅に戻ってくるとする。 最近だんだん暖かくなってきたので(2016年4月記す)、X氏は駅のベンチに上着を忘れてきてしまうことがある。 この確率を 1/6 とする。 あるときX氏は、自宅に戻ってきたときに上着を忘れてきたことに気がついた。 このとき、駅bに上着を忘れてきた確率を求めなさい。 X氏の移動経路をわかりやすく書くと以下になる。 自宅→駅a→駅b→駅c→駅d→自宅 ここでは「自宅に戻ってきたときに上着を忘れてきたことに気がついた」という事象は追加実験に該当する。 追加実験については考えずに、各駅に上着を忘れる確率、および忘れずに自宅まで帰る確率は以下のとおり。 P(自宅) = (5/6)*(5/6)*(5/6)*(5/6) = 625/1296 P(d) = (5/6)*(5/6)*(5/6)*(1/6) = 125/1296 P(c) = (5/6)*(5/6)*(1/6)*(6/6) = 150/1296 P(b) = (5/6)*(1/6)*(6/6)*(6/6) = 180/1296 P(a) = (1/6)*(6/6)*(6/6)*(6/6) = 216/1296 確認:上記を合計すると 1 になることが分かる。 対象とする確率 P(A) = P(b) = 180/1296 ≒ 0.139 新たな実験により、事象B(家に帰ったら上着を持ってない)が起こる確率 P(B) = 1 - 625/1296 これにベイズの定理を適用する。 駅bに忘れてきたら、家に帰ったら上着を持ってない確率は1なのだから、 P(A∧B) = P(b) = 180/1296 従って、 P(A∧B)/P(B) = (180/1296) / ( (1296 - 625) / 1296 ) = (180/1296) / (671/1296) = 180/671 ≒ 0.268 となる。 家に着いたときの状態がわからない場合は、対象となる確率の推定値は 0.133 だったが、 家に帰ったら上着を持ってない、という新たな実験結果により、対象とする確率は、0.268 という より正確な値を知ることができた。 このように追加実験によって、より正確な推定値を得る方法をベイジアン・アプローチという。 --------