ベイズ統計 第2章 ベイズの定理からベイズ理論の出発点へ
ベイズ統計
第2章 ベイズの定理からベイズ理論の出発点へ
ベイズの定理は、乗法定理から導くことができる。 2つの事象、A、Bについての乗法定理は、
・・・(1)
となる。は「Aの起こる確率」を、は「A、Bが同時に起こる確率」(同時確率)を、は「Aが起こるという条件のもとでBが起こる確率」(条件付き確率)を表す。 簡単にいうと、 「A、Bが同時に起こる確率」=「Aが起こる確率」×「Aが起こったときにBが起こる確率」 ということである。
さて、式(1)のAとBを入れ替えると、
・・・(2)
となる。そして、であるから、
・・・(3)
よって、
・・・(4)
が成り立ち、これがベイズの定理である。
簡単に言うと、
BのもとでAが起こる確率=
ということであるが、直観的に理解はしにくいため、例を使って意味を確認してみる。
例1:サイコロを投げたとき、奇数の目がでる事象をA、3以下の目がでる事象をBとする。このとき、ベイズの定理が成立することを確認する。
とは、3以下の目がでたときにそれが奇数である確率を意味する。3以下の目とは{1,2,3}の3通り、これが奇数であると{1,3}の2通りなので、
・・・(5) (ベイズの定理(4)の左辺)
そして、は奇数がでる確率、は3以下の目がでる確率なので、それぞれ、
・・・(6)
・・・(7)
となる。 また、とは、奇数の目がでたときにそれが3以下である確率を意味する。奇数であるとは{1,3,5}の3通り、これが3以下とは{1,3}の2通りなので、
・・・(8)
よって、(6)~(8)より、 ベイズの定理(4)の右辺
これは(5)のに一致するので、ベイズの定理(4)が成り立つことがわかる。
例2:ジョーカーを抜いた1組のトランプから1枚のカードを無作為に引くとする。引いた1枚のカードがハートである事象をA、絵札である事象をBとする。このとき、ベイズの定理を利用して、「絵札を引いたとき、それがハートである」確率を求めてみる。
解となる「絵札を引いたとき、それがハートである」確率とは、である。
逆に、は「ハートを引いたとき、それが絵札である」確率であり、ハート13枚のうち絵札は3枚なので、
・・・(9)
そして、はハートを引く確率、は絵札を引く確率なので、それぞれ、
・・・(10)
・・・(11)
これをベイズの定理(4)に当てはめると、
・・・(12)
まあ、絵札であろうとなかろうと4枚に1枚はハートなので、直観的に解答が求まり、例2もベイズの定理の有用性が全く感じられない。
例3:TeamAyuは男子6人、女子12人、西野家は男子10人、女子5人である。TeamAyuと西野家の集団から1人選んだなら、それが女子であった。このとき、その女子がTeamAyuの人である確率をベイズの定理で求める。なお、どの人も選ばれる確率は等しく、両方に所属している者はいないと仮定する。
まず、AとBを次のように定義する。 A・・・1人を選んだなら、それがTeamAyuである。 B・・・1人を選んだなら、それが女子である。 すると、求めたい確率は「1人選んだときに、それが女子である」(B)ときに「それがTeamAyu」(A)である確率であるので、となり、これをベイズの定理(4)に当てはめると、
「1人選んだら、それがTeamAyuである確率」
「1人選んだら、それが女子である確率」
「「1人選んだときに、それがTeamAyuである」(A)ときに「それが女子」(B)である確率」
よりものほうが直観的にわかりやすいというのが、ベイズの定理を利用する大きな利点となる。
それぞれについて求めると、TeamAyuと西野家の両方に所属している人はいないため、総人数は33人、TeamAyuは18人、女子は17人であるので、
・・・(13)
・・・(14)
そして、TeamAyuは18人でそのうち女子は12人であるので、
・・・(15)
(13)~(15)をベイズの定理(4)に当てはめると、
女子は全部で17人いてそのうちTeamAyuが12人なのでこういう解になるのは当たり前であるが、それが女子であったときにTeamAyuのである確率という問われ方をすると直観的に解答を出すことは少し難しい。
例4:ある地方の気象データでは、10月1日に曇りの確率は0.6、翌2日に雨の確率は0.4である。また、10月1日に曇りのときに翌2日が雨の確率は0.5である。この地域で、10月2日が雨のときに前日の1日が曇りの確率を求める。
まず、AとBを次のように定義する。 A・・・1日は曇り B・・・2日は雨 すると、「10月1日に曇りのときに翌2日が雨の確率は0.5である。」ことから、
・・・(16)
また、「10月1日に曇りの確率は0.6、翌2日に雨の確率は0.4である。」ことから、
・・・(17)
・・・(18)
そして、求めるのは「10月2日が雨のときに前日の1日が曇りの確率」であるから、でありベイズの定理(4)より、
と解が求まる。 この例では、直観的には解法がわからずベイズの定理を利用しないと解答を得るのが困難であろう。(少なくとも、私はわからない)
例5:100点満点数学の試験で、90点以上を取った生徒が2割いた。数学が好きな生徒が90点以上取る確率は0.4である。90点以上を取った生徒から1人抽出したとき、その人が数学を好きである確率を求めよ。ただし、この試験では、数学が好きな人の確率は0.3であった。
まず、AとBを次のように定義する。 A・・・数学が好き B・・・90点以上取る すると、「数学が好きな生徒が90点以上取る確率は0.4である。」ことから、
・・・(19)
また、「数学が好きな人の確率は0.3であった。」ことから、
・・・(20)
また、「90点以上を取った生徒が2割いた。」ことから、
・・・(21)
そして、求めるのは「90点以上を取った生徒から1人抽出したとき、その人が数学を好きである確率」であるから、でありベイズの定理(4)より、
と解が求まる。 さて、この例5の結果は、数学が好きだから数学で90点以上取った確率と考えることもできます。つまり、「数学が好き」という「原因」によって「90点以上の点と取った」という「結果」が生じる確率ということですが、これをそのままベイズの定理(4)に当てはめると、
・・・(22)
となる。 (22)の左辺は「結果が与えられたという条件での原因である」条件付確率で、(22)の右辺は「原因によって(=原因が与えあられたという条件での)結果が生じる」条件付き確率となる。こういう意味で、ベイズの定理をこのように「原因」と「結果」に当てはめると、通常は原因からどういう結果が生じるかを議論するものを、結果から原因を仮定して、その原因によって結果が生じた確率はどれくらいであるかを表すように変換する機能があり、こういう意味で、(22)の左辺を原因の確率という。
このように、結果となるデータ(Data)があって、仮定(Hypothesis)する原因によって生じた確率(原因の確率)がどの程度であるか見積もるための公式とベイズの定理を解釈し直すことがベイズ理論の出発点となる。 この公式をベイズの基本公式と呼ぶ。
・・・(23)