ベイズ統計 第1章 確率の基礎
ベイズ統計
第1章 確率の基礎
1.1 集合について
集合の定義
集合とは、ある一定の条件をみたすものの集まりのことをいう。ただし、対象とするものが、その条件をみたうかどうかは、客観的に明らかなものの集まりでなければならない。
集合の例:奇数の集まり、人間の集まり、20歳から30歳の人間の集まり、etc
集合とならないものの例:
背が高い人の集まり(何を基準に、背を高いとするか定まっていない)
おいしい食べ物の集まり(何を基準に、おいしいとするか定まっていない)
イケメンの集まり(何を基準に、イケメンとするか定まっていない)
集合は、一般的にはA,B,X,Y などのアルファベットの大文字表し、集合を構成しているものをその集合の要素または、元という。
そして、a が集合A の要素であるとき、a ∊A またはA ∍a と表し、b がA の要素でないときは、b ∉A またはA ∌b と表す。
ここで、4で割り切れる20以下の自然数の集合をA とおくと、
A ={n |n =4k (k =1,2,3,4,5)}
A ={ 5,10,15,20 }
の2通りの表し方がある。このA のように、要素の個数が有限の集合を有限集合といい、X ={x |0≦x ≦2π} のように、要素の個数が無限の集合を無限集合という。
また、1つの要素ももっていない集合を特に空集合といい、φ で表す。当然、空集合の要素の個数は n (φ)=0 となる。
さらに集合B の要素がすべて集合A に属するとき、B はA に含まれると言い、B ⊆A (B とA が等しい場合も含む) もしくは、B ⊂A と表し、B をA の部分集合という。特に、B ⊂A のとき、B はA の真部分集合という。
2つの集合A ,B について、A とB に共通な要素の集合を積集合といい、A ∩B と表す。
A ={1,2,3,4},B ={2,4,6,8} ならA ∩B ={2,4}
A ={a,b,c,d,e,f,g},B ={c,e,g,h,i,j} ならA ∩B ={c,e,g}
A ={3の倍数},B ={4の倍数} ならA ∩B ={3と4の公倍数}
A ={1,2,3,4,a,b,c,d,e,f,g},B ={アルファベット} ならA ∩B ={a,b,c,d,e,f,g}
2つの集合A ,B について、A またはB のいずれかに属する要素の集合を和集合といい、A ∪B と表す。
A ={1,2,3,4},B ={2,4,6,8} ならA ∪B ={1,2,3,4,6,8}
A ={a,b,c,d,e,f,g},B ={c,e,g,h,i,j} ならA ∪B ={a,b,c,d,e,f,g,h,i,j}
A ={3の倍数},B ={4の倍数} ならA ∪B ={3の倍数と4倍数}
A ={男性},B ={女性} ならA ∪B ={男性,女性} ={ヒト}
ここで、との要素の個数について、次の公式が成り立つ。
A ∩B =φ のとき、 n(A ∪B )= n(A ) + n(B )
A ∩B ≠φ のとき、 n(A ∪B )= n(A ) + n(B ) - n(A ∩B )
次に、考えている対象のすべてを要素とする集合を、全体集合U と表し、図に示すように、その部分集合A が与えられているとき、補集合Ā を次のように定義する。
補集合Ā :全体集合U に属するが、A には属さない要素から成る集合。
補集合は、命題論理の否定(¬)と同じものと理解して差し支えはないが、「考えられている集合」は明確にさせておかなければならない。例えば、全体集合U をある大学の学生、その大学には理学部と工学部と文学部があるとしたとき、Aを理学部の学生とすれば、Ā は理学部以外の学生、つまり、工学部もしくは文学部の学生となるが、これは全体集合U をある大学の学生としているからである。これをAを理学部でかつ学生と捉えてしまうと、(理学部∩学生)¬=理学部¬ ∪学生¬、つまり、理学部でないかもしくは学生ではないとなってしまい、全体集合U の外側までが、Ā となってしまう。
なお、Ā のようなアルファベットに「 ̄」(オーバーライン)を付した特殊文字が利用できない場合、A ̄やB ̄のように表記することする。
そして、U とA とĀ の要素の個数について次の公式が成り立つ。
n(A )+n(Ā )=n(U )
また、命題論理と同様に、次のド・モルガンの定理が成り立つ。
(A ∩ E ) ̄=Ā∪Ē
(A ∪ E ) ̄=Ā∩Ē
1.2 集合と事象
「コインを投げたり」、「サイコロを振ったり」、同様のことを繰り返すことが可能な行為を、試行といい、その結果、「表が出たり」、「偶数の目が出たり」する事柄を、事象という。そして、この事象の中でも、これ以上簡単にならない1つ1つの基本的な事象を、根元事象という。
この根元事象の集まりは、次のように集合で表すことができる。
コインの場合={ 表,裏}
サイコロの場合={ 1,2,3,4,5,6 }
このような、試行によって起こる事象は、すべて集合によって表すことができるので、これからは、集合A と事象A を区別せずに扱うこととする。集合A の要素の数n(A ) も、事象A の場合の数n(A ) と呼ぶこととする。
また、場合の数と集合では呼び方が異なるので、それを以下にまとめておく。
場合の数 集 合
事象A 、事象B など ⇒ 集合A 、集合B など
全事象U ⇒ 全集合U
A ∩ B :積事象 ⇒ A ∩ B :積集合
A ∪ B :和事象 ⇒ A ∪ B :和集合
Ā :余事象 ⇒ Ā :補集合
φ :余事象 ⇒ φ :空集合
1.1で学んだ集合の要素の個数の公式はすべて、場合の数の計算にも利用できる。
A ∩B =φ のとき、 n(A ∪B )= n(A ) + n(B )
A ∩B ≠φ のとき、 n(A ∪B )= n(A ) + n(B ) - n(A ∩B )
n(A )+n(Ā )=n(U )
n((A ∩ E ) ̄)=n(Ā∪Ē )
n((A ∪ E ) ̄)=n(Ā∩Ē )
2つの集合、A ,B に対して、
A×B = {(a ,b )|a ∈A ,b ∈B }
を、A とB の直積と定義する。
A = { a1 ,a2 ,・・・・,am } ,B = { b1,b2 ,・・・・,bn } とすると、n(A )=m ,n(B )=n で、
(ai ,bj )( i =1 ,2 ,3 ,・・・,m , j =1 ,2 ,3 ,・・・,n)は、m ×n 通りの組み合わの数だけ存在するので、n(A×B ) = n(A )×n(B )となる。
次に、順列と組み合わせについてもまとめておく。
順列
nの階乗: n!=n・(n-1) ・(n-2)・・・・・・・ ・3・2・1
n個の異なるものを1列に並べる並べ方の総数。なお、0 ! = 1! = 1 である。
例えば、○△■なら1番目が3通り、1番目にどれか1つ選べば2番目が残りの2通り、そして最後が残る1通りで、3!=3・2・1=6となる。(○△■、○■△、△○■、△■○、■○△、■△○)
順列の数:nPr=n!/(n-r) !=n・(n-1) ・(n-2)・・・・・・・ ・(n-r + 2) ・(n-r + 1)
n個の異なるものから重複を許さずに、r個を選び出し、それを1列に並べる並び方の総数。
例えば、○△■★◎の5個から3個を選び1列に並べるなら、1番目が5通り、2番目が4通り、3番目が3通りで、5・4・3=60 (=5・4・3・2・1/(2・1)= 5!/2!=5!/(5-3) != 5P3)、つまり60通りとなる。
重複順列の数:n^r
n個の異なるものから重複を許してr個を選び出し、それを1列に並べる並べ方の総数。
○△■から5個を選び出すなら、重複が許されるため、3通り×3通り×3通り×3通り×3通り=3・3・3・3・3=3^5=243、つまり243通りとなる。
組合せの数
組合せの数:nCr=n!/{ r !・(n - r) ! } = nPr/r !
n個の異なるものの中から重複を許さずに、r個を選び出す選び方の個数。
例えば、○△■★◎の5個から3個を選ぶなら、5C3=5!/(3!・2!)=5・4/(2・1)=10となる。
{ ○△■} { ○△★} { ○△◎} { ○■★} { ○■◎} { ○★◎} { △■★} {△■◎} { △★◎} { ■★◎}
(組合せの数の直感的な理解)
組合せの数は、順列の数よりも直感的に理解することが難しいが、
①順列の数 nPr は「n個の異なるものから重複を許さずに、r個を選び出し、それを1列に並べる並び方の総数」であるから、要素の数がr個である集合の並べ方まで識別してカウントされる。(つまり、並び方を識別しない組合せの数では1個である{ ○△■} { ○■△} { △○■} { △■○} { ■△○} { ■○△} が、順列の数では異なるものとしてカウントされる。)
②そして、r個の異なるものを1列に並べる並べ方の総数は、r!個である。(3!個)
③つまり、順列の数は組合せの数のr!倍となっている。(3!倍)
④従って、組合せの数nCrは順列 nPr をr!で割った、nPr/r !となる。
と理解すればよい。
1.3 数学的確率と統計的確率
前節で説明したとおり、「コインを投げたり」、「サイコロを振ったり」、同様のことを繰り返すことが可能な行為を、試行といい、その結果、「表が出たり」、「偶数の目が出たり」する事柄を、事象という。そして、この事象の中でも、これ以上簡単にならない1つ1つの基本的な事象を、根元事象という。
この根元事象の集まりは、集合で表され、対象としているすべての根元事象(要素) a ,b ,c ・・・・から成る集合を、全事象や事象の全体といい、U ={ a ,b ,c ・・・・} で表す。
ここで、有限な全事象U の部分集合である事象A の起こる確率P (A )を、次のように定義し、これを数学的確率という。
数学的確率P (A )の定義
有限な全事象U に対して、そのすべての根元事象が同様に確からしく起こるとき、事象A の起こる確率P (A )は、
P (A ) =n (A )/n(U ) =(事象A の場合の数)/(全事象の場合の数)
で定義される。
例えば、サイコロを1回振って、「3の倍数の目が出る」事象をA とおくと、全事象U ={ 1,2 ,3,4,5,6} ,事象A ={ 3,6}で、いずれの目も同様に確からしく出るので、求める確率P (A )は、
P (A ) =n (A )/n(U ) =2/6 =1/3
となる。なお、この確率は、3回サイコロを振ったら、必ず1回は3の倍数の目が出るという意味ではない。3,000回,30,000回,・・・・と増やしていくと、ほぼ1,000回,1,000回,・・・・は3の倍数の目が出ることを示している。
次に、A =Φ(空事象)とA =U (空事象)の確率を考えてみると、
P (A =Φ)=n(Φ)/n(U ) = 0/n(U ) = 0
P (A =U )=n(U )/n(U ) = 1
となる。従って、確率P (A )は、0 ≦P (A ) ≦1の条件をみたす。
数学的確率P (A )は、事象A の場合の数n (A )を、全事象の場合の数n(U )で割ったものなので、前節で示した場合の数の計算公式と同様のものが、確率計算のための公式としても利用できる。
(1)確率の加法定理
A∩ B =Φのとき、 P (A∩B )=P (A ) + P (B )
A∩ B ≠Φのとき、 P (A∪B )=P (A ) + P (B ) - P (A∩B )
(2)余事象の確率
A∪ A ̄=U A∩ A ̄=Φであるから、
1=P (U )=P (A∪ A ̄)=P (A ) + P (A ̄)
よって、 P (A ̄) =1- P (A )
また、ド・モルガンの定理も同様に成り立ち、
P ((A ∩ B ) ̄)=P (A ̄∪B ̄)
P ((A ∪ B ) ̄)=n(A ̄∩B ̄)
となる。
さて、このようにして数学的な確率が定義されたが、実際のサイコロ(数学的な確率の定義どおりに目が出るとは限らない)で3の倍数の目がでる確率を求めるにはどうすればよいだろう。1回投げただけでは、3の倍数の目が出るか出ないかのいずれか1つなので、1回だけ投げて確率が1/3であることは確かめられない。
このような場合には、確率の値を確かめるために、試行を何回も繰り返せばよい。何千回、何万回、何億回と繰り返すうちに、現象の得られる割合は真の確率の値に近づくと経験的に考えられるからだ。(なお、この経験則は、理論的に導くことが可能で大数の法則と呼ばれる。)
このように、何回も試行を繰り返したとき、得られる事象Aの割合を統計的確率という。なお、単に「確率」という場合、通常は、数学的確率をさす。
ここで、例題に確率を当てはめてみる。なお、少々回りくどい解答であるが、抽象的な確率の概念をどのようにして具体的に適用するかを理解するのに役立つかと思う。
例題1 サイコロを2つ振って、合計が5となる確率を求めよ。
サイコロ2つを振ると同じ目がでることがある。従って、サイコロ2つを振って出る全ての目の場合の数は、6個の異なる目から重複を許して2個の目を選び出し、それを1列に並べる並べ方の総数と同じである。よって、サイコロ2つを振って出る全ての目の場合の数n(U )は、重複順列の数の求め方を用いて、
n(U ) = 6^2=6×6=36
そして、目の合計が5である事象A の全てを書きくだすと、A = {(1,4),(2,3,),(3,2),(4,1)}であり、
n(A ) =4
よって、P (A ) = n(A )/n(U ) = 4/36 = 1/9
例題2 1番~6番までの番号が書かれた6本のくじを2回引く。ただし、1回目に引いたくじはくじ箱の中に戻さない。番号の合計が5となる確率を求めよ。
1度目に引いたくじをくじ箱に戻さないのだから、1回目と2回目で同じ番号のくじを引くことはない。従って、くじを2回引く全ての番号の場合の数は、6個の異なる番号から重複を許さずに2個を選び出し、それを1列に並べる並べ方の総数と同じである。よって、くじを2回引いて出る全ての番号の場合の数n(U )は、順列の数の求め方を用いて、
n(U ) =6P2=6!/(6-2)! = 6!/4! =6×5=30
そして、くじの合計が5である事象A の全てを書きくだすと、A = {(1,4),(2,3,),(3,2),(4,1)}であり、
n(A ) =4
よって、P (A ) = n(A )/n(U ) = 4/30 = 2/15
例題3 サイコロを1個投げたとき、Aを「偶数の目のでる事象」、Bを「4以下の目の出る事象」とします。このとき、確率P(A∪B)を求めよ。
まず、
A = {2,4,6} B = {1,2,3,4} U = {1,2,3,4,5,6}
従って、
A∩B = {2,4}
ゆえに、
n(A∩B ) =2 n(U ) =6
よって、P (A∩B ) = n(A∩B )/n(U ) = 2/6 = 1/3
例題4 中の見えない袋の中に、黒玉が3つ、白玉が7つ入っている。この袋から無作為に玉を1つ取り出したとする。その玉が黒玉である確率を求めよ。
(間違い)
取り出した玉は黒か白なので、U = {●,○} B = {●} W = {○}
ゆえに、
n(B ) =1 n(U ) =2
よって、P (B ) = n(B )/n(U ) = 1/2 ×
(正しい答え)
取り出した1個の玉は黒か白ではあるが、中の見えない袋の中から無作為に取り出した1個である。
従って、無作為に取り出す確率を考える必要がある。
黒玉が3つで、白玉が7つの計10個の玉が中の見えない袋の中に入っているのだから、
U = {1,2,3,4,5,6,7,8,9,10} B = {1,2,3} W = {4,5,6,7,8,9,10}
とする。
ゆえに、
n(B ) =3 n(U ) =10
よって、P (B ) = n(B )/n(U ) = 3/10
1.4 条件付き確率と事象の独立
事象Aが起こったという条件の下で事象Bの起こる確率を、AのもとでBの起こる条件付き確率といい、P (B |A ) で表す。
もう少しわかりやすく言うと、P (B |A ) とは事象A を全体と考えたときに、事象B の起こる確率のことを表す。
図で表すと、濃い緑の部分で、薄い緑の部分を割って得られた値が条件付き確率P (B |A )となる。ただし、薄い緑の部分は濃い緑の部分に含まれているものとする。
このことから、AのもとでBの起こる条件付き確率P (B |A ) は、
P (B |A ) = P (A ∩ B )/P (A )
と公式化される。
さて、これを10本のうち2本の当たりがあるくじをAさん、Bさんの順に1本ずつ引く例に当てはめてみる。なお、引いたくじを戻さないものとする。Aさんが当たりを引く事象をA、Bさんが当たりを引く事象をB、とする。この場合、P (B |A )は、A が起こったという条件のもとで、B が起こる確率であるため、「Aさんが当たりを引いた後に、Bさんがくじを引く時に当たりを引く確率」ということになる。なお、P (A ∩ B )はAさんが当たりを引き、さらにBさんが当たりを引くという事象A、事象B がともに起こる確率を意味し、事象A、事象B の同時確率という。(同時といってもAさんとBさんが同時にくじを引くことを意味しないことに注意)
実際に値を求めてみると、P (A ∩ B ) = 2/10 × 1/9 = 1/45 P (A ) = 2/10 = 1/5 P (B |A ) = P (A ∩ B )/P (A ) = 1/45 ÷ 1/5 = 1/9となる。なお、P (A ∩ B )を求めた際の 2/10 × 1/9 は、Aさんが当たりを引く確率が2/10(10本のうち2本が当たり)、Bさんが当たりを引く確率1/9(Aさんが当たり引いた後なの、9本のうち1本が当たり)と考えて計算しているが、「Bさんが当たりを引く確率」というのが、まさに「Aさんが当たりを引いた後に、Bさんがくじを引く時に当たりを引く確率」であり、条件付き確率P (B |A )を用いて計算している。これは、条件付き確率の公式の両辺にP (A ) を乗ずると得られる式を直観的に用いているが、この式を確率の乗法定理という。
P (A ∩ B ) = P (A )P (B |A ) ・・・・・・ 乗法定理
条件付き確率P (B |A )とは、「事象Aが起こるという条件のもとで事象Bが起こる」確率を表す。また、P (B )は、「単に事象Bが起こる」確率を表す。
ここで、AとBが関係しなければ、Aが起ころうと起こるまいと、Bの起こる確率には関係ないはずである。そこで、2つの事象A、Bが関係しないことは、次のように表現できる。
P (B |A ) =P (B )
これが2つの事象A、Bの独立を表す式となり、これが成立しないとき、2つの事象A、Bに関係があることになり、事象A、Bは従属するという。
さて、この式を乗法定理に代入すると、次の公式が得らる。
P (A ∩ B ) = P (A )P (B) ・・・独立事象の乗法定理
これを独立事象の乗法定理といい、2つの事象A、Bの独立を確認する際にはこの式が用いられることが多い。
1.5 確率変数と確率分布
サイコロの目のように、確率的に値が決まる変数を確率変数という。
また、確率変数のとる各値に対応して、それらが起こる確率が与えられるとき、その対応を確率分布という。この対応が表されている表を、確率分布表という。
例えば、サイコロの目は確率変数なので、これをXとする、確率分布表は次のようになる。
X 1 2 3 4 5 6
確率 1/6 1/6 1/6 1/6 1/6 1/6
あるいは、コインを振って表が出るか裏が出るかも確率変数なので、同様に、
X 表 裏
確率 1/2 1/2
となる。
1.6 平均値、分散及び標準偏差
確率変数と確率分布が与えられたとき、平均値と分散、標準偏差を考えることができる。平均値(期待値とも呼ばれる)とは、確率変数における平均的な値を、分散は平均からの「散らばり具合」を表現する値である
確率変数Xの分布が次のように与えられているものとする。
このとき、確率変数Xの平均値μと分散σ^2、標準偏差σは、次の公式で示される。
平均値: μ=x1p1+x2p2+x3p3+・・・+xnpn
分散: σ^2=(x1-μ)^2・p1+(x2-μ)^2・p2+・・・+(xn-μ)^2・pn
標準偏差: σ=√(σ^2)
(例)サイコロを1個投げたとき、出る目Xの平均値と分散、標準偏差を求める。
1.5の確率分布表より、
平均値μ=1×1/6+2×1/6+3×1/6+4×1/6+5×1/6+6×1/6=21/6=3.5
分散σ^2=(1-3.5)^2×1/6+(2-3.5)^2×1/6+(3-3.5)^2×1/6+・・・+(6-3.5)^2×1/6=35/12≒2.9
標準偏差σ=√(35/12)≒171