数学と物理学のブログ

本業から離れて、趣味である数学と物理学について書きます。

Pythonで量子力学の軌跡解釈に基づく二重スリットシミュレーション

Python量子力学の軌跡解釈に基づく二重スリットシミュレーション

昔、エクセルのVBAでやったときは随分苦労しましたけど、Pythonを使うとめちゃくちゃ簡単ですね。
ちなみに昔やったときのです→
アマリュアリズムの量子力学-ボーム力学(二重スリット1)

Pythonでやるとたった、1時間程度でプログラミングができました。また、グラフ化が容易にできるのが便利です。

これを動かすと、干渉模様が表示されます。(ノートPCで5分くらいです)

f:id:sr-memorandum:20190914150723p:plain

f:id:sr-memorandum:20190914153505p:plain

f:id:sr-memorandum:20190914154235p:plain

動画にしてみました。
youtu.be


import math as m
import random
import matplotlib.pyplot as plt
class Functions:
def __init__(self,b):
self.b=b
self.dt=0.01
self.maxt=50
def func1(self,y):
return m.exp(-(y*y+self.b*self.b)/2)*(m.exp(self.b*y)+m.exp(-self.b*y)+2)
def func2(self,t,y):
sigy=4*(1+t*t/4)
aa=2*self.b/sigy
bb=self.b*t/sigy
py0=y*t/sigy
py1up=-2*aa*m.sin(2*bb*y)+bb*(m.exp(-2*aa*y)-m.exp(2*aa*y))
py1down=m.exp(-2*aa*y)+m.exp(2*aa*y)+2*m.cos(2*bb*y)
py=py0+py1up/py1down
return(y+py*self.dt)
def y0set(self):
ramy=1
z=0
while ramy>z:
ramx=random.uniform(self.b-3,self.b+3)
z=self.func1(ramx)
ramy=random.uniform(0,1)
return ramx
def objuction(self):
yi=self.y0set()
t=0
while t
for i in range(10000):
if random.randint(0,1)==0:
f=Functions(7)
else:
f=Functions(-7)
datasx.append(f.objuction())
datasy=
for i in range(10000):
datasy.append(random.uniform(0,1))

fig=plt.figure()
ax = fig.add_subplot(1,1,1)
ax.scatter(datasx,datasy,s=1)
fig.show()

ちなみ、軌跡解釈では二重スリットのいずれか1つのスリットに粒子を通しただけでも、干渉が現れるという結果を得ることができます。

量子力学の軌跡解釈のガウス関数への適用

量子力学の軌跡解釈のガウス関数への適用

量子力学の軌跡解釈(ボーム力学)の概要 から数式を引用することがありますが、その場合は「概要(3)式」のように表記します。

1.ガウス波束

位置x=x_0を中心とし、運動量の平均がћk_0(k_0は波束を表します)で、位置の広がりがΔxである一元のガウス波束の波動関数Ψ_0は、

    Ψ_0 ∝\int_{-∞}^{∞}exp{{-(k-k_0)^2(Δx)^2+ik(x-x_0)}}dk       (1)

となります。なお、概要(5)式で定義されたように量子ポテンシャルは、

    Q(x,t)≡- \frac{ℏ^2}{2m} \frac{∇^{2} R(x,t)}{R(x,t)}   (2)

という形なので、規格化定数に依存しないため、比例関係(∝)だけを用いて記載しています。
式(1)の形から明らかなように、これは自由粒子の運動量ћkの固有状態φ_k=exp(ikx)をすべて重ね合わせた波動関数です。固有状態の重ね合わせであることを、強調して記載するなら、c_k=exp{-(k-k_0)^2(Δx)^2-ikx_0}とし、k積分Σで置き換えれば、

    Ψ_0 ∝\sum_{k}c_kφ_k    (3)

となります。
さて、自由粒子の質量をmとすれば、運動量ћkの固有状態φ_k=exp(ikx)のエネルギーはE_k=ћ^2k^2/2mとなります(定常状態のシュレディンガー方程式に代入すれば直ちにわかります)。
従って、時間に依存する重ね合わせの状態(非定常状態)は、

    ψ(x,t) ∝ \sum_{k}c_kφ_kexp(-iE_kt/ћ)=\sum_{k}c_kφ_kexp(-iћk^2t/2m)    (4)

再び、Σ積分に置き換えると、

    ψ(x,t) ∝\int_{-∞}^{∞}exp{{-(k-k_0)^2(Δx)^2+ik(x-x_0)-iћk^2t/2m}}    (5)

となります。
式(5)の積分を計算するためには、

    \int_{-∞}^{∞}exp{-a^2x^2+ibx}dx=\frac{\sqrt{π}}{a}exp(- \frac{b^2}{4a^2})   (6)

という公式を用います。すると

ψ(x,t)∝exp(-k_0^2(Δx)^2)\frac{\sqrt{π}}{\sqrt{(Δx)^2+iћt/2m}}exp{-\frac{(x-x_0-2ik_0(Δx)^2)^2}{4((Δx)^2+iћt/2m)^2}}
=\frac{\sqrt{π}exp(-k_0^2(Δx)^2)}{\sqrt{(Δx)^2+iћt/2m}}exp{-\frac{(x-x_0)^2(Δx)^2-2tћk_0(x-x_0)(Δx)^2/m-4k_0^2(Δx)^6}{4((Δx)^4+ћ^2t^2/4m^2)}}
× exp{-i\frac{2ћk_0^2t(Δx)^4/m-(x-x_0)^2ћt/2m-4k_0(x-x_0)(Δx)^4}{4((Δx)^4+ћ^2t^2/4m^2)}}    (7)

のようになります。

さて、この式(7)を、概要(5)式及び概要(12)式

    ψ(x,t)≡R(x,t)exp(i\frac{S(x,t)}{ℏ})    (8)(概要(5)式)

    \boldsymbol{v}=\frac{1}{m}∇S(x,t)    (9)(概要(12)式)

に当てはめて、式(2)の量子ポテンシャルと運動量を求めます。
まず、式(7)は3つの因子の積からなっていますが、第1因子は、式(9)により運動量(mv)を求める場合も、式(2)により量子ポテンシャルを求める場合にも、無視して差し支えない項です。
その理由は、

    (Δx)^2+iℏt/2m=rexp(iθ)  (rとθはいずれも、実数とする)    (10)

とおけば、tanθ=\frac{iℏt}{2m(Δx)^2}r=\sqrt{(Δx)^4+ℏ^2t^2/4m^2}となり、式(7)に当てはめれば、

    R=\frac{\sqrt{π}exp(-k_0^2(Δx)^2)}{((Δx)^4+ℏ^2t^2/4m^2)^{1/4}}exp{-\frac{(x-x_0)^2(Δx)^2-2ћk_0(x-x_0)(Δx)^2/m-4k_0^2(Δx)^6}{4((Δx)^4+ћ^2t^2/4m^2)}} (11)

    S=-\frac{2ћk_0^2t(Δx)^4/m-(x-x_0)^2ћt/2m-4k_0(x-x_0)(Δx)^4}{4((Δx)^4+ћ^2t^2/4m^2)}-θ/2     (12)

となり、xに依存しない式(7)の第一因子は、運動量と量子ポテンシャルの計算結果に関係しないからです。

まず、計算が簡単な運動量を、式(9)により求めると、

    p=\frac{(x-x_0)ћt+4k_0((Δx)^4m}{4(Δx)^4+ћ^2t^2/m^2}    (13)

続いて、量子ポテンシャルを式(2)により求めると、

    Q=\frac{1}{m}{\frac{(Δx)^2-2(Δx)^4(x-x_0-ћk_0t/m)^2}{(4(Δx)^4+ћ^2t^2/m^2)^2}}    (14)

となります。
さて、式(13)は、時刻t=0x_0を中心とするΔxの中、つまりx_0-Δx/2≦x_1≦x_0+Δx/2という領域内に粒子があった場合に、その後ガウス波束の影響を受ける粒子の運動量を表しています。そして、ћk_0は、ガウス波束自体の運動量となります。
例えば、x_0=0、k_0=0.2、Δx=1、m=1、ћ=1(ハートリー原子単位系では、ћ=電子の質量=電子の電荷=光の速さ=ボーア半径=1となり、電子と同じ質量の粒子の運動を表す)とした場合に、t=0xの初期値を与えて運動の様子を表すと図1のようになります。

f:id:sr-memorandum:20190909201259p:plain

図1を見るといずれの軌道もある程度時間が経過すると、一定の速度の収束することがわかりますが、このことは、式(13)を解けば容易に理解できます。
m=1としているので、運動量は速度と等しくなるため、式(13)は、

     \frac{dx}{dt}=\frac{(x-x_0)t+4k_0(Δx)^4}{4(Δx)^4+t^2}    (15)

という微分方程式になります。式(15)は、このままでは変数分離形にはなりませんが、特殊解としてx=k_0t+x_0が簡単に求まります。
これは、図1で初期値がx=0.0の場合に相当し、x=k_0t+x_0+f(x)とおいて、式(15)に代入すると、f(x)が求まり、

    x=c_1\sqrt{(t^2+4(Δx)^4)}+k_0t+x_0    (c_1は定数)   (16)

となります。
ここで、再び式(16)を微分すると、

    \frac{dx}{dt}=\frac{c_1t}{\sqrt{(t^2+4(Δx)^4)}}+k_0    (17)

となり、4(Δx)^4<<t^2では、

    \frac{dx}{dt}=c_1+k_0    (18)

なので、tが大きくなれば、速度が一定になることがわかります。
さて、t=0での粒子の位置x_1を初期条件として与えると、式(17)は定数c_1が求まりますので、

    x=\frac{(x_1-x_0)}{2(Δx)^2}・\sqrt{(t^2+4(Δx)^4)}+k_0t+x_0    (19)

となり、速度は、

    \frac{dx}{dt}=\frac{x_1-x_0}{2(Δx)^2}・\frac{t}{\sqrt{t^2+4(Δx)^4}}+k_0    (20)

となります。そして、4(Δx)^4<<t^2では、

    v=\frac{dx}{dt}≈\frac{x_1-x_0}{2(Δx)^2}+k_0     (21)

となります。ここで、x_1=x_0+Δx/2の場合とx_1=x_0-Δx/2の場合のvの差Δvを求めると、

    Δv≈1/2Δx       ∴ΔvΔx≈1/2

また、m=1であることから、

    ΔpΔx≈1/2

となりますが、これは不確定性原理を表しています。ガウス波束は、そもそもΔpΔx=1/2が成り立つものとして定義されていますが、軌跡解釈を介しても同様な結果が得られます。
ここで、注意しなければならないのは、ここでいう初期値は理論上利用できますが、実際に測定して知ることができないということです。我々は、一定の範囲Δxのどこかに粒子が実在するということは言えても、それがΔxのどこであるを実際に知ることができず、それゆえに式(19)によっても、その後の粒子の位置を特定することはできません。こういう意味で、軌跡解釈は古典力学と同じように因果的ですが決定論的ではないということができます。

2.ガウス波束の収縮

ガウス波束の量子ポテンシャルは(14)で与えられ、一見すると非常に複雑な形をしていますが、これを実際にグラフで表してみると、図2及び図3のような単純な形をしています。

f:id:sr-memorandum:20190909212954p:plain
f:id:sr-memorandum:20190909213024p:plain

図2は、k_0=0の場合ですが、量子ポテンシャルの極大値が、時間とともに小さくなっていき徐々に平坦になっていることがわかります。これは、最終的にポテンシャルが一定となり、速度が一定の値に収束するという、式(18)の結論と一致するものです。なお、t=0xの絶対値が大きいと量子ポテンシャルの勾配も非常に大きくなっていますが、粒子は-Δx/2≦x1≦Δx/2の範囲にあるため、その影響を受けることはありません。

さて、量子ポテンシャルを表す、式(14)は、

    Q=\frac{1}{m}{\frac{(Δx)^2-2(Δx)^4(x-x_0-ћk_0t/m)^2}{(4(Δx)^4+ћ^2t^2/m^2)^2}}    (14)

で、これは位置と時間の関数になっていて、粒子の軌道を与えればその粒子が任意の時間にある位置の量子ポテンシャルを与えることができます。つまり、式(19)のxを代入すれば、t=0x=x1にあった粒子が、任意の時間で影響を受ける量子ポテンシャルを求めることができ、

    Q(t)=\frac{(Δx)^2-x_1^2/2}{4(Δx)^4+t^2}    (22)

となります。同様にして、運動量(=速度:質量=1のため)も求まり、

    P(t)=\frac{x1-x0}{2(Δx)^2}・\frac{t}{\sqrt{t^2+4(Δx)^4}}+k_0   (23)

となり、これは式(20)と同じになります。この結果を、量子的なハミルトン-ヤコビ方程式である概要(14)式と概要(17)式に代入すると、任意の時間におけるエネルギーを求めることができ、

    E=-\frac{∂S}{∂t}=\frac{(∇S)^2}{2m}+V+Q=P(t)^2/2+Q(t)

\frac{1}{2}{\frac{(x_1-x_0)^2}{4(Δx)^4}\frac{t^2}{t^2+4(Δx)^4}+k_0^2+\frac{x_1-x_0}{(Δx)^2}\frac{k_0t}{\sqrt{t^2+4(Δx)^4}}}+\frac{(Δx)^2-x_1^2/2}{t^2+4(Δx)^4}

となりますが、ここで、t→∞とすると、

    E→\frac{1}{2}{\frac{(x_1-x_0)^2}{4(Δx)^4}+k_0^2+\frac{x_1-x_0}{(Δx)^2}k_0}=\frac{1}{2}{\frac{x_1-x_0}{2(Δx)^2}+k_0}^2   (24)

となります。このことは、速度が式(21)に従い一定となり、t→∞で量子ポテンシャルも→0になることからも当然の帰結です。しかし、連続的な変化でエネルギーが一定の状態になるというのは、非定常状態が連続的変化で定常状態に変化することを意味しており、標準解釈で波束の収縮に該当するものです。なお、ここでは敢えてエネルギーを用いましたが、運動量固有状態についても同様なことが言え、式(21)(m=1なので、速度と運動量は同じ)がこれを表しています。
標準解釈との違いをもう少し詳しく説明すると、ガウス波束式をΣを用いて記述すると、

     ψ(x,t) ∝ \sum_{k}c_kφ_kexp(-iE_kt/ћ)=\sum_{k}c_kφ_kexp(-iћk^2t/2m)    (25)

となります。標準解釈ではこれをψ_k状態の重ね合わせの状態とし、運動量の測定によりある1つの状態ψ_sに収縮すると考えます。この時、収縮の過程は、射影演算子により行われる非因果的で非連続的な変化とされ、測定をする直前までの状態は式(25)のままであるとされます。
これに対して、軌跡解釈は、どこにあるかはわからないにしても、図1のような軌道のどれかに粒子が実在しているものと考えます。そして、ある程度の時間(原子単位系では、t=1は光がボーア半径を移動する時間(a0/c)である)が経過すれば、式(21)により運動量(=速度)は一定の値にほとんど収束しており、観測する直前においても状態はψ_sであると考えることができ、非因果的で非連続な変化を避けることができます。さて、そうすると軌跡解釈では標準解釈でいう干渉のような現象が起こらないのかというと、そうではありません。図1で言えば、軌道が直線となっていない領域では、他の運動量固有状態との干渉が起きていると考えることができます。そして、各軌道が位置的に徐々に分離していくにつれて、干渉による効果が徐々に小さくなっていくのです。

量子測定理論~フォン・ノイマンの測定過程理論

量子測定理論~フォン・ノイマンの測定過程理論

1.はじめに

粒子の生成・消滅のような適用範囲でないものを除き、量子力学が自然界で起こり得るあらやる事柄の完全な記述を与えることができるのであれば、量子的な測定の過程もまた、測定装置の波動関数と測定されている系の波動関数によって記述されます。この量子力学的な測定過程は、フォン・ノイマンによって数学的な取扱いがなされています。

2.量子系の相互作用

事前準備として、次のような条件の下での量子系の相互作用を定義します。
まず、量子系Aと量子系Sが、相互作用せずにそれぞれハミルトン演算子H_AH_Sにより、シュレディンガー方程式に従って時間発展しているものとします。
この場合、全体のハミルトン演算子Hは、

      H=H_A+H_S=H_A(y)+H_S(x)    (1)

となります。ここで、、H_Aを変数yだけの関数、H_Sを変数xだけの関数として表していることは、量子系Aと量子系Sには相互作用が無いことを意味しています。
次に、量子系Sの波動関数は、シュレディンガー方程式の解からなる直交関数系ν_m(x)によって展開されるものとします。

     ψ_S=\sum_{m}C_m(t)ν_m(x)      (2)
     (C_m(t)は未知の複素関数

量子系Aと量子系Sが相互作用を始めると、ハミルトン演算子に第三項が現れます。これを、H_I(x,y)と表すと、

     H=H_A(y)+H_S(x)+H_I(x,y)    (3)

となります。
さて、ここまでは全く近似を使っておらず、式(3)を用いてシュレディンガー方程式を解けば厳密解を得ることができます。しかし、ここで数学的な取扱いを簡単にするために、

     H_A(y),H_S(x) << H_I(x,y)     (4)

という近似を用いることとします。従って、相互作用が生じている際のハミルトン演算子は、

      H≈H_I(x,y)     (5)

となります。この近似は、相互作用が非常に強いことを意味しています。

3.量子系の相関

量子系Aと量子系Sというアルファベットを用いたことから、察しの良い方は予想していたと思いますが、量子系Aは測定装置(apparatas:装置)の深針、量子系Sは測定される系(system:系)を表しています。測定が行われるためには、対象となる物理量を量子系Sの波動関数から量子系Aの波動関数へと相関させ(量子系Sの波動関数の違いを量子系Aの波動関数で表すこと)、何等かの方法で量子系Aの差異を古典的に見える形式(メーターや写真乾板上の点など)にする必要があります。ここではまず、測定される系と測定装置を相関させるための相互作用を数式化します。
 相互作用の間、系Sが変化する可能性が2つあります。1つは、相互作用の間にも測定する物理量がシュレディンガー方程式によって変化すること、もう1つは、測定装置との相互作用による変化です。古典力学で考えてみてもわかるように、測定の間に変化する系を取扱うのは困難です。そこで、この変化を無いものとするために、相互作用に一定の条件を付けます。
1つは、式(5)で、もう1つはこの相互作用を極短時間とすることです。これにより相互作用の間、相互作用とは独立に生じるH_A(y)H_S(x)によるシュレディンガー方程式の変化を無視することができます。このような相互作用を衝突的相互作用ということにします。しかし、このような衝突的相互作用だけでは、相互作用自体によって測定しようとする変数にもたらされる変化は回避することができません。そこで、H_Iを次のようなものに設定することにします。
 まず、測定対象となるオブザーバブル演算子Mで表し、この演算子固有値m、固有関数ν_m(x)であるとします。つまり、

     Mν_m(x)=mν_m(x)     (6)

です。
量子系Aと量子系Sを相関させ、オブザーバブルMを量子系Sの波動関数に反映させるためには、H_Iyに依存すると同時に、少なくともMに関係していることが必要となります。ここで、H_IMが対角的である同じ表示でやはり対角的であるように選ぶと、mのひとつの値から他の値への遷移に対応するマトリックス要素は零になります。このことは、相互作用がどんなに強くても、Mは全く変化しないことを意味しています。相互作用をこのように設定することで、相互作用自体によって観測しつつある変数にもたらされる変化も回避できます。このようなH_Iを、

     H_I=H_I(M,y)      (7)

と表すことができ、Myだけの関数となります。
また、量子系Sの波動関数は相互作用の間に変化しないことが前提とされたことにより、式(2)は相互作用の間は、

     ψ_S=\sum_{m}C_mν_m(x)     (8)
     (C_mは未知の複素数

となり、時間に依存しなくなります。

4.シュレディンガー方程式の適用

それでは、相互作用している間のシュレディンガー方程式を量子系Aと量子系Sの結合系について解きます。
まず、結合系の波動関数は量子系Aの波動関数ψ_A=ψ_A(y,t)とすると、

     ψ(x,y,t)=ψ_Aψ_S=\sum_{m}C_mψ_A(y,t)ν_m(x)    (9)

となります。
すると、シュレディンガー方程式は、

     iћ\sum_{m}C_m(∂ψ_A(y,t)/∂t)ν_m(x)=\sum_{m}C_mH_I(M,y)ν_m(x)ψ_A(y,t)=\sum_{m}C_mH_I(m,y)ν_m(x)ψ_A(y,t)   (10)

となります。なお、H_I(M,y)ν_m(x)=H_I(m,y)ν_m(x)となるのは、式(6)によります。

ここで、式(10)の両辺にν_r(x)を乗じて、xについて積分するとν_m(x)が直交関数系であることから、

     iћ(∂ψ_A(y,t)/∂t)=H_I(r,y)ψ_A(y,t)     (11)

となります。この式(11)は、測定装置である量子系Aの波動関数ψ_A(y,t)が、系Sの各固有値rによって、それぞれ相異なる状態の変化を受けるということを意味しています。この測定装置の変数yMという2つのオブザーバブルの相関こそが、相互作用を測定に利用するためポイントとなります。

さて、相互作用がt=0で始まったとすると、式(11)の解は形式的に、

     ψ_A(y,t;r)=exp(-it/ћ・H_I(r,y))ψ_A(y,0)    (12)

と表すことができ、系Sの各固有値rの値によってψ_Aの時間的発展に違いが生じることがわかります。この式(12)を式(9)に代入すると、結合系の波動関数は、

      ψ(x,y,t)=ψ_Aψ_S=\sum_{m}C_mψ_A(y,t)ν_m(x)=\sum_{m}C_mψ_A(y,t;m)ν_m(x)    (13)

となります。このことは、相互作用により各固有状態ν_m(x)に応じて、

     ψ_A(y,t)ν_m(x)  ⇒  ψ_A(y,t;m)ν_m(x)

と時間発展することを意味しています。従って、量子系Sがψ_S=ν_m(x)というように固有状態であった場合は、

     ψ_A(y,t) ⇒ ψ_A(y,t;m)

というように量子系Aの波動関数ψ_Aが変化するが、式(8)のように量子系Sがオブザ-バブルMについて重ね合わせの状態である場合には、結合系においてもその重ね合せが維持されることとなります。そのため、量子系Aと相互作用により相関させたとしても、オブザ-バブルMの物理量を得ることはできません。

ここでは、測定装置を敢えて量子系Aとましたが、フォン・ノイマンの取扱いでは測定装置は量子系ではなく、古典的な測定装置とされ、波動関数ガウス波束のような波束であるとされています。そして、そのような古典的な系だからこそ、当然に確定的な測定値が得られることが前提とされています。このことは、量子系と古典的な測定装置の相互作用により、波束の収縮が起こることを意味しています。つまり、式(8)のような重ね合わせの状態にある量子系Sの波動関数は、相互作用が起こると、

     \sum_{m}C_mν_m(x) ⇒ ν_r(x)

というように、特定の状態ν_r(x)に変化することが前提となっています。なお、「量子系と古典的な測定装置の相互作用により波束の収縮が起きる」というのは仮説であり、相互作用によって波束の収縮が起こる過程については、これまでの考察では何も説明されていません。

4.相互作用の連鎖

測定装置は我々が目に見える形で物理量を表すのだから、古典的な系であることに違いはありません。しかし、そのような測定装置も結局は量子系の集合なのだから、量子系と古典系の直接的な相互作用を前提とせず、量子系と量子系の相互作用の集合として測定過程も説明されると考えるのが自然です。そこで、次のような相互作用の連鎖を考えてみます。
まず、測定される系をこれまでと同様に量子系Sとし、これを量子系A1と相互作用させる。ここでも、相互作用は衝撃的相互作用H_{I1}=H_{I1}(M,y_1)であり(量子系A1の変数をy_1とする)、相互作用が起こっている間、系Sと系A1のそれぞれに固有のハミルトニアンH_{A1}(y_1),H_S(x)は無視でき、H_{I1}(M,y_1)はやはりMが対角的である同じ表示でやはり対角的であるものとします。そして、この相互作用の起こる時間を⊿tとする。すると、t=⊿tにおける結合系の波動関数は、

     ψ(x,y_1,⊿t)=\sum_{m}C_mψ_{A1}(y1,⊿t;m)ν_m(x)    (14)

となります。
続いて、t=⊿tに系Sと系A1の相互作用が終ると同時に、系A1と系A2に同じような衝撃的相互作用H_{I2}=H_{I2}(M(y_1),y_2)を開始するものとします。(M(y_1)は、y_1を変数とする波動関数に作用する演算子という意味)相互作用H_{I1}の場合と同様にH_{I2}が作用する間は、系A1の波動関数の変化は無視できるものとします。従って、系Sと系A1の結合系の波動関数は、

     ψ(x,y_1)=\sum_{m}C_mψ_{A1}(y_1;m)ν_m(x)     (15)

となります。そして、系A2の波動関数ψ_{A2}(y_2,t)とすれば、系Sと系A1及び系A2の結合系の波動関数は、

     ψ(x,y_1,y_2,t)=ψ_{A2}ψ(x,y_1)=\sum_{m}C_mψ_{A2}(y_2,t)ψ_{A1}(y_1;m)ν_m(x)

となります。そして、この結合系に衝突的相互作用H_{I2}=H_{I2}(M(y_1),y_2)のみが作用している間のシュレディンガー方程式は、

     iћ\sum_{m}C_m(∂ψA_2(y_2,t)/∂t)ψ_{A1}(y_1;m)ν_m(x)=\sum_{m}C_mH_{I2}(M(y_1),y_2)ψ_{A1}(y_1;m)ν_m(x)ψ_{A2}(y_2,t)  (16)

であり、ν_r(x)を両辺に乗じてx積分すれば、ν_m(x)が直交関数系であることより、

     iћ(∂ψ_{A2}(y_2,t)/∂t)ψ_{A1}(y_1;r)=H_{I2}(M(y_1),y_2)ψ_{A1}(y_1;r)ψ_{A2}(y_2,t)   (17)

ここで、M(y_1)ψ_{A1}(y_1;m)=mψ_{A1}(y_1;m)であると仮定すれば、H_{I2}(M(y_1),y_2)ψ_{A1}(y_1;r)=H_{I2}(r,y_2)ψ_{A1}(y_1;r)であるため、両辺からψ_{A1}(y_1;r)を落とすことができ、

     iћ(∂ψ_{A2}(y_2,t)/∂t)=H_{I2}(r,y_2)ψ_{A2}(y_2,t)     (18)

となります。この式(18)は、式(11)と同様に、系A1の各固有値rに応じてψ_{A2}(y_2,t)が異なる時間的発展をすることを意味しており、式(12)と同様に形式的な解は、

     ψ_{A2}(y_2,t;r)=exp(-it/ћ・H_{I2}(r,y))ψ_{A2}(y_2,0)     (19)

となり、結合系の波動関数ψ(x,y_1,y_2,t)は、

     ψ(x,y_1,y_2,t)=ψ_{A2}ψ(x,y_1)=\sum_{m}C_mψ_{A2}(y_2,t;m)ψ_{A1}(y_1;m)ν_m(x)   (20)

となります。

さて、このようにして同様の相互作用を系A3・系A4・系A5・系A6・系A7・系A7・・・・・・・・系ANというように、どんどん衝突的相互作用を連鎖させていくと、結合系全体の波動関数は、

      ψ(x,y_1,・・y_N,t)=\sum_{m}C_mψ_{AN}(y_N,t;m)・・ψ_{A2}(y_2;m)ψ_{A1}(y_1;m)ν_m(x)   (21)

となることがわかるかと思います。このことは、系Sの重ね合わせの状態が、後続の量子系にどこまでも先送りされることを意味し、測定結果が得られないことを示しています。フォン・ノイマンは、この矛盾を回避するために、最終的には重ね合わせの状態が人間の意識に伝わる直前まで押しやられ、意識と相互作用することにより波束の収縮が起こると解釈しました。つまり、測定装置から人間の感覚器官、さらには神経、脳・・にまで重ね合わせの状態は維持されると考えたのです。(「・・・」は身体と意識の意識の接点までを表します。これがどこなのか、今のところ判っていません。恐らく、判ることも無いと思います。なお、この解釈を受け入れると、そのままシュレディンガーの猫のパラドクスも解決されます。)

このフォン・ノイマンの解釈よりも、ある程度受け入れやすい別の解釈も存在します。誰が考えたか知りませんが、私が有力だと思う解釈を最後に紹介します。

まず、式(21)の形式からわかるように、ψ_{AN}(y_N,t;m)・・ψ_{A2}(y_2;m)ψ_{A1}(y_1;m)という波動関数の積うち、どれか1つがある状態に確定すれば(波束の収縮を起こせば)、他の波動関数が収縮を起こさなくともψ(x,y_1,・・y_N,t)は確定した状態となり測定結果が得られることがわかります。つまり、ψ_{A10}(y_{10};s)≠0ψ_{A10}(y_{10};n)=0(n≠s) となれば、ψ(x,y_1,・・y_N,t)=C_sψ_{AN}(y_N,t;s)・・ψ_{A2}(y_2;s)ψ_{A1}(y_1;s)ν_s(x)ということです。一方、測定装置というのは非常に多くの量子系から構成されており、式(21)で表そうとすれば、Nは非常に大きな数になります。
ここで、「波動関数は非常に小さな確率で、自律的に波束の収縮を起こす」と仮定します。これまで、量子系の相互作用を考察して来ましたが、このような相互作用とは無関係に、自ら起こるというのが自律的という意味です。そうすると、Nが非常に大きければ、自律的な収縮の起こる確率が非常に低くても、ψ_{AN}(y_N,t;m)・・ψ_{A2}(y_2;m)ψ_{A1}(y_1;m)のどこかで自律的な収縮を起こすことは十分にあり得ます。すると、式(21)の多重的な構造から ψ(x,y_1,・・y_N,t)についても波束の収縮が起こり観測値が得られることになります。

量子力学の軌跡解釈(ボーム力学)の概要

量子力学の軌跡解釈(ボーム力学)の概要1

1.はじめに

量子力学の軌跡解釈は、「ボーム力学」「存在論的解釈」「因果的解釈」「ドプロイ・ボーム解釈」等と呼ばれていますが、「隠れた変数の理論」としてあまり重要視されてていません。中には、既に否定された解釈と思い込んでいる人もいます。
しかし、軌跡解釈のような「隠れた変数の理論」は必ずしも否定されているとはいえず、一定の条件を課すことで、コッヘン・スペッカーの定理やベルの定理とも整合することができます。また、D.Borm も『THEUNDIVIDED UNIVERSE 』で述べているように、理解しやすさという点で標準解釈より優れた解釈になる可能性もあります。
なお、このような理解しやすさという利点から、分子動力学の分野では量子軌跡法という計算ツールとして軌跡解釈は用いられています。
この軌跡解釈の概要を運動学(電磁場を用いない)に限定し、私なりにまとめます。

2.シュレディンガー方程式の変形

軌跡解釈はシュレディンガー方程式

 -iℏ \frac{∂}{∂t}ψ(x,t) =\frac{ -ℏ^{2} }{2m}∇^{2}ψ(x,t)+V(x,t)ψ(x,t)     (1)

を変形するところから、スタートします。
シュレディンガー方程式(式(1))に、

ψ(x,t)≡R(x,t)exp(i\frac{S(x,t)}{ℏ})   (2)

を代入します。なお、R(x,t)及びS(x,t)は式(2)で定義される新たな実数の関数です。
すると、次のような2つの式が得らます。

 \frac{∂R(x,t)}{∂t}=- \frac{1}{2m} {R(x,t)∇^{2}S(x,t)+2∇R(x,t)・∇S(x,t)}    (3)


 \frac{∂S(x,t)}{∂t}=- \frac{1}{2m} {(∇S(x,t))^{2}-ℏ^2 \frac{∇^{2} R(x,t)}{R(x,t)}}-V(x,t)   (4)

ここで、次のような量子ポテンシャルという量を定義します。

Q(x,t)≡- \frac{ℏ^2}{2m} \frac{∇^{2} R(x,t)}{R(x,t)}   (5)

すると、式(4)は次のように表せます。

 \frac{∂S(x,t)}{∂t}=- \frac{1}{2m} (∇S(x,t))^{2}-Q(x,t)-V(x,t)   (6)

式(6)で古典極限をとり、 ℏ⇒0 とした場合、式(5)より、 Q⇒0 となることから、


 \frac{∂S(x,t)}{∂t}=- \frac{1}{2m} (∇S(x,t))^{2}-V(x,t)   (7)

これを古典力学における、ハミルトン=ヤコブ方程式とみなすと、一連のシュレディンガー方程式の変形式を違った視点で見ることができます。
つまり、ここでS(x,t)をハミルトンの主関数W(x,t)と等しいものと仮定すると、運動量 \boldsymbol{p}を、

 \boldsymbol{p} =∇W=∇S   (8)

とすることができ、式(8)を式(6)に代入すると、

 \frac{∂S(x,t)}{∂t}=- \frac{1}{2m} (p)^{2}-Q(x,t)-V(x,t) =- \frac{1}{2m} (p)^{2}-Q(x,t)-V(x,t)  

両辺の∇をとると、

 \frac{∂∇S(x,t)}{∂t}=- \frac{1}{m} ∇p・\boldsymbol{p}  -∇(Q(x,t)+V(x,t))  

左辺に式(8)を適用するとともに、速度 \boldsymbol{v} = \frac{ \boldsymbol{p} }{m}を用いて変形すると、


 \frac{∂\boldsymbol{p} }{∂t}=- ∇p・\boldsymbol{v}  -∇(Q(x,t)+V(x,t))  

右辺第1項を左辺に持ってくると、

 \frac{∂\boldsymbol{p} }{∂t} +∇p・\boldsymbol{v} = -∇(Q(x,t)+V(x,t))

さらに、 \frac{d}{dt}= \frac{∂}{∂t} + \frac{d\boldsymbol{x}}{dt}・∇ であることから、

 \frac{d\boldsymbol{p} }{dt} = -∇(Q(x,t)+V(x,t))    (9)

となります。
式(9)は、ポテンシャルV(x,t)に量子ポテンシャルQ(x,t)が加わっていますが、運動方程式と同じ形式です。しかも、古典的な極限 ℏ⇒0 とした場合、 Q⇒0 となるので正に運動方程式となります。


次に式(3)の両辺にR(x,t)を乗じて整理すると、

 \frac{∂R(x,t)^{2}}{∂t}=- \frac{1}{m} {R(x,t)^{2}∇^{2}S(x,t)+∇R(x,t)^{2}・∇S(x,t)}

となります。ここで、式(2)よりψ(x,t)ψ(x,t){*}=R(x,t)^{2}であるので、これをρ(x,t)とすると、

 \frac{∂ρ(x,t)}{∂t}=- \frac{1}{m} {ρ(x,t)∇^{2}S(x,t)+∇ρ(x,t)・∇S(x,t)}

また、式(8)より、

 \frac{∂ρ(x,t)}{∂t}=- \frac{1}{m} {ρ(x,t)∇\boldsymbol{p}+∇ρ(x,t)・\boldsymbol{p}}=- \frac{1}{m}∇(ρ(x,t)・\boldsymbol{p})

また、速度 \boldsymbol{v} = \frac{ \boldsymbol{p} }{m}を用いると、

 \frac{∂ρ(x,t)}{∂t}=- ∇(ρ(x,t)・\boldsymbol{v(x,t)})

よって、

 \frac{∂ρ(x,t)}{∂t}+ ∇(ρ(x,t)・\boldsymbol{v(x,t)})=0    (10)

となり、まるで流体の連続方程式のような形式になります。

これらの式は単にシュレディンガー方程式を変形しただけのもので、シュレディンガー方程式以上のものではありません。
これらに物理的な意味を与えることにより、軌跡解釈(ボーム力学)となります。

3.軌跡解釈の基本的な考え方

まず、2つの用語を定義します。

所有値:ある物理量を観測していなくとも系が所有していると考えらえる値
観測可能量(オブザーバブル):ある物理量を観測すると測定され得る値

所有値という概念は、標準解釈では、用いられることはありません。一方、観測可能量は標準解釈でいうオブザーバブルと同じ概念で、観測すると測定され得る値は、固有状態以外では、通常多数あります。なお、古典物理では所有値と観測可能量は一致しています。(古典物理で観測とは、所有値を測定することです。)

この所有値という概念を用いて、軌跡解釈は次の3つの公理で表せます。

【公理1】
物理系は個別系として、位置を所有値として有する粒子とそれに随伴するパイロット波ψによって表される。


【公理2】
パイロット波ψは、シュレディンガー方程式(式(1))に従って時間的に発展する。


【公理3】
パイロット波ψは、次のような関係により随伴する粒子の運動に影響を与える。

ψ(x,t)≡R(x,t)exp(i\frac{S(x,t)}{ℏ})    (11)(式(2)と同じ)

と定義したとき、質量mの粒子の運動は、

\boldsymbol{v}=\frac{1}{m}∇S(x,t)       (12)

という速度場に従って運動する。


4.軌跡解釈の展開

3.で提示された公理を出発点として、軌跡解釈は展開されます。

補題1】
シュレディンガー方程式(1)に式(11)を代入すると、次の2つの式を得られます。
※1.で導いたとおりです。

 \frac{∂R(x,t)}{∂t}=- \frac{1}{2m} {R(x,t)∇^{2}S(x,t)+2∇R(x,t)・∇S(x,t)}    (13)(式(3)と同じ)


 \frac{∂S(x,t)}{∂t}=- \frac{1}{2m} {(∇S(x,t))^{2}-ℏ^2 \frac{∇^{2} R(x,t)}{R(x,t)}}-V(x,t)   (14)(式(4)と同じ)


【命題1】
粒子の運動方程式は、次のようになる。
※1.で導いたとおりです。(式(9)と同じ)

m \frac{d^{2} \boldsymbol{v}(t)}{dt^{2}}=-∇(Q(x(t),t)+V(x(t),t))    (15)

ここでQ(x(t),t)は、

Q(x(t),t)≡- \frac{ℏ^2}{2m} \frac{∇^{2} R(x(t),t)}{R(x(t),t)}   (16)

で定義され、量子ポテンシャルと呼ばれる。


【命題2】
2m≫ℏ古典力学の適用範囲とみなせば、粒子の運動方程式は(式(15))は、量子力学古典力学のいずれにも適用できる。
(証明)式(15)より自明。


【命題3】
粒子の軌跡は、任意のある時間の位置を定めれば、一意に定まる。
(証明)粒子の運動方程式(式(15))が2階微分であることから、2つの初期条件が必要とさるが、【公理3】により、任意のある時間の位置x(t0)を定めるとその位置における速度v(x(t0),t0)も定まるため、任意のある時間の位置x(t0)を定めれば粒子の軌跡x(t0)は一意に定まる。


【命題4】
粒子のエネルギーE は、

E=-\frac{∂S(x(t),t)}{∂t}   (17)

となる。
(証明)古典力学で行うのと同様に、粒子の運動方程式(15)の両辺にdx/dtを掛けて積分すると、

\frac{1}{2}mv^{2}+V+Q=C (Cは定数)

となり、これがエネルギーを表すと考えられる。そして、式(12)によりvを消去すると、

\frac{1}{2m}(∇S)^{2}+V+Q=C

となる。【補題1】の式(14)で、左辺より∇Sを消去すると、

-\frac{∂S}{∂t}=C=E


3.存在確率

初期状態x(t0)を定めると運動方程式を解くことにより、その後の軌跡x(t0)が定まります。ここで考えているのは1 粒子系であるため、1つのパイロット波ψに対して見出されるのは1つの軌跡ですが、全く同じパイロット波ψを多数用意し、それぞれに随伴する粒子に初期状態x1(t0),x2(t0),x3(t0),x4(t0),x5(t0),x6(t0)・・・を定めると、それぞれの軌跡x1(t),x2(t),x3(t),x4(t),x5(t),x6(t)・・・・が定まることになる。そして、こういう軌跡をあらゆる初期状態について求めて、重ね合わせることを考えてみると、粒子の存在確率(密度)という概念が浮かび上がります。
ただし、ここでいう存在確率は個別系についての存在確率ではなく、全く同じパイロット波ψをサンプルとして多数用意した場合に、ある単位体積に粒子が存在する個別系の数がどの程度であるかを示すものです。例えば、基底状態の水素原子を無限個用意し、それぞれについて電子の原子核からの距離(r)を測定して、r を横軸、存在したサンプルの数を縦軸にプロットした結果のようなものです。従って、このようにして求められる存在確率は、パイロット波ψの全体的な統計を示すものであり、個別系の性質を表すものではありません。しかし、このようなパイロット波ψで構成される量子ポテンシャルによって粒子の運動は影響された結果として粒子の存在確率はψψ*となるため、無数に存在するサンプルに影響されると考えざる得なくなります。簡単に言えば、統計的な性質は試行の結果から得られるものですが、統計的な性質(存在確率がψψ^{*})を作出するために量子ポテンシャルが運動に影響するということです。
さて、全く同じパイロット波ψに随伴する粒子の運動を調べることは、【公理3】より、式(12)の速度場v(x,t)に従う粒子の運動を調べることです。そして、そのような速度場のある位置に粒子を置き軌跡を求めることを、あらゆる位置について実施し結果を重ね合わせるということは、速度場v(x,t)に相互作用の無い連続流体を置き、その流れを調べることと同じことです。
そこで、流体力学で連続方程式と同形式で、存在確率の連続方程式も表されるはずです。

そこで、まず流体力学における速度場v(x,t)における密度ρ(x,t)は、次のような連続方程式となります。

 \frac{∂ρ(x,t)}{∂t}+ ∇(ρ(x,t)・\boldsymbol{v(x,t)})=0    (18)

これは1.で導いた式(10)と全く同じ形式です。式(10)を導くにあたっては、ψ(x,t)ψ(x,t){*}=R(x,t)^{2}=ρ(x,t)という関係を利用しています。
このことから次のような【公理4】を置くことにします。なお、この公理の前段は標準解釈と一致しますが、後段は異なります。

【公理4】
式(11)におけるRの自乗(R^{2})を規格化すれば、パイロット波ψに随伴する粒子の存在確率を表すが、この存在確率は個別系における存在確率ではなく、アンサンブル(統計集団)の意味での存在確率である。
(理由)
・式(10)は流体力学における速度場v(x,t)における粒子密度の連続方程式式(18)と同形式である。
・式(10)は相互作用のない連続流体における式(18)と同様に、同じ速度場v(x,t)にある1粒子系を無数に相互作用なく、ただ重ね合わせて得られたと考えられる。


この【公理4】により、シュレディンガー方程式の解であるψについて、ψψ^{*}を求めるとアンサンブルの意味での存在確率を求めることができるが、これは個別系の存在確率を記述するものではないということになります。

【命題5】
ψは個別系を表すことはできない。
(証明)
ψψ^{*}は粒子の存在確率ではあるが、【公理4】より、これは全く同じ系を無数に集め、ある位置に粒子がある系がどれくらいあるかを示すだけで、個別系についての情報を含んではいない。


4.エネルギー定常状態

まず、標準理論と同等に、エネルギー定常状態を定義すると、
エネルギー定常状態=Rが時間依存せず かつ エネルギーが一定
ということになります。


補題2】 t=t_0R=R(\boldsymbol{x},t_0) とすると、Rの時間発展は次のようになる。
  R(\boldsymbol{x},t)=R(\boldsymbol{x},t_0)exp(-\int^t_{t_0}\frac{ \boldsymbol{∇}・\boldsymbol{v}(\boldsymbol{x},t') }{2}dt')  (19)

(証明)
式(13)より、   \frac{∂R(x,t)}{∂t}+∇R(x,t)・∇S(x,t)/m=- \frac{1}{2m} {R(x,t)∇^{2}S(x,t)}
式(12)を用いて、∇S(x,t)/mを消去すると、

 \frac{∂R(x,t)}{∂t}+∇R(x,t)・\boldsymbol{v}(x,t)=- \frac{1}{2} {R(x,t)∇・\boldsymbol{v}(x,t)}

そして、両辺をR(x,t)で除して、log(R(x,t))偏微分により、

 \frac{∂log(R(x,t))}{∂t}+∇log(R(x,t))・\boldsymbol{v}(x,t)=- \frac{1}{2} {∇・\boldsymbol{v}(x,t)}

そして、\frac{d}{dt}=\frac{∂}{∂t}+\boldsymbol{v}・∇という関係式を用いると、

 \frac{dlog(R(x,t))}{dt}=- \frac{1}{2} {∇・\boldsymbol{v}(x,t)}

ここで、tt'に置き換え、t_0≦t'≦tの範囲で定積分をすれば、式(19)が成り立つことがわかる。□


【命題6】
エネルギー定常状態では、次の関係式が成り立つ。

      \boldsymbol{∇}・\boldsymbol{v}(\boldsymbol{x},t)=0   (20)

(証明)
エネルギー定常状態の定義より、Rは時間に依存しない。従って、【補題2】の(19)において、

\int^t_{t_0}\frac{ \boldsymbol{∇}・\boldsymbol{v}(\boldsymbol{x},t') }{2}dt'=0

が成り立つ。よって、\boldsymbol{∇}・\boldsymbol{v}(\boldsymbol{x},t)=0 □

【命題6】より、エネルギー定常状態では速度場の生成が無いことがわかります(電磁気学における定常磁場の関係式\boldsymbol{∇}・\boldsymbol{B}=0 を考えてみよ。さらに定常磁場におけるポテンシャルと磁場の関係とのアナロジーから、式(12)は、速度場がS(x,t)=一定という曲線に対して垂直であり、S(x,t)の勾配×1/mが速度場であることを意味し、S(x,t)が速度場のポテンシャル(※)と考えることができる。)。
(※)「ポテンシャル」というものの、力学的な位置エネルギーとは異なることに注意


【命題7】
エネルギーEのエネルギー定常状態におけるS(x,t)は、次の形式であることが必要十分条件である。
     
     S(x,t)=Et+Λ(x)+定数   (21)

     ∇^{2}Λ(x)=0   (22)

(証明)
定義より、①Rが時間依存せず かつ ②エネルギーEが一定であれば、エネルギー定常状態である。
必要性:①については、【命題6】及び式(22)より、∇^{2}S(x,t)=0であることから、式(21)の形式では直ちに式(22)が成り立つ。
②については、【命題4】の式(17)より、S(x,t)の形式は式(21)の形式となることが自明。
十分性:式(17)より、式(21)の形式では、エネルギーEが一定となることが自明。
式(22)より、式(21)の形式では、∇^{2}S(x,t)=0であることがわかる。このことから、【命題6】と式(12)より、Rは時間に依存しない。


5.運動量定常状態

まず、運動量を定義すると、

\boldsymbol{P}(\boldsymbol{x},t)≡\boldsymbol{∇}S(\boldsymbol{x},t)=m\boldsymbol{v}(\boldsymbol{x},t)      (23)

となります。
そして、運動量定常状態とは、\boldsymbol{P}(\boldsymbol{x},t)が一定の状態です。


【命題8】
運動量定常状態では、次の関係式が成り立つ。

{∇}^{2}S(\boldsymbol{x},t)=m\boldsymbol{∇}・\boldsymbol{v}(\boldsymbol{x},t)=0 (24)

(証明)
運動量の定義(式(23))と運動量定常状態の定義より自明□


【命題9】
運動量定常状態では、Rは時間に依存しない。(R=R(\boldsymbol{x})が成り立つ)

(証明)
【命題8】の式(24)より、運動量定常状態では、m\boldsymbol{∇}・\boldsymbol{v}(\boldsymbol{x},t)=0が成り立つ。
また、【補題2】の式(19)より、R=R(\boldsymbol{x},t_0)。これは、Rは時間に依存しないことを意味する。□


【命題10】
エネルギー定常状態かつ運動量定常状態で、次の関係式が成り立つ。
これは、∇R(x)^2vが直行することを意味し、【公理4】によるパイロット波の勾配と随伴する粒子の速度が直交することを意味する。

 ∇R(x)^2・v(x)=0   (25)

(証明)
式(13)におけるSを式(12)を用いて、vで書き換えると、
 \frac{∂R(x,t)}{∂t}=- \frac{1}{2} {R(x,t)∇・v(x,t)+2∇R(x,t)・v(x,t)} 
となる。
また、【命題6】の式(20)より右辺の第1項は0となり、【命題9】より左辺は0となるとともに、右辺も時間に依存しなくなるから、
 ∇R(x)・v(x)=0 が成り立つ。偏微分の性質から、 ∇R(x)^2・v(x)=0が成り立つ。□


【命題11】
エネルギー定常状態かつ運動量定常状態では、次の関係式が成り立つ。
なお、エネルギー定常状態の定義より、Eは一定である。

 E= \frac{1}{2}mv^{2} - \frac{1}{2m} ℏ^{2} \frac{∇^{2} R(x)}{R(x)} +V(x)   (26)

(証明)
式(14)に式(17)を適用し、Sを式(12)を用いてvで書き換え、【命題9】よりRが時間に依存しないことから式(26)が導かれる。


式(26)において、v=0とすると定常状態におけるシュレディンガー方程式と同じ式にはなりますが、この解釈は標準解釈と大きく異なるものとなります。
例えば、式(26)でv=0としてV(x)をクーロンポテンシャルとすれば、Rは水素原子の波動関数となります。
標準解釈では、この波動関数の自乗が電子の存在確率の密度を表しているとはしていますが、原子核の周りを周回するという古典的なモデルのイメージがどこまでも付きまといます。
しかし、式(26)ではv=0としているため、水素原子の電子は静止しているという結論になります。古典的な水素原子モデルでは、電子が加速運動をすると電磁波を放出して、やがては原子核に落ちてしまうと点が問題視されましたが、電子が静止しているのなら、このような問題は生じません。
では、軌跡解釈ではなぜ電子は静止することができるのでしょうか?
式(26)でv=0で、エネルギーが一定ということは、

      一定= - \frac{1}{2m} ℏ^{2} \frac{∇^{2} R(x)}{R(x)} +V(x) = Q(x)+V(x)

ということです。なお、Q(x)は式(16)の量子ポテンシャルです。
つまり、ポテンシャルによる変化を打ち消すように量子ポテンシャルがあるため、エネルギーが一定となるのです。
式(15)の運動方程式を見てみると、粒子が加速されない様子をよりリアルに見ることができます。

    m \frac{d^{2} \boldsymbol{v}(t)}{dt^{2}}=-∇(Q(x(t),t)+V(x(t),t))    (15)

 Q(x)+V(x)が一定であるため、式(15)の右辺が0となり、粒子は加速されないのです。

なお、ここで粒子が静止しているというはあくまで所有値としての話ですので、実際に速度や運動量が0の粒子が観測されるかはまた別の問題です。
これは、観測の理論としてまた取り上げたいと思います。

    













  

ベイズ統計 第3章 ベイズの展開公式

ベイズ統計

第1章 確率の基礎

第2章 ベイズの定理からベイズ理論の出発点へ

第4章 ナイーブベイズ分類器とナイーブベイズフィルター

第3章 ベイズの展開公式

3.1 ベイズの展開式の導出

前章では乗法定理からベイズの定理を導き、ベイズの基本公式(1)にたどり着いた。

P(H|D)=\frac{P(H)P(D|H)}{P(D)}・・・(1)

Dは結果(データ)、Hはその仮定(原因)であり、P(H|D)は「データDが得られたときの原因がH」である確率であるが、通常想定できる原因は1つではない。仮にその原因が3つあるとし、 H_1 H_2 H_3とする。 ここで、原因 H_1にのみ着目し、(1)のH H_1に置き換えると、

P(H_1|D)=\frac{P(H_1)P(D|H_1)}{P(D)}・・・(2)

となり、これを出発点とする。

3つの原因 H_1 H_2 H_3が排他的である(ダブりはない)とすると、原因Dは次のように展開できる。

f:id:sr-memorandum:20190324220258p:plain 図1

P(D)=P(D \cap H_1)+P(D \cap H_2)+P(D \cap H_3)・・・(3)

図1のようにDを得る確率は、D \cap H_1D \cap H_2D \cap H_3の3つの和で表現される部分から得られる確率の和となる。 ここで、この(3)の右辺の各項に、確率の乗法定理を適用してみる。 乗法定理は、P(A \cap B)=P(A)P(B|A)であるので、

P(D)=P(D|H_1)P(H_1)+P(D|H_2)P(H_2)+P(D|H_3)P(H_3)・・・(4)

となる。これを(2)に代入すると、

P(H_1|D)=\frac{P(H_1)P(D|H_1)}{P(D|H_1)P(H_1)+P(D|H_2)P(H_2)+P(D|H_3)P(H_3)}・・・(5)

となる。 (5)は原因として、 H_1 H_2 H_3 の3つを仮定したものであるが、データDの原因としてn個のものを考えるとこれを一般化することができる。

データDは、原因 H_1 H_2、・・、 H_nのどれか1つから生まれると仮定する。このとき、データDが得られたとき、その原因がH_iである確率P(H_i|D)は、

P(H_i|D)=\frac{P(H_i)P(D|H_i)}{P(D|H_1)P(H_1)+P(D|H_2)P(H_2)+・・・+P(D|H_n)P(H_n)}・・・(6)

となり、これをベイズの展開公式という。 各原因からデータの得られる確率P(D|H_i)と、データを得る前の原因の確率P(H_i)が得られたときに、データDが得られたとき原因がH_iである確率P(H_i|D)を表す公式である。

3.2 尤度、事後確率及び事後確率

ベイズの展開式(6)のうち、P(H_i|D)P(D|H_i)及びP(H_i)には、それぞれ統計学的な意味がある。 右辺の分子にあるP(D|H_i)を原因H_i尤度という。これは、原因H_iのもとでデータDが得られる尤もらしい確率を表す。 次に尤度の左隣にあるP(H_i)事前確率という。データDの影響をまだ考慮していない、分析前の原因H_iの起こる確率なので、そう呼ばれる。 また、左辺にある原因の確率P(H_i|D)事後確率という。ベイズの基本公式を用いてデータDを考慮して得られた分析後の原因H_iの確率であるため。

P(D|H_i):尤度 原因H_iのもとでデータDが得られる確率

P(H_i):事前確率 データDを得る前の原因H_iの確からし

P(H_i|D):事後確率 データDが原因H_iから得られた確率

3.3 ベイズの展開公式の利用例

例1:ある地方の気象統計では、10月1日に晴れ、曇り、雨の確率は0.3、0.6、0.1である。翌10月2日に雨の確率は、1日が晴れのときは0.2、曇りのときは0.5、雨のときは0.4である。この地方で、2日が雨のとき前日1日が曇りの確率を求めよ。

まず、記号を定義する。 そうすると各尤度は、 P(D|H_1)=0.2P(D|H_2)=0.5P(D|H_3)=0.4

各事前確率は、 P(H_1)=0.3P(H_2)=0.6P(H_3)=0.1

ベイズの展開式(6)から10月2日が雨のとき10月1日が曇りの確率(事後確率)P(H_2|D)は、

P(H_2|D)=\frac{P(H_2)P(D|H_2)}{P(D|H_1)P(H_1)+P(D|H_2)P(H_2)+P(D|H_3)P(H_3)}=\frac{0.6×0.5}{0.2×0.3+0.5×0.6+0.4×0.1}=\frac{3}{4}

この計算仮定は、一般化することができベイズ理論の計算の流れもこの手順に従うこととなる。

①モデル化し、それから尤度を算出する。 ②事前確率を設定する。 ③ベイズの展開公式を用いて事後確立を算出する。

例2:赤玉と白玉合わせて3個入った壷が3つある。1つには赤玉が1個、もう1つには赤玉が2個、残りの1つには赤玉が3個入っている。これら3つの壷の1つから玉を取り出したところ、それが赤玉であった。取り出された赤玉が「赤玉3個の入った壷」からの玉である確率を求める。ただし、3つの壷が選ばれる確率は順に3:2:1とする。

まず、記号を定義する。 そうすると各尤度は、 P(D|H_1)=1/3P(D|H_2)=2/3P(D|H_3)=3/3=1

各事前確率は、3つの壷が選ばれる確率は順に3:2:1であることから、 P(H_1)=3/6P(H_2)=2/6P(H_3)=1/6

ベイズの展開式(6)から取り出した赤玉が赤玉3個の壷からのものである確率(事後確率)P(H_3|D)は、

P(H_3|D)=\frac{P(H_3)P(D|H_3)}{P(D|H_1)P(H_1)+P(D|H_2)P(H_2)+P(D|H_3)P(H_3)}=\frac{1/6×1}{1/3×3/6+2/3×2/6+1×1/6}=\frac{3}{10}

3.4 ベイズ更新

例3:くじが10個入った箱が2つある。1つは当たりくじが5個、もう1つには当たりくじが1個入っている。2つの箱の1つからくじを引いたところ、ハズレ⇒当たり⇒当たりであった。引いたくじが当たりくじ5個の箱からである確率を求める。なお、引いたくじは箱に戻すものとする。

この例3は、これまでの例と異なり、複数のデータが得られたときの処理を考えることになる。 ベイズ理論は、このように独立して得られる複数のデータを、1つのデータのときと同じように処理することができ、しかも1データずつ逐次処理していくことが可能である。実際に、どのように処理されるかを以下に説明する。

まず、記号を定義する。 そうすると、各尤度は、 P(D_1|H_1)=1/2P(D_1|H_2)=1/10P(D_2|H_1)=1/2P(D_2|H_2)=9/10 となる。 ここで、2つの箱が選ばれる確率が与えられていないため、これまでの例のように事前確率を計算することができない。 こういうとき、ベイズ理論は何も条件が無いのなら事前確率として各々の箱の選択確率は等確率になるという考え方をする。 これを、理由不十分の原則という。 少々理解しにくいかも知れないが、天気が雨・晴れ・曇りの3通りならそれぞれ1/3の確率とする、箱の中の猫が生きているか死んでるかわからないのなら、生きている確率を1/2、死んでいる確率を1/2ととりあえず設定しておこうという発想である。

そうすると、事前確率は、 P(H_1)=1/2P(H_2)=1/2 となる。 これをベイズの展開式(6)に代入して事後確率を求めると、最初のくじは外れであったため、

P(H_1|D_2)=\frac{P(H_1)P(D_2|H_1)}{P(D_2|H_1)P(H_1)+P(D_2|H_2)P(H_2)}=\frac{1/2×1/2}{1/2×1/2+9/10×1/2}=\frac{5}{14}・・・(7)

P(H_2|D_2)=\frac{P(H_2)P(D_2|H_2)}{P(D_2|H_1)P(H_1)+P(D_2|H_2)P(H_2)}=\frac{1/2×9/10}{1/2×1/2+9/10×1/2}=\frac{9}{14}・・・(8)

となる。最初に引いたのがハズレであったため、当たりくじが1個である箱からである確率が高くなっている。

次に2回目のくじ引きの結果である当たりにベイズの展開公式(6)を適用する。 計算方法は、1回目と基本的に変わらないが、事前確率をどうしたらよいのか? そこで、用いられるのがベイズ更新という考えで、1回目の事後確率を2回目の事前確率として利用する。 つまり、(7)と(8)を用いて、事前確率は、 P(H_1)=5/14P(H_2)=9/14 となる。 そして、2回目のくじ引きの結果は当たりであったため、

P(H_1|D_1)=\frac{P(H_1)P(D_1|H_1)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{5/14×1/2}{1/2×5/14+1/10×9/14}=25/34・・・(9)

P(H_2|D_1)=\frac{P(H_2)P(D_1|H_2)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{9/14×1/10}{1/2×5/14+1/10×9/14}=9/34・・・(10)

となる。2回目で当たりくじを引いたことで、当たりくじが5個である箱からである確率が急激に高くなっている。

同様にベイズ更新を用いて、3回目くじ引きの結果である当たりにベイズの展開公式(6)を適用する。 (9)と(10)を用いて、事前確率は、 P(H_1)=25/34P(H_2)=9/34 となる。 そして、3回目のくじ引きの結果は当たりであったため、

P(H_1|D_1)=\frac{P(H_1)P(D_1|H_1)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{25/34×1/2}{1/2×25/34+1/10×9/34}=125/134・・・(11)

P(H_2|D_1)=\frac{P(H_2)P(D_1|H_2)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{9/34×1/2}{1/2×25/34+1/10×9/34}=9/134・・・(12)

となる。

なお、ハズレ⇒当たり⇒当たりという順番で今回はくじを引いているが、この順番が変わったとしても(当たり⇒当たり⇒ハズレ、当たり⇒ハズレ⇒当たりetc)計算結果に違いは生じない。これをベイズ理論の逐次合理性という。

試しに、当たり⇒当たり⇒ハズレと引いた場合について計算し結果を比べてみる。

理由不十分の原則より 事前確率:P(H_1)=1/2P(H_2)=1/2

1回目は当たりなので P(H_1|D_1)=\frac{P(H_1)P(D_1|H_1)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{1/2×1/2}{1/2×1/2+1/10×1/2}=\frac{5}{6}

P(H_2|D_1)=\frac{P(H_2)P(D_1|H_2)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{1/2×1/10}{1/2×1/2+1/10×1/2}=\frac{1}{6}

ベイズ更新により 事前確率:P(H_1)=5/6P(H_2)=1/6

2回目は当たりなので、 P(H_1|D_1)=\frac{P(H_1)P(D_1|H_1)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{5/6×1/2}{1/2×5/6+1/10×1/6}=\frac{25}{26}

P(H_2|D_1)=\frac{P(H_2)P(D_1|H_2)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{1/6×1/10}{1/2×5/6+1/10×1/6}=\frac{1}{26}

ベイズ更新により 事前確率:P(H_1)=25/26P(H_2)=1/26

3回目はハズレなので、

P(H_1|D_2)=\frac{P(H_1)P(D_2|H_1)}{P(D_2|H_1)P(H_1)+P(D_2|H_2)P(H_2)}=\frac{25/26×1/2}{1/2×25/26+9/10×1/26}=\frac{125}{134}

P(H_2|D_2)=\frac{P(H_2)P(D_2|H_2)}{P(D_2|H_1)P(H_1)+P(D_2|H_2)P(H_2)}=\frac{1/26×9/10}{1/2×25/26+9/10×1/26}=\frac{9}{134}

同じ結果となることがわかる。

続き

第1章 確率の基礎

第2章 ベイズの定理からベイズ理論の出発点へ

第4章 ナイーブベイズ分類器とナイーブベイズフィルター

 

簡単な電磁気の考察から見える特殊相対性理論の入り口

1.疑問

f:id:sr-memorandum:20190322205519p:plain

図1

図1のように真空中にある無限長線状荷電体の間にかかる単位長さ当たりのクーロン力F_qは、

F_q=\lambda ^2 /2\pi \epsilon _0 r・・・(1)

\lambda:線状荷電体の線電荷密度 \epsilon _0:真空中の誘電率 r:線状電荷体間の距離 )

となる。(ガウスの定理から簡単に導ける)

f:id:sr-memorandum:20190322213805p:plain

図2

次に図2のように線状荷電体と平行に速度vで等速直線運動で移動する観測者を考えてみる。(速度vの慣性系から観測すると考えてもよい。) 図2の観測者から見ると図1の線状荷電体は電流とし観測されその大きさは、

I=dq/dt=\frac{dq}{dx} \frac{dx}{dt}=\lambda v・・・(2)

となるが、電流が発生するということはアンペールの法則により線状帯電体間にはクーロン力とは別の力、アンペールF_aが働き、その大きさは単位長さ当たり、

F_a=\mu_0 I ^2 /2\pi r = \mu_0 v ^2 \lambda ^2 /2\pi r・・・(3)

 \mu_0 :真空中の透磁率

である。(ビオ・サバールの法則から簡単に導ける) 図2によると、アンペール力はクーロン力と反対に働くので線状帯電体間に作用する力は、

F = \lambda ^2 /2\pi \epsilon _0 r -  \mu_0 v ^2 \lambda ^2 /2\pi r

= \lambda ^2 (1- \epsilon _0 \mu_0 v ^2 ) / 2 \pi  \epsilon _ 0 r ・・・(4)

これにより古典的な電磁気学は、慣性系によって法則が異なるという奇妙な理論であるということになる。しかも、作用する力の大きさが(1)と(4)で異なるというほとんど論理的に破綻していると考えられる結果が導かれる。

2.検証

矛盾した結果が導かれる原因は、導出過程に誤りがあるか、あるいは前提条件に誤りがあるかのいずれかである場合が多い。(1)(4)ともに導出過程は高校生でも可能な程度の単純なもので誤りがあるとは考えにくいので、後者を検討してみる。 すると1つの疑問として浮かび上がるのは、線状荷電体の線電荷密度\lambdaが静止系から観測しても、慣性系から観測しても本当に同一であるかということである。 そこで、慣性系からは線電荷密度 \lambda  \lambda ' に変化するものとして、(1)と(4)の力が等しいとすると、

\lambda ^2 /2\pi \epsilon _0\ r {(1-\epsilon_0\mu_0} v^2){ \lambda '}^2/2 \pi  \epsilon _ 0 r

{ \lambda '}=\frac{ \lambda}{\sqrt{1-{\epsilon_0\mu_0}{v}^2}}・・・(5)

となる。なお、本来なら±となるが符号が変わることはないだろうと考え、+だけを採用した。

そして、\epsilon_0\mu_0= \frac{1}{c^2} (c光速度)という関係があるため、

{ \lambda '}=\frac{ \lambda}{\sqrt{1-{(\frac{v}{c})}^2}}・・・(6)

と、特殊相対性理論ではお馴染みの数式の形が浮かびあがる。

さらに、電荷量は保存されるので、 \lambda = dq/dx \lambda' = dq/dx' とすれば、

{ dx'}= \sqrt{1-{(\frac{v}{c})}^2}dx・・・(7)

ローレンツ変換のような(7)を導くことができる。

3.発展

f:id:sr-memorandum:20190323185804p:plain

図3

今度は図3のように直線状の荷電体の1本とその側に点電荷を置いた場合を考える。点電荷電荷Qとすると静止系のクーロン力は(1)の代わりに、

F_q=\lambda Q /2\pi \epsilon _0 r・・・(8)

となる。

慣性系から点電荷にかかる力はクーロン力ローレンツ力となり、(4)の代わりに、

F_q'= {\lambda}'Q (1- \epsilon _0 \mu_0 v ^2 ) / 2 \pi  \epsilon _ 0 r ・・・(9)

となるが、(6)と\epsilon_0\mu_0= \frac{1}{c^2} (c光速度)を用いると、

F_q'= {\lambda}Q \sqrt{1- {(\frac{v}{c})}^2} / 2 \pi  \epsilon _ 0 r ・・・(10)

となり、(9)と(10)は一致しない。点電荷は大きさが無いのでローレンツ収縮の影響を受けないハズではあるが、(9)と(10)を一致させて矛盾を無くすためには、慣性系から見た点電荷電荷Q'は、

{ Q'}=\frac{ Q}{\sqrt{1-{(\frac{v}{c})}^2}}・・・(11)

となるはずである。

この(6)を質量密度に適用すれば、電荷量のアナロジーから質量mについても同様に、

{ m'}=\frac{ m}{\sqrt{1-{(\frac{v}{c})}^2}}・・・(12)

が成り立つことが想像できる。

このように電磁気学の簡単な考察から特殊相対性理論の片鱗を見ることができるわけであるが、もう少し考察を進めると相対論的な速度の加法定理が導けそうである。

ベイズ統計 第2章 ベイズの定理からベイズ理論の出発点へ

ベイズ統計

第1章 確率の基礎

第3章 ベイズの展開公式

第2章  ベイズの定理からベイズ理論の出発点へ

ベイズの定理は、乗法定理から導くことができる。 2つの事象、ABについての乗法定理は、

P(A \cap B)=P(A)P(B|A)・・・(1)

となる。P(A)は「Aの起こる確率」を、P(A \cap B)は「ABが同時に起こる確率」(同時確率)を、P(B|A)は「Aが起こるという条件のもとでBが起こる確率」(条件付き確率)を表す。 簡単にいうと、 「ABが同時に起こる確率」=「Aが起こる確率」×「Aが起こったときにBが起こる確率」 ということである。

さて、式(1)のABを入れ替えると、

P(B \cap A)=P(B)P(A|B)・・・(2)

となる。そして、P(A \cap B)=P(B \cap A)であるから、

P(B)P(A|B)=P(A)P(B|A)・・・(3)

よって、

P(A|B)=\frac{P(A)P(B|A)}{P(B)}・・・(4)

が成り立ち、これがベイズの定理である。

簡単に言うと、

BのもとでAが起こる確率=\frac{AのもとでBの起こる確率×Aの起こる確率}{Bの起こる確率}

ということであるが、直観的に理解はしにくいため、例を使って意味を確認してみる。

例1:サイコロを投げたとき、奇数の目がでる事象をA、3以下の目がでる事象をBとする。このとき、ベイズの定理が成立することを確認する。

P(A|B)とは、3以下の目がでたときにそれが奇数である確率を意味する。3以下の目とは{1,2,3}の3通り、これが奇数であると{1,3}の2通りなので、

P(A|B)=2/3・・・(5) (ベイズの定理(4)の左辺)

そして、P(A)は奇数がでる確率、P(B)は3以下の目がでる確率なので、それぞれ、

P(A)=1/2・・・(6)

P(B)=1/2・・・(7)

となる。 また、P(B|A)とは、奇数の目がでたときにそれが3以下である確率を意味する。奇数であるとは{1,3,5}の3通り、これが3以下とは{1,3}の2通りなので、

P(B|A)=2/3・・・(8)

よって、(6)~(8)より、 ベイズの定理(4)の右辺\frac{P(A)P(B|A)}{P(B)}=\frac{1/2×2/3}{1/2}=2/3

これは(5)のP(A|B)=2/3に一致するので、ベイズの定理(4)が成り立つことがわかる。

例2:ジョーカーを抜いた1組のトランプから1枚のカードを無作為に引くとする。引いた1枚のカードがハートである事象をA、絵札である事象をBとする。このとき、ベイズの定理を利用して、「絵札を引いたとき、それがハートである」確率を求めてみる。

解となる「絵札を引いたとき、それがハートである」確率とは、P(A|B)である。

逆に、P(B|A)は「ハートを引いたとき、それが絵札である」確率であり、ハート13枚のうち絵札は3枚なので、

P(B|A)=3/13・・・(9)

そして、P(A)はハートを引く確率、P(B)は絵札を引く確率なので、それぞれ、

P(A)=1/4・・・(10)

P(B)=3/13・・・(11)

これをベイズの定理(4)に当てはめると、

P(A|B)=\frac{P(A)P(B|A)}{P(B)}=\frac{1/4×3/13}{3/13}=1/4・・・(12)

まあ、絵札であろうとなかろうと4枚に1枚はハートなので、直観的に解答が求まり、例2もベイズの定理の有用性が全く感じられない。

例3:TeamAyuは男子6人、女子12人、西野家は男子10人、女子5人である。TeamAyuと西野家の集団から1人選んだなら、それが女子であった。このとき、その女子がTeamAyuの人である確率をベイズの定理で求める。なお、どの人も選ばれる確率は等しく、両方に所属している者はいないと仮定する。

まず、ABを次のように定義する。 A・・・1人を選んだなら、それがTeamAyuである。 B・・・1人を選んだなら、それが女子である。 すると、求めたい確率は「1人選んだときに、それが女子である」(B)ときに「それがTeamAyu」(A)である確率であるので、P(A|B)となり、これをベイズの定理(4)に当てはめると、

P(A|B)=\frac{P(A)P(B|A)}{P(B)}

P(A)=「1人選んだら、それがTeamAyuである確率」

P(B)=「1人選んだら、それが女子である確率」

P(B|A)=「「1人選んだときに、それがTeamAyuである」(A)ときに「それが女子」(B)である確率」

P(A|B)よりもP(B|A)=のほうが直観的にわかりやすいというのが、ベイズの定理を利用する大きな利点となる。

それぞれについて求めると、TeamAyuと西野家の両方に所属している人はいないため、総人数は33人、TeamAyuは18人、女子は17人であるので、

P(A)=18/33・・・(13)

P(B)=17/33・・・(14)

そして、TeamAyuは18人でそのうち女子は12人であるので、

P(B|A)=12/18=2/3・・・(15)

(13)~(15)をベイズの定理(4)に当てはめると、

P(A|B)=\frac{P(A)P(B|A)}{P(B)}=\frac{18/33×2/3}{17/33}=12/17

女子は全部で17人いてそのうちTeamAyuが12人なのでこういう解になるのは当たり前であるが、それが女子であったときにTeamAyuのである確率という問われ方をすると直観的に解答を出すことは少し難しい。

例4:ある地方の気象データでは、10月1日に曇りの確率は0.6、翌2日に雨の確率は0.4である。また、10月1日に曇りのときに翌2日が雨の確率は0.5である。この地域で、10月2日が雨のときに前日の1日が曇りの確率を求める。

まず、ABを次のように定義する。 A・・・1日は曇り B・・・2日は雨 すると、「10月1日に曇りのときに翌2日が雨の確率は0.5である。」ことから、

P(B|A)=0.5・・・(16)

また、「10月1日に曇りの確率は0.6、翌2日に雨の確率は0.4である。」ことから、

P(A)=0.6・・・(17)

P(B)=0.4・・・(18)

そして、求めるのは「10月2日が雨のときに前日の1日が曇りの確率」であるから、P(A|B)でありベイズの定理(4)より、

P(A|B)=\frac{P(A)P(B|A)}{P(B)}=\frac{0.6×0.5}{0.4}=3/4

と解が求まる。 この例では、直観的には解法がわからずベイズの定理を利用しないと解答を得るのが困難であろう。(少なくとも、私はわからない)

例5:100点満点数学の試験で、90点以上を取った生徒が2割いた。数学が好きな生徒が90点以上取る確率は0.4である。90点以上を取った生徒から1人抽出したとき、その人が数学を好きである確率を求めよ。ただし、この試験では、数学が好きな人の確率は0.3であった。

まず、ABを次のように定義する。 A・・・数学が好き B・・・90点以上取る すると、「数学が好きな生徒が90点以上取る確率は0.4である。」ことから、

P(B|A)=0.4・・・(19)

また、「数学が好きな人の確率は0.3であった。」ことから、

P(A)=0.3・・・(20)

また、「90点以上を取った生徒が2割いた。」ことから、

P(B)=0.2・・・(21)

そして、求めるのは「90点以上を取った生徒から1人抽出したとき、その人が数学を好きである確率」であるから、P(A|B)でありベイズの定理(4)より、

P(A|B)=\frac{P(A)P(B|A)}{P(B)}=\frac{0.3×0.4}{0.2}=0.6

と解が求まる。 さて、この例5の結果は、数学が好きだから数学で90点以上取った確率と考えることもできます。つまり、「数学が好き」という「原因」によって「90点以上の点と取った」という「結果」が生じる確率ということですが、これをそのままベイズの定理(4)に当てはめると、

P(原因|結果)=\frac{P(原因)P(結果|原因)}{P(結果)}・・・(22)

となる。 (22)の左辺P(原因|結果)は「結果が与えられたという条件での原因である」条件付確率で、(22)の右辺P(結果|原因)は「原因によって(=原因が与えあられたという条件での)結果が生じる」条件付き確率となる。こういう意味で、ベイズの定理をこのように「原因」と「結果」に当てはめると、通常は原因からどういう結果が生じるかを議論するものを、結果から原因を仮定して、その原因によって結果が生じた確率はどれくらいであるかを表すように変換する機能があり、こういう意味で、(22)の左辺P(原因|結果)を原因の確率という。

このように、結果となるデータ(Data)があって、仮定(Hypothesis)する原因によって生じた確率(原因の確率)がどの程度であるか見積もるための公式とベイズの定理を解釈し直すことがベイズ理論の出発点となる。 この公式をベイズの基本公式と呼ぶ。

P(H|D)=\frac{P(H)P(D|H)}{P(D)}・・・(23)

続き

第1章 確率の基礎

第3章 ベイズの展開公式

一般相対性理論を一歩一歩数式で理解する [ 石井 俊全 ]

価格:3,780円
(2019/3/21 13:11時点)
感想(0件)

マンガでわかる量子力学 日常の常識でははかりしれないミクロな世界の現象を解 (サイエンス・アイ新書) [ 福江純 ]

価格:1,188円
(2019/3/21 13:13時点)
感想(2件)