2021-08-14

アルバート・アインシュタインが発見したこと

未だに、アルバート・アインシュタイン（A.E）が原爆と作ったと勘違いしている人がいるようなので、A.E.が発見したことの概要を簡単に書いてみたいと思います。

1.光速度不変の原理と相対性原理

A.Eは特殊相対性理論を発見したと言われることがありますが、本当の意味で発見したのは「光速度不変の原理」です。
特殊相対性理論というのは、光速度不変の原理を出発点とすれば、誰もが数学的な操作で導くことができる結果やその導出過程のことを言います。古典力学で言えば、慣性の法則、作用反作用の法則及び万有引力の法則から様々なことが導かれるようなものです。
ただし、古典力学は多くの人が関わって理論体系ができあがったのに対して、A.Eは特殊相対性理論のほとんどを一人で導出した点で違いはあります。
「光速度不変の原理」は、簡単に言うと「どのような慣性系から見ても光の速さ一定である」というものです。まさに原理と呼ぶに相応しい単純明快な内容ですが、こういうことが原理として取りざたされたことには事情があります。詳しくは、私が以前書いた「簡単な電磁気の考察から見える特殊相対性理論の入り口」読んでもらえるとわかりますが、「光速度不変の原理」が発見される以前は、力学と電磁気学の法則の間に深刻な矛盾が生じていました。例えば、線状の荷電剛体に対して静止していれば電場のみがありますが、これと平行な方向に移動する慣性系からは電流が発生しているのと同等なので、アンペール法則により磁場も発生します。つまり、線状の荷電剛体に対して静止している慣性系では電場のみ、移動する慣性系では電場と磁場があることになります。「全ての慣性系で物理法則の形式が同じである」ことを「相対性原理」と言い、当然成り立つものと考えられていましたが、この原理に反します。
こういう矛盾を取り除く原理として、A.Eが発見したのが「光速度不変の原理」です。「光速度不変の原理」から導出される相対的電磁気学では、電場と磁場は電磁テンソルというもので表現され、上述の例でも各慣性系で同じ形式の物理法則で記述され、慣性系間の関係もローレンツ変換という変換則で矛盾なく記述されます。

2. $E=mc^2$ と原爆の関係

こういう経緯でA.E.が発見した「光速度不変の原理」ですが、この原理があまりにも基礎的なものであったため、力学と電磁気学は全般的に修正され、例えば、相対速度は単純な加算・減算では計算できない、光速に近い速さで移動する慣性系では時間が遅れる、光速に近づくと質量が重くなる等の結論が導出されました。
そんな中の一つとしてあったが、質量とエネルギーの等価性です。
物質の質量を $m$ として、光の速さを $c$ とすれば、その物質が静止している時に有するエネルギー $E$ は次のように表されます。

　　 $E=mc^2$

光の速さは $c=3×10^8m/s$ と非常の大きな数字なので、たった1gの1円玉でも膨大なエネルギーを有していることが想像できます。
核の利用というのは、この物質の質量をエネルギーに変換しようという試みです。放射性物質というのは、ゆっくりと時間をかけてエネルギー（放射性・放射能）に変換されている物質です。
原爆というのは、この物質からエネルギーへの変換を急激に起こして、爆弾にするものです。

そうすると、 $E=mc^2$ が原爆の開発に役立ったと思うかも知れませんが、この関係式は物質をエネルギーに変換することが可能かも知れないことを示しているだけで、その方法論については何も語ってくれません。
確かに、人類に核利用の可能性を最初に示しましたが、即原爆の開発に結び付くものでもないのです。

終わりに

光速度不変の原理は上述のように物理学の基本的な原理で、この原理から $E=mc^2$ を誰でも簡単に導出することができます。 $E=mc^2$ が最後の一歩になったことは否めませんが、これを発見したことで原爆を開発したと言うのであれば、ガリレイ、ニュートン、マックスウェル等、物理学の発展に携わった全ての人が原爆を開発したと言わざるを得ない程のレベルです。
なお、E.A.の場合は核開発を促す大統領宛の信書に署名したという、物理学とは関係ない歴史的な事実がありますが、これが直接マンハッタン計画の実施に結び付いたと言える程、単純な経緯で同計画が実施された訳でもなさそうです。

2021-01-02

ヒルベルト空間の備忘録

ヒルベルト空間の備忘録

１．コーシー列

定義１－１　コーシー列

数列 ${φ_n}$ がコーシー列であるとは、

　　(1-1)　　 $∀ε＞0$ に対し、 $∃N:　　n≧N　⇒|φ_m-φ_n|＜ε$

が成り立つことをいう。

定義１－２　収束

数列 ${φ_n}$ が $a$ に収束するとは、

　　(1-2)　　 $∀ε＞0$ に対し、 $∃N:　　n≧N　⇒|φ_n-a|＜ε$

が成り立つことをいい、 $φ_n→a$ と表す。

定義１－３　有界

数列 $φ_n$ が上に有界とは、

　　　　　　　ある数 $a$ があって、 $∀n:　　φ_n＜a$

が成り立つことをいう。また、このような数 $a$ の集合を上界といい、 $φ_n$ の最小の上界を上限といい、 $sup{φ_n}$ と表す。

数列 $φ_n$ が下に有界とは、

　　　　　　　ある数 $a$ があって、 $∀n:　　φ_n＞a$

が成り立つことをいう。また、このような数 $a$ の集合を下界といい、 $φ_n$ の最大の下界を下限といい、 $inf{φ_n}$ と表す。

定理１－１　有界な単調増加数列と単調減少数列の収束

・有界な単調増加数列数列 $φ_n$ が上に有界であれば、 $φ_n$ は収束する。
・有界な単調減少数列数列 $φ_n$ が下に有界であれば、 $φ_n$ は収束する。
（証明）
※単調増加数列についてのみ
有界な単調増加数列数列 $φ_n$ が上に有界であれば、定義１－３により上限 $α$ をもつ。 $α$ は、最小の上界であるので、
　　　　　 $∀ε＞0$ に対し、 $∃φ_N:　　α-ε＜φ_N≦α$
が成り立つ。そして、 $φ_n$ は単調増加なので、 $k≧N$ であれば、 $φ_k≧φ_N$ 。したがって、
　　　　　 $α-ε＜φ_N≦φ_k≦α$
が成り立つので、 $k≧N$ ⇒ $|φ_n-α|＜ε$ となり、収束の定義１－２より、 $φ_n→α$

定理１－２　縮小区間の原理

閉区間の列{[ $a_n,b_n$ ]}が、任意の $n$ に対し、 $a_n≦a_n+1＜b_n+1≦b_n$ を満足するとき、 $\bigcap_{n=1}^∞$ [ $a_n,b_n$ ] $≠Φ$ 。
とくに、 $b_n-a_n→0$ のときは、 $\bigcap_{n=1}^∞$ [ $a_n,b_n$ ]は１点となる。
（証明）
端点の列 ${a_n}$ は、単調増加で、上からは $b_1$ で抑えられている。ゆえに、定理１－１より $a_n→a$ が存在する。一方 $b_n$ は単調減少で、下から $a_1$ で抑えられているので、 $b_n→b$ が存在し、 $a≦b$ は自明である。よって、閉区間[ $a,b$ ]が $\bigcap_{n=1}^∞$ [ $a_n,b_n$ ]に含まれる。
とくに、 $b_n-a_n→0$ のときは、 $0≦b-a≦b_n-a_n→0$ より、 $a=b$ となるので、[ $a,b$ ]= $a$ である。

定理１－３　収束する列はコーシー列である。

数列 ${φ_n}$ が収束する　⇔　数列 ${φ_n}$ がコーシー列である。

（証明）
【収束⇒コーシー列の証明】
$φ_n$ が $a$ に収束するのであれば、収束の定義（１－２）より、
　　　　 $∀ε/2＞0$ に対し、 $∃N:　　n≧N ⇒ |φ_n-a|＜ε/2$
ゆえに、 $m≧N　⇒　|φ_m-a|＜ε/2$ 。したがって、
　　　　 $m,n≧N ⇒ |φ_m-φ_n|≦|φ_m-a|+|a-φ_n|＜ε$
これは ${φ_n}$ がコーシー列（定義１－１）であることを示している。

２．ベクトル空間・バナッハ空間・ヒルベルト空間

定義２－１　ベクトル空間

元 $φ_1,φ_2,φ_3,$ ・・・からなる集合 $Ｘ$ が次の条件をみたすとき、ベクトル空間といい、その元をベクトル、またはベクトル空間の点という。
任意の $φ_1,φ_2∈X$ に対し、和 $φ_1+φ_2∈X$ が定義されて、

　　(2-1)　　 $φ_1+φ_2=φ_2+φ_1$
　　(2-2)　　 $(φ_1+φ_2)+φ_3=φ_1+(φ_2+φ_3)$
　　(2-3)　　 $∃0∈X:　　∀φ∈Xに対し、φ+0=φ$
　　(2-4)　　 $∀φ∈X:　　∃(-φ)∈X:　　φ+(-φ)=0$

任意の複素数 $α,β$ 及び $φ,φ_1,φ_2∈X$ に対して、スカラー倍 $αφ∈X$ が定義されて、
　　(2-5)　　 $1・φ=φ$
　　(2-6)　　 $α(βφ)=(αβ)φ$
　　(2-7)　　 $(α+β)φ=αφ+βφ$
　　(2-8)　　 $α(φ_1+φ_2)=αφ_1+βφ_2$

定義２－２　ノルム

任意の $φ,φ_1,φ_2∈X$ に対し定義される次のような性質を持つ関数 $|| ・||$ をノルムという。
　　(2-9)　　 $||φ||≧;||φ||=0 ⇔φ=0$
　(2-10)　　 $||αφ||=|α|||φ||$
　 (2-11)　　 $||φ_1+φ_2||≦||φ_1||+||φ_2||$
また、ノルムが定義されているベクトル空間をノルム空間という。

定義２－３　バナッハ空間

ノルム空間 $X$ の任意のコーシー列が $X$ の点に収束するとき、 $X$ は完備であるという。
完備なノルム空間をバナッハ空間という。

定義２－４　内積空間とヒルベルト空間

元 $φ_1,φ_2,φ_3,$ ・・・からなるバナッハ空間 $H$ が次の条件をみたすとき、内積空間という。
内積について完備な内積空間をヒルベルト空間という。

　 (2-11)　　 $<φ_1,φ_1>≧0,　:<φ_1,φ_1>=0 ⇔ φ_1=0$
　 (2-12)　　 $<φ_1,φ_2>=\overline{<φ_2,φ_1>}$
　(2-13)　　 $<αφ_1,φ_2>=α<φ_1,φ_2>$
　(2-14)　　 $<φ_1+φ_2,φ_3>=<φ_1,φ_3>+<φ_2,φ_3>$

定義２－５　閉包と閉集合・開集合

(1) $H$ をヒルベルト空間とし、 $𝒟$ を $H$ の空でない部分集合とする。 $H$ の元で、 $𝒟$ の点列の極限となっているものの全体を $𝒟$ の閉包とよび、 $\overline{𝒟}$ で表す。

　　 $\overline{𝒟}=｛φ∈H |φ_n∈𝒟（n=1,2,・・・）が存在して、lim_{n→∞}φ_n=φ｝$

これは、 $𝒟$ の収束列の極限をすべて集めてできる集合であり、 $𝒟⊂\overline{𝒟}$ となる。
(2)閉包をとっても変わらない部分集合、つまり、 $𝒟=\overline{𝒟}$ をみたす部分集合 $𝒟$ を閉集合という。
(3)補集合 $𝒡^c=H╱𝒡$ が閉集合となる部分集合 $𝒡⊂H$ を開集合という。

定義２－６　直交補空間

ヒルベルト空間 $H$ の部分空間 $𝒟$ に対して、 $𝒟$ のすべてのベクトルと直交するベクトルの全体を $𝒟$ の直交補空間といい、 $𝒟^{⊥}$ で表す。

　　 $𝒟^{⊥}={φ∈H |すべてのψ∈𝒟に対して、<φ,ψ>=0}$

定理２－１　ヒルベルト空間 $H$ の部分集合 $𝒟$ に対して、 $\overline{𝒟}$ は閉集合である。

（証明）
$\overline{𝒟}=F$ とおくと、閉包の定義より、 $F⊂\overline{F}$ となる。
そこで、この逆の包含関係を示すせばよい。
$ψ∈\overline{F}$ とする。このとき、 $φ_n→φ　（n→∞）$ となる $φ_n∈F$ が存在する。したがって、任意の $ε>0$ に対して、番号 $n_0$ が存在して、 $n≧n_0$ ならば、 $||φ_n-φ||＜ε$ が成り立つ。
また、 $φ_{n_0}∈F=\overline{𝒟}$ であるから、 $||φ_n-φ_{n_0}||＜ε$ をみたす点列 $φ_n⊂𝒟$ が存在する。（　 $\overline{𝒟}=｛φ_0∈H |φ_n∈𝒟（n=1,2,・・・）が存在して、lim_{n→∞}φ_n=φ_0｝$ ）
したがって、 $||φ_n-φ||=||(φ_n-φ)+(φ_{n_0}-φ)||≦||φ_n-φ_{n_0}||+||φ_{n_0}-φ||＜2ε$
これは、 $φ_n→φ （n→∞）$ を意味するから $φ∈\overline{𝒟}=F$ である。
よって、 $\overline{F}⊂F$ が示された。

定理２－２　ヒルベル空間 $H$ の部分空間 $𝒟$ が閉集合であるための必要十分条件は、 $𝒟$ の任意の収束列に対して、その極限が $𝒟$ の元になっていることである。

（証明）
【必要性】
$𝒟$ を閉集合、 $φ_n∈𝒟$ 、 $φ_n→φ∈H （n→∞）$ とする。このとき、 $φ∈\overline{𝒟}$ であり、 $𝒟$ は閉集合であるので、 $𝒟=\overline{𝒟}$ である。よって、 $φ∈𝒟$
【十分性】
$𝒟$ の任意の収束列に対して、その極限が $𝒟$ の元になっていると仮定し、 $𝒟⊂\overline{𝒟}$ の逆の包含関係を示す。（このとき、 $𝒟=\overline{𝒟}$ となるので、定理２－１により $𝒟$ は閉集合となる。）
$φ∈\overline{𝒟}$ とすれば、閉包の定義によって、 $φ_n→φ （n→∞）$ となる $φ_n∈𝒟$ が存在する。仮定により、 $φ∈𝒟$ である。
したがって、 $\overline{𝒟}⊂𝒟$ である。

定理２－３　直交分解定理

$𝒨$ をヒルベルト空間 $H$ の閉部分空間とする。このとき、任意の $φ∈H$ に対して、 $d(φ,𝒨)=||φ-φ_𝒨||$ を満たすベクトル $φ_𝒨∈𝒨$ がただ一つ存在し、この $φ_𝒨∈𝒨$ を、 $𝒨$ の上への $φ$ の正射影という。
（証明）
$d=d(φ,𝒨)$ とする。 $d$ の定義より、 $||φ-φ_n||→d （n→∞）$ となる点列 $｛ψ_n｝_{n=1}^∞⊂𝒨$ が存在する。
このとき、
$||ψ_n-ψ_m||^2=||(ψ_n-φ)+(φ-ψ_m)||^2=||ψ_n-φ||^2+||φ-ψ_m||^2+Re(<ψ_n-φ,φ-ψ_m>)$ 　　①
$||ψ_n+ψ_m-2φ||^2=||(ψ_n-φ)-(φ-ψ_m)||^2=||ψ_n-φ||^2+||φ-ψ_m||^2-Re(<ψ_n-φ,φ-ψ_m>)$ 　　②

②より、
$Re(<ψ_n-φ,φ-ψ_m>)=||ψ_n-φ||^2+||φ-ψ_m||^2-||ψ_n+ψ_m-2φ||^2$ 　　③

③を①に代入すると、
$||ψ_n-ψ_m||^2=2||ψ_n-φ||^2+2||φ-ψ_m||^2-||ψ_n+ψ_m-2φ||^2$
　　　 $=2||ψ_n-φ||^2+2||φ-ψ_m||^2-4||\frac{ψ_n+ψ_m-2φ}{2}||^2$
　　　 $≦2||ψ_n-φ||^2+2||φ-ψ_m||^2-4d$
　　　 $→2d^2+2d^2-4d^2=0 （n,m→∞）$
したがって、 $｛ψ_n｝_{n=1}^∞$ はコーシー列である。よって、 $ψ_n→φ_𝒨$ となる $φ_𝒨∈H$ が存在し、 $d(φ,𝒨)=||φ-φ_𝒨||$ が成り立つ。 $𝒨$ は閉部分空間であるから $φ_𝒨∈𝒨$ となる。（定理２－２により、点列の極限が集合でに収束すれば閉集合となる。）
次に、 $φ_𝒨$ の一意性を証明する。
仮に、 $φ_𝒨$ とは別に $d(φ,𝒨)=||φ-ψ||$ を満たす $ψ∈𝒨$ があったする。上記の計算を、 $ψ_n,ψ_m$ の代わりに、 $φ_𝒨,ψ$ を用いて行えば、 $||φ_𝒨-ψ||^2≦2||φ_𝒨-φ||^2+2||φ-ψ||^2-4d=2d^2+2d^2-4d^2=0$ となる。
したがって、 $φ_𝒨=ψ$ となる。

定理２－３　正射影定理

$𝒨$ をヒルベルト空間 $H$ の閉部分空間とする。このとき、 $H$ の任意のベクトル $φ$ は、 $φ=ψ+η （ψ∈𝒨,η∈𝒨^{⊥}）$ という形に一意的に表される。ここで、 $ψ,η$ はそれぞれ、 $𝒨,𝒨^{⊥}$ の上への $φ$ の正射影である。
（証明）
$φ∈H$ とし、 $𝒨$ 上への $φ$ の正射影を $ψ$ とする。 $η=φ-ψ$ とおけば、 $φ=ψ+η$ と書ける。そこで、 $η∈𝒨^{⊥}$ を示す。
$d=||φ-ψ||$ とおく。 $ξ∈𝒨,t∈\bf{R}$ とする。このとき、 $ψ+tξ∈𝒨,d=||η||$ であるから、
　　 $d^2≦||φ-(ψ+tξ)||^2=||η-tξ||^2=d^2+t^2||ξ||^2-2tRe(<η,ξ>)$
したがって、すべての $t∈\bf{R}$ に対して、 $t^2||ξ||^2-2Re(<η,ξ>)≧0$ 、これは $Re(<η,ξ>)=0$ を意味する。 $ｔ$ の代わりにて $it$ を用いれば同様にして、 $Im(<η,ξ>)=0$ が得られる。したがって、 $<η,ξ>=0$ であり、 $ξ$ は $𝒨$ の任意の元であったから、 $η∈𝒨^{⊥}$ である。
次に $φ$ の表示の一意性を示すために、別に $φ=ψ'+η' （ψ'∈𝒨,η'∈𝒨^{⊥}）$ と表されたとする。このとき、 $ψ-ψ'=η-η'$ となり、この式の左辺は $𝒨$ の元であり、右辺は $𝒨^{⊥}$ の元である。ところが、 $𝒨∩𝒨^{⊥}={0}$ であるから、 $ψ-ψ'=0,η-η'=0$ でなければならず、 $ψ=ψ',η=η'$ となる。

３．ヒルベルト空間上の線形汎関数

定義３－１　作用素

作用素 $T$ とはヒルベルト空間 $H$ もしくはその部分空間 $D$ に属している各元 $φ$ （ $∀φ∈H$ ）を $H$ またはその部分空間 $R$ に属している元 $ψ$ へ写像するものである。

　　(3-1)　　 $Tφ=ψ$

定義３－２　線形作用素

作用素 $T$ がヒルベルト空間 $H$ もしくはその部分空間 $D$ に属しているすべての関数 $φ$ 、 $ψ$ およびすべてのスカラー $α$ 、 $β$ （いずれも複素数）に対して、

　　(3-2)　　 $T(αφ+βψ)=αTφ+βTψ$

という性質を有するとき、この $T$ はヒルベルト空間上の線形作用素という。

定義３－３　有界線形作用素

$H_1,H_2$ をヒルベルト空間、 $T$ を $H_1$ から $H_2$ への線形作用素とする。定数 $C＞0$ が存在して、すべての $φ∈D(T)$ に対して次の関係が成り立つとき、 $T$ は有界であるという。有界な線形作用素を、有界線形作用素という。

　　(3-3)　　 $||Tφ||≦C||φ||$

以下では、特に断らない限り、作用素は線形作用素であるとする。

定義３－４　定義域と値域と零空間

作用素 $T$ の定義される元 $φ∈H$ の集合 $D(T)$ を $T$ の定義域、 $R(T)=｛Tφ:φ∈D(T)｝$ を $T$ の値域という。
$Tφ=0$ を満たすすべての元の定義域 $N(T)$ を $T$ の零空間という。

定義３－５　作用素の同等

作用素 $S,T$ について、次の２つの条件(1)と(2)が満たされるとき、 $S$ と $T$ は等しいとし、 $S=T$ と表す。
　(1) $D(S)=D(T)$ 　（定義域が等しい）
　(2)すべての $φ∈D(S)$ （ $=D(T)$ ）に対して $Sφ=Tφ$ 　（作用が等しい）

定義３－６　作用素の単射・全射

・作用素 $T$ が、 $φ≠ψ$ であるような $φ,ψ∈D(T)$ に対して、 $Tφ≠Tψ$ であるとき、 $T$ は１対１あるいは単射であるという。
・作用素 $T$ がヒルベルト空間 $H_1$ から $H_2$ （つまり、 $φ∈H_1,Tφ∈H_2$ ）の作用素であり、値域 $R(T)=H_2$ であるとき、 $T$ を全射であるという。

定義３－７　ヒルベルト空間上の線形汎関数

ヒルベルト空間上の閉部分空間 $M$ に属するすべての $f,g$ とすべての複素数 $α,β$ に対して汎関数 $l$ が次の条件を満たす場合、この $l$ は $M$ 上の線形汎関数という。

　　(3-4)　　 $l(αf+βg)=αl(f)+βl(g)$

この $l$ を $f$ の共役関数といい、 $l(f)$ の集合で作られる空間 $M$ をの共役空間という。

定義３－８　線形汎関数の有界性

ヒルベルト空間 $H$ の部分空間 $M$ に属するすべての $h$ に対して、

　　(3-5)　　 $|l(h)|≦κ||h||$ 　　　（ $||h||^2$ = $<{h},{h}>$ 　）
　　　　
となるような正定数 $κ$ が存在するとき、線形汎関数はその定義域 $M$ 上の有界であると言われる。
この不等号が $M$ に属するすべての $h$ に対して成り立つ最も小さい正定数 $κ$ は線形汎関数 $l$ のノルムといわれ、 $||l||$ によって表される。

　　(3-6)　　 $||I||=sup_{||h||≠0}\frac{|l(h)|}{||h||}$

定義３－９　線形汎関数の連続性

(1)線形汎関数 $i(h)$ が $M$ で連続とは、 $g,h$ が $M$ に属し、各 $ε＞0$ に対して $||g-h||＜δ$ のときはいつでも、 $|l(h)-l(g)|＜ε$ となるような $δ＞0$ が存在することである。
( $δ=0$ では、不連続）
(2) $M$ に属する点列 ${h_n}$ が極限 $h$ をもつときはいつでも $l(h_n)→l(h)$ となるとき、汎関数 $l$ は $h$ で連続であるという。
(3) $M$ 上のすべての点で連続は汎関数は $M$ で連続であるという。

定理３－１　原点で連続な有界線形汎関数 $l$ はその全定義域 $M$ で連続である。

（証明）
$M$ に属する任意の点列 ${h_n}$ が $M$ に属するある点 $h$ に極限をもつとする。
このとき $||h_n-h||→0$ となり、原点で連続であるという仮定より、 $l(h_n-h)→l(h)$ となる。
仮定により $l$ は線形であるから、 $l(h_n-h)=l(h_n)-l(h)$ で、原点において連続であるから、 $l(h_n)→l(h)$ となり、 $l$ は全定義域で連続となる。

定理３－２　線形汎関数において、有界性⇔連続性が成り立つ。

（証明）
【有界⇒連続】
$l$ が有界であるとする、有界の定義３－８よりある定数 $κ$ が存在して、
　　　　 $|l(h_n)-l(h)|=|l(h_n-h)|≦κ||h_n-h||$
となる。したがって、 $h_n→h$ のとき、 $l(h_n)→l(h)$ となり、定義３－９(２)より $l$ は連続である。
【連続⇒有界】
もし、 $l$ が非有界であるなら、 $κ＞0$ に対して
　　　 $|l(h_n)|＞κ||h_n||$
となるような $M$ に属する非ゼロの点列 ${h_n}$ が存在することになる。
すると、0に収束する点列 $g_n=\frac{h_n}{n||h||}$ は $|l(g_n)|＞\frac{κ}{n}＞0$ となり、 $l(g_n)$ は0になりえず、原点における連続性に反する。

定理３－３　有界線形作用素の連続性

$T$ をヒルベルト空間 $H_1$ からヒルベルト空間 $H_2$ への有界線形作用素とするとき、次の(1)と(2)が成り立つ。
(1) $φ_n∈D(T),φ_n→φ∈D(T)$ （ $n→∞$ ）⇒ $Tφ_n→Tφ$ （ $n→∞$ ）
(2) $D(T)=H_2$ のとき、零空間 $N(T)$ は閉部分空間である。
（証明）
(1) $Ｔ$ の線形性と有界性により、 $||Tφ_n-Tφ||=||T(φ_n-φ)||≦||T|| ||φ_n-φ||$
よって、 $φ_n→φ$ であれば、 $||Tφ_n-Tφ||→0$ であり、 $Tφ_n→Tφ$ となる。
（2） $φ_n∈N(T),φ_n→φ∈H_2$ となる。このとき、連続性により、 $Tφ_n→Tφ$ となる。
一方で、 $Tφ_n=0$ であるため、 $Tφ=0$ であるので、 $φ∈N(T)$ 。
よって、 $N(T)$ は閉集合である。なお、 $N(T)$ が部分空間であることは定義より自明。

定理３－４　リースの表現定理

ヒルベルト空間 $H$ の全体で定義される連続有界線形汎関数 $F$ は、 $H$ に属するすべての元 $ψ$ に対して、次のように内積の形で $H$ 内の元 $φ_F$ と対応づけられて一意的に表すことができる。さらに、 $||φ_F||=||F||$ が成り立つ。

　　(3-7)　　 $F(ψ)=<φ_F,ψ>$ 　

（証明）
まず、 $N(F)=H$ （ $F(ψ)=0$ ）の場合を考える。この場合は、 $φ_F=0$ とすれば、 $F(ψ)=0=<φ_F,ψ>,ψ∈H$ が成り立つので、 $φ_F$ が存在する。
次に $N(F)≠H$ の場合を考える。定理３－３(2)により、 $N(F)$ は閉部分空間であるから、正射影定理（定理２－３）により、零でないベクトル $ψ_0∈(N(F))^{⊥}$ が存在し、 $F(ψ_0)≠0$ が成り立つ。
よって、任意の $ψ∈H$ に対して、 $φ≡ψ-F(ψ)F(ψ_0)^{-1}ψ_0$ は $N(F)$ の元である。したがって、 $<ψ_0,φ>=0$ となる。
これを書き直すと、 $0=<ψ_0,ψ>-F(ψ)F(ψ_0)^{-1}||ψ_0||^2$ なので、 $F(ψ)=\frac{F(ψ_0)<ψ_0,ψ>}{||ψ_0||^2}$ を得る。
したがって、 $φ_F=\frac{F(ψ_0)^{*}ψ_0}{||ψ_0||^2}$ とすれば、 $F(ψ)=<φ_F,ψ>$ となり、 $φ_F$ は存在する。
次に、 $φ_F$ の一意性を証明する。
別に、 $F(ψ)=<φ_F',ψ>$ 、 $ψ∈H$ をみたす $φ_F'∈H$ が存在すると、 $<φ_F-φ_F',ψ>=0$ となる。 $ψ$ は任意であるから、特に、 $ψ=φ_F-φ_F'$ とすれば、 $||φ_F-φ_F'||=0$ なので、 $φ_F=φ_F'$ となる。

定義３－１０　共役空間と共役関数

リースの表現定理（定理３－４）により、ヒルベルト空間 $H$ の全体で定義される連続有界線形汎関数 $F$ は、 $F(ψ)=<φ_F,ψ>$ の形式で内積として一意に表されるが、この線形汎関数のすべてからなる集合を $H$ の共役空間また双対空間といい、 $H^*$ で表す。
また、F(ψ)を共役関数という。
ヒルベルト空間においては、 $H^*=H$ となる。

４．ヒルベルト空間の性質

定義４－１　正規直交基底

$H$ をヒルベルト空間とする。 $H$ が有限次元でN次元とすると、N個の独立なベクトルの組 $ψ_1,ψ_2,・・・,ψ_N$ が存在する。グラム・シュミットの直交化法により、正規直交系 ${｛ψ_n｝^N}_{n=1}$ がとれる。
したがって、任意の $φ∈H$ は、 $φ＝{Σ^N}_{n=1}<ψ_n,φ>ψ_n$ と表される。こうして、有限次元ヒルベルト空間 $H$ においては、つねに正規直交系 ${｛ψ_n｝^N}_{n=1}$ が存在して、 $H$ の任意のベクトル（元）は、その $ψ_n$ 方向への正射影の和として一意に表されることができ、このような正規直交系を $H$ の正規直交基底という。

2020-05-06

ディラック方程式の備忘録

１．パウリ行列

　 $σ_1=\begin{pmatrix} &1\\ 1& \\ \end{pmatrix} ~~~σ_2=\begin{pmatrix} &-i\\ i& \\ \end{pmatrix} ~~~σ_3=\begin{pmatrix} 1&\\ &-1\\ \end{pmatrix}$

　　　 $σ_1σ_2=-σ_2σ_1=iσ_3$ 　　 $σ_2σ_3=-σ_3σ_2=iσ_1$ 　　 $σ_3σ_1=-σ_1σ_3=iσ_2$
　　　 $σ_1^2=σ_2^2=σ_3^2=I$

２．ディラック・パウリ行列

※このように４×４の行列を２×２の行列のように表す表示をディラック表示という。
　 $α_1=\begin{pmatrix} &\textbf{σ}_\textbf{1}\\ \textbf{σ}_\textbf{1}&\\ \end{pmatrix} =\begin{pmatrix} & & &1\\ & &1& \\ &1& & \\ 1&& & \\ \end{pmatrix}$

　 $α_2=\begin{pmatrix} &\textbf{σ}_\textbf{2}\\ \textbf{σ}_\textbf{2}&\\ \end{pmatrix} =\begin{pmatrix} & & &-i\\ & &i& \\ &-i& & \\ i&& & \\ \end{pmatrix}$

　 $α_3=\begin{pmatrix} &\textbf{σ}_\textbf{3}\\ \textbf{σ}_\textbf{3}&\\ \end{pmatrix} =\begin{pmatrix} & &1&\\ & & &-1\\ 1& & & \\ &-1& & \\ \end{pmatrix}$

　 $β=\begin{pmatrix} 1& & &\\ &1& &\\ & &-1& \\ & & &-1\\ \end{pmatrix}$

　　　 ${α_i}^2=β^2=1$
　　　 $α_iα_j+α_jα_i=2δ_{ij}$
　　　 $α_iβ+βα_i=0$

３．ガンマ行列

　　　 $γ^0=β~~~~~~γ^i=βα_i$
　　　 $(γ^0)^2=1~~~~~~(γ^i)^2=-1$
　　　 $γ^νγ^μ=-γ^μγ^ν~~(μ≠ν)$
　　　 $γ^0=γ_0~~~~γ^i=-γ_i$

　ディラック表示で表すと、

$γ^0=\begin{pmatrix} 1&0\\ 0&-1\\ \end{pmatrix} ~~~γ^i=\begin{pmatrix} 0&{σ_i}\\ {-σ_i}&0\\ \end{pmatrix}$

４．特殊相対性理論

計量テンソル： $g^{μν}=g_{μν}= \begin{pmatrix} 1& & & \\ &-1& & \\ & &-1& \\ & & &-1\\ \end{pmatrix}$
※添え字を上げ下げする。
　　　 $x_μ=g_{μρ}x^ρ$
　　　 $g^{μρ}g_{ρν}=g^μ_{~~ν}=δ^μ_ν$

　　　ガンマ行列との関係： $γ^μγ^ν＋γ^νγ^μγ=g^{νμ}~~~γ^ν=g^{νμ}γ_μ$

　　　ローレンツ変換の不変量： $s^2≡g_{μν}x^μx^ν$

　　　ローレンツ変換： $x'^μ=Λ^μ_{~~ν}x^ν$
　　　
　　　 $g_{μν}x'^μx'^ν=g_{μν}x^μx^ν$
　　　 $g_{μν}Λ^μ_{~~ρ}x^ρΛ^ν_{~~σ}x^σ=g_{μν}x^μx^ν$
　　∴ $g_{μν}Λ^μ_{~~ρ}Λ^ν_{~~σ}=g_{ρσ}$ ・・・ローレンツ変換が満たす関係

　　　ローレンツ変換の逆変換

　　　 $x^μ=(Λ^{-1})^μ_{~~ρ}x'^ρ=(Λ^{-1})^μ_{~~ρ}Λ^ρ_{~~ν}x^ν$
　　∴ $(Λ^{-1})^μ_{~~ρ}Λ^ρ_{~~ν}=g^μ_{~~ν}=δ^μ_ν$

　一方 $g_{σρ}Λ^σ_{~~μ}ρΛ^ρ_{~~ν}=g_{μν}$
　　∴ $Λ_{ρμ}Λ^ρ_{~~ν}=g_{μν}$

　さらに $Λ_{ρσ}g^{σμ}Λ^ρ_{~~ν}=g_{σν}g^{σμ}$
　　∴ $Λ_{ρ}^{~~μ}Λ^ρ_{~~ν}=g^μ_{~~ν}=δ^μ_ν$

　　∴ $(Λ^{-1})^μ_{~~ρ}=Λ_{ρ}^{~~μ}$

　　　微小ローレンツ変換： $Λ^μ_{~~ν}=δ^{μ}_{ν}+ε^{μ}_{~~ν}$

　微小量 $ε^{μ}_{~~ν}$ について、１次のレベルまでローレンツ変換の条件を適用すると、
　
　　　 $g_{μν}δ^ν_{σ}δ^{μ}_{ρ}+g_{μν}(ε^μ_{~~ρ}δ^ν_{σ}+δ^μ_{ρ}ε^ν_{~~σ})=g_{ρσ}$
　　∴ $g_{ρσ}+g_{μσ}ε^μ_{~~ρ}+g_{ρν}ε^ν_{~~σ}=g_{ρσ}$

　　　 $ε_{σρ}+ε_{ρσ}=0$ 　
　　よって、無限小ローレンツ変換は反対称テンソル。

５．ディラック方程式

　　　 $i{\hbar}\frac{\partial}{{\partial}t}{\psi}(\textbf{r},t)=(-i{\hbar}c\textbf{α}{\cdot}∇+βmc^2　){\psi}(\textbf{r},t)$

左から $β=γ^0$ を乗じ、 $γ^i=βα_i~~β^2=1$ を用い、さらに $x^0=ct$ とすると、
　　　 $(i{\hbar}γ^μ\frac{\partial}{{\partial}x^μ}-mc){\psi}(\textbf{r})=0$

　　　 $(i{\hbar}γ^μ{\partial}_μ-mc){\psi}(\textbf{r})=0$

ディラック方程式の解である４成分の ${\psi}(\textbf{r})$ を、ディラックスピノルという。

ディラックスピノルと確率密度 $P$ の関係
　　　 $P={\psi}^{\dagger}{\psi}=|{\psi}_0|^2+|{\psi}_1|^2+|{\psi}_2|^2+|{\psi}_3|^2$

６．ディラック方程式のローレンツ変換の共変性

座標が、ローレンツ変換 $x'^μ=Λ^μ_{~~ν}x^ν$ で変換されるときに、ディラックスピノル ${\psi}(x)$ に対して、次のような変換 $S$ が存在すれば、ディラック方程式はローレンツ変換に対して共変であるといえる。

　　　 ${\psi}'(x')=S(Λ){\psi}(x)$ ・・・・
　　　（ $S(Λ)$ は、ローレンツ変換 $Λ^μ_{~~ν}$ によって構成される行列）

　　　 $(i{\hbar}γ^μ{\partial}_μ-mc){\psi}(\textbf{r})=0$

左から $S$ を乗じると

　　　 $(i{\hbar}Sγ^μ{\partial}_μ-mcS){\psi}(\textbf{r})=0$

$S$ と $γ$ 行列は交換しないので、第１項の左に $I=S^{-1}S$ を乗じると、

　　　 $(i{\hbar}Sγ^μS^{-1}{\partial}_μ-mc)S{\psi}(\textbf{r})=0$

　　　 ${\partial}_μ=\frac{{\partial}x'^{ν}}{{\partial}x^{μ}}\frac{\partial}{{\partial}x'^{ν}}=Λ^ν_{~~μ}{\partial}'_{ν}$
なので、

　　　 $(i{\hbar}Λ^ν_{~~μ}Sγ^μS^{-1}{\partial}'_ν-mc){\psi}'(\textbf{r}')=0$

これが
　　　 $(i{\hbar}γ^ν{\partial}'_ν-mc){\psi}'(\textbf{r}')=0$
となればよいが、そのためには、

　　　 $Λ^ν_{~~μ}Sγ^μS^{-1}=γ^ν$
を満たすことが必要で

このような $S$ を微小ローレンツ変換に適用する。
無限小ローレンツ変換 $ε_{μν}$ の１次までで、 $S$ を次のように取る。

　　　 $S=1-iε_{μν}kT^{μν}(γ)~~~~~S^{-1}=1+iε_{μν}kT^{μν}(γ)$
※ $T^{μν}$ は、行列Tの要素ではなく $γ$ 行列から構成される行列である。これを行列の要素と勘違いすると、以下の数式の展開が全く理解できなくなるので注意。当然、 $T^{μν}$ は $γ$ 行列と交換しない。また、 $k$ は定数である。

　　　 $(δ^ν_μ+ε^ν_{~~μ})(1-iε_{ρσ}kT^{ρσ})γ^μ(1+iε_{ρσ}kT^{ρσ})=γ^ν$
　
　 $ε$ の１次までをとると
　　　 $δ^ν_μγ^μ+ε^ν_{~~μ}γ^μ-iδ^ν_με_{ρσ}kT^{ρσ}γ^μ+iδ^ν_μγ^με_{ρσ}kT^{ρσ}=γ^ν$
　　　 $γ^μ+ε^ν_{~~μ}γ^μ-iε_{ρσ}kT^{ρσ}γ^ν+iγ^νε_{ρσ}kT^{ρσ}=γ^ν$
　　∴ $ε^ν_{~~μ}γ^μ-iε_{ρσ}kT^{ρσ}γ^ν+iγ^νε_{ρσ}kT^{ρσ}=0$

第１項の $μ$ を $σ$ にし、 $ε^ν_{~~σ}=g^{νρ}ε_{ρσ}$ を用いると、
　　　 $g^{νρ}ε_{ρσ}γ^σ-iε_{ρσ}kT^{ρσ}γ^ν+iγ^νε_{ρσ}kT^{ρσ}=0$
　　　 $ε_{ρσ}(g^{νρ}γ^σ-ikT^{ρσ}γ^ν+iγ^νkT^{ρσ})=0$
　　　 $ig^{νρ}γ^σ+kT^{ρσ}γ^ν-γ^νkT^{ρσ}=0$
　　∴ $［kT^{ρσ},γ^ν］=-ig^{νρ}γ^σ$

$g^{νρ}=γ^νγ^ρ+γ^ργ^ν$ なので、

　　　 $［kT^{ρσ},γ^ν］=-i(γ^νγ^ργ^σ+γ^ργ^νγ^σ)=-i(γ^νγ^ργ^σ-γ^ργ^σγ^ν)=i［γ^ργ^σ,γ^ν］$
　　∴ $kT^{ρσ}=iγ^ργ^σ$
よって、 $S$ は存在する。

さらに、
　　　 ${\psi}'(x')=S(Λ){\psi}(x)=S(Λ){\psi}(Λ^{-1}x')$

　 $x$ を $x'$ に書き換えると、
　　　 ${\psi}'(x)=S(Λ){\psi}(x)=S(Λ){\psi}(Λ^{-1}x)$

　ここで、
　　　 ${\psi}(Λ^{-1}x)={\psi}(x-ε^μ_{~~ν}x)≒{\psi}(x)-ε^μ_{~~ν}x^ν{\partial}_μ{\psi}(x)$

　よって、
　　　 ${\psi}'(x')=(1-iε_{ρσ}kT^{ρσ})({\psi}(x)-ε^μ_{~~ν}x^ν{\partial}_μ{\psi}(x))$

　 $ε$ を１次までとると、
　　　 ${\psi}'(x')={\psi}(x)-ε^μ_{~~ν}x^ν{\partial}_μ{\psi}(x)-iε_{ρσ}kT^{ρσ}{\psi}(x)$
　　　 ${\psi}'(x')={\psi}(x)-g^{ρμ}ε_{ρσ}x^σ{\partial}_μ{\psi}(x)-iε_{ρσ}kT^{ρσ}{\psi}(x)$
　　　 ${\psi}'(x')={\psi}(x)-ε_{ρσ}x^σ{\partial}^ρ{\psi}(x)-iε_{ρσ}kT^{ρσ}{\psi}(x)$
　　　 ${\psi}'(x')={\psi}(x)-i\frac{ε_{ρσ}}{2}(-i2x^σ{\partial}^ρ+2kT^{ρσ}){\psi}(x)$

　　∴ ${\psi}'(x')={\psi}(x)-\frac{iε_{ρσ}}{2}(ix^ρ{\partial}^σ-ix^σ{\partial}^ρ+2kT^{ρσ}){\psi}(x)$

　ここで、ローレンツ変換の生成子 $M^{ρσ}$ 、

　　　 ${\psi}'(x')={\psi}(x)-\frac{iε_{ρσ}}{2\hbar}M^{ρσ}{\psi}(x)$
　と比較すると、
　　　 $M^{ρσ}=i{\hbar}x^ρ{\partial}^σ-i{\hbar}x^σ{\partial}^ρ+2{\hbar}kT^{ρσ}$
　　　 $M^{ρσ}=x^ρp^σ-x^σp^ρ+2{\hbar}kT^{ρσ}$

　ここで、
　　　 $(M^{23},M^{31},M^{12})=\textbf{L}+\frac{\hbar}{2}\begin{pmatrix}{\textbf{σ}}&0\\0&{\textbf{σ}}\\\end{pmatrix}$
　であるので、 $2{\hbar}k(T^{23},T^{31},T^{12})$ を求めてみると、

　　　 $T^{23}=iγ^2γ^3={i}\begin{pmatrix}0&{σ_2}\\{-σ_2}&0\\\end{pmatrix}\begin{pmatrix}0&{σ_3}\\{-σ_3}&0\\\end{pmatrix}={i}\begin{pmatrix}{-σ_2σ_3}&0\\0&{-σ_2σ_3}\\\end{pmatrix}=\begin{pmatrix}{σ_1}&0\\0&{σ_1}\\\end{pmatrix}$
　　　（ $σ_2σ_3=iσ_1$ ）

　同様にして、 $T^{31}とT^{12}$ も求めると、

　　　 $2{\hbar}k(T^{23},T^{31},T^{12})=2{\hbar}k\begin{pmatrix}{\textbf{σ}}&0\\0&{\textbf{σ}}\\\end{pmatrix}$
　　∴ $k=\frac{1}{4}$

　よって、 $S$ は
　　　 $S=1-\frac{iε_{μν}}{4}T^{μν}(γ)~~~~~S^{-1}=1+\frac{iε_{μν}}{4}T^{μν}(γ)$

2020-02-29

量子力学の軌跡解釈（ボーム力学）とコッヘン＝シュペッカーのＮＯ－ＧＯ定理

量子力学の軌跡解釈（ボーム力学）とコッヘン＝シュペッカーのＮＯ－ＧＯ定理ＮＯ－ＧＯ定理

ここでは、「量子力学の軌跡解釈（ボーム力学）による力学の概要」で用いた数式を引用することがあります。その場合は、概要式（10）」というように標記します。また、同様に公理や命題を引用することもありますが、公理や命題の番号は「量子力学の軌跡解釈（ボーム力学）による力学の概要」から通し番号にします。（公理１～公理４、命題１～命題１１、補題１～２は「量子力学の軌跡解釈（ボーム力学）による力学の概要」からの引用となります。）

１．所有値とオブザーバブル（観測可能量)

古典物理学は、運動量やエネルギーといった物理量を理想的に測定すれば唯一の値が得られ、その測定値は測定前からその物理量が有していたものであるという暗黙の前提の上に成り立っています。従って、観測して測定される得る値は一意に定まっており、「物理量が有する値」「観測すれば測定され得る値」「理想的な測定値」を区別する必要はありません。
これに対して、量子力学は「観測すれば測定され得る値」が多数存在していて、その中から１つの値が「理想的な測定値」として確率的に出現するという構成の上に成り立っています。このような一見して、我々の直観に反する論理が与えられているのは、シュレディンガー方程式が実験結果と一致するという事実を説明するために与えらた後付けの解釈であるためです。
このような多数存在する「観測すれば測定され得る値」は、物理量に応じて決まった演算子の固有値となっており、こういう状況を指して物理量は「観測可能量(オブザーバブル)」であるとも言われています。
しかし、「観測すれば測定され得る値」が多数存在し１つの演算子の固有値となっていれば、逆に演算子から「観測すれば測定され得る値」を数学的に導くことが可能なため、通常はこの演算子のことを観測可能量(オブザーバブル)というのが一般的です。しかし、量という言葉の意味からすれば、観測可能量というのは誤解を生じやすいため、以後「オブザーバブル」という言葉を使用することにします。なお、物理量は実数であり、「観測すれば測定され得る値」も実数であることから、それを固有値とする演算子は、必ずエルミート演算子であります。従って、物理量はオブザーバブルであり、それはエルミート演算子であるということになります。
「量子力学の軌跡解釈（ボーム力学）による力学の概要」では、所有値(＝「ある物理量を観測していなくとも系が所有していると考えらえる値」)を主に取扱い、対照的な概念として「観測可能量」(＝｢ある物理量を観測すると測定され得る値」）を用い、この「観測可能量」という言葉を、通常用いられている演算子としての「オブザーバブル」とは異なる意味で使用していましたが、ここでは、標準的な「オブザーバブル」とその所有値の関係を与えます。（「量子力学の軌跡解釈（ボーム力学）による力学の概要」では、演算子そのものよりもその固有値全体という意味で「観測可能量」という言葉を用いていました。通常は、演算子のほうを観測可能量（オブザーバブル）といいます。）

【公理４】（所有値とオブザーバブルの関係）
系が位置 $x$ を所有値として有する粒子とそれに随伴するパイロット波 $Ψ$ によって表されているとき、その系の物理量であるオブザーバブル $Ａ$ (エルミート演算子)について、粒子は所有値としては次にような $a$ を有する。（ $Re(・)$ は、実部のみを取ることを意味します。）

　　　　　　　 $a(x,t)=Re(\frac{Ψ(x,t)*AΨ(x,t)}{Ψ(x,t)*Ψ(x,t)})$ 　　　　　(1)

なお、概要(11)（ $ψ(x,t)≡R(x,t)exp(i\frac{S(x,t)}{ℏ})$ ）を用いると、

　　　　　 $a(x,t)=Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}AR(x,t)e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})$ 　　　(2)

となる。
【公理４】は、あらゆるオブザーバブル $Ａ$ が、粒子の所有値の場(時間と位置に依存する)となることを示していますが、これを運動量に適用すると次のような結論が得られます。

【命題１２】
パイロット波 $Ψ$ が随伴する粒子は、運動量として次のような [P(x,t)]を有し、その運動量の場に従って運動する。

　　　　　　　　　　　 $P(x,t)＝∇S(x,t)$ 　　　　(3)

（証明）
運動量のオブザーバブルは、 $P=-iℏ∇$ であるから、式(2)より、

　　　　　 $p=Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}(-iℏ∇)R(x,t)e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})$
　　　　　　　　 $=Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}(-iℏ∇R(x,t)+R(x,t)∇S(x,t))e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})$
　　　　　　　　 $=Re(\frac{-iℏR(x,t)∇R(x,t)+R(x,t)^{2}∇S(x,t))}{R(x,t)^2})=∇S(x,t)$ 　　　(4)

　　　（ $R$ 及び $S$ は、概要(11)（ $ψ(x,t)≡R(x,t)exp(i\frac{S(x,t)}{ℏ})$ ）の定義により実数）
以上のことから、式(3)が成り立つことがわかります。

【命題１２】から粒子の質量が $m$ であったとすれば、概要式(12)に従い粒子が運動することが明らかとなります。従って、【公理３】、より一般的である【公理４】の内容に抱合されることになりますので、[公理３]を不要となります。
次に、エネルギーのオブザーバブルであるハミルトニアン $H=iћ∂/∂t$ ついて、【公理４】を適用すると、【命題４】の概要式(17)と同じ結果になることがわかる。

【命題１３】
パイロット波 $Ψ$ が随伴する粒子は、エネルギーとして次のような $E(x,t)$ を有する。

　　　　　　　　　　　　　　 $E=-∂S(x,t)/∂t$ 　　　　　(5)

（証明）
エネルギーのオブザーバブルである $H=iћ∂/∂t$ を、式(2)の $A$ に代入すれば明らか。

【補題３】
運動量所有値の自乗 $p(x,t)^{2}$ と運動量自乗の所有値 $p^{2}(x,t)$ の間には次のような関係が成り立つ。

$p^{2}(x,t)=-\frac{ћ^{2}}{R(x,t)}∇^{2}R(x,t)+(∇S(x,t))^{2}=-\frac{ћ^{2}}{R(x,t)}∇^{2}R(x,t)+p(x,t)^{2}$ 　　　　(6)

（証明）
式(2)より、

　 $p^{2}(x,t)=Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}(-iℏ∇)^{2}R(x,t)e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})$
　　　　　 $=Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}(-iℏ∇)(-iℏ∇R(x,t)+R(x,t)∇S(x,t))R(x,t)e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})$
　　　　　 $=Re(\frac{R(-2iℏ∇S・∇R-ℏ^{2}∇^{2}R+R(∇S)^{2})}{R^2})$
　　　　　 $=-\frac{ћ^{2}}{R}∇^{2}R+(∇S)^{2}=-\frac{ћ^{2}}{R(x,t)}∇^{2}R(x,t)+p(x,t)^{2}$
　

２．ＦＵＮＣとコッヘン＝シュペッカーのＮＯ－ＧＯ定理

まず、「ベルの定理」と「コッヘン＝シュペッカーのＮＯ－ＧＯ定理」について簡単に説明します。
証明過程は省略しますが、「ベルの定理」とは次のように３つの条件が両立しないことを証明したものです。

【ベルの定理】
次の３つの条件は両立しない。
　(1) 個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できる。
　(2) そのような個々の量子系に付与された値が、集団としては量子力学の統計的予測を再現する。
　(3) 量子系においては局所的な相関しかない。

量子力学が実験事実と整合することから、(2)は成立するものとみなします。すると、ベルの定理を満たすためには、(1)か(3)のいずれかが否定されなければなりませんが、(1)を否定し(3)を肯定するのが標準解釈で、「個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できない。」が「量子系においては局所的な相関しかない。」とする立場です。

【標準解釈】
　・個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できない。
　・量子系においては局所的な相関しかない。」

一方で、軌跡解釈は(1)を肯定し、(3)を否定するもので、「すべてのオブザーバブルに同時に確定した値を付与できる。」が「量子系においては非局所的な相関もありうる。」とする立場です。もっとも、(1)を肯定しすべてのオブザーバブルに同時に確定した値を付与できるとしても、その同時確定した値を同時に観測できることを意味するのではなく、所有値(＝「あるオブザーバブルを観測していな
くとも系が所有していると考えらえる値」)として粒子が確定した値を有するとすることも可能です。一般的に軌跡解釈はこの論理構成に依拠するもので、所有値という概念は言わば「隠れた変数」であり、軌跡解釈が「非局所的な隠れた変数の理論」と呼ばれるのはこのためです。

【軌跡解釈】
　・すべてのオブザーバブルに同時に確定した値を付与できる。
　・量子系においては非局所的な相関もありうる。

「コッヘン＝シュペッカーの NO-GO 定理」(ＫＳ定理)は、次のような３つの条件が両立しないことを示すものですが、これにより【ベルの定理】の条件(1)を否定し「すべてのオブザーバブルに同時に確定した値を付与できない。」と結論付けており、できないこと証明したという意味でNO-GO 定理と言われています。しかし、ＫＳ定理は証明の過程で、同時に確定した値を付与されたオブザーバブルが有するＦＵＮＣ(The Functional Composition Principle)という規則を用いていますが、軌跡解釈ではこのＦＵＮＣが成り立たないことを示すことができ、ＫＳ定理によって軌跡解釈が否定されたとは必ずしもいい切れません。

【コッヘン＝シュペッカーの NO-GO 定理】（ＫＳ定理）
次の３つの条件は両立しない。
　(1) 個々の量子系について、すべての物理量に同時に確定した値を付与できる。
　(2）もし個々の量子系について、すべての物理量が同時に確定した値を有するなら、その値は測定状況に依存しない。
　(3) 個々の量子系について、すべての物理量の取り得る値と射影演算子には１対１の対応関係がある。

この定理の証明には次のような公理を仮定する必要があります。これはエルミート演算子がオブザーバブルであるための条件を仮定するものです。（全てのエルミート演算子がオブザーバブルであるわけではありません。）

【仮定】
エルミート演算子 $A$ の固有値である実数 $a$ が定義されており、与えられた量子状態について、 $A$ に対する量子力学の統計的計算により、 $b=ρ(［A］=a)$ である実数 $b$ が導かれるなら、実数 $a$ に対するエルミート演算子 $A$ はオブザーバブルである。
（ここで、 $〔A〕$ とはエルミート演算子 $A$ の固有値である実数を表し、 $b=ρ(［A］=a)$ とは $〔A〕=a$ である確率を表す。）

この仮定を用いた、ＫＳ定理の証明過程の概要は次のようになります。

（証明１）（ＦＵＮＣの導出）
ある量子系にオブザーバブル $A$ がある。ＫＳ定理の(1)が成立するなら、オブザーバブル $A$ は所有値として［A］=aを有する。従って、ある関数 $f：R→R$ に対して、値 $f(［A］=b)$ を定義することができる。（ $f：R→R$ は、関数 f が実数から実数への関数であることを表す。）
また、【仮定】よりオブザーバブル $A$ は量子力学の統計的計算により確率 $c=ρ(［A］=a)$ を定義することができる。
一方、関数 $f$ により、エルミート演算子 $B=f(A)$ を定義することができ、確率の定義より、 $ρ(［A］=a)=ρ(［f(Ａ)］=a)$ が成り立つ。
従って、エルミート演算子 $B=f(A)$ は、 $〔B〕=〔f(A)〕=b$ という値が定義され、量子力学の統計的計算により $c=ρ(〔f(Ａ)〕=b)$ という実数を求めることができるので、【仮定】より $B＝f(A)$ はオブザーバブルである。
そして、ＫＳ定理の(2)が成立するなら、オブザーバブル $B$ に定義される値 $〔B〕$ は測定状況に依存せずに一意であることが言えるため、次のことが成り立つ。

【ＦＵＮＣ】
$A$ をオブザーバブルとし、 $f：R→R$ をある関数とすると、 $f(Ａ)$ は一意に定まるオブザーバブルであり、

　　　　　 $〔f(Ａ)〕=f(〔Ａ〕)$

が成り立つ。
（ $H=ℏ^2P^2/2m$ が成り立つのであれば、所有値について $E=ℏ^2p^2/2m$ が成り立つ）

(証明２)（和の規則の導出）
オブザーバブル $A$ と $B$ が可換であるとき、ある極大エルミート演算子 $C$ が存在し、ある関数 $f , g：R→R$ により、 $A=f(C)$ 及び $B=g(C)$ と表すことができる。
ここで $C$ はエルミート演算子であるため、スペクトル定理により、

　　　　　 $C=\int{λdE(λ)}$

と表すことができるため、

　　　　　 $A=\int{f(λ)dE(λ)}$ 　　　　 $B=\int{g(λ)dE(λ)}$

　　　　　 $A+B=\int{（f(λ)+g(λ)）dE(λ)}$

となる。ここで、 $h(λ)=f(λ)+g(λ)$ を定義すると、

　　　　　 $A+B=\int{h(λ)dE(λ)}=h(C)$

であるため、 $［A+B］=［h(C)］$ となる。

一方で、

　　　　　 $［A］+［B］=［f(C)］+［g(C)］$

なので、ここで【ＦＵＮＣ】より、

　　　　　 $［A］+［B］=［f(C)］+［g(C)］=f(［Ｃ］)+g(［Ｃ］)=h(［Ｃ］)=［h(Ｃ)］$

となるため、

　　　　　 $［A］+［B］＝［A+B］$

が成り立りたち、次のことが言える。

【和の規則】
オブザーバブル $A$ と $B$ が可換であるときが可換であるとき、 $［A］+［B］=［A+B］$ が成り立つ。

（証明３）
【仮定】より、恒等演算子はオブザーバブルであるといえる。従って、次のような射影演算子の和で与えられる恒等演算子に $I=P_1+P_2+P_3+・・・P_N$ には【和の規則】を適用でき、

　　　　　 $［I］=［P_1］+［P_2］+［P_3］+・・・［P_N］$

となる。

この先の証明過程は省略しますが、これを用いて、３以上の任意のヒルベルト空間において、相互に直交する一次元射影作用素からなる任意の集合について、その中の一つだけに射影作用素に１を与え、残りすべてに０を与える付与は存在しないことを数学的に証明し、ＫＳ定理(3)が成り立たないことが証明され、ＫＳ定理は証明されています。

最後まで証明したわけではありませんが、ＫＳ定理が成立するためには、【仮定】と【ＦＵＮＣ】が前提となっていることがわかります。
従って、逆にこのどちらかを満たさない理論についてはＫＳ定理の適用除外となる可能性がありそうです。
なお、ＫＳ定理が成立することからＫＳ定理(1)を否定的にとらえ「個々の量子系について、すべての物理量に同時に確定した値を付与できない。」とし同時に確定した物理量を否定するのが、コッヘンとシュペッカーが示そうとしたことです。

次のように、軌跡解釈には【ＦＵＮＣ】が適用されないことから、ＫＳ定理が必ずしも適用されないことが証明されます。

【命題 16】
軌跡解釈における運動量の所有値はＦＵＮＣを満たさない。従って、軌跡解釈にはＫＳ定理が適用されない。

（証明）
ＦＵＮＣより、 $f(A)=A^2$ という関数に対して、

　　　　 $［f(A)］＝［A^2］＝［A］^2$

が成り立ち、運動量オブザーバブル $P$ が所有値 $p$ 有し、ＦＵＮＣを満たすなら、

　　　　 $［f(P)］＝［P^2］＝［P］^2$

が成り立つはずである。
しかし、【命題１２】の式(3)から $(p)^2＝(∇S(x,t))^2$ であり、

一方【補題４】式(6)より、

　　　　 $p^{2}(x,t)=\frac{ћ^{2}}{R(x,t)}∇^{2}R(x,t)+p(x,t)^{2}$ 　　　　　　　　　

となるため、 $［P^2］≠［P］^2$ である。
よって、軌跡解釈における運動量の所有値はＦＵＮＣを満たさず、軌跡解釈にＫＳ定理は適用されない。

2020-01-21

ベイズ統計　第４章　ナイーブベイズ分類器とナイーブベイズフィルター

ベイズ統計

第１章　　確率の基礎
 第２章　　ベイズの定理からベイズ理論の出発点へ
 第３章　　ベイズの展開公式

ベイズ統計

第４章　ナイーブベイズ分類器とナイーブベイズフィルター

4.1　ナイーブベイズ分類器とナイーブベイズフィルター

ベイズ分類器とは、ベイズ理論を用いて、与えられたデータを目的のカテゴリーに分類する分類器のモデルをいう。例えば、文書に記載されている特定のキーワードが一定確率であるならば、この文書のカテゴリーは「物理学」「労働法」「社会保険」等といった分類をする。
このベイズ分類器で有名な応用の１つがナイーブベイズフィルターである。ナイーブベイズフィルターは、分類するといっても多数のカテゴリーに分類するのではなく、２つのカテゴリーに分類し不要なものを排除する（まさに、フィルターである）。わかりやすい例は、迷惑メールの排除で、メールに記載されたキーワードから迷惑メールを判別し、排除する。
ここでは、この迷惑メールの排除方法にどのようにベイズ統計が用いられているか見てみる。

4.2　ナイーブベイズフィルターの具体例

迷惑メールであるかどうかを判別するために、４つキーワード「クリック」「キャンペーン」「運営」「停止」に着目すると、これらのキーワードが次の確率で迷惑メールと普通メールに含まれていることが分かっているものとする。

クリック　　　：迷惑メール 0.6　普通メール 0.2
キャンペーン：迷惑メール 0.5　普通メール 0.1
運営　　　　　：迷惑メール 0.05　普通メール 0.45
停止　　　　　：迷惑メール 0.01　普通メール 0.3

あるメールを調べてみると、「クリック」「キャンペーン」「停止」の順でこれらのキーワードが１回ずつ記載されていた。
このメールが、迷惑メールであるかどうか判別してみる。
なお、受信メールのうち、迷惑メールと普通メールの比率は８：２の割合であるものとする。

4.2.1　事象（記号）の定義

まず、各事象について、次のとおり記号を定義する。
なお、前章までと同様に、原因を $H$ 、データを $D$ で表すこととする。

$H_1$ ：受信メールが迷惑メールである。
$H_2$ ：受信メールが普通メールである。

$D_1$ ：受信メールに「クリック」というキーワードが含まれる。
$D_2$ ：受信メールに「キャンペーン」というキーワードが含まれる。
$D_3$ ：受信メールに「運営」というキーワードが含まれる。
$D_4$ ：受信メールに「停止」というキーワードが含まれる。

メールで出現したキーワードは、順番に「クリック」「キャンペーン」「運営」であったので、これをデータ（ $D$ ）として次のように定義する。

$D$ ： $D_1→D_2 → D_4$

求めたいものは、データが $D$ であるという条件のもので、受信メールが迷惑メールである確率もしくは普通メールである確率であるため、

$P(H_1|D)=P(H_1|D_1→D_2 → D_4)$

$P(H_2|D)=P(H_2|D_1→D_2 → D_4)$

と表される。

ベイズ統計第３章ベイズの展開公式 - 数学と物理学のブログ

ここで前章で導出したベイズの展開式を用いると、

$P(H_1|D)=\frac{P(D|H_1)P(H_1)}{P(D|H_1)P(H_1)+P(D|H_2)P(H_2)}$ 　　(1)

$P(H_2|D)=\frac{P(D|H_2)P(H_2)}{P(D|H_1)P(H_1)+P(D|H_2)P(H_2)}$ 　　(2)

4.2.2　判別条件

式(1)と式(2)を用いれば、迷惑メールであるか普通メールであるかを判別できるが、分母が同じため、次のようになる。

迷惑メール： $P(H_1|D)＞P(H_2|D)$ 　⇒　 $P(D|H_1)P(H_1)＞P(D|H_2)P(H_2)$ 　　(3)

通常メール： $P(H_1|D)＜P(H_2|D)$ 　⇒　 $P(D|H_1)P(H_1)＜P(D|H_2)P(H_2)$ 　　(4)

4.2.3　ベイズ更新による判別

ベイズ更新を用いて、実際に判別をしてみるが、対象とする文書の中の単語はそれぞれ独立であると仮定する。つまり、メールに記載されている各単語は互いに確率的に影響がないものとする。
まず、「受信メールのうち、迷惑メールと普通メールの比率は８：２の割合であるものとする。」としていることから、事前確率 $P(H_1)$ と $P(H_2)$ を次のように設定する。

　　 $P(H_1)=0.8$
　　 $P(H_2)=0.2$

ここで、ベイズの展開式を用いてデータ $D_1$ が出た場合（「クリック」というキーワードが出た場合）に迷惑メールである確率 $P(H_1|D_1))$ と普通メールである確率 $P(H_2|D_1)$ を求めると、

　　 $P(H_1|D_1)=\frac{P(H_1)P(D_1|H_1)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{0.8×0.6}{0.6×0.8+0.2×0.2}≒0.9231$
　　 $P(H_2|D_1)=\frac{P(H_2)P(D_1|H_2)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{0.2×0.2}{0.6×0.8+0.2×0.2}≒0.0769$

となる。

ベイズ更新により、この結果を今度は事前確率とすると

　　 $P(H_1)=0.9231$
　　 $P(H_2)=0.0769$

同様にして、データ $D_2$ が出た場合（「キャンペーン」というキーワードが出た場合）にそれぞれの確率を求めると、

　　 $P(H_1|D_2)=\frac{P(H_1)P(D_2|H_1)}{P(D_2|H_1)P(H_1)+P(D_2|H_2)P(H_2)}=\frac{0.9231×0.5}{0.5×0.9231+0.1×0.0769}≒0.9836$
　　 $P(H_2|D_2)=\frac{P(H_2)P(D_2|H_2)}{P(D_2|H_1)P(H_1)+P(D_2|H_2)P(H_2)}=\frac{0.0769×0.1}{0.5×0.9231+0.1×0.0769}≒0.0164$

ベイズ更新により、この結果を今度は事前確率とすると

　　 $P(H_1)=0.9836$
　　 $P(H_2)=0.0164$

同様にして、データ $D_4$ が出た場合（「停止」というキーワードが出た場合）にそれぞれの確率を求めると、
　　
　　 $P(H_1|D_4)=\frac{P(H_1)P(D_4|H_1)}{P(D_4|H_1)P(H_1)+P(D_4|H_2)P(H_2)}=\frac{0.9836×0.01}{0.01×0.9836+0.3×0.0164}≒0.667$
　　 $P(H_2|D_4)=\frac{P(H_2)P(D_4|H_2)}{P(D_4|H_1)P(H_1)+P(D_4|H_2)P(H_2)}=\frac{0.0164×0.3}{0.01×0.9836+0.3×0.0164}≒0.333$

となる。これが最後のキーワードであるため、

　　 $P(H_1|D)≒0.667$
　　 $P(H_2|D)≒0.333$

となり、 $P(H_1|D)＞P(H_2|D)$ が成り立つため、迷惑メールと判別される。

なお、第３章で説明したベイズ理論の逐次合理性により、「クリック」「キャンペーン」「停止」という順番が変ったとしても結果は同じになる。

4.2.4　単語の独立性による判別

次は、ベイズ更新を用いずに判別してみる。対象とする文書の中の単語はそれぞれ独立であると仮定していることから、 $P(D|H_1)$ と $P(D|H_2)$ は次のように表すことができる。

$P(D|H_1)=P(D_1→D_2 → D_4|H_1)=P(D_1|H_1)P(D_2|H_1)P(D_4|H_1)$ 　　(5)
$P(D|H_2)=P(D_1→D_2 → D_4|H_2)=P(D_1|H_2)P(D_2|H_2)P(D_4|H_2)$ 　　(6)

そして、式(5)と式(6)を式(3)と式(4)に代入すると、判別式は次のようになる。

迷惑メール： $P(D_1|H_1)P(D_2|H_1)P(D_4|H_1)P(H_1)＞P(D_1|H_2)P(D_2|H_2)P(D_4|H_2)P(H_2)$ 　　(7)
通常メール： $P(D_1|H_1)P(D_2|H_1)P(D_4|H_1)P(H_1)＜P(D_1|H_2)P(D_2|H_2)P(D_4|H_2)P(H_2)$ 　　(8)

式(7)の左辺と右辺を求めると、

$P(D_1|H_1)P(D_2|H_1)P(D_4|H_1)P(H_1)=0.6×0.5×0.01×0.8＝0.0024$ 　　(9)
$P(D_1|H_2)P(D_2|H_2)P(D_4|H_2)P(H_2)=0.2×0.1×0.3×0.2=0.0012$ 　　　(10)

となり、迷惑メールと判別されることがわかる。そして、式(9)と式(10)はそれぞれ迷惑メールである確率と普通メールである確率に比例するので、

$P(H_1|D)=\frac{0.0024}{0.0024+0.0012}≒0.667$
$P(H_1|D)=\frac{0.0024}{0.0024+0.0012}≒0.333$

これは、4.2.3でベイズ更新を用いて計算した確率と一致する。

4.3　ナイーブベイズ分類器と壷のモデル

このナイーブベイズ分類器は、前章の3.3の例２で利用した壷と玉のモデルと同等である。
ベイズ統計第３章ベイズの展開公式 - 数学と物理学のブログ
例えば、「クリック」というキーワードを玉に置き換えてみると、それが「迷惑メール」の壷から出てきた玉か、「普通メール」の壷から出た玉かを判別していることとなる。そして、「クリック」というキーワードが現れる尤度は、各壷に入っている玉の割合で算出される。また、4.2.3で計算したように、事前確率には壷の選択確率、すなわち迷惑メールと普通メールとの経験的なメール数の比があてられることとなる。

続き
 第１章　　確率の基礎
 第２章　　ベイズの定理からベイズ理論の出発点へ
 第３章　　ベイズの展開公式

2019-10-14

量子力学の軌跡解釈による二重スリットシミュレーション２～ドブロイ・ボーム解釈によるアプローチ

第１編「量子力学の軌跡解釈による二重スリットシミュレーション１～ド・ブロイ=ボーム解釈によるアプローチ」の続きとなり、式(1)～式(14)は第１編からの引用となります。また、第１編と同様に、「量子力学の軌跡解釈（ボーム力学）の概要」もしくは「量子力学の軌跡解釈のガウス関数への適用」から数式を引用することがありますが、その場合は「概要(3)式」「ガウス(3)式」のように表記します。

４．二重スリットの量子ポテンシャル

次に、二重スリットの量子ポテンシャルを求めて、どのような動きをするのか見てみます。そのためには、式(9)を $Ψ(r,t)＝Rexp(iS)$ に当てはめて $R$ を求め、それを概要(16)式 $Ｑ＝－(1/2m)({∇}^2R ／R)$ に代入し計算しなければなりません。

　　　　 $r=(exp(2Ay)+exp(-2Ay)+2cos(2By) )^2$

　　　　 $ψ_1+ψ_2=g(x)exp(\frac{(y^2+b^2)it}{2σ_y}+iθ)exp(-\frac{(y^2+b^2)(Δy)^2}{σ_y})r$ 　　　(9)

式(9)を、 $ψ(r,t)＝Rexp(iS)$ に当てはめると、

　　　　 $R=Re｛g(x)｝exp(-\frac{(y^2+b^2)(Δy)^2}{σ_y}){f(y)}^2$ (10)

　　　　 $f(y)=exp(2Ay)+exp(-2Ay)+2cos(2By)$ 　　　　　(11)

　　（ $σ_y=4( (Δy)^4+t^2/4)$ 　　　　　 $A=\frac{2b(Δy)^2}{σ_y}$ 　　　　　 $B=\frac{bt}{σ_y}$ ）

となります。量子ポテンシャル $Q$ のうち、Ｘ方向で２階偏微分して求まる項は、「量子力学の軌跡解釈のガウス関数への適用」で計算した結果と同じなので、ここでは、Ｙ方向で２階偏微分して求まる項のみを計算します。つまり、 $Re｛g(x)｝$ の因子は無視してよいことになります。

まず、式(10)を１階偏微分して、

　　　　　　　　　 $\frac{∂R}{∂y}＝(-\frac{2y(Δy)^2}{σ_y}＋\frac{f}{2}\frac{∂f}{∂y})R$

さらに、２階偏微分すると、

　　　　　 $\frac{∂^2R}{∂y^2}＝(-\frac{2(Δy)^2}{σ_y}-\frac{f^2}{2}(\frac{∂f}{∂y})^2＋\frac{f}{2}\frac{∂^2f}{∂y^2})R＋(-\frac{2y(Δy)^2}{σ_y}＋\frac{f}{2}\frac{∂f}{∂y})\frac{∂R}{∂y}$
　　　　　　= $｛-\frac{2(Δy)^2}{σ_y}-\frac{f^2}{2}(\frac{∂f}{∂y})^2＋\frac{f}{2}\frac{∂^2f}{∂y^2}｝R＋｛-\frac{2y(Δy)^2}{σ_y}＋\frac{f}{2}\frac{∂f}{∂y}｝^2R$

これらを丹念に計算していくと、概要(16)式 $Ｑ＝－(1/2m)({∇}^2R ／R)$ より、 $m=1$ の場合の量子ポテンシャル $Q$ は、

　　　 $Q=\frac{(Δy)^2}{σ_y}＋\frac{1}{8}｛\frac{(∂f/∂y)}{f}｝^2-\frac{1}{4f}\frac{∂^2f}{∂y^2}-\frac{2y^2(Δy)^4}{σ_y^2}＋y(Δy)^2\frac{1}{f}\frac{∂f}{∂y}+(xによる２階偏微分の項)$

　　　　　　　 $f＝exp(2Ay)+exp(-2Ay)+2cos(2By)$

　　　　　　　 $\frac{∂f}{∂y}=2A（exp(2Ay)-exp(-2Ay)）-4Bsin(2By)$

　　　　　　　 $\frac{∂^2f}{∂y^2}=4A^2（exp(2Ay)+exp(-2Ay)）-8B^2cos(2By)$

　　　　　　　 $σ_y=4( (Δy)^4+t^2/4)$ 　　　 $A=\frac{2b(Δy)^2}{σ_y}$ 　　　 $B=\frac{bt}{σ_y}$

となります。
そして、「Ｘによる２階偏微分の項」は、ガウス(14)式で $t=0$ で $x=0$ として、 $k_0$ を $k_x$ に置き換え、 $ћ=m=1$ （原子単位系）とすればよいので、

　　　　　　　　 $Q=\frac{(Δy)^2}{σ_y}＋\frac{1}{8}｛\frac{(∂f/∂y)}{f}｝^2-\frac{1}{4f}\frac{∂^2f}{∂y^2}-\frac{2y^2(Δy)^4}{σ_y^2}＋y(Δy)^2\frac{1}{f}\frac{∂f}{∂y}+\frac{(Δx)^2-2(Δx)^4(x-k_xt)^2}{(4(Δx)^4+t^2)^2}$ 　　　　　　(12)

となります。
式(12)をプロットしてみると次のようになります。

まず、 $a=6、b=10、Δx=Δy=1$ で量子ポテンシャルの変化を見てみます。

f:id:sr-memorandum:20191014102556p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014102725p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014102749p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014102806p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014102830p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014103233p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1);

f:id:sr-memorandum:20191014103344p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014103949p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014104019p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014104050p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014104118p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014104140p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

f:id:sr-memorandum:20191014104216p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

Ｘ方向に0.4の速度を保ったまま、Ｙ方向はポテンシャルの低い方向に運動するため、量子ポテンシャルによって軌跡に粗密ができることが（粒子の軌跡はポテンシャルが谷の部分に集まります）わかります。
ただ、３Ｄでは分かりにくいうえ、 $t=5$ 以上では量子ポテンシャルが $x$ にほとんど依存しなくなるため、 $x=0$ に固定して量子ポテンシャルの時間的な変化を見てみます。

f:id:sr-memorandum:20191014145918p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

時間が早すぎるので、１秒ずつにしてみます。

f:id:sr-memorandum:20191014150311p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

f:id:sr-memorandum:20191014150827p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

f:id:sr-memorandum:20191014151226p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

f:id:sr-memorandum:20191014151816p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

f:id:sr-memorandum:20191014152231p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

徐々に平坦になりつつも、ポテンシャルが中心付近で激しく振動し、波のように外に広がって行くことがわかります。
そして、最終的には真ん中からポテンシャルは徐々に平坦になっていきます。
これは、最終的にはＹ方向の運動も等速になることを意味しています。

f:id:sr-memorandum:20191014152951p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

最後にＹ軸と時間（ $t$ ）量子ポテンシャルの様子を３Ｄグラフにしてみました。

f:id:sr-memorandum:20191014153809p:plain — 量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

2019-09-29

量子力学の軌跡解釈による二重スリットシミュレーション１～ド・ブロイ=ボーム解釈によるアプローチ

量子力学の軌跡解釈による二重スリットシミュレーション～ドブロイ・ボーム解釈によるアプローチ

※量子力学の軌跡解釈（ボーム力学）の概要もしくは量子力学の軌跡解釈のガウス関数への適用から数式を引用することがありますが、その場合は「概要(3)式」「ガウス(3)式」のように表記します。

１．ボームによる二重スリットの解釈

D.Bohmによる二重スリットの解釈は、De Broglieが提唱した「パイロット波」解釈を発展させたもので、そのような経緯もあり、「ドブロイ＝ボーム解釈」と呼ばれることもあります。なお、二重スリットの解釈と述べたが、それは量子力学の解釈そのものを意味してしており、このことは、『THE UNDIVIDED UNIVERSE』にも触れられています。
「「パイロット波」が粒子の運動を誘導するという考えは、1927年にDe Broglieによって初めて主張されたが、それは単粒子系のみによるものであった。De Broglieは、1927年に開催された「ソルベイ会議」でこの考えをプレゼンしたが、Pauliによって激しく批判された。Pauliの最も重要な批判は、二体の散乱過程では、このモデルを矛盾無く適用できないということであった。その結果、De Broglieは自分の主張を放棄した。「パイロット波」の考えは、その後1952年に、D.Bohmによって多体系での解釈が加えられ、再び主張された。De Broglieの主張は、Pauliの批判に答えることが可能であり、実際に、量子現象の多くの領域に適用できる観測の理論を含む一貫した解釈に道を開いた。その結果、De Broglieは最初の自分の考えを再度主張し、それらを多様な方法で発展させていった。」（『THE UNDIVIDED UNIVERSE』より抜粋）

さて、軌跡解釈（＝「ドブロイ＝ボーム解釈」）による二重スリットの解釈は、おおまかにいって次のようなものとなります。例として、電子を用いて二重スリットシミュレーションを行うものとしました。なお、二重スリットについて詳しく知らない人は、http://ja.wikipedia.org/wiki/%E4%BA%8C%E9%87%8D%E3%82%B9%E3%83%AA%E3%83%83%E3%83%88%E5%AE%9F%E9%A8%93（ウィキペディア）等を参照してください。

①電子は粒子として存在している。

②波動関数は、粒子の運動を誘導するパイロット波である。

③電子は粒子として、パイロット波によって誘導され運動する。

④電子は粒子だから、二重スリットのどちらか一方を通り抜ける。

⑤パイロット波は、二重スリットの両方を通り、通り抜けると干渉を起こす。

⑥電子は粒子として、パイロット波によって誘導されるから、二重スリットを通り抜けると干渉したパイロット波によって誘導される。

⑦その結果、スクリーンに浮かび上がる電子の像は干渉した波のようなものになる。

標準解釈では、粒子の実在を前提とせず、実在の基礎を波動関数とするため、波動関数が同時に２つのスリットを通り抜け干渉を起こし、その結果スクリーン上に干渉像のような分布が浮かび上がるということになります。古典的には理解しにくいですが、粒子の実在を否定するため、波動関数が同時に２つのスリットを通り抜けることができるということになります。

標準解釈がどうであれ、軌跡会社では波動関数が粒子の運動を誘発するパイロット波となるため、二重スリットを扱うには、

①二重スリットの波動関数を求める。

②求めた波動関数 $Ψ(r,t)$ を、 $Ψ(r,t)＝Rexp(iS/ћ)$ （概要(11)式）に当てはめ、RまたはSを求める。

③Sを求めた場合、 $p＝∇S$ （概要(12)式）から運動量 $p$ が求まり、ここから粒子運動の軌道が求まる。ただし、初期条件を確定させることができないため、初期条件を仮に設定した場合の軌道となる。

④ $R$ を求めた場合、 $Q＝－(ћ^2/2m)(∇2R/R)$ （概要(16)式から量子ポテンシャル $Q$ が求まり、これを $mdv／dt＝－∇(V+Q)$ （概要(15)式）に代入すれば、粒子運動の軌道が求まる。ただし、初期条件のうち初速度は③から求まるが、位置のほうは確定させることができないため、やはり初期条件を仮に設定した場合の軌道となることは、③の場合と同様である。

とすればよく、ここでは③を用いることにしました。
なお、数式を簡単にするために、以下、m(電子の質量)=ћ=c(光速度)=1となる原子単位系を用います。

２．２次元ガウス波束

まず、 $t=0$ で中心が $x=0$ 、 $y=b$ にあり、x方向に速度 $k_x$ で移動するガウス波束の波動関数を求めてみます。x方向とy方向はそれぞれ独立であるため、ガウス式(7)より直ちに、

$ψ_1(x,y,t)=\frac{\sqrt{π}exp(-k_x^2(Δx)^2)}{\sqrt{(Δx)^2+it/2}} exp｛-\frac{x^2(Δx)^2-2tk_xx(Δx)^2-4k_x(Δx)^6}{4( (Δx)^{4}+t^{2}/4)}｝exp｛-i\frac{2k_x^2t(Δx)^4-x^2t/2-4k_xx(Δx)^4}{4( (Δx)^4+t^2/4)}｝$
× $exp｛-\frac{(y-b)^2(Δy)^2}{4( (Δy)^4+t^2/4)}｝exp｛i\frac{(y-b)^2t/2}{4( (Δy)^4+t^2/4)}｝$ 　　　　　(1)

となります。なお、 $Δy$ はy方向の波束の広がりで、 $m=ћ=1$ （対象の粒子は電子）としています。
同様にして、、 $t=0$ で中心が $x=0$ 、 $y=-b$ にあり、x方向に速度 $k_x$ で移動するガウス波束の波動関数は、

$ψ_2(x,y,t)=\frac{\sqrt{π}exp(-k_x^2(Δx)^2)}{\sqrt{(Δx)^2+it/2}}exp｛-\frac{x^2(Δx)^2-2tk_xx(Δx)^2-4k_x(Δx)^6}{4( (Δx)^4+t^2/4)}｝exp｛-i\frac{2k_x^2t(Δx)^4-x^2t/2-4k_xx(Δx)^4}{4( (Δx)^4+t^2/4)}｝$
× $exp｛-\frac{(y+b)^2(Δy)^2}{4( (Δy)^4+t^2/4)}｝exp｛i\frac{(y+b)^2t/2}{4( (Δy)^4+t^2/4)}｝$ 　　　　　(2)

となります。
$ψ_1$ と $ψ_2$ は、いずれもx方向に速度 $k_x$ で進行するガウス波束の波動関数ですが、 $t=0$ での波束の中心はそれぞれ $(0,b)$ 、 $(0,-b)$ となっており、二重スリットの双方を推進する波動関数（パイロット波）を表します。

f:id:sr-memorandum:20190916201538p:plain
図１

そこで、 $ψ_1+ψ_2$ を求めます。
まず、ｘ方向ｙ方向のガウス波束がそれぞれ独立であるため当然のことですが、式(1)と式(2)から直ちにわかることは、 $x$ に依存する因子は $Ψ_1$ 　， $Ψ_2$ ともに共通となります。そこで、これを $g(x)$ とすれば、

$ψ_1+ψ_2=g(x)｛exp｛-\frac{(y-b)^2(Δy)^2}{4( (Δy)^4+t^2/4)}｝exp｛i\frac{(y-b)^2t/2}{4( (Δy)^4+t^2/4)}｝+exp｛-\frac{(y+b)^2(Δy)^2}{4( (Δy)^4+t^2/4)}｝exp｛i\frac{(y+b)^2t/2}{4( (Δy)^4+t^2/4)}｝｝$

となります。ここで、

　　　 $σ_y=4( (Δy)^4+t^2/4)$ 　　　　　(3)

　　　　　　　 $A=\frac{2b(Δy)^2}{σ_y}$ 　　　　　(4)

　　　　　　　 $B=\frac{bt}{σ_y}$ 　　　　　(5)

とすれば、

$ψ_1+ψ_2=g(x)exp(\frac{(y^2+b^2)it}{2σ_y})exp(-\frac{(y^2+b^2)(Δy)^2}{σ_y})｛exp(-Ay)exp(iBy)+exp(Ay)exp(-iBy)｝$ 　　　(6)

となります。

さらに、式(6)の第４因子を

$rexp(iθ)$ とおけば、

　　　　　 $r=(exp(2Ay)+exp(-2Ay)+2cos(2By) )^2$ 　　　　　(7)

　　　　　 $θ=Tan^{-1}｛\frac{e^{-Ay}-e^{Ay}}{e^{Ay}+e^{-Ay}}tan(By)｝$ 　　　　　　　　(8)

　　　　　 $ψ_1+ψ_2=g(x)exp(\frac{(y^2+b^2)it}{2σ_y}+iθ)exp(-\frac{(y^2+b^2)(Δy)^2}{σ_y})r$ 　　　　(9)

であるため、

$S=\frac{(y^2+b^2)t}{2σ_y}+θ(y)+（xに依存する項）$ 　　　　　　　(10)

となります。

ここで、式(9)の絶対値（複素共役）を計算して、粒子の確率密度を求めてみます。

$(ψ_1+ψ_2)(ψ_1+ψ_2)^*=g(x)g(x)^*exp(-\frac{2(y^2+b^2)(Δy)^2}{σ_y})｛e^{2Ay}+e^{-2Ay}+2cos(2By)｝$ 　　　　　(11)

ここから、 $y$ に依存する部分だけ取り出せば、

$P(y,t)=exp(-\frac{2(y^2+b^2)(Δy)^2}{σ_y})｛e^{2Ay}+e^{-2Ay}+2cos(2By)｝$ 　　　　(12)

となります。ここで $∝$ となっているのは、波動関数を規格化していないからです。この $P(y)$ を時間毎にプロットすると、次のようになる。

f:id:sr-memorandum:20190916213404p:plain
図２

最初は、 $b=10$ 及び $b=-10$ の周りに集中しているが、時間が経つにつれて分布が広がって行き、干渉を起こす様子がわかります。なお、 $y$ を0.1ずつの間隔で-50.0～50.0までとり、 $P(y)$ をプロットしたものの一部ですが、時間 $t$ 毎に規格化定数が異なるためy=-50.0からy=50.0までの式(12)右辺の総和を求め（これは近似的に積分範囲-50.0～50.0で $\int{p(y)}dy$ を計算することにあたります）、その総和で除算した上でプロットしています。図からわかるように、全ての時間において $y$ の絶対値が40となる辺りで $P(y)$ がほとんど0になることから、規格化は概ね正確ですので、 $t$ が異なっていても確率分布として比較することができます。

　さて、図２で $t=0.0$ の曲線について $y=10.0$ 近辺のみをプロットすると、図３のようになります。

f:id:sr-memorandum:20190929002112p:plain
図３

図３によると概ね $Δy＝1$ の４倍～６倍程度の範囲(原点に近い領域で $y=7.0～8.0)$ で確率分布が小さくなることがわかります。これは、シミュレーションをする際にスリットの幅を $Δy$ に対してどの程度に設定すべきかということに関係します。これによると、 $Δy$ に対して４倍～６倍程度に設定するのが妥当です。

さて、いよいよ式(10)を $y$ で偏微分し、ｙ方向の運動量(＝ｙ方向の速度:m=1、 $p＝∇S$ )を求めると、

$p_y=\frac{∂S}{∂y}=\frac{∂}{∂y}（\frac{(y^2+b^2)t}{2σ_y}＋θ(y) ＋（ｘに依存する項)）＝yt/σ_y＋∂θ(y)/∂y$

となります。
そして、式(8)により、非常に煩雑な $∂θ(y)/∂y$ の計算を行うと、

　　　 $p_y=\frac{yt}{σ_y}+\frac{-2Asin(2By)-B(e^{2Ay}+e^{-2Ay})}{e^{2Ay}+e^{-2Ay}+2cos(2By)}$ 　　　(13)

続いて、ｘ方向ですが、式(6)の $ｇ(x)$ に相当する部分は、「量子力学の軌跡解釈のガウス関数への適用」の(7)式（ガウス(7)式）と同じです。ｘ方向とｙ方向を独立するものとして波動関数を設定していますので、当然の結果です。従って、ｘ方向の軌跡は解析的に求めることが可能で、ガウス(19)式より、

　　　 $x＝\frac{x_1}{2(Δx)^2}・\sqrt{(t^2＋4(Δx)^4)}＋k_xt$ 　　　　(14)

となります。なお、 $x_1$ が $＝0$ における粒子の位置のｘ座標となります。

３．シミュレーションの実行

式(13)と式(14)を用いれば、２重スリットのシミュレーションが可能になります。ｘ方向は、解析的に解が判っているので特に近似計算をする必要はありません。式(14)については、次のようにして粒子軌道を計算します。

①　 $t＝0$ における $y$ の初期値 $y_0$ を設定する。

②　式(13)の $p_y$ は $m=1$ としていることから、これは時間と位置により与えらえる速度と見なすことができるため、ある時間 $t_i$ に $y_i$ にある粒子の速度を $v(t_i,y_i)$ と表し、時間の刻みを $Δt$ とすれば、

　　　　　　　　　　　　　　　　 $y_{i+1}=v(t_i,y_i)Δt＋ y_i$
により、y_0から順次任意の時刻における粒子の位置が求まる。

あまり、精度が高い近似ではありませんが、これにより粒子のy方向の位置をシミュレートします。

なお、初期値の設定は $Δy＝1$ とし、y軸の正座標側を $y＝b$ の周りに $b－a/2≦y_0≦b＋a/2$ 、y軸の負座標側を $y＝－b$ の周りに $-b-a/2≦y0≦-b＋a/2$ として与えることとし、 $a$ がスリットの幅に相当します。図３の後で説明したように、 $a$ は $Δy=1$ の４倍～６倍程度の大きさとします。また、 $k_x=0.4$ としました。

続いて、ｘ方向の運動については、式(14)で $x_1＝0$ としてシミュレーションを行います。理由は、このように扱うと粒子の軌跡が判り易くなることと、『THE UNDIVIDED UNIVERSE』の中で紹介されているものと同様の軌跡が得られるためです。

f:id:sr-memorandum:20190929012344p:plain — 図４　二重スリットの軌跡（b=10,a=6,軌跡数=120)

f:id:sr-memorandum:20190929013005p:plain — 図５　二重スリットの軌跡（b=8,a=6,軌跡数120）

f:id:sr-memorandum:20190929013336p:plain — 図６　二重スリットの軌跡（b=6,a=6,軌跡数120）

f:id:sr-memorandum:20190929013546p:plain — 図７　二重スリットの軌跡（b=4,a=6,軌跡数120）

f:id:sr-memorandum:20190929013831p:plain — 図８　二重スリットの軌跡（b=2,a=6,軌跡数120）

まず、図４～図８は、スリットの幅(a)＝6.00，スリットの間隔(2b)=20.00～4.00，時間の刻み $Δt=0.01$ とし、粒子の軌跡120本を $t=0～100$ までプロットしたものです。初期値となる粒子の位置は、スリットの幅であるa=6.00の範囲で0.01毎に等間隔に設定しました。（各スリット60本の軌跡が２スリットで120本の軌跡）
粒子が干渉のような粗密性のある軌道を辿ることがわかります。
図４～図８のどの図も、初期値が異なる軌道が多数描かれているのであり、決して流体のようなものではありません。粒子の実在を仮定する軌跡解釈では、スリットを通った１つの粒子が、このような軌道の１つを辿る運動をすることになります。従って、どちらかのスリットを粒子が通ったとすることができ、さらに粒子がどちらかのスリットを通ることと干渉像が生じることの間に矛盾が生じないのです。ただし、初期値を確定することができないため、どの軌道を実際に粒子が辿るのかは予測することはできません。粒子の実在を肯定し、粒子の不可分性を保ち、干渉像が表れることが説明できるという意味で、軌跡解釈は直観的に理解しやすく、二重スリットの問題に限定するなら、標準解釈より優れています。

f:id:sr-memorandum:20190929014338p:plain — 図９　二重スリットの軌跡（b=10,a=6,軌跡数120）

続いて、図９は図４を拡大したものです。粒子がどのような運動をし、干渉像を形成するのかがわかります。
なお、この軌跡の粗密性がそのまま粒子の干渉を表すわけではありません。この１２０本の軌跡は、 $t=0.0$ における $y$ を等間隔に定めていますので、 $t=0.0$ における確率密度が考慮されていません。干渉像を得るためには、図２で $t=0.0$ の曲線の確率で粒子を発生させて、その軌跡を追っていく必要があります。フォンノイマンの棄却法を用いて、図２で $t=0.0$ の曲線の確率で粒子を発生させて、実際に干渉像ができる様子を動画にしてみました。これは、b=8で10,000個の軌跡を用い、x=20でのyの値に粒子を表示させています。なお、画面の縦方向の位置は0～1の一様乱数を利用してランダムに表示しています。干渉像が得られることがわかります。
youtu.be