数学と物理学のブログ

本業から離れて、趣味である数学と物理学について書きます。

アルバート・アインシュタインが発見したこと

アルバート・アインシュタインが発見したこと

未だに、アルバート・アインシュタイン(A.E)が原爆と作ったと勘違いしている人がいるようなので、A.E.が発見したことの概要を簡単に書いてみたいと思います。

1.光速度不変の原理と相対性原理

A.Eは特殊相対性理論を発見したと言われることがありますが、本当の意味で発見したのは「光速度不変の原理」です。
特殊相対性理論というのは、光速度不変の原理を出発点とすれば、誰もが数学的な操作で導くことができる結果やその導出過程のことを言います。古典力学で言えば、慣性の法則、作用反作用の法則及び万有引力の法則から様々なことが導かれるようなものです。
ただし、古典力学は多くの人が関わって理論体系ができあがったのに対して、A.Eは特殊相対性理論のほとんどを一人で導出した点で違いはあります。
光速度不変の原理」は、簡単に言うと「どのような慣性系から見ても光の速さ一定である」というものです。まさに原理と呼ぶに相応しい単純明快な内容ですが、こういうことが原理として取りざたされたことには事情があります。詳しくは、私が以前書いた「簡単な電磁気の考察から見える特殊相対性理論の入り口」読んでもらえるとわかりますが、「光速度不変の原理」が発見される以前は、力学と電磁気学の法則の間に深刻な矛盾が生じていました。例えば、線状の荷電剛体に対して静止していれば電場のみがありますが、これと平行な方向に移動する慣性系からは電流が発生しているのと同等なので、アンペール法則により磁場も発生します。つまり、線状の荷電剛体に対して静止している慣性系では電場のみ、移動する慣性系では電場と磁場があることになります。「全ての慣性系で物理法則の形式が同じである」ことを「相対性原理」と言い、当然成り立つものと考えられていましたが、この原理に反します。
こういう矛盾を取り除く原理として、A.Eが発見したのが「光速度不変の原理」です。「光速度不変の原理」から導出される相対的電磁気学では、電場と磁場は電磁テンソルというもので表現され、上述の例でも各慣性系で同じ形式の物理法則で記述され、慣性系間の関係もローレンツ変換という変換則で矛盾なく記述されます。

2.E=mc^2と原爆の関係

こういう経緯でA.E.が発見した「光速度不変の原理」ですが、この原理があまりにも基礎的なものであったため、力学と電磁気学は全般的に修正され、例えば、相対速度は単純な加算・減算では計算できない、光速に近い速さで移動する慣性系では時間が遅れる、光速に近づくと質量が重くなる等の結論が導出されました。
そんな中の一つとしてあったが、質量とエネルギーの等価性です。
物質の質量をmとして、光の速さをcとすれば、その物質が静止している時に有するエネルギーEは次のように表されます。

  E=mc^2

光の速さはc=3×10^8m/sと非常の大きな数字なので、たった1gの1円玉でも膨大なエネルギーを有していることが想像できます。
核の利用というのは、この物質の質量をエネルギーに変換しようという試みです。放射性物質というのは、ゆっくりと時間をかけてエネルギー(放射性・放射能)に変換されている物質です。
原爆というのは、この物質からエネルギーへの変換を急激に起こして、爆弾にするものです。

そうすると、E=mc^2が原爆の開発に役立ったと思うかも知れませんが、この関係式は物質をエネルギーに変換することが可能かも知れないことを示しているだけで、その方法論については何も語ってくれません。
確かに、人類に核利用の可能性を最初に示しましたが、即原爆の開発に結び付くものでもないのです。

終わりに

光速度不変の原理は上述のように物理学の基本的な原理で、この原理からE=mc^2を誰でも簡単に導出することができます。E=mc^2が最後の一歩になったことは否めませんが、これを発見したことで原爆を開発したと言うのであれば、ガリレイニュートン、マックスウェル等、物理学の発展に携わった全ての人が原爆を開発したと言わざるを得ない程のレベルです。
なお、E.A.の場合は核開発を促す大統領宛の信書に署名したという、物理学とは関係ない歴史的な事実がありますが、これが直接マンハッタン計画の実施に結び付いたと言える程、単純な経緯で同計画が実施された訳でもなさそうです。

ヒルベルト空間の備忘録

ヒルベルト空間の備忘録

1.コーシー列

定義1-1 コーシー列

数列{φ_n}がコーシー列であるとは、

  (1-1)  ∀ε>0に対し、∃N:  n≧N ⇒|φ_m-φ_n|<ε

が成り立つことをいう。

定義1-2 収束

数列{φ_n}a収束するとは、

  (1-2)  ∀ε>0に対し、∃N:  n≧N ⇒|φ_n-a|<ε

が成り立つことをいい、φ_n→aと表す。

定義1-3 有界

数列φ_nが上に有界とは、

       ある数aがあって、∀n:  φ_n<a

が成り立つことをいう。また、このような数aの集合を上界といい、φ_nの最小の上界を上限といい、sup{φ_n}と表す。

数列φ_nが下に有界とは、

       ある数aがあって、∀n:  φ_n>a

が成り立つことをいう。また、このような数aの集合を下界といい、φ_nの最大の下界を下限といい、inf{φ_n}と表す。

定理1-1 有界な単調増加数列と単調減少数列の収束

有界な単調増加数列数列φ_nが上に有界であれば、φ_nは収束する。
有界な単調減少数列数列φ_nが下に有界であれば、φ_nは収束する。
(証明)
※単調増加数列についてのみ
有界な単調増加数列数列φ_nが上に有界であれば、定義1-3により上限αをもつ。αは、最小の上界であるので、
     ∀ε>0に対し、∃φ_N:  α-ε<φ_N≦α
が成り立つ。そして、φ_nは単調増加なので、k≧Nであれば、φ_k≧φ_N。したがって、
     α-ε<φ_N≦φ_k≦α
が成り立つので、k≧N|φ_n-α|<εとなり、収束の定義1-2より、φ_n→α

定理1-2 縮小区間の原理

区間の列{[ a_n,b_n ]}が、任意のnに対し、a_n≦a_n+1<b_n+1≦b_nを満足するとき、\bigcap_{n=1}^∞[ a_n,b_n ]≠Φ
とくに、b_n-a_n→0のときは、\bigcap_{n=1}^∞[ a_n,b_n ]は1点となる。
(証明)
端点の列{a_n}は、単調増加で、上からはb_1で抑えられている。ゆえに、定理1-1よりa_n→aが存在する。一方b_nは単調減少で、下からa_1で抑えられているので、b_n→bが存在し、a≦bは自明である。よって、閉区間[ a,b ]が\bigcap_{n=1}^∞[ a_n,b_n ]に含まれる。
とくに、b_n-a_n→0のときは、0≦b-a≦b_n-a_n→0より、a=bとなるので、[ a,b ]=aである。

定理1-3 収束する列はコーシー列である。

数列{φ_n}が収束する ⇔ 数列{φ_n}がコーシー列である。

(証明)
【収束⇒コーシー列の証明】
φ_naに収束するのであれば、収束の定義(1-2)より、
    ∀ε/2>0に対し、∃N:  n≧N ⇒ |φ_n-a|<ε/2
ゆえに、m≧N ⇒ |φ_m-a|<ε/2。したがって、
    m,n≧N ⇒  |φ_m-φ_n|≦|φ_m-a|+|a-φ_n|<ε
これは{φ_n}がコーシー列(定義1-1)であることを示している。

2.ベクトル空間・バナッハ空間・ヒルベルト空間

定義2-1 ベクトル空間

φ_1,φ_2,φ_3,・・・からなる集合Xが次の条件をみたすとき、ベクトル空間といい、そのをベクトル、またはベクトル空間のという。
任意のφ_1,φ_2∈Xに対し、和φ_1+φ_2∈Xが定義されて、

  (2-1)  φ_1+φ_2=φ_2+φ_1
  (2-2)  (φ_1+φ_2)+φ_3=φ_1+(φ_2+φ_3)
  (2-3)  ∃0∈X:  ∀φ∈Xに対し、φ+0=φ
  (2-4)  ∀φ∈X:  ∃(-φ)∈X:  φ+(-φ)=0

任意の複素数α,β及びφ,φ_1,φ_2∈Xに対して、スカラーαφ∈Xが定義されて、
  (2-5)  1・φ=φ
  (2-6)  α(βφ)=(αβ)φ
  (2-7)  (α+β)φ=αφ+βφ
  (2-8)  α(φ_1+φ_2)=αφ_1+βφ_2

定義2-2 ノルム

任意のφ,φ_1,φ_2∈Xに対し定義される次のような性質を持つ関数|| ・||をノルムという。
  (2-9)  ||φ||≧;||φ||=0 ⇔φ=0
 (2-10)  ||αφ||=|α|||φ||
  (2-11)  ||φ_1+φ_2||≦||φ_1||+||φ_2||
また、ノルムが定義されているベクトル空間をノルム空間という。

定義2-3 バナッハ空間

ノルム空間Xの任意のコーシー列がXの点に収束するとき、X完備であるという。
完備なノルム空間をバナッハ空間という。

定義2-4 内積空間とヒルベルト空間

φ_1,φ_2,φ_3,・・・からなるバナッハ空間Hが次の条件をみたすとき、内積空間という。
内積について完備な内積空間をヒルベルト空間という。

  (2-11)  <φ_1,φ_1>≧0, :<φ_1,φ_1>=0 ⇔ φ_1=0
  (2-12)  <φ_1,φ_2>=\overline{<φ_2,φ_1>}
 (2-13)  <αφ_1,φ_2>=α<φ_1,φ_2>
 (2-14)  <φ_1+φ_2,φ_3>=<φ_1,φ_3>+<φ_2,φ_3>

定義2-5 閉包と閉集合・開集合

(1)Hヒルベルト空間とし、𝒟Hの空でない部分集合とする。Hの元で、𝒟の点列の極限となっているものの全体を𝒟閉包とよび、 \overline{𝒟}で表す。

  \overline{𝒟}={φ∈H |φ_n∈𝒟(n=1,2,・・・)が存在して、lim_{n→∞}φ_n=φ}

これは、𝒟の収束列の極限をすべて集めてできる集合であり、𝒟⊂\overline{𝒟}となる。
(2)閉包をとっても変わらない部分集合、つまり、𝒟=\overline{𝒟}をみたす部分集合𝒟閉集合という。
(3)補集合𝒡^c=H╱𝒡閉集合となる部分集合𝒡⊂H開集合という。

定義2-6 直交補空間

ヒルベルト空間Hの部分空間𝒟に対して、𝒟のすべてのベクトルと直交するベクトルの全体を𝒟直交補空間といい、𝒟^{⊥}で表す。

  𝒟^{⊥}={φ∈H |すべてのψ∈𝒟に対して、<φ,ψ>=0}

定理2-1 ヒルベルト空間Hの部分集合𝒟に対して、\overline{𝒟}閉集合である。

(証明)
\overline{𝒟}=Fとおくと、閉包の定義より、F⊂\overline{F}となる。
そこで、この逆の包含関係を示すせばよい。
ψ∈\overline{F}とする。このとき、φ_n→φ (n→∞)となるφ_n∈Fが存在する。したがって、任意のε>0に対して、番号n_0が存在して、n≧n_0ならば、||φ_n-φ||<εが成り立つ。
また、φ_{n_0}∈F=\overline{𝒟}であるから、||φ_n-φ_{n_0}||<εをみたす点列φ_n⊂𝒟が存在する。( \overline{𝒟}={φ_0∈H |φ_n∈𝒟(n=1,2,・・・)が存在して、lim_{n→∞}φ_n=φ_0}
したがって、||φ_n-φ||=||(φ_n-φ)+(φ_{n_0}-φ)||≦||φ_n-φ_{n_0}||+||φ_{n_0}-φ||<2ε
これは、φ_n→φ (n→∞)を意味するからφ∈\overline{𝒟}=Fである。
よって、\overline{F}⊂Fが示された。

定理2-2 ヒルベル空間Hの部分空間𝒟閉集合であるための必要十分条件は、𝒟の任意の収束列に対して、その極限が𝒟の元になっていることである。

(証明)
【必要性】
𝒟閉集合φ_n∈𝒟φ_n→φ∈H (n→∞)とする。このとき、φ∈\overline{𝒟}であり、𝒟閉集合であるので、𝒟=\overline{𝒟}である。よって、φ∈𝒟
【十分性】
𝒟の任意の収束列に対して、その極限が𝒟の元になっていると仮定し、𝒟⊂\overline{𝒟}の逆の包含関係を示す。(このとき、𝒟=\overline{𝒟}となるので、定理2-1により𝒟閉集合となる。)
φ∈\overline{𝒟}とすれば、閉包の定義によって、φ_n→φ (n→∞)となるφ_n∈𝒟が存在する。仮定により、φ∈𝒟である。
したがって、\overline{𝒟}⊂𝒟である。

定理2-3 直交分解定理

𝒨ヒルベルト空間Hの閉部分空間とする。このとき、任意のφ∈Hに対して、d(φ,𝒨)=||φ-φ_𝒨||を満たすベクトルφ_𝒨∈𝒨がただ一つ存在し、このφ_𝒨∈𝒨を、𝒨の上へのφ正射影という。
(証明)
d=d(φ,𝒨)とする。dの定義より、||φ-φ_n||→d (n→∞)となる点列{ψ_n}_{n=1}^∞⊂𝒨が存在する。
このとき、
||ψ_n-ψ_m||^2=||(ψ_n-φ)+(φ-ψ_m)||^2=||ψ_n-φ||^2+||φ-ψ_m||^2+Re(<ψ_n-φ,φ-ψ_m>)   ①
||ψ_n+ψ_m-2φ||^2=||(ψ_n-φ)-(φ-ψ_m)||^2=||ψ_n-φ||^2+||φ-ψ_m||^2-Re(<ψ_n-φ,φ-ψ_m>)  ②

②より、
Re(<ψ_n-φ,φ-ψ_m>)=||ψ_n-φ||^2+||φ-ψ_m||^2-||ψ_n+ψ_m-2φ||^2  ③

③を①に代入すると、
||ψ_n-ψ_m||^2=2||ψ_n-φ||^2+2||φ-ψ_m||^2-||ψ_n+ψ_m-2φ||^2
   =2||ψ_n-φ||^2+2||φ-ψ_m||^2-4||\frac{ψ_n+ψ_m-2φ}{2}||^2
   ≦2||ψ_n-φ||^2+2||φ-ψ_m||^2-4d
   →2d^2+2d^2-4d^2=0 (n,m→∞)
したがって、{ψ_n}_{n=1}^∞はコーシー列である。よって、ψ_n→φ_𝒨となるφ_𝒨∈Hが存在し、d(φ,𝒨)=||φ-φ_𝒨||が成り立つ。𝒨は閉部分空間であるからφ_𝒨∈𝒨となる。(定理2-2により、点列の極限が集合でに収束すれば閉集合となる。)
次に、φ_𝒨の一意性を証明する。
仮に、φ_𝒨とは別にd(φ,𝒨)=||φ-ψ||を満たすψ∈𝒨があったする。上記の計算を、ψ_n,ψ_mの代わりに、φ_𝒨,ψを用いて行えば、||φ_𝒨-ψ||^2≦2||φ_𝒨-φ||^2+2||φ-ψ||^2-4d=2d^2+2d^2-4d^2=0となる。
したがって、φ_𝒨=ψとなる。

定理2-3 正射影定理

𝒨ヒルベルト空間Hの閉部分空間とする。このとき、Hの任意のベクトルφは、φ=ψ+η (ψ∈𝒨,η∈𝒨^{⊥})という形に一意的に表される。ここで、ψ,ηはそれぞれ、𝒨,𝒨^{⊥}の上へのφの正射影である。
(証明)
φ∈Hとし、𝒨上へのφの正射影をψとする。η=φ-ψとおけば、φ=ψ+ηと書ける。そこで、η∈𝒨^{⊥}を示す。
d=||φ-ψ||とおく。ξ∈𝒨,t∈\bf{R}とする。このとき、ψ+tξ∈𝒨,d=||η||であるから、
  d^2≦||φ-(ψ+tξ)||^2=||η-tξ||^2=d^2+t^2||ξ||^2-2tRe(<η,ξ>)
したがって、すべてのt∈\bf{R}に対して、t^2||ξ||^2-2Re(<η,ξ>)≧0、これはRe(<η,ξ>)=0を意味する。tの代わりにてitを用いれば同様にして、Im(<η,ξ>)=0が得られる。したがって、<η,ξ>=0であり、ξ𝒨の任意の元であったから、η∈𝒨^{⊥}である。
次にφの表示の一意性を示すために、別にφ=ψ'+η' (ψ'∈𝒨,η'∈𝒨^{⊥})と表されたとする。このとき、ψ-ψ'=η-η'となり、この式の左辺は𝒨の元であり、右辺は𝒨^{⊥}の元である。ところが、𝒨∩𝒨^{⊥}={0}であるから、ψ-ψ'=0,η-η'=0でなければならず、ψ=ψ',η=η'となる。

3.ヒルベルト空間上の線形汎関数

定義3-1 作用素

作用素Tとはヒルベルト空間Hもしくはその部分空間Dに属している各元φ∀φ∈H)をHまたはその部分空間Rに属している元ψ写像するものである。

  (3-1)  Tφ=ψ

定義3-2 線形作用素

作用素Tヒルベルト空間Hもしくはその部分空間Dに属しているすべての関数φψおよびすべてのスカラーαβ(いずれも複素数)に対して、

  (3-2)  T(αφ+βψ)=αTφ+βTψ

という性質を有するとき、このTヒルベルト空間上の線形作用素という。

定義3-3 有界線形作用素

H_1,H_2ヒルベルト空間、TH_1からH_2への線形作用素とする。定数C>0が存在して、すべてのφ∈D(T)に対して次の関係が成り立つとき、T有界であるという。有界な線形作用素を、有界線形作用素という。

  (3-3)  ||Tφ||≦C||φ||

以下では、特に断らない限り、作用素は線形作用素であるとする。

定義3-4 定義域と値域と零空間

作用素Tの定義される元φ∈Hの集合D(T)T定義域R(T)={Tφ:φ∈D(T)}T値域という。
Tφ=0を満たすすべての元の定義域N(T)T零空間という。

定義3-5 作用素の同等

作用素S,Tについて、次の2つの条件(1)と(2)が満たされるとき、STは等しいとし、S=Tと表す。
 (1)D(S)=D(T) (定義域が等しい)
 (2)すべてのφ∈D(S)=D(T))に対してSφ=Tφ (作用が等しい)

定義3-6 作用素単射全射

作用素Tが、φ≠ψであるようなφ,ψ∈D(T)に対して、Tφ≠Tψであるとき、T1対1あるいは単射であるという。
作用素Tヒルベルト空間H_1からH_2(つまり、φ∈H_1,Tφ∈H_2)の作用素であり、値域R(T)=H_2であるとき、T全射であるという。

定義3-7 ヒルベルト空間上の線形汎関数

ヒルベルト空間上の閉部分空間Mに属するすべてのf,gとすべての複素数α,βに対して汎関数lが次の条件を満たす場合、このlM上の線形汎関数という。

  (3-4)  l(αf+βg)=αl(f)+βl(g)

このlf共役関数といい、l(f)の集合で作られる空間Mをの共役空間という。

定義3-8 線形汎関数有界

ヒルベルト空間Hの部分空間Mに属するすべてのhに対して、

  (3-5)  |l(h)|≦κ||h||     (||h||^2=<{h},{h}> )
    
となるような正定数κが存在するとき、線形汎関数はその定義域M上の有界であると言われる。
この不等号がMに属するすべてのhに対して成り立つ最も小さい正定数κは線形汎関数lのノルムといわれ、||l||によって表される。

  (3-6)  ||I||=sup_{||h||≠0}\frac{|l(h)|}{||h||}

定義3-9 線形汎関数の連続性

(1)線形汎関数i(h)Mで連続とは、g,hMに属し、各ε>0に対して||g-h||<δのときはいつでも、|l(h)-l(g)|<εとなるようなδ>0が存在することである。
(δ=0では、不連続)
(2)Mに属する点列{h_n}が極限hをもつときはいつでもl(h_n)→l(h)となるとき、汎関数lhで連続であるという。
(3)M上のすべての点で連続は汎関数Mで連続であるという。

定理3-1 原点で連続な有界線形汎関数lはその全定義域Mで連続である。

(証明)
Mに属する任意の点列{h_n}Mに属するある点hに極限をもつとする。
このとき||h_n-h||→0となり、原点で連続であるという仮定より、l(h_n-h)→l(h)となる。
仮定によりlは線形であるから、l(h_n-h)=l(h_n)-l(h)で、原点において連続であるから、l(h_n)→l(h)となり、lは全定義域で連続となる。

定理3-2 線形汎関数において、有界性⇔連続性が成り立つ。

(証明)
有界⇒連続】
l有界であるとする、有界の定義3-8よりある定数κが存在して、
    |l(h_n)-l(h)|=|l(h_n-h)|≦κ||h_n-h||
となる。したがって、h_n→hのとき、l(h_n)→l(h)となり、定義3-9(2)よりlは連続である。
【連続⇒有界
もし、lが非有界であるなら、κ>0に対して
   |l(h_n)|>κ||h_n||
となるようなMに属する非ゼロの点列{h_n}が存在することになる。
すると、0に収束する点列g_n=\frac{h_n}{n||h||}|l(g_n)|>\frac{κ}{n}>0となり、l(g_n)は0になりえず、原点における連続性に反する。

定理3-3 有界線形作用素の連続性

Tヒルベルト空間H_1からヒルベルト空間H_2への有界線形作用素とするとき、次の(1)と(2)が成り立つ。
(1)φ_n∈D(T),φ_n→φ∈D(T)n→∞)⇒Tφ_n→Tφn→∞
(2)D(T)=H_2のとき、零空間N(T)は閉部分空間である。
(証明)
(1)Tの線形性と有界性により、||Tφ_n-Tφ||=||T(φ_n-φ)||≦||T|| ||φ_n-φ||
よって、φ_n→φであれば、||Tφ_n-Tφ||→0であり、Tφ_n→Tφとなる。
(2)φ_n∈N(T),φ_n→φ∈H_2となる。このとき、連続性により、Tφ_n→Tφとなる。
一方で、Tφ_n=0であるため、Tφ=0であるので、φ∈N(T)
よって、N(T)閉集合である。なお、N(T)が部分空間であることは定義より自明。

定理3-4 リースの表現定理

ヒルベルト空間Hの全体で定義される連続有界線形汎関数Fは、Hに属するすべての元ψに対して、次のように内積の形でH内の元φ_Fと対応づけられて一意的に表すことができる。さらに、||φ_F||=||F||が成り立つ。

  (3-7)  F(ψ)=<φ_F,ψ> 

(証明)
まず、N(F)=HF(ψ)=0)の場合を考える。この場合は、φ_F=0とすれば、F(ψ)=0=<φ_F,ψ>,ψ∈Hが成り立つので、φ_Fが存在する。
次にN(F)≠Hの場合を考える。定理3-3(2)により、N(F)は閉部分空間であるから、正射影定理(定理2-3)により、零でないベクトルψ_0∈(N(F))^{⊥}が存在し、F(ψ_0)≠0が成り立つ。
よって、任意のψ∈Hに対して、φ≡ψ-F(ψ)F(ψ_0)^{-1}ψ_0N(F)の元である。したがって、<ψ_0,φ>=0となる。
これを書き直すと、0=<ψ_0,ψ>-F(ψ)F(ψ_0)^{-1}||ψ_0||^2なので、F(ψ)=\frac{F(ψ_0)<ψ_0,ψ>}{||ψ_0||^2}を得る。
したがって、φ_F=\frac{F(ψ_0)^{*}ψ_0}{||ψ_0||^2}とすれば、F(ψ)=<φ_F,ψ>となり、φ_Fは存在する。
次に、φ_Fの一意性を証明する。
別に、F(ψ)=<φ_F',ψ>ψ∈Hをみたすφ_F'∈Hが存在すると、<φ_F-φ_F',ψ>=0となる。ψは任意であるから、特に、ψ=φ_F-φ_F'とすれば、||φ_F-φ_F'||=0なので、φ_F=φ_F'となる。

定義3-10 共役空間と共役関数

リースの表現定理(定理3-4)により、ヒルベルト空間Hの全体で定義される連続有界線形汎関数Fは、F(ψ)=<φ_F,ψ>の形式で内積として一意に表されるが、この線形汎関数のすべてからなる集合をH共役空間また双対空間といい、H^*で表す。
また、F(ψ)を共役関数という。
ヒルベルト空間においては、H^*=Hとなる。

4.ヒルベルト空間の性質

定義4-1 正規直交基底

Hヒルベルト空間とする。Hが有限次元でN次元とすると、N個の独立なベクトルの組ψ_1,ψ_2,・・・,ψ_Nが存在する。グラム・シュミットの直交化法により、正規直交系{{ψ_n}^N}_{n=1}がとれる。
したがって、任意のφ∈Hは、φ={Σ^N}_{n=1}<ψ_n,φ>ψ_nと表される。こうして、有限次元ヒルベルト空間Hにおいては、つねに正規直交系{{ψ_n}^N}_{n=1}が存在して、Hの任意のベクトル(元)は、そのψ_n方向への正射影の和として一意に表されることができ、このような正規直交系をHの正規直交基底という。

ディラック方程式の備忘録

1.パウリ行列

 σ_1=\begin{pmatrix}
&1\\
1& \\
\end{pmatrix}
~~~σ_2=\begin{pmatrix}
&-i\\
i& \\
\end{pmatrix}
~~~σ_3=\begin{pmatrix}
1&\\
&-1\\
\end{pmatrix}

   σ_1σ_2=-σ_2σ_1=iσ_3  σ_2σ_3=-σ_3σ_2=iσ_1  σ_3σ_1=-σ_1σ_3=iσ_2
   σ_1^2=σ_2^2=σ_3^2=I

2.ディラック・パウリ行列

※このように4×4の行列を2×2の行列のように表す表示をディラック表示という。
 α_1=\begin{pmatrix}
&\textbf{σ}_\textbf{1}\\
\textbf{σ}_\textbf{1}&\\
\end{pmatrix}
=\begin{pmatrix}
 & & &1\\
 & &1& \\
 &1& & \\
1&& & \\
\end{pmatrix}


 α_2=\begin{pmatrix}
&\textbf{σ}_\textbf{2}\\
\textbf{σ}_\textbf{2}&\\
\end{pmatrix}
=\begin{pmatrix}
 & & &-i\\
 & &i& \\
 &-i& & \\
i&& & \\
\end{pmatrix}


 α_3=\begin{pmatrix}
&\textbf{σ}_\textbf{3}\\
\textbf{σ}_\textbf{3}&\\
\end{pmatrix}
=\begin{pmatrix}
 & &1&\\
 & & &-1\\
1& & & \\
 &-1& & \\
\end{pmatrix}


 β=\begin{pmatrix}
1& & &\\
 &1& &\\
 & &-1& \\
 & & &-1\\
\end{pmatrix}

   {α_i}^2=β^2=1
   α_iα_j+α_jα_i=2δ_{ij}
   α_iβ+βα_i=0

3.ガンマ行列

   γ^0=β~~~~~~γ^i=βα_i
   (γ^0)^2=1~~~~~~(γ^i)^2=-1
   γ^νγ^μ=-γ^μγ^ν~~(μ≠ν)
   γ^0=γ_0~~~~γ^i=-γ_i

 ディラック表示で表すと、

γ^0=\begin{pmatrix}
1&0\\
0&-1\\
\end{pmatrix}
~~~γ^i=\begin{pmatrix}
0&{σ_i}\\
{-σ_i}&0\\
\end{pmatrix}

4.特殊相対性理論

計量テンソルg^{μν}=g_{μν}=
\begin{pmatrix}
1& & & \\
 &-1& & \\
 & &-1& \\
 & & &-1\\
\end{pmatrix}
※添え字を上げ下げする。
   x_μ=g_{μρ}x^ρ
   g^{μρ}g_{ρν}=g^μ_{~~ν}=δ^μ_ν

   ガンマ行列との関係:γ^μγ^ν+γ^νγ^μγ=g^{νμ}~~~γ^ν=g^{νμ}γ_μ

   ローレンツ変換の不変量:s^2≡g_{μν}x^μx^ν

   ローレンツ変換x'^μ=Λ^μ_{~~ν}x^ν
   
   g_{μν}x'^μx'^ν=g_{μν}x^μx^ν
   g_{μν}Λ^μ_{~~ρ}x^ρΛ^ν_{~~σ}x^σ=g_{μν}x^μx^ν
  ∴g_{μν}Λ^μ_{~~ρ}Λ^ν_{~~σ}=g_{ρσ}・・・ローレンツ変換が満たす関係

   ローレンツ変換の逆変換

   x^μ=(Λ^{-1})^μ_{~~ρ}x'^ρ=(Λ^{-1})^μ_{~~ρ}Λ^ρ_{~~ν}x^ν
  ∴(Λ^{-1})^μ_{~~ρ}Λ^ρ_{~~ν}=g^μ_{~~ν}=δ^μ_ν

 一方g_{σρ}Λ^σ_{~~μ}ρΛ^ρ_{~~ν}=g_{μν}
  ∴Λ_{ρμ}Λ^ρ_{~~ν}=g_{μν}

 さらにΛ_{ρσ}g^{σμ}Λ^ρ_{~~ν}=g_{σν}g^{σμ}
  ∴Λ_{ρ}^{~~μ}Λ^ρ_{~~ν}=g^μ_{~~ν}=δ^μ_ν

  ∴(Λ^{-1})^μ_{~~ρ}=Λ_{ρ}^{~~μ}

   微小ローレンツ変換Λ^μ_{~~ν}=δ^{μ}_{ν}+ε^{μ}_{~~ν}

 微小量ε^{μ}_{~~ν}について、1次のレベルまでローレンツ変換の条件を適用すると、
 
   g_{μν}δ^ν_{σ}δ^{μ}_{ρ}+g_{μν}(ε^μ_{~~ρ}δ^ν_{σ}+δ^μ_{ρ}ε^ν_{~~σ})=g_{ρσ}
  ∴g_{ρσ}+g_{μσ}ε^μ_{~~ρ}+g_{ρν}ε^ν_{~~σ}=g_{ρσ}

   ε_{σρ}+ε_{ρσ}=0 
  よって、無限小ローレンツ変換は反対称テンソル


 

5.ディラック方程式

   i{\hbar}\frac{\partial}{{\partial}t}{\psi}(\textbf{r},t)=(-i{\hbar}c\textbf{α}{\cdot}∇+βmc^2 ){\psi}(\textbf{r},t)

左からβ=γ^0を乗じ、γ^i=βα_i~~β^2=1を用い、さらにx^0=ctとすると、
   (i{\hbar}γ^μ\frac{\partial}{{\partial}x^μ}-mc){\psi}(\textbf{r})=0

   (i{\hbar}γ^μ{\partial}_μ-mc){\psi}(\textbf{r})=0

ディラック方程式の解である4成分の{\psi}(\textbf{r})を、ディラックピノルという。

ディラックピノルと確率密度Pの関係
   P={\psi}^{\dagger}{\psi}=|{\psi}_0|^2+|{\psi}_1|^2+|{\psi}_2|^2+|{\psi}_3|^2

6.ディラック方程式ローレンツ変換の共変性

座標が、ローレンツ変換x'^μ=Λ^μ_{~~ν}x^νで変換されるときに、ディラックピノ{\psi}(x)に対して、次のような変換Sが存在すれば、ディラック方程式ローレンツ変換に対して共変であるといえる。

   {\psi}'(x')=S(Λ){\psi}(x)・・・・
   (S(Λ)は、ローレンツ変換Λ^μ_{~~ν}によって構成される行列)

   (i{\hbar}γ^μ{\partial}_μ-mc){\psi}(\textbf{r})=0

左からSを乗じると

   (i{\hbar}Sγ^μ{\partial}_μ-mcS){\psi}(\textbf{r})=0

Sγ行列は交換しないので、第1項の左にI=S^{-1}Sを乗じると、

   (i{\hbar}Sγ^μS^{-1}{\partial}_μ-mc)S{\psi}(\textbf{r})=0

   {\partial}_μ=\frac{{\partial}x'^{ν}}{{\partial}x^{μ}}\frac{\partial}{{\partial}x'^{ν}}=Λ^ν_{~~μ}{\partial}'_{ν}
なので、

   (i{\hbar}Λ^ν_{~~μ}Sγ^μS^{-1}{\partial}'_ν-mc){\psi}'(\textbf{r}')=0

これが
   (i{\hbar}γ^ν{\partial}'_ν-mc){\psi}'(\textbf{r}')=0
となればよいが、そのためには、

   Λ^ν_{~~μ}Sγ^μS^{-1}=γ^ν
を満たすことが必要で

このようなSを微小ローレンツ変換に適用する。
無限小ローレンツ変換ε_{μν}の1次までで、Sを次のように取る。

   S=1-iε_{μν}kT^{μν}(γ)~~~~~S^{-1}=1+iε_{μν}kT^{μν}(γ)
T^{μν}は、行列Tの要素ではなくγ行列から構成される行列である。これを行列の要素と勘違いすると、以下の数式の展開が全く理解できなくなるので注意。当然、T^{μν}γ行列と交換しない。また、kは定数である。

   (δ^ν_μ+ε^ν_{~~μ})(1-iε_{ρσ}kT^{ρσ})γ^μ(1+iε_{ρσ}kT^{ρσ})=γ^ν
 
 εの1次までをとると
   δ^ν_μγ^μ+ε^ν_{~~μ}γ^μ-iδ^ν_με_{ρσ}kT^{ρσ}γ^μ+iδ^ν_μγ^με_{ρσ}kT^{ρσ}=γ^ν
   γ^μ+ε^ν_{~~μ}γ^μ-iε_{ρσ}kT^{ρσ}γ^ν+iγ^νε_{ρσ}kT^{ρσ}=γ^ν
  ∴ε^ν_{~~μ}γ^μ-iε_{ρσ}kT^{ρσ}γ^ν+iγ^νε_{ρσ}kT^{ρσ}=0

第1項のμσにし、ε^ν_{~~σ}=g^{νρ}ε_{ρσ}を用いると、
   g^{νρ}ε_{ρσ}γ^σ-iε_{ρσ}kT^{ρσ}γ^ν+iγ^νε_{ρσ}kT^{ρσ}=0
   ε_{ρσ}(g^{νρ}γ^σ-ikT^{ρσ}γ^ν+iγ^νkT^{ρσ})=0
   ig^{νρ}γ^σ+kT^{ρσ}γ^ν-γ^νkT^{ρσ}=0
  ∴[kT^{ρσ},γ^ν]=-ig^{νρ}γ^σ

g^{νρ}=γ^νγ^ρ+γ^ργ^νなので、

   [kT^{ρσ},γ^ν]=-i(γ^νγ^ργ^σ+γ^ργ^νγ^σ)=-i(γ^νγ^ργ^σ-γ^ργ^σγ^ν)=i[γ^ργ^σ,γ^ν]
  ∴kT^{ρσ}=iγ^ργ^σ
よって、Sは存在する。

さらに、
   {\psi}'(x')=S(Λ){\psi}(x)=S(Λ){\psi}(Λ^{-1}x')

 xx'に書き換えると、
   {\psi}'(x)=S(Λ){\psi}(x)=S(Λ){\psi}(Λ^{-1}x)

 ここで、
   {\psi}(Λ^{-1}x)={\psi}(x-ε^μ_{~~ν}x)≒{\psi}(x)-ε^μ_{~~ν}x^ν{\partial}_μ{\psi}(x)

 よって、
   {\psi}'(x')=(1-iε_{ρσ}kT^{ρσ})({\psi}(x)-ε^μ_{~~ν}x^ν{\partial}_μ{\psi}(x))

 εを1次までとると、
   {\psi}'(x')={\psi}(x)-ε^μ_{~~ν}x^ν{\partial}_μ{\psi}(x)-iε_{ρσ}kT^{ρσ}{\psi}(x)
   {\psi}'(x')={\psi}(x)-g^{ρμ}ε_{ρσ}x^σ{\partial}_μ{\psi}(x)-iε_{ρσ}kT^{ρσ}{\psi}(x)
   {\psi}'(x')={\psi}(x)-ε_{ρσ}x^σ{\partial}^ρ{\psi}(x)-iε_{ρσ}kT^{ρσ}{\psi}(x)
   {\psi}'(x')={\psi}(x)-i\frac{ε_{ρσ}}{2}(-i2x^σ{\partial}^ρ+2kT^{ρσ}){\psi}(x)

  ∴{\psi}'(x')={\psi}(x)-\frac{iε_{ρσ}}{2}(ix^ρ{\partial}^σ-ix^σ{\partial}^ρ+2kT^{ρσ}){\psi}(x)

 ここで、ローレンツ変換の生成子M^{ρσ}

   {\psi}'(x')={\psi}(x)-\frac{iε_{ρσ}}{2\hbar}M^{ρσ}{\psi}(x)
 と比較すると、
   M^{ρσ}=i{\hbar}x^ρ{\partial}^σ-i{\hbar}x^σ{\partial}^ρ+2{\hbar}kT^{ρσ}
   M^{ρσ}=x^ρp^σ-x^σp^ρ+2{\hbar}kT^{ρσ}

 ここで、
   (M^{23},M^{31},M^{12})=\textbf{L}+\frac{\hbar}{2}\begin{pmatrix}{\textbf{σ}}&0\\0&{\textbf{σ}}\\\end{pmatrix}
 であるので、2{\hbar}k(T^{23},T^{31},T^{12})を求めてみると、

   T^{23}=iγ^2γ^3={i}\begin{pmatrix}0&{σ_2}\\{-σ_2}&0\\\end{pmatrix}\begin{pmatrix}0&{σ_3}\\{-σ_3}&0\\\end{pmatrix}={i}\begin{pmatrix}{-σ_2σ_3}&0\\0&{-σ_2σ_3}\\\end{pmatrix}=\begin{pmatrix}{σ_1}&0\\0&{σ_1}\\\end{pmatrix}
   (σ_2σ_3=iσ_1

 同様にして、T^{31}とT^{12}も求めると、

   2{\hbar}k(T^{23},T^{31},T^{12})=2{\hbar}k\begin{pmatrix}{\textbf{σ}}&0\\0&{\textbf{σ}}\\\end{pmatrix}
  ∴k=\frac{1}{4}

 よって、S
   S=1-\frac{iε_{μν}}{4}T^{μν}(γ)~~~~~S^{-1}=1+\frac{iε_{μν}}{4}T^{μν}(γ)

量子力学の軌跡解釈(ボーム力学)とコッヘン=シュペッカーのNO-GO定理

量子力学の軌跡解釈(ボーム力学)とコッヘン=シュペッカーのNO-GO定理NO-GO定理


ここでは、「量子力学の軌跡解釈(ボーム力学)による力学の概要」で用いた数式を引用することがあります。その場合は、概要式(10)」というように標記します。また、同様に公理や命題を引用することもありますが、公理や命題の番号は「量子力学の軌跡解釈(ボーム力学)による力学の概要」から通し番号にします。(公理1~公理4、命題1~命題11、補題1~2は「量子力学の軌跡解釈(ボーム力学)による力学の概要」からの引用となります。)

1.所有値とオブザーバブル(観測可能量)

古典物理学は、運動量やエネルギーといった物理量を理想的に測定すれば唯一の値が得られ、その測定値は測定前からその物理量が有していたものであるという暗黙の前提の上に成り立っています。従って、観測して測定される得る値は一意に定まっており、「物理量が有する値」「観測すれば測定され得る値」「理想的な測定値」を区別する必要はありません。
これに対して、量子力学は「観測すれば測定され得る値」が多数存在していて、その中から1つの値が「理想的な測定値」として確率的に出現するという構成の上に成り立っています。このような一見して、我々の直観に反する論理が与えられているのは、シュレディンガー方程式が実験結果と一致するという事実を説明するために与えらた後付けの解釈であるためです。
このような多数存在する「観測すれば測定され得る値」は、物理量に応じて決まった演算子固有値となっており、こういう状況を指して物理量は「観測可能量(オブザーバブル)」であるとも言われています。
しかし、「観測すれば測定され得る値」が多数存在し1つの演算子固有値となっていれば、逆に演算子から「観測すれば測定され得る値」を数学的に導くことが可能なため、通常はこの演算子のことを観測可能量(オブザーバブル)というのが一般的です。しかし、量という言葉の意味からすれば、観測可能量というのは誤解を生じやすいため、以後「オブザーバブル」という言葉を使用することにします。なお、物理量は実数であり、「観測すれば測定され得る値」も実数であることから、それを固有値とする演算子は、必ずエルミート演算子であります。従って、物理量はオブザーバブルであり、それはエルミート演算子であるということになります。
量子力学の軌跡解釈(ボーム力学)による力学の概要」では、所有値(=「ある物理量を観測していなくとも系が所有していると考えらえる値」)を主に取扱い、対照的な概念として「観測可能量」(=「ある物理量を観測すると測定され得る値」)を用い、この「観測可能量」という言葉を、通常用いられている演算子としての「オブザーバブル」とは異なる意味で使用していましたが、ここでは、標準的な「オブザーバブル」とその所有値の関係を与えます。(「量子力学の軌跡解釈(ボーム力学)による力学の概要」では、演算子そのものよりもその固有値全体という意味で「観測可能量」という言葉を用いていました。通常は、演算子のほうを観測可能量(オブザーバブル)といいます。)

【公理4】(所有値とオブザーバブルの関係)
系が位置 x を所有値として有する粒子とそれに随伴するパイロット波Ψによって表されているとき、その系の物理量であるオブザーバブルA(エルミート演算子)について、粒子は所有値としては次にような a を有する。(Re(・)は、実部のみを取ることを意味します。)


       a(x,t)=Re(\frac{Ψ(x,t)*AΨ(x,t)}{Ψ(x,t)*Ψ(x,t)})     (1)

なお、概要(11)(ψ(x,t)≡R(x,t)exp(i\frac{S(x,t)}{ℏ}))を用いると、

     a(x,t)=Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}AR(x,t)e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})   (2)

となる。
【公理4】は、あらゆるオブザーバブルAが、粒子の所有値の場(時間と位置に依存する)となることを示していますが、これを運動量に適用すると次のような結論が得られます。


【命題12】
パイロット波Ψが随伴する粒子は、運動量として次のような [P(x,t)]を有し、その運動量の場に従って運動する。

           P(x,t)=∇S(x,t)     (3)

(証明)
運動量のオブザーバブルは、P=-iℏ∇であるから、式(2)より、

     p=Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}(-iℏ∇)R(x,t)e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})
        =Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}(-iℏ∇R(x,t)+R(x,t)∇S(x,t))e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})
        =Re(\frac{-iℏR(x,t)∇R(x,t)+R(x,t)^{2}∇S(x,t))}{R(x,t)^2})=∇S(x,t)   (4)

   (R及びS は、概要(11)(ψ(x,t)≡R(x,t)exp(i\frac{S(x,t)}{ℏ}))の定義により実数)
以上のことから、式(3)が成り立つことがわかります。

【命題12】から粒子の質量が mであったとすれば、概要式(12)に従い粒子が運動することが明らかとなります。従って、【公理3】、より一般的である【公理4】の内容に抱合されることになりますので、[公理3]を不要となります。
次に、エネルギーのオブザーバブルであるハミルトニアンH=iћ∂/∂tついて、【公理4】を適用すると、【命題4】の概要式(17)と同じ結果になることがわかる。


【命題13】
パイロット波Ψが随伴する粒子は、エネルギーとして次のようなE(x,t)を有する。

              E=-∂S(x,t)/∂t     (5)

(証明)
エネルギーのオブザーバブルであるH=iћ∂/∂tを、式(2)のAに代入すれば明らか。



補題3】
運動量所有値の自乗p(x,t)^{2}と運動量自乗の所有値p^{2}(x,t)の間には次のような関係が成り立つ。

p^{2}(x,t)=-\frac{ћ^{2}}{R(x,t)}∇^{2}R(x,t)+(∇S(x,t))^{2}=-\frac{ћ^{2}}{R(x,t)}∇^{2}R(x,t)+p(x,t)^{2}    (6)

(証明)
式(2)より、

 p^{2}(x,t)=Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}(-iℏ∇)^{2}R(x,t)e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})
     =Re(\frac{R(x,t)e^{-i\frac{S(x,t)}{ℏ}}(-iℏ∇)(-iℏ∇R(x,t)+R(x,t)∇S(x,t))R(x,t)e^{i\frac{S(x,t)}{ℏ}}}{R(x,t)^2})
     =Re(\frac{R(-2iℏ∇S・∇R-ℏ^{2}∇^{2}R+R(∇S)^{2})}{R^2})
     =-\frac{ћ^{2}}{R}∇^{2}R+(∇S)^{2}=-\frac{ћ^{2}}{R(x,t)}∇^{2}R(x,t)+p(x,t)^{2}
 

2.FUNCとコッヘン=シュペッカーのNO-GO定理

まず、「ベルの定理」と「コッヘン=シュペッカーのNO-GO定理」について簡単に説明します。
証明過程は省略しますが、「ベルの定理」とは次のように3つの条件が両立しないことを証明したものです。

ベルの定理
次の3つの条件は両立しない。
 (1) 個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できる。
 (2) そのような個々の量子系に付与された値が、集団としては量子力学の統計的予測を再現する。
 (3) 量子系においては局所的な相関しかない。

量子力学が実験事実と整合することから、(2)は成立するものとみなします。すると、ベルの定理を満たすためには、(1)か(3)のいずれかが否定されなければなりませんが、(1)を否定し(3)を肯定するのが標準解釈で、「個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できない。」が「量子系においては局所的な相関しかない。」とする立場です。

【標準解釈】
 ・個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できない。
 ・量子系においては局所的な相関しかない。」

一方で、軌跡解釈は(1)を肯定し、(3)を否定するもので、「すべてのオブザーバブルに同時に確定した値を付与できる。」が「量子系においては非局所的な相関もありうる。」とする立場です。もっとも、(1)を肯定しすべてのオブザーバブルに同時に確定した値を付与できるとしても、その同時確定した値を同時に観測できることを意味するのではなく、所有値(=「あるオブザーバブルを観測していな
くとも系が所有していると考えらえる値」)として粒子が確定した値を有するとすることも可能です。一般的に軌跡解釈はこの論理構成に依拠するもので、所有値という概念は言わば「隠れた変数」であり、軌跡解釈が「非局所的な隠れた変数の理論」と呼ばれるのはこのためです。

【軌跡解釈】
 ・すべてのオブザーバブルに同時に確定した値を付与できる。
 ・量子系においては非局所的な相関もありうる。

「コッヘン=シュペッカーの NO-GO 定理」(KS定理)は、次のような3つの条件が両立しないことを示すものですが、これにより【ベルの定理】の条件(1)を否定し「すべてのオブザーバブルに同時に確定した値を付与できない。」と結論付けており、できないこと証明したという意味でNO-GO 定理と言われています。しかし、KS定理は証明の過程で、同時に確定した値を付与されたオブザーバブルが有するFUNC(The Functional Composition Principle)という規則を用いていますが、軌跡解釈ではこのFUNCが成り立たないことを示すことができ、KS定理によって軌跡解釈が否定されたとは必ずしもいい切れません。

【コッヘン=シュペッカーの NO-GO 定理】(KS定理)
次の3つの条件は両立しない。
 (1) 個々の量子系について、すべての物理量に同時に確定した値を付与できる。
 (2) もし個々の量子系について、すべての物理量が同時に確定した値を有するなら、その値は測定状況に依存しない。
 (3) 個々の量子系について、すべての物理量の取り得る値と射影演算子には1対1の対応関係がある。

この定理の証明には次のような公理を仮定する必要があります。これはエルミート演算子オブザーバブルであるための条件を仮定するものです。(全てのエルミート演算子オブザーバブルであるわけではありません。)

【仮定】
エルミート演算子A固有値である実数a が定義されており、与えられた量子状態について、Aに対する量子力学の統計的計算により、b=ρ([A]=a)である実数 b が導かれるなら、実数aに対するエルミート演算子Aオブザーバブルである。
(ここで、〔A〕とはエルミート演算子A固有値である実数を表し、b=ρ([A]=a)とは〔A〕=aである確率を表す。)

この仮定を用いた、KS定理の証明過程の概要は次のようになります。

(証明1)(FUNCの導出)
ある量子系にオブザーバブルAがある。KS定理の(1)が成立するなら、オブザーバブルAは所有値として[A]=aを有する。従って、ある関数 f:R→R に対して、値f([A]=b)を定義することができる。(f:R→Rは、関数 f が実数から実数への関数であることを表す。)
また、【仮定】よりオブザーバブルA量子力学の統計的計算により確率c=ρ([A]=a)を定義することができる。
一方、関数fにより、エルミート演算子B=f(A)を定義することができ、確率の定義より、ρ([A]=a)=ρ([f(A)]=a)が成り立つ。
従って、エルミート演算子B=f(A)は、〔B〕=〔f(A)〕=b という値が定義され、量子力学の統計的計算により c=ρ(〔f(A)〕=b)という実数を求めることができるので、【仮定】よりB=f(A)オブザーバブルである。
そして、KS定理の(2)が成立するなら、オブザーバブルBに定義される値〔B〕は測定状況に依存せずに一意であることが言えるため、次のことが成り立つ。

【FUNC】
Aオブザーバブルとし、 f:R→R をある関数とすると、f(A)は一意に定まるオブザーバブルであり、

     〔f(A)〕=f(〔A〕)

が成り立つ。
H=ℏ^2P^2/2mが成り立つのであれば、所有値についてE=ℏ^2p^2/2mが成り立つ)

(証明2)(和の規則の導出)
オブザーバブルABが可換であるとき、ある極大エルミート演算子Cが存在し、ある関数 f , g:R→Rにより、A=f(C)及びB=g(C)と表すことができる。
ここでCはエルミート演算子であるため、スペクトル定理により、

     C=\int{λdE(λ)}

と表すことができるため、

     A=\int{f(λ)dE(λ)}    B=\int{g(λ)dE(λ)}

     A+B=\int{(f(λ)+g(λ))dE(λ)}

となる。ここで、h(λ)=f(λ)+g(λ)を定義すると、

     A+B=\int{h(λ)dE(λ)}=h(C)

であるため、[A+B]=[h(C)]となる。

一方で、

     [A]+[B]=[f(C)]+[g(C)]

なので、ここで【FUNC】より、

     [A]+[B]=[f(C)]+[g(C)]=f([C])+g([C])=h([C])=[h(C)]

となるため、

     [A]+[B]=[A+B]

が成り立りたち、次のことが言える。

【和の規則】
オブザーバブルABが可換であるときが可換であるとき、[A]+[B]=[A+B]が成り立つ。

(証明3)
【仮定】より、恒等演算子オブザーバブルであるといえる。従って、次のような射影演算子の和で与えられる恒等演算子I=P_1+P_2+P_3+・・・P_N には【和の規則】を適用でき、

     [I]=[P_1]+[P_2]+[P_3]+・・・[P_N]

となる。

この先の証明過程は省略しますが、これを用いて、3以上の任意のヒルベルト空間において、相互に直交する一次元射影作用素からなる任意の集合について、その中の一つだけに射影作用素に1を与え、残りすべてに0を与える付与は存在しないことを数学的に証明し、KS定理(3)が成り立たないことが証明され、KS定理は証明されています。

最後まで証明したわけではありませんが、KS定理が成立するためには、【仮定】と【FUNC】が前提となっていることがわかります。
従って、逆にこのどちらかを満たさない理論についてはKS定理の適用除外となる可能性がありそうです。
なお、KS定理が成立することからKS定理(1)を否定的にとらえ「個々の量子系について、すべての物理量に同時に確定した値を付与できない。」とし同時に確定した物理量を否定するのが、コッヘンとシュペッカーが示そうとしたことです。

次のように、軌跡解釈には【FUNC】が適用されないことから、KS定理が必ずしも適用されないことが証明されます。


【命題 16】
軌跡解釈における運動量の所有値はFUNCを満たさない。従って、軌跡解釈にはKS定理が適用されない。

(証明)
FUNCより、f(A)=A^2という関数に対して、

    [f(A)]=[A^2]=[A]^2

が成り立ち、運動量オブザーバブルPが所有値p有し、FUNCを満たすなら、

    [f(P)]=[P^2]=[P]^2

が成り立つはずである。
しかし、【命題12】の式(3)から(p)^2=(∇S(x,t))^2であり、

一方【補題4】式(6)より、

     p^{2}(x,t)=\frac{ћ^{2}}{R(x,t)}∇^{2}R(x,t)+p(x,t)^{2}         


となるため、[P^2]≠[P]^2である。
よって、軌跡解釈における運動量の所有値はFUNCを満たさず、軌跡解釈にKS定理は適用されない。

ベイズ統計 第4章 ナイーブベイズ分類器とナイーブベイズフィルター

第1章  確率の基礎
第2章  ベイズの定理からベイズ理論の出発点へ
第3章  ベイズの展開公式

ベイズ統計

第4章 ナイーブベイズ分類器とナイーブベイズフィルター

4.1 ナイーブベイズ分類器とナイーブベイズフィルター

ベイズ分類器とは、ベイズ理論を用いて、与えられたデータを目的のカテゴリーに分類する分類器のモデルをいう。例えば、文書に記載されている特定のキーワードが一定確率であるならば、この文書のカテゴリーは「物理学」「労働法」「社会保険」等といった分類をする。
このベイズ分類器で有名な応用の1つがナイーブベイズフィルターである。ナイーブベイズフィルターは、分類するといっても多数のカテゴリーに分類するのではなく、2つのカテゴリーに分類し不要なものを排除する(まさに、フィルターである)。わかりやすい例は、迷惑メールの排除で、メールに記載されたキーワードから迷惑メールを判別し、排除する。
ここでは、この迷惑メールの排除方法にどのようにベイズ統計が用いられているか見てみる。

4.2 ナイーブベイズフィルターの具体例

迷惑メールであるかどうかを判別するために、4つキーワード「クリック」「キャンペーン」「運営」「停止」に着目すると、これらのキーワードが次の確率で迷惑メールと普通メールに含まれていることが分かっているものとする。

クリック    :迷惑メール 0.6 普通メール 0.2
キャンペーン:迷惑メール 0.5 普通メール 0.1
運営     :迷惑メール 0.05 普通メール 0.45
停止     :迷惑メール 0.01 普通メール 0.3

あるメールを調べてみると、「クリック」「キャンペーン」「停止」の順でこれらのキーワードが1回ずつ記載されていた。
このメールが、迷惑メールであるかどうか判別してみる。
なお、受信メールのうち、迷惑メールと普通メールの比率は8:2の割合であるものとする。

4.2.1 事象(記号)の定義

まず、各事象について、次のとおり記号を定義する。
なお、前章までと同様に、原因をH、データをDで表すこととする。

H_1:受信メールが迷惑メールである。
H_2:受信メールが普通メールである。

D_1:受信メールに「クリック」というキーワードが含まれる。
D_2:受信メールに「キャンペーン」というキーワードが含まれる。
D_3:受信メールに「運営」というキーワードが含まれる。
D_4:受信メールに「停止」というキーワードが含まれる。

メールで出現したキーワードは、順番に「クリック」「キャンペーン」「運営」であったので、これをデータ(D)として次のように定義する。

DD_1→D_2 → D_4

求めたいものは、データがDであるという条件のもので、受信メールが迷惑メールである確率もしくは普通メールである確率であるため、

P(H_1|D)=P(H_1|D_1→D_2 → D_4)

P(H_2|D)=P(H_2|D_1→D_2 → D_4)

と表される。

ベイズ統計 第3章 ベイズの展開公式 - 数学と物理学のブログ

ここで前章で導出したベイズの展開式を用いると、

P(H_1|D)=\frac{P(D|H_1)P(H_1)}{P(D|H_1)P(H_1)+P(D|H_2)P(H_2)}  (1)

P(H_2|D)=\frac{P(D|H_2)P(H_2)}{P(D|H_1)P(H_1)+P(D|H_2)P(H_2)}  (2)

4.2.2 判別条件

式(1)と式(2)を用いれば、迷惑メールであるか普通メールであるかを判別できるが、分母が同じため、次のようになる。

迷惑メール:P(H_1|D)>P(H_2|D) ⇒ P(D|H_1)P(H_1)>P(D|H_2)P(H_2)  (3)

通常メール:P(H_1|D)<P(H_2|D) ⇒ P(D|H_1)P(H_1)<P(D|H_2)P(H_2)  (4)

4.2.3 ベイズ更新による判別

ベイズ更新を用いて、実際に判別をしてみるが、対象とする文書の中の単語はそれぞれ独立であると仮定する。つまり、メールに記載されている各単語は互いに確率的に影響がないものとする。
まず、「受信メールのうち、迷惑メールと普通メールの比率は8:2の割合であるものとする。」としていることから、事前確率P(H_1)P(H_2)を次のように設定する。

  P(H_1)=0.8
  P(H_2)=0.2

ここで、ベイズの展開式を用いてデータD_1が出た場合(「クリック」というキーワードが出た場合)に迷惑メールである確率P(H_1|D_1))と普通メールである確率P(H_2|D_1)を求めると、

  P(H_1|D_1)=\frac{P(H_1)P(D_1|H_1)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{0.8×0.6}{0.6×0.8+0.2×0.2}≒0.9231
  P(H_2|D_1)=\frac{P(H_2)P(D_1|H_2)}{P(D_1|H_1)P(H_1)+P(D_1|H_2)P(H_2)}=\frac{0.2×0.2}{0.6×0.8+0.2×0.2}≒0.0769

となる。

ベイズ更新により、この結果を今度は事前確率とすると

  P(H_1)=0.9231
  P(H_2)=0.0769

同様にして、データD_2が出た場合(「キャンペーン」というキーワードが出た場合)にそれぞれの確率を求めると、

  P(H_1|D_2)=\frac{P(H_1)P(D_2|H_1)}{P(D_2|H_1)P(H_1)+P(D_2|H_2)P(H_2)}=\frac{0.9231×0.5}{0.5×0.9231+0.1×0.0769}≒0.9836
  P(H_2|D_2)=\frac{P(H_2)P(D_2|H_2)}{P(D_2|H_1)P(H_1)+P(D_2|H_2)P(H_2)}=\frac{0.0769×0.1}{0.5×0.9231+0.1×0.0769}≒0.0164

ベイズ更新により、この結果を今度は事前確率とすると

  P(H_1)=0.9836
  P(H_2)=0.0164

同様にして、データD_4が出た場合(「停止」というキーワードが出た場合)にそれぞれの確率を求めると、
  
  P(H_1|D_4)=\frac{P(H_1)P(D_4|H_1)}{P(D_4|H_1)P(H_1)+P(D_4|H_2)P(H_2)}=\frac{0.9836×0.01}{0.01×0.9836+0.3×0.0164}≒0.667
  P(H_2|D_4)=\frac{P(H_2)P(D_4|H_2)}{P(D_4|H_1)P(H_1)+P(D_4|H_2)P(H_2)}=\frac{0.0164×0.3}{0.01×0.9836+0.3×0.0164}≒0.333

となる。これが最後のキーワードであるため、

  P(H_1|D)≒0.667
  P(H_2|D)≒0.333

となり、P(H_1|D)>P(H_2|D)が成り立つため、迷惑メールと判別される。

なお、第3章で説明したベイズ理論の逐次合理性により、「クリック」「キャンペーン」「停止」という順番が変ったとしても結果は同じになる。

4.2.4 単語の独立性による判別

次は、ベイズ更新を用いずに判別してみる。対象とする文書の中の単語はそれぞれ独立であると仮定していることから、P(D|H_1)P(D|H_2)は次のように表すことができる。

P(D|H_1)=P(D_1→D_2 → D_4|H_1)=P(D_1|H_1)P(D_2|H_1)P(D_4|H_1)  (5)
P(D|H_2)=P(D_1→D_2 → D_4|H_2)=P(D_1|H_2)P(D_2|H_2)P(D_4|H_2)  (6)

そして、式(5)と式(6)を式(3)と式(4)に代入すると、判別式は次のようになる。

迷惑メール:P(D_1|H_1)P(D_2|H_1)P(D_4|H_1)P(H_1)>P(D_1|H_2)P(D_2|H_2)P(D_4|H_2)P(H_2)  (7)
通常メール:P(D_1|H_1)P(D_2|H_1)P(D_4|H_1)P(H_1)<P(D_1|H_2)P(D_2|H_2)P(D_4|H_2)P(H_2)  (8)

式(7)の左辺と右辺を求めると、

P(D_1|H_1)P(D_2|H_1)P(D_4|H_1)P(H_1)=0.6×0.5×0.01×0.8=0.0024  (9)
P(D_1|H_2)P(D_2|H_2)P(D_4|H_2)P(H_2)=0.2×0.1×0.3×0.2=0.0012   (10)

となり、迷惑メールと判別されることがわかる。そして、式(9)と式(10)はそれぞれ迷惑メールである確率と普通メールである確率に比例するので、

P(H_1|D)=\frac{0.0024}{0.0024+0.0012}≒0.667
P(H_1|D)=\frac{0.0024}{0.0024+0.0012}≒0.333

これは、4.2.3でベイズ更新を用いて計算した確率と一致する。

4.3 ナイーブベイズ分類器と壷のモデル

このナイーブベイズ分類器は、前章の3.3の例2で利用した壷と玉のモデルと同等である。
ベイズ統計 第3章 ベイズの展開公式 - 数学と物理学のブログ
例えば、「クリック」というキーワードを玉に置き換えてみると、それが「迷惑メール」の壷から出てきた玉か、「普通メール」の壷から出た玉かを判別していることとなる。そして、「クリック」というキーワードが現れる尤度は、各壷に入っている玉の割合で算出される。また、4.2.3で計算したように、事前確率には壷の選択確率、すなわち迷惑メールと普通メールとの経験的なメール数の比があてられることとなる。


続き
第1章  確率の基礎
第2章  ベイズの定理からベイズ理論の出発点へ
第3章  ベイズの展開公式

量子力学の軌跡解釈による二重スリットシミュレーション2~ドブロイ・ボーム解釈によるアプローチ

量子力学の軌跡解釈による二重スリットシミュレーション2~ドブロイ・ボーム解釈によるアプローチ

第1編「量子力学の軌跡解釈による二重スリットシミュレーション1~ド・ブロイ=ボーム解釈によるアプローチ」の続きとなり、式(1)~式(14)は第1編からの引用となります。また、第1編と同様に、「量子力学の軌跡解釈(ボーム力学)の概要」もしくは「量子力学の軌跡解釈のガウス関数への適用」から数式を引用することがありますが、その場合は「概要(3)式」「ガウス(3)式」のように表記します。

4.二重スリットの量子ポテンシャル

次に、二重スリットの量子ポテンシャルを求めて、どのような動きをするのか見てみます。そのためには、式(9)をΨ(r,t)=Rexp(iS)に当てはめてRを求め、それを概要(16)式Q =-(1/2m)({∇}^2R /R)に代入し計算しなければなりません。

    r=(exp(2Ay)+exp(-2Ay)+2cos(2By) )^2

    ψ_1+ψ_2=g(x)exp(\frac{(y^2+b^2)it}{2σ_y}+iθ)exp(-\frac{(y^2+b^2)(Δy)^2}{σ_y})r    (9)

式(9)を、ψ(r,t)=Rexp(iS)に当てはめると、

    R=Re{g(x)}exp(-\frac{(y^2+b^2)(Δy)^2}{σ_y}){f(y)}^2 (10)

    f(y)=exp(2Ay)+exp(-2Ay)+2cos(2By)     (11)

  (σ_y=4( (Δy)^4+t^2/4)     A=\frac{2b(Δy)^2}{σ_y}     B=\frac{bt}{σ_y}

となります。量子ポテンシャルQのうち、X方向で2階偏微分して求まる項は、「量子力学の軌跡解釈のガウス関数への適用」で計算した結果と同じなので、ここでは、Y方向で2階偏微分して求まる項のみを計算します。つまり、Re{g(x)}の因子は無視してよいことになります。

まず、式(10)を1階偏微分して、

         \frac{∂R}{∂y}=(-\frac{2y(Δy)^2}{σ_y}+\frac{f}{2}\frac{∂f}{∂y})R

さらに、2階偏微分すると、

      \frac{∂^2R}{∂y^2}=(-\frac{2(Δy)^2}{σ_y}-\frac{f^2}{2}(\frac{∂f}{∂y})^2+\frac{f}{2}\frac{∂^2f}{∂y^2})R+(-\frac{2y(Δy)^2}{σ_y}+\frac{f}{2}\frac{∂f}{∂y})\frac{∂R}{∂y}
      ={-\frac{2(Δy)^2}{σ_y}-\frac{f^2}{2}(\frac{∂f}{∂y})^2+\frac{f}{2}\frac{∂^2f}{∂y^2}}R+{-\frac{2y(Δy)^2}{σ_y}+\frac{f}{2}\frac{∂f}{∂y}}^2R

これらを丹念に計算していくと、概要(16)式Q =-(1/2m)({∇}^2R /R)より、m=1の場合の量子ポテンシャルQは、

   Q=\frac{(Δy)^2}{σ_y}+\frac{1}{8}{\frac{(∂f/∂y)}{f}}^2-\frac{1}{4f}\frac{∂^2f}{∂y^2}-\frac{2y^2(Δy)^4}{σ_y^2}+y(Δy)^2\frac{1}{f}\frac{∂f}{∂y}+(xによる2階偏微分の項)

       f=exp(2Ay)+exp(-2Ay)+2cos(2By)

       \frac{∂f}{∂y}=2A(exp(2Ay)-exp(-2Ay))-4Bsin(2By)

       \frac{∂^2f}{∂y^2}=4A^2(exp(2Ay)+exp(-2Ay))-8B^2cos(2By)

       σ_y=4( (Δy)^4+t^2/4)   A=\frac{2b(Δy)^2}{σ_y}   B=\frac{bt}{σ_y}

となります。
そして、「Xによる2階偏微分の項」は、ガウス(14)式でt=0x=0として、k_0k_xに置き換え、ћ=m=1(原子単位系)とすればよいので、

        Q=\frac{(Δy)^2}{σ_y}+\frac{1}{8}{\frac{(∂f/∂y)}{f}}^2-\frac{1}{4f}\frac{∂^2f}{∂y^2}-\frac{2y^2(Δy)^4}{σ_y^2}+y(Δy)^2\frac{1}{f}\frac{∂f}{∂y}+\frac{(Δx)^2-2(Δx)^4(x-k_xt)^2}{(4(Δx)^4+t^2)^2}      (12)

となります。
式(12)をプロットしてみると次のようになります。

まず、a=6、b=10、Δx=Δy=1で量子ポテンシャルの変化を見てみます。

f:id:sr-memorandum:20191014102556p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014102725p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014102749p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014102806p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014102830p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014103233p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1);
f:id:sr-memorandum:20191014103344p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014103949p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014104019p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014104050p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014104118p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014104140p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)
f:id:sr-memorandum:20191014104216p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1)

X方向に0.4の速度を保ったまま、Y方向はポテンシャルの低い方向に運動するため、量子ポテンシャルによって軌跡に粗密ができることが(粒子の軌跡はポテンシャルが谷の部分に集まります)わかります。
ただ、3Dでは分かりにくいうえ、t=5以上では量子ポテンシャルがxにほとんど依存しなくなるため、x=0に固定して量子ポテンシャルの時間的な変化を見てみます。

f:id:sr-memorandum:20191014145918p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

時間が早すぎるので、1秒ずつにしてみます。

f:id:sr-memorandum:20191014150311p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)
f:id:sr-memorandum:20191014150827p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)
f:id:sr-memorandum:20191014151226p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)
f:id:sr-memorandum:20191014151816p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)
f:id:sr-memorandum:20191014152231p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

徐々に平坦になりつつも、ポテンシャルが中心付近で激しく振動し、波のように外に広がって行くことがわかります。
そして、最終的には真ん中からポテンシャルは徐々に平坦になっていきます。
これは、最終的にはY方向の運動も等速になることを意味しています。

f:id:sr-memorandum:20191014152951p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

最後にY軸と時間(t)量子ポテンシャルの様子を3Dグラフにしてみました。

f:id:sr-memorandum:20191014153809p:plain
量子ポテンシャルの変化(a=6,b=10,Δx=Δy=1,x=0)

量子力学の軌跡解釈による二重スリットシミュレーション1~ド・ブロイ=ボーム解釈によるアプローチ

量子力学の軌跡解釈による二重スリットシミュレーション~ドブロイ・ボーム解釈によるアプローチ

量子力学の軌跡解釈(ボーム力学)の概要もしくは量子力学の軌跡解釈のガウス関数への適用から数式を引用することがありますが、その場合は「概要(3)式」「ガウス(3)式」のように表記します。

1.ボームによる二重スリットの解釈

D.Bohmによる二重スリットの解釈は、De Broglieが提唱した「パイロット波」解釈を発展させたもので、そのような経緯もあり、「ドブロイ=ボーム解釈」と呼ばれることもあります。なお、二重スリットの解釈と述べたが、それは量子力学の解釈そのものを意味してしており、このことは、『THE UNDIVIDED UNIVERSE』にも触れられています。
「「パイロット波」が粒子の運動を誘導するという考えは、1927年にDe Broglieによって初めて主張されたが、それは単粒子系のみによるものであった。De Broglieは、1927年に開催された「ソルベイ会議」でこの考えをプレゼンしたが、Pauliによって激しく批判された。Pauliの最も重要な批判は、二体の散乱過程では、このモデルを矛盾無く適用できないということであった。その結果、De Broglieは自分の主張を放棄した。「パイロット波」の考えは、その後1952年に、D.Bohmによって多体系での解釈が加えられ、再び主張された。De Broglieの主張は、Pauliの批判に答えることが可能であり、実際に、量子現象の多くの領域に適用できる観測の理論を含む一貫した解釈に道を開いた。その結果、De Broglieは最初の自分の考えを再度主張し、それらを多様な方法で発展させていった。」(『THE UNDIVIDED UNIVERSE』より抜粋)

さて、軌跡解釈(=「ドブロイ=ボーム解釈」)による二重スリットの解釈は、おおまかにいって次のようなものとなります。例として、電子を用いて二重スリットシミュレーションを行うものとしました。なお、二重スリットについて詳しく知らない人は、http://ja.wikipedia.org/wiki/%E4%BA%8C%E9%87%8D%E3%82%B9%E3%83%AA%E3%83%83%E3%83%88%E5%AE%9F%E9%A8%93ウィキペディア)等を参照してください。

  • ①電子は粒子として存在している。
  • ③電子は粒子として、パイロット波によって誘導され運動する。
  • ④電子は粒子だから、二重スリットのどちらか一方を通り抜ける。
  • パイロット波は、二重スリットの両方を通り、通り抜けると干渉を起こす。
  • ⑥電子は粒子として、パイロット波によって誘導されるから、二重スリットを通り抜けると干渉したパイロット波によって誘導される。
  • ⑦その結果、スクリーンに浮かび上がる電子の像は干渉した波のようなものになる。

標準解釈では、粒子の実在を前提とせず、実在の基礎を波動関数とするため、波動関数が同時に2つのスリットを通り抜け干渉を起こし、その結果スクリーン上に干渉像のような分布が浮かび上がるということになります。古典的には理解しにくいですが、粒子の実在を否定するため、波動関数が同時に2つのスリットを通り抜けることができるということになります。

標準解釈がどうであれ、軌跡会社では波動関数が粒子の運動を誘発するパイロット波となるため、二重スリットを扱うには、

  • ②求めた波動関数Ψ(r,t)を、Ψ(r,t)=Rexp(iS/ћ)(概要(11)式) に当てはめ、RまたはSを求める。
  • ③Sを求めた場合、p=∇S(概要(12)式)から運動量pが求まり、ここから粒子運動の軌道が求まる。ただし、初期条件を確定させることができないため、初期条件を仮に設定した場合の軌道となる。
  • Rを求めた場合、Q=-(ћ^2/2m)(∇2R/R)(概要(16)式から量子ポテンシャルQが求まり、これをmdv/dt=-∇(V+Q)(概要(15)式)に代入すれば、粒子運動の軌道が求まる。ただし、初期条件のうち初速度は③から求まるが、位置のほうは確定させることができないため、やはり初期条件を仮に設定した場合の軌道となることは、③の場合と同様である。

とすればよく、ここでは③を用いることにしました。
なお、数式を簡単にするために、以下、m(電子の質量)=ћ=c(光速度)=1となる原子単位系を用います。

2.2次元ガウス波束

まず、t=0で中心がx=0y=bにあり、x方向に速度k_xで移動するガウス波束の波動関数を求めてみます。x方向とy方向はそれぞれ独立であるため、ガウス式(7)より直ちに、

ψ_1(x,y,t)=\frac{\sqrt{π}exp(-k_x^2(Δx)^2)}{\sqrt{(Δx)^2+it/2}} exp{-\frac{x^2(Δx)^2-2tk_xx(Δx)^2-4k_x(Δx)^6}{4( (Δx)^{4}+t^{2}/4)}}exp{-i\frac{2k_x^2t(Δx)^4-x^2t/2-4k_xx(Δx)^4}{4( (Δx)^4+t^2/4)}}
×exp{-\frac{(y-b)^2(Δy)^2}{4( (Δy)^4+t^2/4)}}exp{i\frac{(y-b)^2t/2}{4( (Δy)^4+t^2/4)}}     (1)

となります。なお、Δyはy方向の波束の広がりで、m=ћ=1(対象の粒子は電子)としています。
同様にして、、t=0で中心がx=0y=-bにあり、x方向に速度k_xで移動するガウス波束の波動関数は、

ψ_2(x,y,t)=\frac{\sqrt{π}exp(-k_x^2(Δx)^2)}{\sqrt{(Δx)^2+it/2}}exp{-\frac{x^2(Δx)^2-2tk_xx(Δx)^2-4k_x(Δx)^6}{4( (Δx)^4+t^2/4)}}exp{-i\frac{2k_x^2t(Δx)^4-x^2t/2-4k_xx(Δx)^4}{4( (Δx)^4+t^2/4)}}
×exp{-\frac{(y+b)^2(Δy)^2}{4( (Δy)^4+t^2/4)}}exp{i\frac{(y+b)^2t/2}{4( (Δy)^4+t^2/4)}}     (2)

となります。
ψ_1ψ_2は、いずれもx方向に速度k_xで進行するガウス波束の波動関数ですが、t=0での波束の中心はそれぞれ(0,b)(0,-b)となっており、二重スリットの双方を推進する波動関数パイロット波)を表します。

f:id:sr-memorandum:20190916201538p:plain
図1


そこで、ψ_1+ψ_2を求めます。
まず、x方向y方向のガウス波束がそれぞれ独立であるため当然のことですが、式(1)と式(2)から直ちにわかることは、xに依存する因子はΨ_1 ,Ψ_2ともに共通となります。そこで、これをg(x)とすれば、

ψ_1+ψ_2=g(x){exp{-\frac{(y-b)^2(Δy)^2}{4( (Δy)^4+t^2/4)}}exp{i\frac{(y-b)^2t/2}{4( (Δy)^4+t^2/4)}}+exp{-\frac{(y+b)^2(Δy)^2}{4( (Δy)^4+t^2/4)}}exp{i\frac{(y+b)^2t/2}{4( (Δy)^4+t^2/4)}}}

となります。ここで、

   σ_y=4( (Δy)^4+t^2/4)     (3)

       A=\frac{2b(Δy)^2}{σ_y}     (4)

       B=\frac{bt}{σ_y}     (5)

とすれば、

ψ_1+ψ_2=g(x)exp(\frac{(y^2+b^2)it}{2σ_y})exp(-\frac{(y^2+b^2)(Δy)^2}{σ_y}){exp(-Ay)exp(iBy)+exp(Ay)exp(-iBy)}   (6)

となります。

さらに、式(6)の第4因子を

rexp(iθ)とおけば、

     r=(exp(2Ay)+exp(-2Ay)+2cos(2By) )^2     (7)

     θ=Tan^{-1}{\frac{e^{-Ay}-e^{Ay}}{e^{Ay}+e^{-Ay}}tan(By)}        (8)

     ψ_1+ψ_2=g(x)exp(\frac{(y^2+b^2)it}{2σ_y}+iθ)exp(-\frac{(y^2+b^2)(Δy)^2}{σ_y})r    (9)

であるため、

S=\frac{(y^2+b^2)t}{2σ_y}+θ(y)+(xに依存する項)       (10)

となります。

ここで、式(9)の絶対値(複素共役)を計算して、粒子の確率密度を求めてみます。

(ψ_1+ψ_2)(ψ_1+ψ_2)^*=g(x)g(x)^*exp(-\frac{2(y^2+b^2)(Δy)^2}{σ_y}){e^{2Ay}+e^{-2Ay}+2cos(2By)}     (11)

ここから、yに依存する部分だけ取り出せば、

P(y,t)=exp(-\frac{2(y^2+b^2)(Δy)^2}{σ_y}){e^{2Ay}+e^{-2Ay}+2cos(2By)}    (12)

となります。ここで∝となっているのは、波動関数を規格化していないからです。このP(y)を時間毎にプロットすると、次のようになる。

f:id:sr-memorandum:20190916213404p:plain
図2

最初は、b=10及びb=-10の周りに集中しているが、時間が経つにつれて分布が広がって行き、干渉を起こす様子がわかります。なお、yを0.1ずつの間隔で-50.0~50.0までとり、P(y)をプロットしたものの一部ですが、時間t毎に規格化定数が異なるためy=-50.0からy=50.0までの式(12)右辺の総和を求め(これは近似的に積分範囲-50.0~50.0で\int{p(y)}dyを計算することにあたります)、その総和で除算した上でプロットしています。図からわかるように、全ての時間においてyの絶対値が40となる辺りでP(y)がほとんど0になることから、規格化は概ね正確ですので、tが異なっていても確率分布として比較することができます。

 さて、図2でt=0.0の曲線についてy=10.0近辺のみをプロットすると、図3のようになります。

f:id:sr-memorandum:20190929002112p:plain
図3

図3によると概ねΔy=1の4倍~6倍程度の範囲(原点に近い領域でy=7.0~8.0)で確率分布が小さくなることがわかります。これは、シミュレーションをする際にスリットの幅をΔyに対してどの程度に設定すべきかということに関係します。これによると、Δyに対して4倍~6倍程度に設定するのが妥当です。

さて、いよいよ式(10)をy偏微分し、y方向の運動量(=y方向の速度:m=1、p=∇S)を求めると、

p_y=\frac{∂S}{∂y}=\frac{∂}{∂y}(\frac{(y^2+b^2)t}{2σ_y}+θ(y) +(xに依存する項))=yt/σ_y+∂θ(y)/∂y

となります。
そして、式(8)により、非常に煩雑な∂θ(y)/∂yの計算を行うと、

   p_y=\frac{yt}{σ_y}+\frac{-2Asin(2By)-B(e^{2Ay}+e^{-2Ay})}{e^{2Ay}+e^{-2Ay}+2cos(2By)}   (13)

続いて、x方向ですが、式(6)のg(x)に相当する部分は、「量子力学の軌跡解釈のガウス関数への適用」の(7)式(ガウス(7)式)と同じです。x方向とy方向を独立するものとして波動関数を設定していますので、当然の結果です。従って、x方向の軌跡は解析的に求めることが可能で、ガウス(19)式より、

   x=\frac{x_1}{2(Δx)^2}・\sqrt{(t^2+4(Δx)^4)}+k_xt    (14)

となります。なお、x_1=0における粒子の位置のx座標となります。

3.シミュレーションの実行

式(13)と式(14)を用いれば、2重スリットのシミュレーションが可能になります。x方向は、解析的に解が判っているので特に近似計算をする必要はありません。式(14)については、次のようにして粒子軌道を計算します。

  • ① t=0におけるyの初期値y_0を設定する。
  • ② 式(13)のp_ym=1としていることから、これは時間と位置により与えらえる速度と見なすことができるため、ある時間t_iy_iにある粒子の速度をv(t_i,y_i)と表し、時間の刻みをΔtとすれば、

                 y_{i+1}=v(t_i,y_i)Δt+ y_i
により、y_0から順次任意の時刻における粒子の位置が求まる。

あまり、精度が高い近似ではありませんが、これにより粒子のy方向の位置をシミュレートします。

なお、初期値の設定はΔy=1とし、y軸の正座標側をy=bの周りにb-a/2≦y_0≦b+a/2、y軸の負座標側をy=-bの周りに-b-a/2≦y0≦-b+a/2として与えることとし、aがスリットの幅に相当します。図3の後で説明したように、aΔy=1の4倍~6倍程度の大きさとします。また、k_x=0.4としました。

続いて、x方向の運動については、式(14)でx_1=0としてシミュレーションを行います。理由は、このように扱うと粒子の軌跡が判り易くなることと、『THE UNDIVIDED UNIVERSE』の中で紹介されているものと同様の軌跡が得られるためです。

f:id:sr-memorandum:20190929012344p:plain
図4 二重スリットの軌跡(b=10,a=6,軌跡数=120)

f:id:sr-memorandum:20190929013005p:plain
図5 二重スリットの軌跡(b=8,a=6,軌跡数120)

f:id:sr-memorandum:20190929013336p:plain
図6 二重スリットの軌跡(b=6,a=6,軌跡数120)

f:id:sr-memorandum:20190929013546p:plain
図7 二重スリットの軌跡(b=4,a=6,軌跡数120)

f:id:sr-memorandum:20190929013831p:plain
図8 二重スリットの軌跡(b=2,a=6,軌跡数120)

まず、図4~図8は、スリットの幅(a)=6.00,スリットの間隔(2b)=20.00~4.00,時間の刻みΔt=0.01とし、粒子の軌跡120本をt=0~100までプロットしたものです。初期値となる粒子の位置は、スリットの幅であるa=6.00の範囲で0.01毎に等間隔に設定しました。(各スリット60本の軌跡が2スリットで120本の軌跡)
粒子が干渉のような粗密性のある軌道を辿ることがわかります。
図4~図8のどの図も、初期値が異なる軌道が多数描かれているのであり、決して流体のようなものではありません。粒子の実在を仮定する軌跡解釈では、スリットを通った1つの粒子が、このような軌道の1つを辿る運動をすることになります。従って、どちらかのスリットを粒子が通ったとすることができ、さらに粒子がどちらかのスリットを通ることと干渉像が生じることの間に矛盾が生じないのです。ただし、初期値を確定することができないため、どの軌道を実際に粒子が辿るのかは予測することはできません。粒子の実在を肯定し、粒子の不可分性を保ち、干渉像が表れることが説明できるという意味で、軌跡解釈は直観的に理解しやすく、二重スリットの問題に限定するなら、標準解釈より優れています。

f:id:sr-memorandum:20190929014338p:plain
図9 二重スリットの軌跡(b=10,a=6,軌跡数120)

続いて、図9は図4を拡大したものです。粒子がどのような運動をし、干渉像を形成するのかがわかります。
なお、この軌跡の粗密性がそのまま粒子の干渉を表すわけではありません。この120本の軌跡は、t=0.0におけるyを等間隔に定めていますので、t=0.0における確率密度が考慮されていません。干渉像を得るためには、図2でt=0.0の曲線の確率で粒子を発生させて、その軌跡を追っていく必要があります。フォンノイマンの棄却法を用いて、図2でt=0.0の曲線の確率で粒子を発生させて、実際に干渉像ができる様子を動画にしてみました。これは、b=8で10,000個の軌跡を用い、x=20でのyの値に粒子を表示させています。なお、画面の縦方向の位置は0~1の一様乱数を利用してランダムに表示しています。干渉像が得られることがわかります。
youtu.be

一般相対性理論を一歩一歩数式で理解する [ 石井 俊全 ]

価格:3,780円
(2019/3/21 13:11時点)
感想(0件)

マンガでわかる量子力学 日常の常識でははかりしれないミクロな世界の現象を解 (サイエンス・アイ新書) [ 福江純 ]

価格:1,188円
(2019/3/21 13:13時点)
感想(2件)