アルバート・アインシュタインが発見したこと
アルバート・アインシュタインが発見したこと
未だに、アルバート・アインシュタイン(A.E)が原爆と作ったと勘違いしている人がいるようなので、A.E.が発見したことの概要を簡単に書いてみたいと思います。
1.光速度不変の原理と相対性原理
A.Eは特殊相対性理論を発見したと言われることがありますが、本当の意味で発見したのは「光速度不変の原理」です。
特殊相対性理論というのは、光速度不変の原理を出発点とすれば、誰もが数学的な操作で導くことができる結果やその導出過程のことを言います。古典力学で言えば、慣性の法則、作用反作用の法則及び万有引力の法則から様々なことが導かれるようなものです。
ただし、古典力学は多くの人が関わって理論体系ができあがったのに対して、A.Eは特殊相対性理論のほとんどを一人で導出した点で違いはあります。
「光速度不変の原理」は、簡単に言うと「どのような慣性系から見ても光の速さ一定である」というものです。まさに原理と呼ぶに相応しい単純明快な内容ですが、こういうことが原理として取りざたされたことには事情があります。詳しくは、私が以前書いた「簡単な電磁気の考察から見える特殊相対性理論の入り口」読んでもらえるとわかりますが、「光速度不変の原理」が発見される以前は、力学と電磁気学の法則の間に深刻な矛盾が生じていました。例えば、線状の荷電剛体に対して静止していれば電場のみがありますが、これと平行な方向に移動する慣性系からは電流が発生しているのと同等なので、アンペール法則により磁場も発生します。つまり、線状の荷電剛体に対して静止している慣性系では電場のみ、移動する慣性系では電場と磁場があることになります。「全ての慣性系で物理法則の形式が同じである」ことを「相対性原理」と言い、当然成り立つものと考えられていましたが、この原理に反します。
こういう矛盾を取り除く原理として、A.Eが発見したのが「光速度不変の原理」です。「光速度不変の原理」から導出される相対的電磁気学では、電場と磁場は電磁テンソルというもので表現され、上述の例でも各慣性系で同じ形式の物理法則で記述され、慣性系間の関係もローレンツ変換という変換則で矛盾なく記述されます。
2.と原爆の関係
こういう経緯でA.E.が発見した「光速度不変の原理」ですが、この原理があまりにも基礎的なものであったため、力学と電磁気学は全般的に修正され、例えば、相対速度は単純な加算・減算では計算できない、光速に近い速さで移動する慣性系では時間が遅れる、光速に近づくと質量が重くなる等の結論が導出されました。
そんな中の一つとしてあったが、質量とエネルギーの等価性です。
物質の質量をとして、光の速さをとすれば、その物質が静止している時に有するエネルギーは次のように表されます。
光の速さはと非常の大きな数字なので、たった1gの1円玉でも膨大なエネルギーを有していることが想像できます。
核の利用というのは、この物質の質量をエネルギーに変換しようという試みです。放射性物質というのは、ゆっくりと時間をかけてエネルギー(放射性・放射能)に変換されている物質です。
原爆というのは、この物質からエネルギーへの変換を急激に起こして、爆弾にするものです。
そうすると、が原爆の開発に役立ったと思うかも知れませんが、この関係式は物質をエネルギーに変換することが可能かも知れないことを示しているだけで、その方法論については何も語ってくれません。
確かに、人類に核利用の可能性を最初に示しましたが、即原爆の開発に結び付くものでもないのです。
ヒルベルト空間の備忘録
ヒルベルト空間の備忘録
1.コーシー列
定義1-1 コーシー列
数列がコーシー列であるとは、
(1-1) に対し、
が成り立つことをいう。
定義1-2 収束
数列がに収束するとは、
(1-2) に対し、
が成り立つことをいい、と表す。
定義1-3 有界
数列が上に有界とは、
ある数があって、
が成り立つことをいう。また、このような数の集合を上界といい、の最小の上界を上限といい、と表す。
数列が下に有界とは、
ある数があって、
が成り立つことをいう。また、このような数の集合を下界といい、の最大の下界を下限といい、と表す。
定理1-1 有界な単調増加数列と単調減少数列の収束
・有界な単調増加数列数列が上に有界であれば、は収束する。
・有界な単調減少数列数列が下に有界であれば、は収束する。
(証明)
※単調増加数列についてのみ
有界な単調増加数列数列が上に有界であれば、定義1-3により上限をもつ。は、最小の上界であるので、
に対し、
が成り立つ。そして、は単調増加なので、であれば、。したがって、
が成り立つので、⇒となり、収束の定義1-2より、
定理1-2 縮小区間の原理
閉区間の列{[ ]}が、任意のに対し、を満足するとき、[ ]。
とくに、のときは、[ ]は1点となる。
(証明)
端点の列は、単調増加で、上からはで抑えられている。ゆえに、定理1-1よりが存在する。一方は単調減少で、下からで抑えられているので、が存在し、は自明である。よって、閉区間[ ]が[ ]に含まれる。
とくに、のときは、より、となるので、[ ]=である。
定理1-3 収束する列はコーシー列である。
数列が収束する ⇔ 数列がコーシー列である。
(証明)
【収束⇒コーシー列の証明】
がに収束するのであれば、収束の定義(1-2)より、
に対し、
ゆえに、。したがって、
これはがコーシー列(定義1-1)であることを示している。
2.ベクトル空間・バナッハ空間・ヒルベルト空間
定義2-1 ベクトル空間
元・・・からなる集合が次の条件をみたすとき、ベクトル空間といい、その元をベクトル、またはベクトル空間の点という。
任意のに対し、和が定義されて、
(2-1)
(2-2)
(2-3)
(2-4)
定義2-2 ノルム
任意のに対し定義される次のような性質を持つ関数をノルムという。
(2-9)
(2-10)
(2-11)
また、ノルムが定義されているベクトル空間をノルム空間という。
定義2-3 バナッハ空間
ノルム空間の任意のコーシー列がの点に収束するとき、は完備であるという。
完備なノルム空間をバナッハ空間という。
定義2-4 内積空間とヒルベルト空間
元・・・からなるバナッハ空間が次の条件をみたすとき、内積空間という。
内積について完備な内積空間をヒルベルト空間という。
(2-11)
(2-12)
(2-13)
(2-14)
定義2-5 閉包と閉集合・開集合
(1)をヒルベルト空間とし、をの空でない部分集合とする。の元で、の点列の極限となっているものの全体をの閉包とよび、で表す。
これは、の収束列の極限をすべて集めてできる集合であり、となる。
(2)閉包をとっても変わらない部分集合、つまり、をみたす部分集合を閉集合という。
(3)補集合が閉集合となる部分集合を開集合という。
定理2-1 ヒルベルト空間の部分集合に対して、は閉集合である。
(証明)
とおくと、閉包の定義より、となる。
そこで、この逆の包含関係を示すせばよい。
とする。このとき、となるが存在する。したがって、任意のに対して、番号が存在して、ならば、が成り立つ。
また、であるから、をみたす点列が存在する。( )
したがって、
これは、を意味するからである。
よって、が示された。
定理2-2 ヒルベル空間の部分空間が閉集合であるための必要十分条件は、の任意の収束列に対して、その極限がの元になっていることである。
(証明)
【必要性】
を閉集合、、とする。このとき、であり、は閉集合であるので、である。よって、
【十分性】
の任意の収束列に対して、その極限がの元になっていると仮定し、の逆の包含関係を示す。(このとき、となるので、定理2-1によりは閉集合となる。)
とすれば、閉包の定義によって、となるが存在する。仮定により、である。
したがって、である。
定理2-3 直交分解定理
をヒルベルト空間の閉部分空間とする。このとき、任意のに対して、を満たすベクトルがただ一つ存在し、このを、の上へのの正射影という。
(証明)
とする。の定義より、となる点列が存在する。
このとき、
①
②
②より、
③
③を①に代入すると、
したがって、はコーシー列である。よって、となるが存在し、が成り立つ。は閉部分空間であるからとなる。(定理2-2により、点列の極限が集合でに収束すれば閉集合となる。)
次に、の一意性を証明する。
仮に、とは別にを満たすがあったする。上記の計算を、の代わりに、を用いて行えば、となる。
したがって、となる。
定理2-3 正射影定理
をヒルベルト空間の閉部分空間とする。このとき、の任意のベクトルは、という形に一意的に表される。ここで、はそれぞれ、の上へのの正射影である。
(証明)
とし、上へのの正射影をとする。とおけば、と書ける。そこで、を示す。
とおく。とする。このとき、であるから、
したがって、すべてのに対して、、これはを意味する。の代わりにてを用いれば同様にして、が得られる。したがって、であり、はの任意の元であったから、である。
次にの表示の一意性を示すために、別にと表されたとする。このとき、となり、この式の左辺はの元であり、右辺はの元である。ところが、であるから、でなければならず、となる。
3.ヒルベルト空間上の線形汎関数
定義3-3 有界線形作用素
をヒルベルト空間、をからへの線形作用素とする。定数が存在して、すべてのに対して次の関係が成り立つとき、は有界であるという。有界な線形作用素を、有界線形作用素という。
(3-3)
定義3-4 定義域と値域と零空間
作用素の定義される元の集合をの定義域、をの値域という。
を満たすすべての元の定義域をの零空間という。
定義3-6 作用素の単射・全射
・作用素が、であるようなに対して、であるとき、は1対1あるいは単射であるという。
・作用素がヒルベルト空間から(つまり、)の作用素であり、値域であるとき、を全射であるという。
定義3-7 ヒルベルト空間上の線形汎関数
ヒルベルト空間上の閉部分空間に属するすべてのとすべての複素数に対して汎関数が次の条件を満たす場合、このは上の線形汎関数という。
(3-4)
このをの共役関数といい、の集合で作られる空間をの共役空間という。
定義3-8 線形汎関数の有界性
ヒルベルト空間の部分空間に属するすべてのに対して、
(3-5) (= )
となるような正定数が存在するとき、線形汎関数はその定義域上の有界であると言われる。
この不等号がに属するすべてのに対して成り立つ最も小さい正定数は線形汎関数のノルムといわれ、によって表される。
(3-6)
定義3-9 線形汎関数の連続性
(1)線形汎関数がで連続とは、がに属し、各に対してのときはいつでも、となるようなが存在することである。
(では、不連続)
(2)に属する点列が極限をもつときはいつでもとなるとき、汎関数はで連続であるという。
(3)上のすべての点で連続は汎関数はで連続であるという。
定理3-1 原点で連続な有界線形汎関数はその全定義域で連続である。
(証明)
に属する任意の点列がに属するある点に極限をもつとする。
このときとなり、原点で連続であるという仮定より、となる。
仮定によりは線形であるから、で、原点において連続であるから、となり、は全定義域で連続となる。
定理3-2 線形汎関数において、有界性⇔連続性が成り立つ。
(証明)
【有界⇒連続】
が有界であるとする、有界の定義3-8よりある定数が存在して、
となる。したがって、のとき、となり、定義3-9(2)よりは連続である。
【連続⇒有界】
もし、が非有界であるなら、に対して
となるようなに属する非ゼロの点列が存在することになる。
すると、0に収束する点列はとなり、は0になりえず、原点における連続性に反する。
定理3-3 有界線形作用素の連続性
をヒルベルト空間からヒルベルト空間への有界線形作用素とするとき、次の(1)と(2)が成り立つ。
(1)()⇒()
(2)のとき、零空間は閉部分空間である。
(証明)
(1)の線形性と有界性により、
よって、であれば、であり、となる。
(2)となる。このとき、連続性により、となる。
一方で、であるため、であるので、。
よって、は閉集合である。なお、が部分空間であることは定義より自明。
定理3-4 リースの表現定理
ヒルベルト空間の全体で定義される連続有界線形汎関数は、に属するすべての元に対して、次のように内積の形で内の元と対応づけられて一意的に表すことができる。さらに、が成り立つ。
(3-7)
(証明)
まず、()の場合を考える。この場合は、とすれば、が成り立つので、が存在する。
次にの場合を考える。定理3-3(2)により、は閉部分空間であるから、正射影定理(定理2-3)により、零でないベクトルが存在し、が成り立つ。
よって、任意のに対して、はの元である。したがって、となる。
これを書き直すと、なので、を得る。
したがって、とすれば、となり、は存在する。
次に、の一意性を証明する。
別に、、をみたすが存在すると、となる。は任意であるから、特に、とすれば、なので、となる。
ディラック方程式の備忘録
1.パウリ行列
4.特殊相対性理論
計量テンソル:
※添え字を上げ下げする。
ガンマ行列との関係:
ローレンツ変換の不変量:
ローレンツ変換の逆変換
∴
一方
∴
さらに
∴
∴
微小ローレンツ変換:
微小量について、1次のレベルまでローレンツ変換の条件を適用すると、
∴
6.ディラック方程式のローレンツ変換の共変性
座標が、ローレンツ変換で変換されるときに、ディラックスピノルに対して、次のような変換が存在すれば、ディラック方程式はローレンツ変換に対して共変であるといえる。
・・・・
(は、ローレンツ変換によって構成される行列)
左からを乗じると
と行列は交換しないので、第1項の左にを乗じると、
なので、
これが
となればよいが、そのためには、
を満たすことが必要で
このようなを微小ローレンツ変換に適用する。
無限小ローレンツ変換の1次までで、を次のように取る。
※は、行列Tの要素ではなく行列から構成される行列である。これを行列の要素と勘違いすると、以下の数式の展開が全く理解できなくなるので注意。当然、は行列と交換しない。また、は定数である。
の1次までをとると
∴
第1項のをにし、を用いると、
∴
なので、
∴
よって、は存在する。
さらに、
をに書き換えると、
ここで、
よって、
を1次までとると、
∴
ここで、ローレンツ変換の生成子、
と比較すると、
ここで、
であるので、を求めてみると、
()
同様にして、も求めると、
∴
よって、は
量子力学の軌跡解釈(ボーム力学)とコッヘン=シュペッカーのNO-GO定理
量子力学の軌跡解釈(ボーム力学)とコッヘン=シュペッカーのNO-GO定理NO-GO定理
ここでは、「量子力学の軌跡解釈(ボーム力学)による力学の概要」で用いた数式を引用することがあります。その場合は、概要式(10)」というように標記します。また、同様に公理や命題を引用することもありますが、公理や命題の番号は「量子力学の軌跡解釈(ボーム力学)による力学の概要」から通し番号にします。(公理1~公理4、命題1~命題11、補題1~2は「量子力学の軌跡解釈(ボーム力学)による力学の概要」からの引用となります。)
1.所有値とオブザーバブル(観測可能量)
古典物理学は、運動量やエネルギーといった物理量を理想的に測定すれば唯一の値が得られ、その測定値は測定前からその物理量が有していたものであるという暗黙の前提の上に成り立っています。従って、観測して測定される得る値は一意に定まっており、「物理量が有する値」「観測すれば測定され得る値」「理想的な測定値」を区別する必要はありません。
これに対して、量子力学は「観測すれば測定され得る値」が多数存在していて、その中から1つの値が「理想的な測定値」として確率的に出現するという構成の上に成り立っています。このような一見して、我々の直観に反する論理が与えられているのは、シュレディンガー方程式が実験結果と一致するという事実を説明するために与えらた後付けの解釈であるためです。
このような多数存在する「観測すれば測定され得る値」は、物理量に応じて決まった演算子の固有値となっており、こういう状況を指して物理量は「観測可能量(オブザーバブル)」であるとも言われています。
しかし、「観測すれば測定され得る値」が多数存在し1つの演算子の固有値となっていれば、逆に演算子から「観測すれば測定され得る値」を数学的に導くことが可能なため、通常はこの演算子のことを観測可能量(オブザーバブル)というのが一般的です。しかし、量という言葉の意味からすれば、観測可能量というのは誤解を生じやすいため、以後「オブザーバブル」という言葉を使用することにします。なお、物理量は実数であり、「観測すれば測定され得る値」も実数であることから、それを固有値とする演算子は、必ずエルミート演算子であります。従って、物理量はオブザーバブルであり、それはエルミート演算子であるということになります。
「量子力学の軌跡解釈(ボーム力学)による力学の概要」では、所有値(=「ある物理量を観測していなくとも系が所有していると考えらえる値」)を主に取扱い、対照的な概念として「観測可能量」(=「ある物理量を観測すると測定され得る値」)を用い、この「観測可能量」という言葉を、通常用いられている演算子としての「オブザーバブル」とは異なる意味で使用していましたが、ここでは、標準的な「オブザーバブル」とその所有値の関係を与えます。(「量子力学の軌跡解釈(ボーム力学)による力学の概要」では、演算子そのものよりもその固有値全体という意味で「観測可能量」という言葉を用いていました。通常は、演算子のほうを観測可能量(オブザーバブル)といいます。)
【公理4】(所有値とオブザーバブルの関係)
系が位置 を所有値として有する粒子とそれに随伴するパイロット波によって表されているとき、その系の物理量であるオブザーバブル(エルミート演算子)について、粒子は所有値としては次にようなを有する。(は、実部のみを取ることを意味します。)
(1)
なお、概要(11)()を用いると、
(2)
となる。
【公理4】は、あらゆるオブザーバブルが、粒子の所有値の場(時間と位置に依存する)となることを示していますが、これを運動量に適用すると次のような結論が得られます。
【命題12】
パイロット波が随伴する粒子は、運動量として次のような [P(x,t)]を有し、その運動量の場に従って運動する。
(3)
(証明)
運動量のオブザーバブルは、であるから、式(2)より、
(4)
(及び は、概要(11)()の定義により実数)
以上のことから、式(3)が成り立つことがわかります。
【命題12】から粒子の質量が であったとすれば、概要式(12)に従い粒子が運動することが明らかとなります。従って、【公理3】、より一般的である【公理4】の内容に抱合されることになりますので、[公理3]を不要となります。
次に、エネルギーのオブザーバブルであるハミルトニアンついて、【公理4】を適用すると、【命題4】の概要式(17)と同じ結果になることがわかる。
【命題13】
パイロット波が随伴する粒子は、エネルギーとして次のようなを有する。
(5)
(証明)
エネルギーのオブザーバブルであるを、式(2)のに代入すれば明らか。
【補題3】
運動量所有値の自乗と運動量自乗の所有値の間には次のような関係が成り立つ。
(6)
(証明)
式(2)より、
2.FUNCとコッヘン=シュペッカーのNO-GO定理
まず、「ベルの定理」と「コッヘン=シュペッカーのNO-GO定理」について簡単に説明します。
証明過程は省略しますが、「ベルの定理」とは次のように3つの条件が両立しないことを証明したものです。
【ベルの定理】
次の3つの条件は両立しない。
(1) 個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できる。
(2) そのような個々の量子系に付与された値が、集団としては量子力学の統計的予測を再現する。
(3) 量子系においては局所的な相関しかない。
量子力学が実験事実と整合することから、(2)は成立するものとみなします。すると、ベルの定理を満たすためには、(1)か(3)のいずれかが否定されなければなりませんが、(1)を否定し(3)を肯定するのが標準解釈で、「個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できない。」が「量子系においては局所的な相関しかない。」とする立場です。
【標準解釈】
・個々の量子系について、すべてのオブザーバブルに同時に確定した値を付与できない。
・量子系においては局所的な相関しかない。」
一方で、軌跡解釈は(1)を肯定し、(3)を否定するもので、「すべてのオブザーバブルに同時に確定した値を付与できる。」が「量子系においては非局所的な相関もありうる。」とする立場です。もっとも、(1)を肯定しすべてのオブザーバブルに同時に確定した値を付与できるとしても、その同時確定した値を同時に観測できることを意味するのではなく、所有値(=「あるオブザーバブルを観測していな
くとも系が所有していると考えらえる値」)として粒子が確定した値を有するとすることも可能です。一般的に軌跡解釈はこの論理構成に依拠するもので、所有値という概念は言わば「隠れた変数」であり、軌跡解釈が「非局所的な隠れた変数の理論」と呼ばれるのはこのためです。
【軌跡解釈】
・すべてのオブザーバブルに同時に確定した値を付与できる。
・量子系においては非局所的な相関もありうる。
「コッヘン=シュペッカーの NO-GO 定理」(KS定理)は、次のような3つの条件が両立しないことを示すものですが、これにより【ベルの定理】の条件(1)を否定し「すべてのオブザーバブルに同時に確定した値を付与できない。」と結論付けており、できないこと証明したという意味でNO-GO 定理と言われています。しかし、KS定理は証明の過程で、同時に確定した値を付与されたオブザーバブルが有するFUNC(The Functional Composition Principle)という規則を用いていますが、軌跡解釈ではこのFUNCが成り立たないことを示すことができ、KS定理によって軌跡解釈が否定されたとは必ずしもいい切れません。
【コッヘン=シュペッカーの NO-GO 定理】(KS定理)
次の3つの条件は両立しない。
(1) 個々の量子系について、すべての物理量に同時に確定した値を付与できる。
(2) もし個々の量子系について、すべての物理量が同時に確定した値を有するなら、その値は測定状況に依存しない。
(3) 個々の量子系について、すべての物理量の取り得る値と射影演算子には1対1の対応関係がある。
この定理の証明には次のような公理を仮定する必要があります。これはエルミート演算子がオブザーバブルであるための条件を仮定するものです。(全てのエルミート演算子がオブザーバブルであるわけではありません。)
【仮定】
エルミート演算子の固有値である実数 が定義されており、与えられた量子状態について、に対する量子力学の統計的計算により、である実数 が導かれるなら、実数に対するエルミート演算子はオブザーバブルである。
(ここで、とはエルミート演算子の固有値である実数を表し、とはである確率を表す。)
この仮定を用いた、KS定理の証明過程の概要は次のようになります。
(証明1)(FUNCの導出)
ある量子系にオブザーバブルがある。KS定理の(1)が成立するなら、オブザーバブルは所有値として[A]=aを有する。従って、ある関数 に対して、値を定義することができる。(は、関数 f が実数から実数への関数であることを表す。)
また、【仮定】よりオブザーバブルは量子力学の統計的計算により確率を定義することができる。
一方、関数により、エルミート演算子を定義することができ、確率の定義より、が成り立つ。
従って、エルミート演算子は、 という値が定義され、量子力学の統計的計算により という実数を求めることができるので、【仮定】よりはオブザーバブルである。
そして、KS定理の(2)が成立するなら、オブザーバブルに定義される値は測定状況に依存せずに一意であることが言えるため、次のことが成り立つ。
【FUNC】
をオブザーバブルとし、 をある関数とすると、は一意に定まるオブザーバブルであり、
が成り立つ。
(が成り立つのであれば、所有値についてが成り立つ)
(証明2)(和の規則の導出)
オブザーバブルとが可換であるとき、ある極大エルミート演算子が存在し、ある関数 により、及びと表すことができる。
ここではエルミート演算子であるため、スペクトル定理により、
と表すことができるため、
となる。ここで、を定義すると、
であるため、となる。
一方で、
なので、ここで【FUNC】より、
となるため、
が成り立りたち、次のことが言える。
【和の規則】
オブザーバブルとが可換であるときが可換であるとき、が成り立つ。
(証明3)
【仮定】より、恒等演算子はオブザーバブルであるといえる。従って、次のような射影演算子の和で与えられる恒等演算子に には【和の規則】を適用でき、
となる。
この先の証明過程は省略しますが、これを用いて、3以上の任意のヒルベルト空間において、相互に直交する一次元射影作用素からなる任意の集合について、その中の一つだけに射影作用素に1を与え、残りすべてに0を与える付与は存在しないことを数学的に証明し、KS定理(3)が成り立たないことが証明され、KS定理は証明されています。
最後まで証明したわけではありませんが、KS定理が成立するためには、【仮定】と【FUNC】が前提となっていることがわかります。
従って、逆にこのどちらかを満たさない理論についてはKS定理の適用除外となる可能性がありそうです。
なお、KS定理が成立することからKS定理(1)を否定的にとらえ「個々の量子系について、すべての物理量に同時に確定した値を付与できない。」とし同時に確定した物理量を否定するのが、コッヘンとシュペッカーが示そうとしたことです。
次のように、軌跡解釈には【FUNC】が適用されないことから、KS定理が必ずしも適用されないことが証明されます。
【命題 16】
軌跡解釈における運動量の所有値はFUNCを満たさない。従って、軌跡解釈にはKS定理が適用されない。
(証明)
FUNCより、という関数に対して、
が成り立ち、運動量オブザーバブルが所有値有し、FUNCを満たすなら、
が成り立つはずである。
しかし、【命題12】の式(3)からであり、
一方【補題4】式(6)より、
となるため、である。
よって、軌跡解釈における運動量の所有値はFUNCを満たさず、軌跡解釈にKS定理は適用されない。
ベイズ統計 第4章 ナイーブベイズ分類器とナイーブベイズフィルター
第1章 確率の基礎
第2章 ベイズの定理からベイズ理論の出発点へ
第3章 ベイズの展開公式
ベイズ統計
第4章 ナイーブベイズ分類器とナイーブベイズフィルター
4.1 ナイーブベイズ分類器とナイーブベイズフィルター
ベイズ分類器とは、ベイズ理論を用いて、与えられたデータを目的のカテゴリーに分類する分類器のモデルをいう。例えば、文書に記載されている特定のキーワードが一定確率であるならば、この文書のカテゴリーは「物理学」「労働法」「社会保険」等といった分類をする。
このベイズ分類器で有名な応用の1つがナイーブベイズフィルターである。ナイーブベイズフィルターは、分類するといっても多数のカテゴリーに分類するのではなく、2つのカテゴリーに分類し不要なものを排除する(まさに、フィルターである)。わかりやすい例は、迷惑メールの排除で、メールに記載されたキーワードから迷惑メールを判別し、排除する。
ここでは、この迷惑メールの排除方法にどのようにベイズ統計が用いられているか見てみる。
4.2 ナイーブベイズフィルターの具体例
迷惑メールであるかどうかを判別するために、4つキーワード「クリック」「キャンペーン」「運営」「停止」に着目すると、これらのキーワードが次の確率で迷惑メールと普通メールに含まれていることが分かっているものとする。
クリック :迷惑メール 0.6 普通メール 0.2
キャンペーン:迷惑メール 0.5 普通メール 0.1
運営 :迷惑メール 0.05 普通メール 0.45
停止 :迷惑メール 0.01 普通メール 0.3
あるメールを調べてみると、「クリック」「キャンペーン」「停止」の順でこれらのキーワードが1回ずつ記載されていた。
このメールが、迷惑メールであるかどうか判別してみる。
なお、受信メールのうち、迷惑メールと普通メールの比率は8:2の割合であるものとする。
4.2.1 事象(記号)の定義
まず、各事象について、次のとおり記号を定義する。
なお、前章までと同様に、原因を、データをで表すこととする。
:受信メールが迷惑メールである。
:受信メールが普通メールである。
:受信メールに「クリック」というキーワードが含まれる。
:受信メールに「キャンペーン」というキーワードが含まれる。
:受信メールに「運営」というキーワードが含まれる。
:受信メールに「停止」というキーワードが含まれる。
メールで出現したキーワードは、順番に「クリック」「キャンペーン」「運営」であったので、これをデータ()として次のように定義する。
:
求めたいものは、データがであるという条件のもので、受信メールが迷惑メールである確率もしくは普通メールである確率であるため、
と表される。
ベイズ統計 第3章 ベイズの展開公式 - 数学と物理学のブログ
ここで前章で導出したベイズの展開式を用いると、
(1)
(2)
4.2.2 判別条件
式(1)と式(2)を用いれば、迷惑メールであるか普通メールであるかを判別できるが、分母が同じため、次のようになる。
迷惑メール: ⇒ (3)
通常メール: ⇒ (4)
4.2.3 ベイズ更新による判別
ベイズ更新を用いて、実際に判別をしてみるが、対象とする文書の中の単語はそれぞれ独立であると仮定する。つまり、メールに記載されている各単語は互いに確率的に影響がないものとする。
まず、「受信メールのうち、迷惑メールと普通メールの比率は8:2の割合であるものとする。」としていることから、事前確率とを次のように設定する。
ここで、ベイズの展開式を用いてデータが出た場合(「クリック」というキーワードが出た場合)に迷惑メールである確率と普通メールである確率を求めると、
となる。
ベイズ更新により、この結果を今度は事前確率とすると
同様にして、データが出た場合(「キャンペーン」というキーワードが出た場合)にそれぞれの確率を求めると、
ベイズ更新により、この結果を今度は事前確率とすると
同様にして、データが出た場合(「停止」というキーワードが出た場合)にそれぞれの確率を求めると、
となる。これが最後のキーワードであるため、
となり、が成り立つため、迷惑メールと判別される。
なお、第3章で説明したベイズ理論の逐次合理性により、「クリック」「キャンペーン」「停止」という順番が変ったとしても結果は同じになる。
4.3 ナイーブベイズ分類器と壷のモデル
このナイーブベイズ分類器は、前章の3.3の例2で利用した壷と玉のモデルと同等である。
ベイズ統計 第3章 ベイズの展開公式 - 数学と物理学のブログ
例えば、「クリック」というキーワードを玉に置き換えてみると、それが「迷惑メール」の壷から出てきた玉か、「普通メール」の壷から出た玉かを判別していることとなる。そして、「クリック」というキーワードが現れる尤度は、各壷に入っている玉の割合で算出される。また、4.2.3で計算したように、事前確率には壷の選択確率、すなわち迷惑メールと普通メールとの経験的なメール数の比があてられることとなる。
量子力学の軌跡解釈による二重スリットシミュレーション2~ドブロイ・ボーム解釈によるアプローチ
量子力学の軌跡解釈による二重スリットシミュレーション2~ドブロイ・ボーム解釈によるアプローチ
第1編「量子力学の軌跡解釈による二重スリットシミュレーション1~ド・ブロイ=ボーム解釈によるアプローチ」の続きとなり、式(1)~式(14)は第1編からの引用となります。また、第1編と同様に、「量子力学の軌跡解釈(ボーム力学)の概要」もしくは「量子力学の軌跡解釈のガウス関数への適用」から数式を引用することがありますが、その場合は「概要(3)式」「ガウス(3)式」のように表記します。
4.二重スリットの量子ポテンシャル
次に、二重スリットの量子ポテンシャルを求めて、どのような動きをするのか見てみます。そのためには、式(9)をに当てはめてを求め、それを概要(16)式に代入し計算しなければなりません。
(9)
式(9)を、に当てはめると、
(10)
(11)
( )
となります。量子ポテンシャルのうち、X方向で2階偏微分して求まる項は、「量子力学の軌跡解釈のガウス関数への適用」で計算した結果と同じなので、ここでは、Y方向で2階偏微分して求まる項のみを計算します。つまり、の因子は無視してよいことになります。
まず、式(10)を1階偏微分して、
さらに、2階偏微分すると、
=
これらを丹念に計算していくと、概要(16)式より、の場合の量子ポテンシャルは、
となります。
そして、「Xによる2階偏微分の項」は、ガウス(14)式ででとして、をに置き換え、(原子単位系)とすればよいので、
(12)
となります。
式(12)をプロットしてみると次のようになります。
まず、で量子ポテンシャルの変化を見てみます。
X方向に0.4の速度を保ったまま、Y方向はポテンシャルの低い方向に運動するため、量子ポテンシャルによって軌跡に粗密ができることが(粒子の軌跡はポテンシャルが谷の部分に集まります)わかります。
ただ、3Dでは分かりにくいうえ、以上では量子ポテンシャルがにほとんど依存しなくなるため、に固定して量子ポテンシャルの時間的な変化を見てみます。
時間が早すぎるので、1秒ずつにしてみます。
徐々に平坦になりつつも、ポテンシャルが中心付近で激しく振動し、波のように外に広がって行くことがわかります。
そして、最終的には真ん中からポテンシャルは徐々に平坦になっていきます。
これは、最終的にはY方向の運動も等速になることを意味しています。
最後にY軸と時間()量子ポテンシャルの様子を3Dグラフにしてみました。
量子力学の軌跡解釈による二重スリットシミュレーション1~ド・ブロイ=ボーム解釈によるアプローチ
量子力学の軌跡解釈による二重スリットシミュレーション~ドブロイ・ボーム解釈によるアプローチ
※量子力学の軌跡解釈(ボーム力学)の概要もしくは量子力学の軌跡解釈のガウス関数への適用から数式を引用することがありますが、その場合は「概要(3)式」「ガウス(3)式」のように表記します。
1.ボームによる二重スリットの解釈
D.Bohmによる二重スリットの解釈は、De Broglieが提唱した「パイロット波」解釈を発展させたもので、そのような経緯もあり、「ドブロイ=ボーム解釈」と呼ばれることもあります。なお、二重スリットの解釈と述べたが、それは量子力学の解釈そのものを意味してしており、このことは、『THE UNDIVIDED UNIVERSE』にも触れられています。
「「パイロット波」が粒子の運動を誘導するという考えは、1927年にDe Broglieによって初めて主張されたが、それは単粒子系のみによるものであった。De Broglieは、1927年に開催された「ソルベイ会議」でこの考えをプレゼンしたが、Pauliによって激しく批判された。Pauliの最も重要な批判は、二体の散乱過程では、このモデルを矛盾無く適用できないということであった。その結果、De Broglieは自分の主張を放棄した。「パイロット波」の考えは、その後1952年に、D.Bohmによって多体系での解釈が加えられ、再び主張された。De Broglieの主張は、Pauliの批判に答えることが可能であり、実際に、量子現象の多くの領域に適用できる観測の理論を含む一貫した解釈に道を開いた。その結果、De Broglieは最初の自分の考えを再度主張し、それらを多様な方法で発展させていった。」(『THE UNDIVIDED UNIVERSE』より抜粋)
さて、軌跡解釈(=「ドブロイ=ボーム解釈」)による二重スリットの解釈は、おおまかにいって次のようなものとなります。例として、電子を用いて二重スリットシミュレーションを行うものとしました。なお、二重スリットについて詳しく知らない人は、http://ja.wikipedia.org/wiki/%E4%BA%8C%E9%87%8D%E3%82%B9%E3%83%AA%E3%83%83%E3%83%88%E5%AE%9F%E9%A8%93(ウィキペディア)等を参照してください。
- ①電子は粒子として存在している。
- ③電子は粒子として、パイロット波によって誘導され運動する。
- ④電子は粒子だから、二重スリットのどちらか一方を通り抜ける。
- ⑤パイロット波は、二重スリットの両方を通り、通り抜けると干渉を起こす。
- ⑦その結果、スクリーンに浮かび上がる電子の像は干渉した波のようなものになる。
標準解釈では、粒子の実在を前提とせず、実在の基礎を波動関数とするため、波動関数が同時に2つのスリットを通り抜け干渉を起こし、その結果スクリーン上に干渉像のような分布が浮かび上がるということになります。古典的には理解しにくいですが、粒子の実在を否定するため、波動関数が同時に2つのスリットを通り抜けることができるということになります。
標準解釈がどうであれ、軌跡会社では波動関数が粒子の運動を誘発するパイロット波となるため、二重スリットを扱うには、
- ①二重スリットの波動関数を求める。
- ②求めた波動関数を、(概要(11)式) に当てはめ、RまたはSを求める。
- ③Sを求めた場合、(概要(12)式)から運動量が求まり、ここから粒子運動の軌道が求まる。ただし、初期条件を確定させることができないため、初期条件を仮に設定した場合の軌道となる。
- ④を求めた場合、(概要(16)式から量子ポテンシャルが求まり、これを(概要(15)式)に代入すれば、粒子運動の軌道が求まる。ただし、初期条件のうち初速度は③から求まるが、位置のほうは確定させることができないため、やはり初期条件を仮に設定した場合の軌道となることは、③の場合と同様である。
とすればよく、ここでは③を用いることにしました。
なお、数式を簡単にするために、以下、m(電子の質量)=ћ=c(光速度)=1となる原子単位系を用います。
2.2次元ガウス波束
まず、で中心が、にあり、x方向に速度で移動するガウス波束の波動関数を求めてみます。x方向とy方向はそれぞれ独立であるため、ガウス式(7)より直ちに、
× (1)
となります。なお、はy方向の波束の広がりで、(対象の粒子は電子)としています。
同様にして、、で中心が、にあり、x方向に速度で移動するガウス波束の波動関数は、
× (2)
となります。
とは、いずれもx方向に速度で進行するガウス波束の波動関数ですが、での波束の中心はそれぞれ、となっており、二重スリットの双方を推進する波動関数(パイロット波)を表します。
図1
そこで、を求めます。
まず、x方向y方向のガウス波束がそれぞれ独立であるため当然のことですが、式(1)と式(2)から直ちにわかることは、に依存する因子は ,ともに共通となります。そこで、これをとすれば、
となります。ここで、
(3)
(4)
(5)
とすれば、
(6)
となります。
さらに、式(6)の第4因子を
とおけば、
(7)
(8)
(9)
であるため、
(10)
となります。
ここで、式(9)の絶対値(複素共役)を計算して、粒子の確率密度を求めてみます。
(11)
ここから、に依存する部分だけ取り出せば、
(12)
となります。ここでとなっているのは、波動関数を規格化していないからです。このを時間毎にプロットすると、次のようになる。
図2
最初は、及びの周りに集中しているが、時間が経つにつれて分布が広がって行き、干渉を起こす様子がわかります。なお、を0.1ずつの間隔で-50.0~50.0までとり、をプロットしたものの一部ですが、時間毎に規格化定数が異なるためy=-50.0からy=50.0までの式(12)右辺の総和を求め(これは近似的に積分範囲-50.0~50.0でを計算することにあたります)、その総和で除算した上でプロットしています。図からわかるように、全ての時間においての絶対値が40となる辺りでがほとんど0になることから、規格化は概ね正確ですので、が異なっていても確率分布として比較することができます。
さて、図2での曲線について近辺のみをプロットすると、図3のようになります。
図3
図3によると概ねの4倍~6倍程度の範囲(原点に近い領域でで確率分布が小さくなることがわかります。これは、シミュレーションをする際にスリットの幅をに対してどの程度に設定すべきかということに関係します。これによると、に対して4倍~6倍程度に設定するのが妥当です。
さて、いよいよ式(10)をで偏微分し、y方向の運動量(=y方向の速度:m=1、)を求めると、
となります。
そして、式(8)により、非常に煩雑なの計算を行うと、
(13)
続いて、x方向ですが、式(6)のに相当する部分は、「量子力学の軌跡解釈のガウス関数への適用」の(7)式(ガウス(7)式)と同じです。x方向とy方向を独立するものとして波動関数を設定していますので、当然の結果です。従って、x方向の軌跡は解析的に求めることが可能で、ガウス(19)式より、
(14)
となります。なお、がにおける粒子の位置のx座標となります。
3.シミュレーションの実行
式(13)と式(14)を用いれば、2重スリットのシミュレーションが可能になります。x方向は、解析的に解が判っているので特に近似計算をする必要はありません。式(14)については、次のようにして粒子軌道を計算します。
- ① におけるの初期値を設定する。
- ② 式(13)のはとしていることから、これは時間と位置により与えらえる速度と見なすことができるため、ある時間ににある粒子の速度をと表し、時間の刻みをとすれば、
により、y_0から順次任意の時刻における粒子の位置が求まる。
あまり、精度が高い近似ではありませんが、これにより粒子のy方向の位置をシミュレートします。
なお、初期値の設定はとし、y軸の正座標側をの周りに、y軸の負座標側をの周りにとして与えることとし、がスリットの幅に相当します。図3の後で説明したように、はの4倍~6倍程度の大きさとします。また、としました。
続いて、x方向の運動については、式(14)でとしてシミュレーションを行います。理由は、このように扱うと粒子の軌跡が判り易くなることと、『THE UNDIVIDED UNIVERSE』の中で紹介されているものと同様の軌跡が得られるためです。
まず、図4~図8は、スリットの幅(a)=6.00,スリットの間隔(2b)=20.00~4.00,時間の刻みとし、粒子の軌跡120本をまでプロットしたものです。初期値となる粒子の位置は、スリットの幅であるa=6.00の範囲で0.01毎に等間隔に設定しました。(各スリット60本の軌跡が2スリットで120本の軌跡)
粒子が干渉のような粗密性のある軌道を辿ることがわかります。
図4~図8のどの図も、初期値が異なる軌道が多数描かれているのであり、決して流体のようなものではありません。粒子の実在を仮定する軌跡解釈では、スリットを通った1つの粒子が、このような軌道の1つを辿る運動をすることになります。従って、どちらかのスリットを粒子が通ったとすることができ、さらに粒子がどちらかのスリットを通ることと干渉像が生じることの間に矛盾が生じないのです。ただし、初期値を確定することができないため、どの軌道を実際に粒子が辿るのかは予測することはできません。粒子の実在を肯定し、粒子の不可分性を保ち、干渉像が表れることが説明できるという意味で、軌跡解釈は直観的に理解しやすく、二重スリットの問題に限定するなら、標準解釈より優れています。
続いて、図9は図4を拡大したものです。粒子がどのような運動をし、干渉像を形成するのかがわかります。
なお、この軌跡の粗密性がそのまま粒子の干渉を表すわけではありません。この120本の軌跡は、におけるを等間隔に定めていますので、における確率密度が考慮されていません。干渉像を得るためには、図2での曲線の確率で粒子を発生させて、その軌跡を追っていく必要があります。フォンノイマンの棄却法を用いて、図2での曲線の確率で粒子を発生させて、実際に干渉像ができる様子を動画にしてみました。これは、b=8で10,000個の軌跡を用い、x=20でのyの値に粒子を表示させています。なお、画面の縦方向の位置は0~1の一様乱数を利用してランダムに表示しています。干渉像が得られることがわかります。
youtu.be