光子(英语:Photon)是一种基本粒子,是电磁辐射的量子。在量子场论里是负责传递电磁力的力载子。这种作用力的效应在微观层次或宏观层次都可以很容易地观察到,因为光子的静止质量为零,它可以移动至很远距离,这也意味着它在真空中的传播速度是光速。如同其它微观粒子,光子具有波粒二象性,能够展现出波动性与粒子性。例如,它能在双缝实验里展示出波动性,也能在光电效应实验里展示出粒子性。

阿尔伯特·爱因斯坦在 1905 年至 1917 年发展出光子的现代概念,这是为了解释一些与光的经典波动模型不相符合的实验结果。当时被普遍接受的经典电磁理论,尽管能够论述关于光是电磁波的概念,但是无法正确解释黑体辐射与光电效应等实验现象。半经典理论在麦克斯韦方程组的框架下将物质吸收光和发射光所涉及的能量量子化,而进行的光波仍然采用经典方法处理;如此可对黑体辐射的实验结果做出合理解释。爱因斯坦的主张与普朗克的半经典理论明显不同,他提出光本身就是量子化的概念,当时爱因斯坦称之为“光量子”(英语:light quantum)。 1926 年,美国物理化学家吉尔伯特·路易斯正式提出“光子(photon)“的命名。

光子从激光的相干光束中射出
光子从激光的相干光束中射出
组成基本粒子
玻色子
基本相互作用电磁力
符号γ
理论阿尔伯特·爱因斯坦
吉尔伯特·路易斯
命名“光子(photon)”
质量0
<1×1018[eVc2]\lt 1 \times 10^{-18} [\tfrac{eV}{c^{2}}]
平均寿命稳定
电荷0
<1×1035e\lt 1 \times 10^{-35} e
自旋1d

虽然半经典理论对于量子力学的初始发展做出重大贡献,但于 1924 年观测到的电子对单独光子的康普顿散射开始,更多的实验证据使爱因斯坦光量子的假说得到充分证实。由于这关键发现,爱因斯坦于 1921 年获颁诺贝尔物理学奖。


光子的概念带动了实验和理论物理学在多个领域的巨大发展,例如激光、玻色-爱因斯坦凝聚、量子场论、量子力学的统计诠释、量子光学和量子计算等。在物理学外的其他领域里,这概念也找到很多重要应用,如光化学、高分辨显微术,以及分子间距测量等。在当代相关研究中,光子是研究量子计算机的基本元素,也在复杂的光通信技术,例如量子密码学等领域有着重要的研究价值。

根据粒子物理的标准模型,光子的存在可以满足物理定律在时空内每一点具有特定对称性的理论要求。这种对称性成为规范对称性,他可以决定光子的内禀属性,例如质量、电荷、自旋等。光子的自旋为1,因此是玻色子,不遵守泡利不相容原理。

命名

光子起初被爱因斯坦命名为“光量子”。光子的现代英文名称photon源于希腊文 φῶς(在罗马字下写为 phôs),即光的意思。这名称是由物理化学家吉尔伯特·路易斯于1926年在他的一个假设性理论中创建的。在路易斯的理论中,photon指的是一种新种类原子,是光的载子,像原子一般,不能被创造也不能被毁灭。阿瑟·康普顿在一篇发表于1928年的论文里特别提到,路易斯曾经建议使用这术语。在这之前,这术语曾经在不同地方至少有四次被用到过。尽管由于路易斯的理论与大多数实验结果相违背而从未得到公认,photon这术语很快被很多物理学家所采用。

在物理学领域,光子通常用希腊字母 γ(音:Gamma)表示。这一符号表示有可能来源于法国物理学家保罗·维拉德于1900年发现的伽玛射线。伽玛射线由欧内斯特·卢瑟福和英国物理学家爱德华·安德拉德于1914年证实是电磁辐射的一种形式。在化学和光学工程领域,光子经常被写为 hν,即用它的能量来表示;有时也用 f 来表示其频率,即写为 hf。

物理性质

量子关系式

光子遵守基本量子关系式:

E=hv=ħωE = hv = \text{ħ}ω

p=ħλ=ħkp = \dfrac{\text{ħ}}{λ} = \text{ħ}k

其中:

  • E为能量;
  • h为普朗克常数
  • ħ为约化普朗克常数或称狄拉克常数,ħ = h / 2π;
  • ν为频率;
  • ω为角频率,ω = 2πν;
  • p为动量的大小;
  • λ为波长;
  • k为波数。

光的静质量

光子的静质量严格为0。根据规范场论,如果光子静质量不为0,那么库仑定律也不是严格的平方反比定律。使用上述量子关系式以及爱因斯坦质能等价关系可约略得到光子质量的上限:

hv=mγc2hv = m_{γ}c^{2}

此处 mγ 即是光子质量的上限,ν 是任意电磁波的频率,位于超低频段的舒曼共振已知最低频率约为 7.8 赫兹。

mγ<hv/c2=6×1050kgm_{γ} < hv/c^{2} = 6 \times 10^{-50} kg

这个值仅比现在得到的广为接受的上限值高出一个数量级。
根据狭义相对论,质量为 m 的粒子,其能量 E 和动能 p 的关系为

E2=p2c2+m2c4E^{2} = p^{2}c^{2} + m^{2}c^{4}

由于光子的质量为 0 ,光子的能量与动量的关系变为

E=pcE = pc

因此前述的量子关系式中,光子的能量与其频率 ν 或波长 λ 有关:

E=ħw=hv=hcλE = \text{ħ}w = hv = \frac{hc}{λ}

这里用到光速与频率、波长的关系式:

c=vλc = vλ

同理,光子的动量向量与动量大小的关系式为

p=ħkp = \text{ħ}k

p=ħk=hλ=hvcp = \text{ħ}k = \dfrac{h}{λ} = \frac{hv}{c}

其中, k 是波矢,其大小 kk=2π/λk \equiv ||k|| = 2π/λ 即为波数,方向为光子的传播方向。

其他性质

光的自旋和宇称:JPC=1J^{PC}=1^{--}

光子本身还携带有与其频率无关的内秉角动量:自旋角动量,其大小为 2\sqrt{2},并且自旋角动量在其运动方向上的分量,即螺旋形,一定为 ±ħ ,两种可能的螺旋形分别为对应着光子的两种圆偏振态,右旋偏振态和左旋偏振态。

光子的波矢决定了它的波长和传播方向。光子的自旋为1,质量为0,因此自旋只能有两种相互垂直的方向,而且都垂直于波矢。由于自旋决定了偏振,光子具有两种可能的偏振态,例如,这两种偏振态可以是垂直偏振态、水平偏振态,也可以是右旋偏振态、左旋偏振态。

光子的电荷为零,半衰期无限长。光子是玻色子,因此轻子数、重子数和味量子数都为0,而且不遵守泡利不相容原理。

光子能够在很多自然过程中产生,例如:在分子、原子或原子核从高能级向低能级跃迁时会辐射光子,粒子和反粒子湮灭时也会产生光子;在对应于上述过程的时间反演过程中,光子能够被吸收,即分子、原子或原子核从低能级向高能级跃迁,粒子和反粒子对的产生。

从光子的能量、动量公式可导出一个推论:粒子和其反粒子的湮灭过程必会产生至少两个光子。原因是在动量中心系下粒子和其反粒子组成的系统总动量为零,由于动量守恒定律,产生的光子的总动量也必须为零,而单个光子总具有不为零的大小为 p=hv/cp = hv/c 的动量,因此系统只能产生两个或两个以上的光子来满足总动量为零。产生光子的频率即他们的能量,则由能量-动量守恒定律(四维动量守恒)决定。单光子生成电子-反电子对的过程不可能在真空中自发产生,这是因为这个过程无法遵守动量守恒,从电子与反电子对的动量中心系观察,它们的总动量为零,但是光子的动量无法被抵消。因此需要有一个额外的带质量粒子参与,例如一个原子核,这个过程才能发生。

历史发展

托马斯·杨于1801年进行的双缝干涉实验证实光波动说,同时否定了光微粒说的有力证据。
托马斯·杨于1801年进行的双缝干涉实验证实光波动说,同时否定了光微粒说的有力证据。

在17世纪与18世纪时期,在学术界主要有两种论述光的学说:光微粒说与光波动说。根据光微粒说,光是由无数微小粒子组成的物质。虽然这可以解释光的直线移动与反射,但并不能正确地解释折射、衍射等现象。勒内·笛卡尔(1637年)、罗伯特·胡克(1665年)和克里斯蒂安·惠更斯(1678年)等人主张光波动说,认为光是弥漫在宇宙中的以太所传播的扰动。

虽然光波动说可以解释光为什么能够进行直线传播与球面传播,并且解释反射与折射机制,但是无法解衍射机制。当时由于艾萨克·牛顿的权威影响力,光微粒说仍然占有主导地位。十九世纪初,托马斯·杨和奥古斯丁·菲涅耳的实验清晰地证实了光的干涉和衍射特性,并且用光波动说合理解释这些特性。到1830年左右,光波动说已经完全被学界接受。1865年,詹姆斯·麦克斯韦的理论预言光是一种电磁波,证实电磁波存在的实验由海因里希·赫兹在1888年完成,这被认为标志着光微粒说的彻底终结。

然而,麦克斯韦理论下的光的电磁说并不能解释光的所有性质。例如在经典电磁理论中,光波的能量只与波场的能量密度(辐照度)有关,与光波的频率无关;但很多相关实验,例如在光化学的某些反应中,只有当光照频率超过某一阈值时反应才会发生,而在阈值以下无论如何提高辐照度,反应都不会发生。类似的例子还有光电效应实验,只有当照射足够高频率的光束于金属版时,光电子才会被发射出来;光电子的能量只与频率有关,而与辐照度无关。

与此同时,由众多物理学家进行的对于黑体辐射长达四十多年(1860-1900)的研究因普朗克建立的假说而得到终结。

詹姆斯·麦克斯韦的光的电磁理论将光描述为振动的正交电场和磁场,这一理论在1900年左右似乎已经相当完备,然而电磁理论不能解释所有的实验现象,这导致普朗克、爱因斯坦提出的用E=hν来描述能量最小单位的光量子假说产生。其后的实验表明这种光量子还具有动量,是一种基本粒子:光子概念的诞生,开创了人类对于电磁场量子化的更深入的研究。
詹姆斯·麦克斯韦的光的电磁理论将光描述为振动的正交电场和磁场,这一理论在1900年左右似乎已经相当完备,然而电磁理论不能解释所有的实验现象,这导致普朗克、爱因斯坦提出的用E=hν来描述能量最小单位的光量子假说产生。其后的实验表明这种光量子还具有动量,是一种基本粒子:光子概念的诞生,开创了人类对于电磁场量子化的更深入的研究。

普朗克提出任何系统发射或吸收频率为 ν 的电磁波的能量总是 E=hvE = hv 的整数倍。爱因斯坦由此提出的光量子假说则能够成功对光电效应作出解释,爱因斯坦因此获得 1921 年的诺贝尔物理学奖。爱因斯坦的理论先进性在于,在麦克斯韦的经典电磁理论中电磁场的能量是连续的,能够具有任意大小的值,而由于物质发射或吸收电磁波的能量是量子化的,这使得很多物理学家试图去寻找是怎样一种存在于物质中的约束限制了电磁波的能量只能为量子化的值;而爱因斯坦则开创性地提出电磁场的能量本身就是量子化的。爱因斯坦并没有质疑麦克斯韦理论的正确性,但他也指出如果将麦克斯韦理论中的经典光波场的能量集中到一个个运动互不影响的光量子上,很多类似于光电效应的实验能够被很好地解。在 1909年 和 1916 年,爱因斯坦指出如果普朗克的黑体辐射定律成立,则电磁波的量子必须具有 $p = \frac{h}{λ} $ 的动量,以赋予它们完美的粒子性。光子的动量在 1926 年由康普顿在实验中观测到,康普顿也因此获得 1927 年的诺贝尔奖。

爱因斯坦等人的工作证明了光子的存在,随之而来的问题是:如何将麦克斯韦关于光的电磁理论和光量子理论统一起来呢?爱因斯坦始终未能找到统一两者的理论,但如今这个问题的解答已经被包含在量子电动力学和其其后续的标准模型理论中。

与物质的相互作用

光子在透明物质中的传播速度要小于其在真空中的速度。例如在太阳内核产生的光子在到达太阳表面的路程中要经过无数次碰撞,到达表面所需时间可达一百万年,而一旦辐射到太空中只需 8.3 分钟就可到达地球。基于经典电磁理论的波动光学对此的解释是光波的电场引起了物质内部电子的极化,极化场和原有的光电场发生干涉造成波的延迟,这种效应在宏观上表现为几何光学的折射率;而从光量子的角度来看,这个过程可以被描述为光子与处于激发态的物质粒子(准粒子,如声子或激发子)混合成为一个偏振子,偏振子具有非零的有效质量,这意味着它的运动速度不能达到光速。对于不同频率的光,在物质中的运动速度可能是不同的,这种现象叫做色散。偏振子的传播速度是光波的群速,是真正的光波能量的传播速度,由能量对动量的导数给出:

v=dwdk=dEdpv = \frac{dw}{dk} = \frac{dE}{dp}

公式中变量的意义同前,E 和 p 是偏振子的能量和动量,ω 和 k 是其角频率和波数。光子与其他准粒子的相互作用能够从拉曼散射和布里渊散射中观测到。
光子也能够被分子、原子或原子核吸收,引发它们能级的跃迁。一个經典的例子是视黄醛(C20H28O,见右图)的分子跃迁,这是由诺贝尔奖得主、生物化学家乔治·沃尔德和他的同事于 1958 年发现的。光子的吸收甚至能够打破化学键,例如氯的光解过程,这是光化学的研究主题。


视黄醛在经过恰当波长的光子照射后分子结构会被拉直
视黄醛在经过恰当波长的光子照射后分子结构会被拉直

光子与量子力学

波粒二象性和不确定性原理

光子和其他量子一样,同时具有波和粒子的双重性质,这种波粒二象性很难直观地说明。在其波长的尺度上,光表现出干涉、衍射等波的现象;例如一个单个光子在进行双缝实验时打到屏上的概率分布与很多个光子(即通常状态下的电磁辐射)集体通过双缝时形成的干涉条纹相同,这种干涉条纹的分布可由麦克斯韦方程组决定。然而,实验证实单个光子并不等同于一个短暂的电磁脉冲,在传播过程中光子不会扩散,穿过光学分束器时也不会分成两个;光子也不是一种传统的粒子,单个光子在双缝实验中的概率分布似乎说明当它穿过双缝之一时“知道”另一条的存在。光子看上去像是一种无尺寸的粒子,原因是它能够被那些尺寸远小于其波长的粒子,例如原子核(10-15米)和同样无尺寸的电子,整体地吸收或发射。根据我们当前对光子的理解,光子是产生电磁场的原因,而光子本身的存在是局域的规范对称性和量子场论定律的结果。

海森堡的不确定性原理,作为量子力学中的一条重要基本法则,指出一个粒子同方向的位置和动量不可能在同一时刻被确定。值得注意的是,对于带有电荷的物质粒子,不确定性原理本身即要求将光量子化为光子,这里需要用到光子的动量和能量与频率的相关性。关于这一点的解说有一个很漂亮的示例[66],这是海森堡的一个假想实验,讨论的是用一个理想的伽玛射线显微镜去确定一个电子的位置的情形。假设电子的位置确定在显微镜的分辨本领可达的范围之内,这用经典光学表示为

$Δx \sim \frac{\lambda}{\sin\theta}$
这里 θ 是显微镜的孔径角。由此得到的位置不确定度 Δx 可以随着用来观测电子的光波长 λ 的减小而变得尽可能小;然而此时由于波长 λ 的减小,用来观测电子的光子动量增大,这使得光子在电子上发生散射造成电子的动量变得越来越不确定。如果光不是量子化的,则电子的动量不确定度则可以通过减小辐照度来逐渐降低。这种情况是不可能发生的因为同时调节波长和辐照度就相当于能够同时确定位置和动量,这违反了不确定性原理。


海森堡的假想实验:通过一个高分辨率的伽玛射线显微镜来确定一个电子位置(用蓝色表示)。入射的伽玛射线(用绿色表示) 被电子散射到显微镜的孔径角θ内,被散射的伽玛射线用红色表示。经典光学告诉我们电子的位置不确定度不可能小于由孔径角和光波波长确定的一个值。
海森堡的假想实验:通过一个高分辨率的伽玛射线显微镜来确定一个电子位置(用蓝色表示)。入射的伽玛射线(用绿色表示) 被电子散射到显微镜的孔径角θ内,被散射的伽玛射线用红色表示。经典光学告诉我们电子的位置不确定度不可能小于由孔径角和光波波长确定的一个值。

与之相反的是,爱因斯坦的光量子理论是符合不确定性原理的:当光子被散射到孔径角内,传递的动量不确定度为 $ Δp \sim p_{photon}\sin\theta = \frac{h}{\lambda}\sin\theta $ 。这就得到了海森堡不确定性原理 $ ΔxΔp \sim h $ ,这意味着整个世界都是量子化的,包括物质和场都遵循量子定律。

对于光子类似的一条不确定性原理是说无法同时测量一束电磁波中光子的数量n(参见福克态与下文的二次量子化)和这束电磁波的相位φ,两者不确定度的关系为 $ ΔnΔφ > 1 $ 。


光子的波动性是指经典的电磁波呢,还是量子力学的几率波呢?

光子和像电子那样的物质粒子都能够在双缝实验中形成类似的干涉条纹。在数学上,干涉条纹分布的计算既可以用经典波动干涉的方法,也能够完全从量子力学波函数的方法推导出。由于单个光子穿过双缝时也会发生干涉,这种干涉很容易让人理解为光子的波函数的几率波干涉;因为这种干涉完全无法用经典电磁理论解释,几率波的概念似乎更接近光子波动性的本质。不过一般教材在讨论光子的波动性时只使用经典电磁理论,而物质粒子的波动性只使用波动力学,这涉及到在物理学界光子的波函数本身仍然是一个有争议的概念。经典波动来自麦克斯韦方程组,而波函数来自薛定谔方程,但大多数物理学家都不认为这意味着对于光子而言麦克斯韦方程是薛定谔方程的简化形式,原因是通常意义下的薛定谔的几率波函数概念无法应用到光子上,光子的波函数无法拥有非相对论波动力学中薛定谔方程的所有性质。光子没有质量,无法定域化一个光子,这造成光子没有一个定义完备的位置本征态r|\mathbf{r} \rangle,不确定性原理的一般形式 $ ΔxΔp > h/2 $ 对于光子而言没有定义。尽管现在有一些建立光子波函数的尝试,这些都没有得到广泛认可和应用。现在被普遍接受的观点是光子的二次量子化理论,即在量子电动力学中,光子是量子化的电磁场激发模式。

玻色 - 爱因斯坦光子气体模型

1924 年,萨特延德拉·纳特·玻色在没有借助电磁理论的情形下推导出了普朗克的黑体辐射定律,他所用的方法是对相空间内粗粒计数(coarse-grained counting)的修正。爱因斯坦证明了这种修正等价于认为光子是严格的全同粒子,并暗示了一种“神秘的非定域的相互作用”,这种相互作用在今天被理解为量子力学对称态的要求。此项工作引出了相干态的概念,并导致了激光的发展。爱因斯坦将玻色的结构体系推广至物质粒子(玻色子),并预言它们在足够低的温度下会凝聚到能量最低的量子态上;1995 年,人们在实验中成功实现了玻色-爱因斯坦凝聚态。

如果电磁场的线性叠加原理成立,光子必须服从玻色-爱因斯坦统计。(整数自旋的粒子是玻色子,而1/2奇数倍自旋的粒子是费米子;自旋统计定理的结论是所有玻色子服从玻色-爱因斯坦分布,而所有费米子服从费米-狄拉克分布,或是说它们受到泡利不相容原理的制约,每一个量子态上最多只能有一个费米子。)简单说来,假使光子是费米子,则激光不可能在任意辐照度下同时辐射出大量处在同一状态的具有相同运动方向的相干光子,因此光子只能是玻色子。

受激辐射和自发辐射

1916年,爱因斯坦发现普朗克的量子假说 E = hν 能够从一个速率方程中导出。假设有一个处于热平衡状态的空腔,内部充满了能够被系统吸收或发射的电磁辐射。热平衡状态要求系统中具有频率 ν 的光子的数密度为 n(ν) 不随时间变化的常数,这样系统发射光子的速率一定等于吸收光子的速率。
爱因斯坦假设一个系统从低能级 Ej 向高能级 Ei 跃迁时吸收频率为 ν 的光子速率 Rji 与处于低能级 Ej 的分子数 Nj , 以及周围具有此种频率 ν 的光子数密度成正比:

$ R_{ji} = N_{j}B_{ji}\rho(\nu) $
其中 Bji 是系统的吸收系数。
受激辐射(是一个光子“克隆”其自身的过程)是由爱因斯坦在用速率方程的方法推导 E=hν时预言的,这一工作引领了激光的发展,也驱动了研究光的本性的一系列量子方法的产生,如半经典理论和量子电动力学。
受激辐射(是一个光子“克隆”其自身的过程)是由爱因斯坦在用速率方程的方法推导 E=hν时预言的,这一工作引领了激光的发展,也驱动了研究光的本性的一系列量子方法的产生,如半经典理论和量子电动力学。

爱因斯坦还进一步假设从高能级 $ E_{i} $ 向低能级 $ E_{j} $ 跃迁时发射频率为 ν 的光子反向速率 $ R_{ij} $ 由两项组成: $ R_{ij} = N_{i}A_{ij} + N_{i}B_{ij}ρ(v) $
其中 $ A_{ij} $ 是与系统自发辐射的系数,而 $ B_{ij} $ 是受激辐射的系数。爱因斯坦证明在系统处于热平衡时,普朗克的量子假说 $ E = hv $ 是这些假设成立的必然结果,并且这与系统的材料组成无关。
这一运动学模型相当简单而颇含物理意义。爱因斯坦还证明了系统的吸收系数 $ B_{ji} $ 等于受激辐射的系数 $ B_{ij} $ ;以及可能更值得注意的一个关系: $ A_ij = \frac{8\pi hv{3}}{c{3}}B_{ij} $
爱因斯坦没有尝试给出系数的形式从而进一步完善这个理论的速率方程,但他指出 $ A_{ij} $ 和 $ B_{ij} $ 的形式应该能够从“经修正能够适用于量子假说的力学和电动力学”中推导出,这一预言已经分别在量子力学和量子电动力学中得到证实,计算这些系数的确需要借助这两者包含的第一性原理。保罗·狄拉克在1926年用半经典近似的方法得到了 $ B_{ij} $ 的形式,其后在1927年通过第一性原理推导出了所有系数的形式。狄拉克的工作是量子电动力学的基石,这种电磁场的量子化又叫做二次量子化或量子场论,这是相对于早期的量子力学所研究的在势阱中运动的物质粒子的量子化(代表着“一次量子化”)而言的。
爱因斯坦曾为他这一理论的不完整性所困扰,因为方程并没有给出自发辐射光子确定的运动方向,而今天我们知道自发辐射的光子不存在确定的运动方向,只存在某些特定的几率,这是量子力学的统计诠释的结果。最早去思考光微粒运动的概率本性的人是牛顿,他在处理双折射问题,以及光在界面上部分反射部分折射的问题时做出假设:在光微粒中有某些未知的变量决定了光微粒将走哪条路径。类似地,爱因斯坦也寄希望于能找到一个更完备的理论,从而能够完全消除这种不确定性,他和量子力学由此开始分道扬镳。具有讽刺意味的是,马克斯·玻恩却受到爱因斯坦试图完善这一理论的启发,建立了波函数的统计诠释。由全同玻色子组成的孤立系统,处于热平衡时,分布在能级εi的粒子数为

Ni=gi/(eα+βεi1)Ni = gi/(e^{α+βεi} - 1)

α 为拉格朗日乘子、 β = 1/kT ,由体系温度、粒子密度和粒子质量决定。εi 为能级 i 的能量, gi 为能级的简并度。

光子与量子场论

二次量子化

1910 年,彼得·德拜从一个相对简单的假设推导出了普朗克的黑体辐射。他成功地将一个谐振腔内的电磁场分解成其傅立叶模式,并假设了每一种模式的能量都是

$ E = hv $
的整数倍,将这些模式求和就得到了黑体辐射定律。不过,德拜的方法没有能够给出爱因斯坦于1909年得到的黑体辐射能量涨落公式的正确形式。1925年,马克斯·玻恩、海森堡和帕斯库尔·约当对德拜的概念做了关键性的重新阐述[93]。在经典理论中就可以证明,电磁场的傅立叶模式,这个由其波矢k和偏振态标记的平面电磁波的一组完备集合,和无耦合的谐振子的一组集合等价。
不同的“电磁波模式” 可以被认为是彼此独立的谐振子,一个光子对应着该种模式的对应能量的最小单位 E = hv
不同的“电磁波模式” 可以被认为是彼此独立的谐振子,一个光子对应着该种模式的对应能量的最小单位 E = hv

在量子力学中,这组谐振子的能级可用 $ E = hv $ ν 是谐振子的频率。而下一个关键步骤就是证明电磁场的每一种傅立叶模式的能级都对应可用 $ E = nhv $ 表示的具有n个光子的一个态,每一个光子的能量是 $ E = hv $ 这种方法给出了正确的能量涨落公式。

在量子场论中,一个可观测事件的概率来源于对所有可能过程的概率振幅(一个复数)求和。在这里的费曼图中,概率等于振幅之和的模的平方
在量子场论中,一个可观测事件的概率来源于对所有可能过程的概率振幅(一个复数)求和。在这里的费曼图中,概率等于振幅之和的模的平方

狄拉克在此基础上做了进一步推导,他将一个电荷和电磁场的相互作用处理为引起光子能级跃迁的微扰,能级跃迁造成了光子数量的变化,但总体上系统满足能量和动量守恒。狄拉克成功地从第一性原理导出了爱因斯坦系数 Aij 和 Bij 的形式,并证明了光子的玻色-爱因斯坦统计是电磁场量子化的自然结果(玻色的推导过程正好相反,他在假设玻色-爱因斯坦统计成立的条件下导出了普朗克公式)。在狄拉克的时代,人们还不知道包括光子之内的所有玻色子都服从玻色-爱因斯坦统计。
狄拉克的二阶微扰理论会涉及到虚光子,虚光子可以认为是极短暂的电磁场的中间态,如静电场或静磁场中的相互作用就是由虚光子来传递。在量子场论中,可观测事件的概率振幅是由对所有可能的中间态求和得到的,包括那些没有物理意义的态。

这样虚光子并没有如 $ E = pc $ 这类公式的约束,而且可能会存在两个以外的偏振态,在某些规范条件下光子可能会有三个甚至四个偏振态。尽管虚光子不能被观测到,它们对可观测事件的概率的贡献是可以测量到的。当然,二阶微扰以及更高阶的微扰在数学上会使求和的结果无限大,对于这种不存在物理意义的结果解决的技巧是重整化。其他种类的虚粒子也能够对求和产生贡献,例如在两个光子的相互作用中的虚电子-正电子对。

在现代物理的符号系统中,电磁场的量子态是用一个福克态来表示,这是每一种电磁场模式对应的量子态的张量积:

$ |n_{k_{0}}\rangle \times |n_{k_{1}}\rangle \times ··· \times |n_{k_{n}}\rangle$

在这里 $ |n_{k_{i}}\rangle $ 表示的量子态意为有 $ n_{k_{i}} $ 个光子处于模式 $ k_{i} $ 下。在这种符号系统中,模式 $ k_{i} $ 下产生一个新光子的过程被记作 $ |n_{k_{i}}\rangle \rightarrow |n_{k_{i}}+1\rangle $ 。这只是波恩、海森堡和约当概念的一种数学表述,并没有更多的物理内容。

光子:规范玻色子

电磁场可用规范场论来理解为要求时空中每一个位置都满足对称性要求的结果。对于电磁场,这种规范对称性是复数的局域阿贝尔U(1)对称性,复数代表着可以自由改变其相位,而不改变其实数部分,例如能量或拉格朗日量是复数的实部。
在对称不破缺的前提下,阿贝尔规范场的量子必须是无质量的、不带电荷的玻色子,因此理论预言光子为无质量无电荷并带有整数自旋的粒子。电磁相互作用的形式决定了光子的自旋一定为±1,即螺旋性一定为 ±ħ 对应着光子经典概念中的左旋和右旋;而虚光子也可能会具有无物理意义的其他自旋态。物理学家一直在致力于检查实验结果和标准模型的预言相矛盾之处,特别是从实验中计算光子所带电荷和内秉质量的上限,任何一个值非零都是对标准模型致命的破坏。然而,目前为止所有实验都证明光子具有的电荷和内秉质量为零,现今最为广泛接受的上限值分别为 $ 5 \times 10^{-52} $ 库伦($ 3 \times 10^{-33} $ 倍基本电荷)和 $ 1.1 \times 10^{-52} $ 库伦($ 6 \times 10^{-17} $ 电子伏特)。
在流行的标准模型中,光子是弱电相互作用的四个规范玻色子之一,其他三个是参与弱相互作用的 $ W^+ $ 、 $ W^{-} $ 和 $ Z^0 $,它们都具有内秉质量,因此需要一种SU(2)规范对称破缺的机制来解释。光子和 W、Z 玻色子的电弱理论是由格拉肖、萨拉姆和温伯格完成的,三人因此项工作获得 1979年的诺贝尔物理学奖。而大统一理论的创立,是物理学家试图将这四种规范玻色子和传递强相互作用的八种胶子规范玻色子联系起来的尝试;然而大统一理论的一些关键性预言,例如质子的衰减,还没有在实验中得到证实。

光子的结构

所谓光子结构的测量,在量子色动力学中是指观测光子场的量子涨落,这种能量涨落用一个光子的结构方程来描述。目前对光子结构的测量一般都依赖于对光子与电子,以及正负电子的对撞时的深度非线性散射的观测。

对系统质量的贡献

当一个系统辐射出一个光子,从相对系统静止的参考系来看,能量相应的降低了一个光子对应的能量 $ E = hv $ ,这造成系统质量降低了 $ E/c^{2} $ ; 同样地,系统吸收光子时质量也会增加相应的值。

这一概念被应用于狄拉克发起的理论——量子电动力学的关键性预言中。在这理论里,电子(或更普遍性的,轻子)的质量被修正,将虚光子的质量贡献纳入计算,应用到重整化技术。这种“辐射修正”在量子电动力学里给出一些预言,例如,轻子的磁偶极矩、兰姆位移、束缚轻子对的超精细结构(例如μ介子素或电子偶素)。

既然光子对能量-动量张量有贡献,根据广义相对论它们也会产生引力场。反过来,光子本身也会受到引力场的作用,在弯曲的时空中它们的路径也会发生弯曲,在天体物理学中这被应用为引力透镜。在强引力场中运动时光子的频率会发生引力红移,这一点已经在庞德-雷布卡实验中得到证实。当然,这些效应并不仅限于光子,而对经典的电磁波同样成立。

技术应用

这里讨论的是光子在当今技术中的应用,而不是泛指可在传统光学下应用的光学仪器(如透镜)。激光的原理是上文讨论的受激辐射。

对单个光子的探测可用多种方法,传统的光电倍增管利用光电效应:当有光子到达金属板激发出电子时,所形成的光电流将被放大引起雪崩放电。电荷耦合元件(CCD)应用半导体中类似的效应,入射的光子在一个微型电容器上激发出电子从而可被探测到。其他探测器,如盖革计数器利用光子能够电离气体分子的性质,从而在导体中形成可检测的电流。

普朗克的能量公式 $ E = hv $ 经常在工程和化学中被用来计算存在光子吸收时的能量变化,以及能级跃迁时发射光的频率。例如,在荧光灯的发射光谱的设计中,会使用拥有不同电子能级的气体分子,然后调整电子的能量并且用这些电子去碰撞气体分子,这样,可以得到想要的荧光。

在某些情形下,单独一个光子无能力激发一个能级的跃迁,而需要有两个光子同时激发。这就提供了更高分辨率的显微技术,因为样品只有在两束不同颜色的光所照射的高度重叠的部分之内才会吸收能量,而这部分的体积要比单独一束光照射到并引起激发的部分小很多,这种技术被应用于双光子激发显微镜中。而且,应用弱光照射能够减小光照对样品的影响。

有时候两个系统的能级跃迁会发生耦合,即一个系统吸收光子,而另一个系统从中“窃取”了这部分能量并释放出不同频率的光子。这是荧光共振能量传递的基础,被应用于分子生物学来研究蛋白质与蛋白质之间的相互作用。

近期研究

量子光学是物理光学中相对于波动光学的另一个分支。未来超快的量子计算机的基本运算元素可能是光子,而在这方面重点研究的对象是量子纠缠态。非线性光学是当前光学另一个活跃的领域,它研究的课题包括光纤中的非线性散射效应、四波混频、双光子吸收、自相位调变、光学参数振荡器等。不过这些课题中并不都要求假设光子的存在,在建模过程中原子经常被处理为一个非线性振子。非线性效应中的自发参量下转换经常被用来产生单光子态。光子是光通信领域某些方面的关键因素,特别是在量子密码学中。

2019年7月31日,大型强子对撞机的超环面仪器实验团队宣布找到光子与光子散射的确切证据,超过背景期望值8.2 个标准差。


此间车厢已使用  次 |   人乘坐过此趟开往世界尽头的列车