1.1 平稳作用量原理

假设每个物理系统都存在一个路径区分函数,它在可实现的路径上取平稳值。我们将尝试推导它的一些性质。

运动的经验

我们的日常经验表明,物理运动可以用连续且光滑的构型路径来描述。3 我们看不到杂耍棒从一个位置跳到另一个位置,也看不到杂耍棒突然改变其运动方式。

我们的日常经验表明,物理系统的运动并不依赖于系统的全部历史。如果我们在一根杂耍棒被抛入空中后才进入房间,我们无法判断它是何时离开杂耍者的手的。杂耍者可以在不同的时间、不同的位置抛出杂耍棒,而在我们走进门时呈现相同的结果。4 因此,杂耍棒的运动并不依赖于历史细节。

我们的日常经验表明,物理系统的运动是确定性的。事实上,少量参数就概括了系统历史的重要方面,并决定了其未来的演化。例如,在任何时刻,杂耍棒的位置、速度、取向和取向变化率就足以完全确定杂耍棒未来的运动。

可实现的路径

从我们对运动的经验中,我们形成了对可实现的构型路径的某些预期。如果一条路径是可实现的,那么该路径的任何片段都是可实现的路径片段。反之,如果一条路径的每一片段都是可实现的路径片段,那么该路径就是可实现的。一个路径片段的可实现性取决于该片段中路径的所有点。一个路径片段的可实现性以相同方式依赖于该路径片段的每一个点;路径的任何部分都不具有特殊性。一个路径片段的可实现性仅依赖于该片段内路径上的点;路径片段的可实现性是一种局域性质。

因此,路径区分函数聚合了沿路径片段每一时刻所测量的系统的某种局域性质。沿路径的每一时刻必须以相同方式处理。沿路径片段每一时刻的贡献必须以保持不相交子片段贡献独立性的方式组合起来。满足这些要求的一种组合方法是将贡献相加,使得路径区分函数成为沿路径片段对某种路径局域性质的积分。5

因此,我们将尝试构造一个路径区分函数,它被构造为沿路径的某种局域性质的积分,并对任何可实现的路径取极值。这样的路径区分函数传统上被称为系统的action。我们使用“作用量”这个词是为了与常用术语保持一致。或许继续称其为“路径区分函数”会更清楚,但那样别人就更难理解我们在说什么了。6

为了推进变分力学的议程,我们必须构造出在所研究系统的可实现轨迹上取平稳值的作用量函数。我们将考虑那些是路径每一时刻某种局域性质积分的作用量。设为构型路径函数;(t)是时刻t的构型。路径在时间区间t1到t2上的作用量为7

其中[]是一个时间函数,它度量路径的某种局域性质。它可以依赖于函数在该时刻的值以及在该时刻的任何导数值。8

构型路径在某一时刻可以用构型、构型的变化率以及该时刻构型的所有更高阶导数来局域描述。有了这些信息,路径可以在包含该时刻的某个区间内重建。9 路径的局域性质只能依赖于路径的局域描述。

函数度量构型路径的某种局域性质。我们可以将[]分解为两部分:一部分度量局域描述的某种性质,另一部分从路径函数中提取路径的局域描述。度量系统局域性质的函数依赖于特定的物理系统;从路径构造路径局域描述的方法对于任何系统都是相同的。我们可以将[]写为这两个函数的复合:10

函数接受路径并产生一个时间函数,其值是一个有序元组,包含时间、该时刻的构型、该时刻的构型变化率以及该时刻路径的更高阶导数值。对于路径和时刻t:11

我们将这个包含所需数量导数的元组称为局域元组。

函数依赖于所研究的物理系统的具体细节,但不依赖于任何特定的构型路径。函数计算路径的一个实值局域性质。我们将发现只需要局域元组的有限个分量来计算这一性质:路径可以从完整的局域描述中局域地重建;依赖于局域元组的有限个分量保证了它度量的是局域性质。12

这种分解的优点是,路径的局域描述是通过统一的过程从构型路径计算得到的,与所考虑的系统无关。所有系统特定的信息都包含在函数中。

函数被称为系统的拉格朗日量(Lagrangian),13 由此产生的作用量称为拉格朗日作用量:

对于大量系统都可以找到拉格朗日量。我们将看到,对于许多系统,拉格朗日量可以取为动能与势能之差。这样的拉格朗日量只依赖于时间、构型和构型的变化率。我们将聚焦于这类系统,但也会不时考虑更一般的系统。

系统的可实现路径应通过相对于某组附近不可实现路径具有平稳作用量来与其他路径区分。现在,可实现路径附近的一些路径也将是可实现的:对于杂耍棒的任何运动,都存在另一个略有不同的运动。因此,在处理作用量是否对路径的变分取平稳值的问题时,我们必须以某种方式将所考虑的路径集合限制为仅包含一条可实现路径。结果表明,对于仅依赖于构型和构型变化率的拉格朗日量,将路径集合限制为那些在路径片段端点具有相同构型的路径就足够了。

平稳作用量原理14断言,对于每个动力学系统,我们可以构造一个拉格朗日量,使得连接两个时刻t1和t2构型的可实现路径,通过作用量[](t1, t2)对路径变分取平稳值这一事实,与所有可想象的路径区分开来。对于仅依赖于构型和构型变化率的拉格朗日量,变分被限制为那些在t1和t2处保持构型不变的变分。15

练习 1.1. 费马光学 费马观察到,反射和折射定律可以用以下事实来解释:光在任何特定介质中沿直线传播,其速度依赖于介质。光线从光源到目的地经过任意序列介质所经过的路径,与邻近路径相比,是总时间最小的路径。证明这些事实蕴含反射和折射定律。16


3 原子尺度系统的经验表明,在此尺度下系统并不沿明确定义的构型路径运动。为描述原子尺度系统的演化,我们采用量子力学。在此,我们将注意力限制在运动可由光滑构型路径很好描述的系统上。

4 将月球轨道向后外推无法确定它是在哪一点被放置到这一轨迹上的。要确定月球的起源,我们必须用其他物理证据(如化学成分)来补充动力学证据。

5 我们相信这一论证可以提升为对构造此路径区分函数的可能方式的一个精确约束。

6 历史上,惠更斯(Huygens)是第一个在力学中使用术语“作用量”的人,他指的是“运动的效果”。这是来自希腊人的一个概念。莱布尼茨(Leibniz)在1690年的手稿《动力学》(Dynamica)中,使用“无害作用量”(即质量、速度和运动距离的乘积)阐述了“最小作用量原理”。莱布尼茨还谈到了物体碰撞情况下的“有害作用量”。

7 实变量实值函数f的定积分写作ab f。这也可以写作ab f(x) dx。第一种记法强调被积分的是一个函数。

8 传统上,函数参数的周围使用方括号。在这种情况下,方括号提醒我们的值可能以复杂的方式依赖于函数,例如通过其导数。

9 对于实值函数,某点的函数值及其导数可用于构造幂级数。对于足够好的函数(实解析函数),这样构造的幂级数在包含该点的某个区间内收敛。并非所有函数都能以这种方式局域表示。例如,函数f(x) = exp( - 1/x2),其中f(0) = 0,在x = 0处为零且所有导数都为零,但这无穷多个导数不足以确定任何其他点的函数值。

10 这里 o 表示函数的复合:(f o g)(t) = f(g(t))。在我们的记号中,依赖于路径的函数对其路径的应用优先级高于复合,因此 o [] = o ([])。

11 构型路径的导数 可以通过指定它如何作用于构型的足够光滑的实值函数f,用普通导数来定义。其确切定义在这一阶段并不重要。如果你好奇,请参见脚注23。

12 我们稍后将发现,局域元组的一个初始片段足以确定系统未来的演化。构型和有限个导数决定未来,意味着存在一种从初始片段确定路径所有其余导数的方法。

13 经典的拉格朗日量在量子力学的路径积分表述(由狄拉克和费曼提出)中扮演着基本角色,其中经典作用量的复指数给出了路径的相对概率振幅。拉格朗日量是哈密顿力学表述(在第3章讨论)的出发点,该表述对量子力学的薛定谥表述和海森伯表述以及统计力学的波尔兹曼-吉布斯方法也是必不可少的。

14 这一原理常被称为“最小作用量原理”,因为其最初的表述谈论的是作用量被最小化,而非更一般的取平稳值的情况。术语“最小作用量原理”也常被用来指由莫佩尔蒂(Maupertuis)、欧拉(Euler)和拉格朗日(Lagrange)得出的一个结果,该结果指出自由粒子沿这样的路径运动:在所有具有给定端点的路径中,动能的积分取最小值。相应地,“作用量”一词有时也特指动能的积分。(实际上,欧拉和拉格朗日使用的是活力(vis viva),即两倍的动能。)

15 对平稳作用量原理的其他表述方式使它听起来带有目的论和神秘色彩。例如,可以想象系统考虑了从初始构型到最终构型的所有可能路径,然后选择了作用量最小的那条。事实上,关于一个有目的、经济和理性的宇宙的基本愿景,在伴随力学最初发展的哲学考虑中扮演了重要角色。保持为现代物理学一部分的最早的作用量原理是费马原理,该原理指出光线在两点之间传播的路径是耗时最少的路径。费马在级1660年阐述了这一原理,并用它推导了反射和折射定律。受此启发,法国数学家和天文学家皮埃尔-路易·莫罗·德·莫佩尔蒂将最小作用量原理阐述为物理学中的一个宏大统一原理。在他的《宇宙学论》(Essai de cosmologie, 1750)中,莫佩尔蒂援引这一“自然经济性”原理作为上帝存在的证据,声称它证明了“上帝通过一个最高完美的普遍原理来规范物理现象的意图”。关于莫佩尔蒂、欧拉和拉格朗日在最小作用量原理阐述中所起作用的历史视角,参见文献[28]。

16 对于反射,入射角等于反射角。折射由斯涅尔定律(Snell's law)描述:当光线从一种介质进入另一种介质时,与界面法线所成角度的正弦之比等于两种介质折射率之比的倒数。折射率是真空中的光速与介质中的光速之比。