1.6 如何寻找拉格朗日量

拉格朗日方程是一组二阶微分方程。为了利用它们计算力学系统的演化,我们必须为系统找到合适的拉格朗日量。并不存在为每个系统构造拉格朗日量的通用方法,但有一类重要的系统,我们可以直接用动能和势能来构造拉格朗日量。关键思想是构造一个拉格朗日量 L,使得拉格朗日方程就是牛顿方程 = m

假设我们的系统由 N 个粒子组成,用下标 标记,质量为 m,位置矢量为 (t)。再假设作用在粒子上的力可以写成势能 的梯度,该势能是粒子位置和可能时间的函数,但不依赖于速度。换句话说,作用在粒子 上的力为 = - ,其中 关于下标为 的粒子位置的梯度。我们可以将牛顿方程写为

矢量可以表示为矢量在直角基上的分量元组。因此 1(t) 表示为元组 x1(t)。令 V 为用分量表示的势能函数:

牛顿方程为

其中 1, VV 关于第 x(t) 个参数槽的偏导数。

为了形成拉格朗日方程,我们将所有粒子的所有位置分量收集到一个元组 x(t) 中,因此 x(t) = (x0(t), ..., xN-1(t))。坐标路径 x 的拉格朗日方程为

观察可知,如果我们选择 L 具有如下性质,则牛顿方程 (1.51) 正好是拉格朗日方程 (1.54) 的分量:

此处 V(t, x(t)) = V(t; x0(t), ..., xN-1(t)),而 1, V(t, x(t)) 是 V 关于下标为 的粒子坐标的导数分量元组,在时刻 t 和坐标 x(t) 处取值。如果对于每一个 ab 满足以下条件

并且

其中 a = (a0, ..., aN-1)。我们使用符号 ab 来强调这些只是拉格朗日量的形式参数。具有所需性质 (1.56-1.57) 的 L 的一种选择是

其中 v2 是 v 各分量平方之和。[61]

第一项是动能,通常记为 T。因此拉格朗日量的这一选择为 L(t, x, v) = T(t, x, v) - V(t, x),即动能与势能之差。我们通常将势能函数的参数扩展到包含速度,从而可以写作 L = T - V。[62]

哈密顿原理

对于一组质点系统,若其力可表示为与速度无关的势能 V 的(负)导数,我们已经证明系统沿满足拉格朗日方程的路径演化,其中 L = T - V。为这类系统确定了拉格朗日量之后,我们可以用能量重新表述平稳作用量原理。这一表述称为哈密顿原理:对于力由与速度无关的势能导出的质点系统,系统沿路径 q 演化,使得作用量

关于保持端点固定的路径 q 的变分是平稳的,其中 L = T - V 是动能与势能之差。[63]

似乎我们已将拉格朗日方程简化为 = m ,事实上,这一原理正是通过比较这两类特殊系统的方程而得到启发的。然而,运动方程的拉格朗日表述相比 = m 有一个重要优势。我们在推导中使用了组成粒子的位置的直角分量 x 作为广义坐标,但如果系统的路径在某个特定坐标系中满足拉格朗日方程,那么它在 any 坐标系中也必然满足。因此我们看到,对于 any 组广义坐标,L = T - V 都可以作为合适的拉格朗日量。变分力学的方程在任何构型空间和任何坐标系中都以相同的方式推导。相比之下,牛顿表述基于初等几何:要使 D2(t) 有意义地作为加速度,(t) 必须是物理空间中的矢量。拉格朗日方程对坐标 q 的含义没有这样的限制。广义坐标可以是任何方便描述系统构型的参数。

匀加速运动

考虑一个质量为 m 的粒子在加速度为 g 的均匀引力场中运动。势能为 m g h,其中 h 是粒子的高度。动能为 (1/2) mv2。系统的拉格朗日量是动能与势能之差。在直角坐标中,y 测量垂直位置,x 测量水平位置,拉格朗日量为 L(t; x, y; vx, vy) = (1/2) m ( vx2 + vy2 ) - m g y。我们有[64]

(define ((L-uniform-acceleration m g) local)
  (let ((q (coordinate local))
        (v (velocity local)))
    (let ((y (ref q 1)))
      (- (* 1/2 m (square v)) (* m g y)))))
(show-expression
 (((Lagrange-equations
    (L-uniform-acceleration 'm 'g))
   (up (literal-function 'x) 
       (literal-function 'y)))
  't))



该方程描述了水平方向的无加速运动 (mD2 x(t) = 0) 和垂直方向的匀加速运动 (mD2 y(t) = - g m)。

中心力场

考虑一个质量为 m 的粒子在中心力场中的平面运动,势能 U(r) 只依赖于到吸引中心的距离 r。我们将用直角坐标和极坐标分别推导该系统的拉格朗日方程。

在以吸引中心为原点的直角坐标 (x, y) 中,势能为 V(t; x, y) = U((x2 + y2)1/2),动能为 T(t; x, y; vx, vy) = (1/2) m (vx2 + vy2)。系统的拉格朗日量为 L = T - V

作为过程:

(define ((L-central-rectangular m U) local)
  (let ((q (coordinate local))
        (v (velocity local)))
    (- (* 1/2 m (square v))
       (U (sqrt (square q))))))

拉格朗日方程为

(show-expression
 (((Lagrange-equations 
    (L-central-rectangular 'm (literal-function 'U)))
   (up (literal-function 'x) 
       (literal-function 'y)))
  't))



我们可以将这些拉格朗日方程重写为:

其中 r(t) = ((x(t))2 + (y(t))2)1/2。我们可以如下解释这些方程。粒子受到一个径向力,其大小为 - DU(r)。牛顿方程将该力与质量和加速度的乘积相等。两个拉格朗日方程正是牛顿方程的直角分量形式。

我们也可以用极坐标描述同一个系统。直角坐标 (x, y) 与极坐标 (r, ) 之间的关系为

广义速度之间的关系由坐标变换导出。考虑一个同时用直角坐标和极坐标表示的构型路径。设 为直角坐标路径的分量, 为相应极坐标路径的分量。时刻 t 的直角坐标为 ((t), (t)),时刻 t 的极坐标为 ((t), (t))。它们通过 (1.62) 相联系:

时刻 t 的直角速度为 (D(t), D(t))。对 (1.63) 微分可得速度之间的关系

这些关系对任何构型路径在任何时刻都成立,因此我们可以将其抽象为任意速度的坐标表示之间的关系。设 vxvy 为速度的直角分量,r 的变化率。则

动能为 (1/2) m(vx2 + vy2):

拉格朗日量为

我们将此拉格朗日量表示为以下形式:

(define ((L-central-polar m U) local)
  (let ((q (coordinate local))
        (qdot (velocity local)))
    (let ((r (ref q 0)) (phi (ref q 1))
          (rdot (ref qdot 0)) (phidot (ref qdot 1)))
      (- (* 1/2 m
           (+ (square rdot)
              (square (* r phidot))) )
         (U r)))))

拉格朗日方程为

(show-expression
 (((Lagrange-equations 
    (L-central-polar 'm (literal-function 'U)))
   (up (literal-function 'r) 
       (literal-function 'phi)))
  't))



我们可以将第一个方程解释为:质量与径向加速度的乘积等于势能引起的力与离心力之和。第二个方程可以解释为:角动量 mr2D 的导数为零,因此角动量守恒。

注意我们在两种坐标系中都使用了同一个 Lagrange-equations 过程。不同坐标系下拉格朗日量的坐标表示不同,不同坐标系下的拉格朗日方程看起来也不同。然而,在任何坐标系中推导拉格朗日方程所用的方法是相同的。

练习 1.13。

验证中心力运动在极坐标下和直角坐标下的拉格朗日方程是等价的。将路径代入变换方程并计算导数,从而确定二阶导数之间的关系,然后将这些关系代入运动方程。

1.6.1 坐标变换

系统的运动与我们所使用的坐标系无关。运动的这种与坐标无关的性质在作用量原理中显而易见。作用量只依赖于拉格朗日量沿路径的值,而不依赖于表示拉格朗日量所用的特定坐标。我们可以利用这一性质,用另一种坐标系中的拉格朗日量来找到某一种坐标系中的拉格朗日量。

假设我们有一个力学系统,其运动由依赖于时间、坐标和速度的拉格朗日量 L 描述。再假设我们有一个坐标变换 F,使得 x = F(t, x')。拉格朗日量 L 用不带撇的坐标表示。我们想要找到一个用带撇坐标表示的、描述同一系统的拉格朗日量 L'。一种方法是要求沿任何构型路径的拉格朗日量值不依赖于坐标系。如果 q 是不带撇坐标中的路径,而 q' 是带撇坐标中的相应路径,则拉格朗日量必须满足:

我们已经看到,从直角坐标到极坐标的变换意味着广义速度以某种方式变换。速度变换可以从以下要求推导出来:极坐标中的路径与直角坐标中的相应路径必须与坐标变换一致。一般来说,要求两个不同坐标系中的路径与坐标变换一致,可以用来推导局部元组的所有分量如何变换。给定坐标变换 F,令 C 为相应的函数,它将带撇坐标系中的局部元组映射为不带撇坐标系中的相应局部元组:

下面我们将推导 C 的一般形式。

给定这样一个局部元组变换 C,满足方程 (1.68) 的拉格朗日量 L' 为

我们可以通过将 L' 代入方程 (1.68) 来验证这一点:

为了在给定坐标变换 F 的情况下找到局部元组变换 C,我们推导局部元组的每个分量如何变换。当然,坐标变换指定了局部元组的坐标分量如何变换。广义速度分量的局部元组变换可以如下推导。设 qq' 为两个坐标系中表示的同一构型路径。将这些路径代入坐标变换并计算导数,我们得到

通过任何一点,总存在一条具有任意给定速度的路径,因此我们可以推广并得出结论:沿相应的坐标路径,广义速度满足

如有需要,可以类似方式确定局部元组的高阶导数分量规则。将带撇系统中的局部元组变换到不带撇系统中的局部元组变换由分量变换构造而成:

因此如果我们取拉格朗日量 L' 为

那么作用量的值就与计算所用的坐标系无关。平稳作用量的构型路径与描述路径所用的坐标系无关。由这些拉格朗日量导出的拉格朗日方程通常看起来彼此非常不同,但它们必然是等价的。

练习 1.14。通过直接计算证明,如果关于 L 的拉格朗日方程成立,则关于 L' 的拉格朗日方程也成立。

给定坐标变换 F,我们可以使用 (1.74) 找到变换局部元组的函数 C。过程 F->C 实现了这一点:[65]

(define ((F->C F) local)
  (->local (time local)
           (F local)
           (+ (((partial 0) F) local)
              (* (((partial 1) F) local) 
                 (velocity local)))))

作为示例,考虑从极坐标到直角坐标的变换:x = r cos y = r sin ,实现如下:

(define (p->r local)
  (let ((polar-tuple (coordinate local)))
    (let ((r (ref polar-tuple 0)) 
          (phi (ref polar-tuple 1)))
      (let ((x (* r (cos phi))) 
            (y (* r (sin phi))))
        (up x y)))))

用极坐标及其变化率表示的直角分量的变化率为

(show-expression 
 (velocity
  ((F->C p->r)
   (->local 't (up 'r 'phi) (up 'rdot 'phidot)))))



我们可以使用 F->C 从直角分量下的拉格朗日量出发,利用方程 (1.70) 找到中心力运动在极坐标下的拉格朗日量:

(define (L-central-polar m U)
  (compose (L-central-rectangular m U) (F->C p->r)))

(show-expression
  ((L-central-polar 'm (literal-function 'U))
   (->local 't (up 'r 'phi) (up 'rdot 'phidot))))



结果与拉格朗日量 (1.67) 相同。

练习 1.15。中心力运动 分别用直角坐标和球坐标寻找三维中心力运动的拉格朗日量。首先解析地找到拉格朗日量,然后通过推广我们已有的程序在计算机上验证结果。

1.6.2 具有刚性约束的系统

我们已经发现,对于受势能导出的力作用的质点系统,L = T - V 是一个合适的拉格朗日量。扩展物体有时可以方便地理想化为由刚性约束连接的质点系统。我们将发现,对于具有刚性约束的质点系统,用无冗余坐标表示的 L = T - V 是一个合适的拉格朗日量。我们将首先说明该方法,然后提供理论依据。

刚性约束系统的拉格朗日量

假定系统由普通三维空间中的 N 个质点组成,用下标 标记。第一步是选择一组方便的无冗余广义坐标 q,并用这些坐标重新描述系统。用广义坐标表示,粒子 的直角坐标为

对于无冗余坐标 q,所有坐标约束都内建在函数 f 之中。我们通过将路径函数代入方程 (1.76)、微分、然后抽象到任意速度,来推导广义速度 v 与组成粒子速度 v 之间的关系。[66] 我们得到

我们使用方程 (1.76) 和 (1.77) 将动能用广义坐标和广义速度表示。令 为作为直角坐标和速度函数的动能:

其中 v2v 的模平方。作为广义坐标元组 q 和广义速度元组 v 的函数,动能为

类似地,我们使用方程 (1.76) 将势能重新用广义坐标表示。令 (t, x) 为时刻 t 在直角坐标元组 x 所指定构型下的势能。用广义坐标表示的势能为

我们取拉格朗日量为动能与势能之差:L = T - V

支点驱动的摆

考虑一个长度为 l、质量为 m 的摆(见图 1.2),将其建模为质点,支点由给定时间函数 ys 沿垂直方向驱动。

该系统构型空间的维数为一;我们选择 (如图 1.2 所示)作为广义坐标。

在直角坐标中,摆锤的位置由下式给出

速度为

通过沿路径微分并抽象到该时刻的速度得到。

动能为 (t; x, y; vx, vy) = (1/2) m (vx2 + vy2)。用广义坐标表示的动能为

势能为 (t; x, y) = mgy。用广义坐标表示的势能为

拉格朗日量为 L = T - V

拉格朗日量表示为

(define ((T-pend m l g ys) local)
  (let ((t (time local))
        (theta (coordinate local))
        (thetadot (velocity local)))
    (let ((vys (D ys)))
      (* 1/2 m
         (+ (square (* l thetadot))
            (square (vys t))
            (* 2 l (vys t) thetadot (sin theta)))))))
(define ((V-pend m l g ys) local)
  (let ((t (time local))
        (theta (coordinate local)))
    (* m g (- (ys t) (* l (cos theta))))))

(define L-pend (- T-pend V-pend))

此系统的拉格朗日方程为[67]

(show-expression
 (((Lagrange-equations
     (L-pend 'm 'l 'g (literal-function 'y_s)))
   (literal-function 'theta))
  't))



练习 1.16。推导练习 1.9 中的拉格朗日量。

练习 1.17。螺旋线上的珠子 一个质量为 m 的珠子被约束在无摩擦的螺旋线上运动。螺旋线的轴线水平放置。螺旋线的直径为 d,螺距(单位长度的圈数)为 h。系统处于垂直加速度为 g 的均匀引力场中。构建描述该系统的拉格朗日量,并求出拉格朗日运动方程。

练习 1.18。三轴曲面上的珠子 一个质量为 m 的珠子在无摩擦的三轴椭球面上运动。在直角坐标中,曲面满足

其中 abc 为常数。确定合适的广义坐标,构建拉格朗日量,并求出拉格朗日方程。

练习 1.19。双杆连杆机构 图 1.3 所示的双杆连杆机构被约束在平面内运动。它由三个通过两根无质量刚性杆连接的小质量体组成,处于垂直加速度为 g 的均匀引力场中。杆通过铰链与中心体连接,允许连杆折叠。系统的布置使铰链完全自由:各构件可在不发生碰撞的情况下经过所有构型。构建描述该系统的拉格朗日量,并求出拉格朗日运动方程。由于方程相当庞大,请使用计算机进行推导。

练习 1.20。滑动摆 考虑一个长度为 l 的摆,连接在一个可水平自由移动的支架上,如图 1.4 所示。设支架质量为 m1,摆锤质量为 m2。构建拉格朗日量,并推导该系统的拉格朗日方程。

原理说明

在这一节中,我们证明 L = T - V 确实是刚性约束系统的合适拉格朗日量。我们通过要求拉格朗日方程与具有矢量约束力的牛顿矢量动力学等价来做到这一点。[68]

我们考虑一个粒子系统。下标为 的粒子质量为 m,时刻 t 的位置为 (t)。粒子的数量可以非常多,也可以只有少数几个。某些位置也可能是时间的指定函数,例如受驱摆的支点位置。粒子之间存在刚性位置约束。我们假设所有这些约束都具有形式

即,粒子 与 ß 之间的距离为 lß。

粒子 的牛顿运动方程表明,粒子的质量乘以加速度等于势能力与约束力之和。势能力为势能的负梯度,可能依赖于其他粒子的位置和时间。约束力 ß 是与粒子 和粒子 ß 之间的刚性约束相关联的矢量约束力。因此

其中求和下标 ß 仅遍历与下标为 的粒子存在刚性约束的那些粒子下标;我们使用记号 ß <--> 表示所指粒子之间存在刚性约束。

约束力沿粒子之间的连线方向,因此我们可以写为

其中 Fß(t) 是时刻 t 约束中标量张力的大小。注意 ß = - ß。一般来说,标量约束力随系统演化而变化。

形式上,我们可以用拉格朗日量[69] 来重现牛顿方程

其中约束力被当作额外的广义坐标处理。这里 x 是由所有 x 的所有直角分量组成的结构, 是所有 是由所有 的所有直角分量组成的结构, 是所有速度矢量 F 的结构,而 是由所有 Fß 组成的结构。F 的速度不出现在拉格朗日量中,F 本身仅线性出现。因此与 F 相关联的拉格朗日方程为

但这只是对约束的重新陈述。与粒子坐标相关的拉格朗日方程就是牛顿方程 (1.87)

现在我们有了一个合适的拉格朗日量,就可以利用拉格朗日量可以用任何广义坐标重新表示的事实来找到更简单的拉格朗日量。策略是选择一组新的坐标,其中许多坐标为常数,而其余坐标为无冗余坐标。

q 为无冗余地指定系统自由度的广义坐标元组。令 c 为指定约束所涉及粒子间距离的其他广义坐标元组。坐标 c 将具有常数值。qc 的组合取代了冗余的直角坐标 x。[70] 此外,我们还有 F 坐标,即标量约束力。我们的新坐标是 qcF 的分量。

存在函数 f,用 qc 给出组成粒子的直角坐标:

为了用 qcF 重新表示拉格朗日量,我们需要用广义速度 表示 v:这可以通过沿路径微分 f 并抽象到任意速度来实现(参见第 1.6.1 节):

将这些代入拉格朗日量 (1.89),并利用

我们得到

拉格朗日方程通过通常的过程推导。与其写出所有繁琐的细节,不如思考一下推导过程将会如何进行。

F 相关的拉格朗日方程只是重新陈述了约束:

因此,沿解路径,我们知道 c(t) = lDc(t) = D2c(t) = 0。我们可以利用这一结果来简化与 qc 相关的拉格朗日方程。

q 相关的拉格朗日方程与从拉格朗日量 [71] 导出的方程相同

但这正是 T - V,其中 TV 是根据广义坐标 q 在固定约束下计算的。注意约束力没有出现在关于 q 的拉格朗日方程中,因为在拉格朗日方程中它们乘以一个在解路径上恒为零的项。因此,对于具有固定约束的无冗余广义坐标 q,关于 T - V 的拉格朗日方程与具有矢量约束力的牛顿方程等价。

关于 c 的拉格朗日方程可用于求约束力。拉格朗日方程是一大堆复杂的表达式,我们不会显式地写出它们,但一般来说,它们是关于 D2cDcc 的方程,并依赖于 qDqF。对 F 的依赖是线性的,因此我们可以用解路径 qDq 来求解 F,其中 c = lDc = D2c = 0。

如果我们对约束力不感兴趣,可以放弃完整的拉格朗日量 (1.95),转而使用拉格朗日量 (1.97),就广义坐标 q 的演化而言,两者等价。

即使粒子间距离约束中指定的长度 lß 是时间的函数,同样的推导也成立。它还可以推广到允许与时间相关的位置的距离约束,只需将某些粒子位置 ß 设为时间的指定函数即可。

更一般的情况

考虑形式如下的约束

其中 x(t) 是时刻 t 所有直角分量 __P3__(t) 的结构。在第 1.10 节中,我们将利用变分原理证明,适合此系统的拉格朗日量为

其中 是一个额外的坐标, 是相应的广义速度。与 相关的拉格朗日方程只是对约束的重新陈述:(t, x(t)) = 0。与粒子坐标相关的拉格朗日方程为

这样的约束也可以通过将适当的约束力包含在牛顿方程中来建模:

为了使方程 (1.100) 与方程 (1.101) 相同,我们必须将 (t) 1, (t, x(t)) 识别为作用在粒子 上的约束力。注意这些约束力正比于每个时刻约束面的法线方向,因此对于满足约束的运动不做功。我们之前为包含位置约束的牛顿约束力而开发的拉格朗日量 (1.89) 正好具有这种形式。我们可以识别出

约束力满足

接受拉格朗日量 (1.99) 作为描述形式为 (1.98) 的约束系统的合适拉格朗日量后,我们可以进行坐标变换,从冗余坐标 x 变换到无冗余广义坐标 q 和约束坐标 c = (t,x),如上所述。坐标 不会出现在关于 q 的拉格朗日方程中,因为在解路径上它们会乘以一个恒为零的因子。如果我们只关心广义坐标的演化,可以假设约束恒满足,并将拉格朗日量取为用广义坐标表示的动能与势能之差。

练习 1.21。哑铃 在本练习中,我们将针对一个特定的简单系统,重新梳理约束系统拉格朗日量的推导过程。

考虑两个大质量粒子在平面上被一根无质量刚性杆约束,保持相距 l,如图 1.5 所示。平面中两个大质量粒子显然有四个自由度,但刚性杆将其减少到三个。

我们可以用粒子的冗余坐标唯一地指定构型,例如 x0(t)、y0(t)、x1(t)、y1(t)。约束 (x1(t) - x0(t))2 + (y1(t) - y0(t))2 = l2 消除了一个自由度。

a。写出两个粒子的四个直角坐标的牛顿力平衡方程,设杆中的标量张力为 F

b。写出形式拉格朗日量

使得拉格朗日方程给出你在 a 部分中推导的牛顿方程。

c。变换到具有质心坐标 xcmycm、角度 、粒子间距 c 和张力 F 的坐标系。写出该坐标系中的拉格朗日量,并写出拉格朗日方程。

d。从其中一个方程可以推断出 c(t) = l。由此事实我们得到 Dc = 0 和 D2c = 0。将这些代入你刚刚计算的拉格朗日方程,得到关于 xcmycm 的运动方程。

e。为用无冗余广义坐标 xcmycm 描述的系统构建拉格朗日量 (= T - V),并从此拉格朗日量计算拉格朗日方程。它们应与你在 d 部分中为相同坐标推导出的方程一致。

练习 1.22。受驱摆 证明拉格朗日量 (1.89) 可用于描述受驱摆,其中支点位置是时间的指定函数:使用牛顿约束力方法推导运动方程,并证明它们与拉格朗日方程相同。务必检查约束力方程以及摆锤位置的方程。

练习 1.23。补充细节 证明拉格朗日量 (1.97) 的拉格朗日方程与拉格朗日量 (1.95) 在代入 c(t) = lDc(t) = D2c(t) = 0 后的拉格朗日方程相同。

练习 1.24。约束力 求无驱动平面摆中的张力。

1.6.3 约束作为坐标变换

约束系统拉格朗日量的推导涉及与坐标变换推导类似的步骤。

对于约束系统,我们用包含了约束的广义坐标来指定组成粒子的直角坐标。然后我们将组成粒子的直角速度确定为广义坐标和广义速度的函数。我们已知如何在组成粒子的直角坐标和速度中表达拉格朗日量,然后可以将其重新用广义坐标和广义速度表示。

要进行坐标变换,需要指定如何将用一组广义坐标表示的系统构型重新用另一组广义坐标表示。然后我们确定由广义坐标变换所隐含的广义速度变换。用其中一组广义坐标表示的拉格朗日量可以重新用另一组广义坐标表示。

这实际上是同一过程的两种应用,因此我们可以通过将无约束粒子的拉格朗日量与包含约束的坐标变换复合来构造约束系统的拉格朗日量。我们关于 L = T - V 是约束系统合适拉格朗日量的推论,实际上是基于从一组受约束的坐标到一组无冗余坐标加上常值约束坐标的坐标变换。

__P3__ 为下标为 的组成粒子的直角分量元组,__P4__ 为其速度。拉格朗日量

是组成粒子的动能与势能之差。这是一组具有势能 V 的无约束自由粒子的合适拉格朗日量。

q 为无冗余广义坐标元组,v 为相应的广义速度元组。坐标 q__P7__(组成粒子的坐标)通过 __P8__ = f(t, q) 相关联,如前所述。组成粒子之间的约束在 f 的定义中得到了考虑。这里我们将其视为一个坐标变换。该坐标变换的特殊之处在于 x 的维数与 q 的维数不同。由此坐标变换我们可以找到局部元组变换函数(参见第 1.6.1 节)

约束系统的拉格朗日量可以通过将无约束系统的拉格朗日量与从约束坐标到无约束坐标的局部元组变换函数复合而得到:

约束仅出现在变换中。

为了说明这一点,我们将为第 1.6.2 节中引入的受驱摆寻找拉格朗日量。质量为 m 的自由粒子在垂直平面中、受重力加速度 g 作用的 T - V 拉格朗日量为

其中 y 测量质点的垂直高度。计算该拉格朗日量的程序为

(define ((L-uniform-acceleration m g) local)
  (let ((q (coordinate local))
        (v (velocity local)))
    (let ((y (ref q 1)))
      (- (* 1/2 m (square v)) (* m g y)))))

从广义坐标 到直角坐标的坐标变换为 x = l sin y = ys(t) - l cos ,其中 l 为摆长,ys 给出支架高度随时间的变化。有趣的是,驱动仅通过约束的指定而进入系统。实现此坐标变换的程序为

(define ((dp-coordinates l y_s) local)
  (let ((t (time local))
        (theta (coordinate local)))
    (let ((x (* l (sin theta)))
          (y (- (y_s t) (* l (cos theta)))))
      (up x y))))

利用 F->C 我们可以推导出局部元组变换,并通过复合定义受驱摆的拉格朗日量:

(define (L-pend m l g y_s)
  (compose (L-uniform-acceleration m g) 
           (F->C (dp-coordinates l y_s))))

拉格朗日量为

(show-expression
 ((L-pend 'm 'l 'g (literal-function 'y_s))
  (->local 't 'theta 'thetadot)))



这与第 1.6.2 节中得到的拉格朗日量相同。

我们发现了约束系统拉格朗日量一个非常有趣的分解。一部分由组成粒子的动能与势能之差构成。另一部分描述了特定系统构型的特有约束。

1.6.4 拉格朗日量不唯一

拉格朗日量与物理系统之间并非一一对应——多个拉格朗日量可用于描述同一个物理系统。在本节中,我们将通过证明在拉格朗日量中加上仅依赖于时间和坐标的函数的“全时间导数”不会改变平稳作用量的路径或从作用量原理导出的运动方程,来展示这一点。

全时间导数

首先解释我们所说的“全时间导数”的含义。令 F 为时间和坐标的函数。则 F 沿路径 q 的时间导数为

由于 F 仅依赖于时间和坐标,我们有

因此我们只需要 D[q] 的前两个分量

来构成乘积

其中 = I2 是一个选择函数:[72] c = (a, b, c),因此 Dq = o [q]。函数

称为 F 的全时间导数;它是一个关于三个参数的函数:时间、广义坐标和广义速度。

一般来说,局部元组函数 F 的全时间导数是一个函数 Dt F,当与局部元组路径复合时,它等于函数 F 与同一局部元组路径复合后的时间导数:

全时间导数 Dt F 显式地由下式给出

我们取所需数量的项以穷尽 F 的所有参数。

练习 1.25。Dt 的性质 全时间导数 Dt F 不是函数 F 的导数。尽管如此,全时间导数具有与导数许多共同的性质。证明 Dt 对于局部元组函数 FG、数 c 以及定义域包含 G 值域的函数 H 具有以下性质。

aDt (F + G) = Dt F + Dt G

bDt (cF) = c Dt F

cDt (F G) = F Dt G + (Dt F) G

dDt (H o G) = (D H o G ) Dt G

在拉格朗日量中加入全时间导数

考虑两个拉格朗日量 LL',它们相差一个仅依赖于时间和坐标的函数 F 的全时间导数

相应作用量积分为

变分原理指出,沿可实现轨迹的作用量积分关于在端点处保持构型不变的轨迹变分是平稳的。作用量积分 S[q](t1, t2) 和 S/[q](t1, t2) 相差一项

该项仅依赖于端点处的坐标和时间,而这些是不允许变动的。因此,如果 S[q](t1, t2) 对某条路径是平稳的,则 S/[q](t1, t2) 也是平稳的。因此,任一拉格朗日量都可以用来区分可实现路径。

在拉格朗日量中加入全时间导数不会影响给定路径的作用量是否取临界值。因此,如果两个拉格朗日量相差一个全时间导数,则相应的拉格朗日方程是等价的,相同的路径满足每一个。此外,全时间导数引入作用量中的额外项只出现在端点条件中,因此不影响从作用量变分导出的拉格朗日方程,所以拉格朗日方程是一样的。因此在拉格朗日量中加入全时间导数不会改变拉格朗日方程。

练习 1.26。全时间导数的拉格朗日方程 令 F(t, q) 是仅关于 tq 的函数,其全时间导数为

显式证明 Dt F 的拉格朗日方程恒为零,因此在拉格朗日量中加入 Dt F 不影响拉格朗日方程。

受驱摆为在拉格朗日量中加入全时间导数提供了一个很好的说明。受驱摆的运动方程(见第 1.6.2 节)

有一个有趣且富有启发性的解释:它与无驱动摆的运动方程相同,只是重力加速度 g 被增加了支点加速度 D2 ys。这种直观的解释在第 1.6.2 节中作为动能与势能之差推导出的拉格朗日量中并不明显。然而,我们可以写出一个具有相同运动方程的替代拉格朗日量,它与运动方程一样容易解释:

利用该拉格朗日量,可以明显看出加速支点的效果是修正了重力加速度。但请注意,它并不是动能与势能之差。让我们比较受驱摆的两个拉格朗日量。差值 L = L - L/ 为

L 中既不依赖于 也不依赖于 的两项不影响运动方程。剩余的两项是函数 F(t, ) = - m l Dys(t) cos 的全时间导数,该函数不依赖于 。在拉格朗日量中加入这样的项不影响运动方程。

全时间导数的识别

如果参数为 (t, q, v) 的局部元组函数 G 是函数 F(参数为 (t, q))的全时间导数,则 G 必须具有某些性质。

从方程 (1.112) 我们看到,G 必须关于广义速度是线性的

其中 G1 和 G0 都不依赖于广义速度:2 G1 = 2 G0 = 0。

如果 GF 的全时间导数,则 G1 = 1 FG0 = 0 F,因此

关于时间参数的偏导数没有结构,因此 0 1 F = 1 0 F。因此,如果 GF 的全时间导数,则

此外,G1 = 1 F,因此

如果存在多个自由度,这些偏导数实际上是关于每个坐标的偏导数结构。关于两个不同坐标的偏导数必须相同,与微分次序无关。因此 1 G1 必须是对称的。

注意,我们尚未证明这些条件是确定一个函数是否为全时间导数的充分条件,仅指出了它们是必要条件。

练习 1.27。识别全时间导数

对于以下每个函数,要么证明它不是全时间导数,要么给出可从中导出该函数的函数。

aG(t, x, vx) = m vx

bG(t, x, vx) = m vx cos t

cG(t, x, vx) = vx cos t - x sin t

dG(t, x, vx) = vx cos t + x sin t

eG(t; x, y; vx, vy) = 2 (x vx + y vy) cos t - (x2 + y2) sin t

fG(t; x, y; vx, vy) = 2 (x vx + y vy) cos t - (x2 + y2) sin t + y3 vx + x vy


61 记住 xv 只是拉格朗日量的形式参数。此处的 x 不是推导中先前使用的路径 x,尽管它可以是该路径在特定时刻的值。

62 我们总可以给函数提供不被使用的额外参数,以便它能够与具有相同形状的其他函数进行代数组合。

63 哈密顿在 1834-1835 年提出了适用于时间无关系统的基本变分原理。雅可比将此原理命名为“哈密顿原理”。对于受一般非定常约束的系统,哈密顿原理由奥斯特罗格拉茨基于 1848 年研究,在俄文文献中哈密顿原理常被称为哈密顿-奥斯特罗格拉茨基原理。

威廉·罗·哈密顿 (1805-1865) 是一位杰出的数学家。他在几何光学(基于费马原理)方面的早期工作令人印象深刻,以至于他还在读本科时就被选为三一学院天文学教授并担任爱尔兰皇家天文学家。他撰写了两部不朽的数学著作。他发现的四元数重振了抽象代数,并引发了物理学中矢量技术的发展。他 1835 年的论文“论动力学的一种通用方法”将变分力学建立在坚实的基础之上,最终赋予了 100 年前莫佩尔蒂含糊陈述的最小作用量原理以实质内容。哈密顿还写诗,并与华兹华斯保持广泛通信,华兹华斯建议他将精力投入数学写作而非诗歌。

除提出基本变分原理外,哈密顿还强调了几何光学与力学之间的类比,并强调了动量变量(由拉格朗日和柯西更早引入)的重要性,从而引出了第 3 章讨论的力学“正则”形式。

64 当应用于元组时,square 表示元组各分量平方之和。

65 如上述脚注 28 所述,过程 ->local 从时间、坐标和速度的初始片段构造局部元组。

66 见第 1.6.1 节。

67 我们希望您能欣赏这里 TEX 魔法的奥妙。带有下划线字符的符号会被 show-expression 转换为下标。带有脱字符号的符号、希腊字母的名称以及以“dot”结尾的符号也受到类似的特殊处理。

68 我们将直接接受具有刚性约束系统的牛顿方法,并找到等价的拉格朗日量。当然,实际物体从来不是真正刚性的,因此我们可能会疑问需要做哪些详细的近似才能将它们视为真正刚性的。例如,更令人满意的方法是将刚性距离约束替换为非常硬的弹簧。然后我们可以立即将拉格朗日量写为 L = T - V,并且我们应该能够 derive 具有刚性约束系统的牛顿方法作为近似。然而,在此阶段这过于复杂,因此我们接受牛顿的理想化。

69 该拉格朗日量纯粹是形式上的,并不代表约束力的模型。特别注意,约束项并不累积成为在约束恰好满足时具有最小值的势能。相反,拉格朗日量中的约束项在约束满足时为零,并且根据粒子间距是大于还是小于约束距离,它可以是正或负。

70 通常,x 的分量数等于 qc 的分量数之和;添加一个支撑杆会减少一个自由度并增加一个距离约束。然而,在某些奇异情况下,添加单个支撑杆可能减少多于一个自由度。我们在此不考虑奇异情况。

71 考虑一个函数 g(比如三个参数),令 g0 是一个两个参数的函数,满足 g0(x, y) = g(x, y, 0)。则 (0 g0)(x, y) = (0 g)(x, y, 0)。在某个参数中代入一个值与关于另一个不同参数取偏导数的操作是可交换的。在推导关于 q 的拉格朗日方程时,我们可以在拉格朗日量中设 c = l = 0,但在推导关于 c 的拉格朗日方程时不能这样做,因为我们必须对相应的参数取导数。

72 元组结构的分量,例如 [q](t) 的值,可以用选择器函数选取:Ii 从元组中获取下标为 i 的元素。