Physics · Mathematics · Lecture Notes
物理與數學講義

張量物理導論

An Introduction to Tensor Physics
從應力張量到時空曲率,以及貫穿其間的對稱結構——四元數、群論與最小作用量
對稱創造簡單,非對稱需要張量;
而對稱性,決定了動力學。
詳解增訂版 · ANNOTATED EDITION
主題 張量、應力、四元數、群論、規範對稱、拉格朗日力學
程度 高中銜接大學物理 / 工程數學 / 理論物理導引
特色 保留完整推導與中間步驟,關鍵定理附嚴格證明

導讀:本書的兩條主線

這本講義從一個看似單純的問題出發——「壓力是純量還是向量?」——再沿著它,一路走到時空曲率、量子自旋與規範對稱。表面上主題在變,底層卻只有一個信念貫穿始終:物理的形狀由對稱性決定。對稱創造簡單,非對稱才需要張量。

第一條線是「張量」(第一部):從應力張量切入,建立梯度、散度、旋度的張量本質,最後抵達廣義相對論。這條線回答「當方向之間互相耦合,該用什麼語言描述」。

第二條線是「對稱」(第二至六部):從複數與四元數的代數源頭出發,經由旋轉的夾擊乘法、向量分析的歷史抉擇,進入群論,最後在拉格朗日力學與最小作用量原理收束。這條線回答「為什麼物理定律會長成現在的樣子」。

兩條線在數個節點交會——梯度張量的 spin 分解(第六、十七章)、四元數與 SU(2) 的對應(第十八章)皆是。各章可獨立閱讀,但依序讀下來,會看見一個完整的故事:從一塊承受壓力的流體,到決定宇宙動力學的對稱群。標有「定理」與「證明」的方框,是為希望看到嚴格論證的讀者準備的,初讀可略過而不影響理解。

第一部張量的世界
力是向量,那壓力呢?這個問題會帶我們認識張量——一種描述「方向之間如何耦合」的語言,並一路通向時空的曲率。
第一章

壓力的本質:純量、向量,還是張量?

我們從一個看似簡單的問題出發:力是向量,那壓力呢?這個問題會一路帶我們走到張量。

1.1中文「壓力」混用了兩個概念

我們都知道力是向量,壓力理論上似乎也該有方向性,但教學上談壓力時往往不強調方向。這其實源自中文術語的混用——「壓力」同時指稱兩個不同的物理量:

術語本質是否為向量
壓力(接觸力意義)物體對接觸面施加的法向力是向量
壓強($P = F/A$)單位面積上的正向力大小是純量

這正是方向性被模糊的根源:當我們說「壓強是純量」時是對的,但「接觸壓力是向量」也是對的,兩者是不同的量。

1.2壓強為什麼是純量:等向性

壓強是純量並非教學偷懶,而是有深刻的物理原因。在靜態流體中,壓強具有等向性(isotropy):流體內任一點,不論你如何擺放一個面積元素 $dA$,該面上承受的力大小都是 $P\,dA$,方向永遠沿著那個面的法向量 $\hat{n}$:

$$d\vec{F} = P\,dA\,\hat{n}$$

關鍵洞見方向來自幾何(面的法向量 $\hat{n}$),而非來自 $P$ 本身。因此 $P$ 不需要攜帶方向資訊——它是純量,恰恰是因為它在所有方向上都相等。

用更底層的語言說:壓強是應力張量的等向部分(trace)。應力張量本身是二階張量,純靜水壓的應力張量恰好是 $-P\,\mathbf{I}$,其全部方向資訊都被單位矩陣 $\mathbf{I}$ 編碼了,所以剩下的 $P$ 才是純量。

1.3固體接觸壓力的方向為何被輕描淡寫

那固體接觸的「壓力」(向量意義)為什麼老師也不太強調方向?因為它的方向已被幾何決定——接觸面的壓力永遠垂直於接觸面,方向隱含在「法向」這個字裡。一旦你認出接觸面,方向就確定了,所以不需要額外強調。理論上它仍然是完整的向量。

1.4牛頓第三定律:壓力與正向力

物體壓地板的「壓力」與地板回推物體的「正向力」,正是牛頓第三定律的作用—反作用對:

物體 A ──── 壓力(A 對地板)────▶ 地板
地板 ──── 正向力(地板對 A)────▶ 物體 A

兩者大小相等、方向相反、作用於不同物體,都垂直於接觸面——這才是真正的第三定律對。

常見混淆靜止物體上,正向力與重力大小相等,很多人誤以為它們是第三定律對——不是。它們作用在同一個物體上,屬於平衡力對(第一定律),而非反作用力對。重力的真正反作用力是「物體對地球的引力」,兩者都是萬有引力,方向相反、分別作用在地球與物體上。

1.5液體中的應力:張量還是純量?

視描述層次而定——底層是張量,靜態特例退化為純量。完整的描述是 Cauchy 應力張量(二階對稱張量):

$$\boldsymbol{\sigma} = \begin{pmatrix} \sigma_{xx} & \sigma_{xy} & \sigma_{xz} \\ \sigma_{yx} & \sigma_{yy} & \sigma_{yz} \\ \sigma_{zx} & \sigma_{zy} & \sigma_{zz} \end{pmatrix}$$

對法向量為 $\hat{n}$ 的面元,受力是 $d\vec{F} = \boldsymbol{\sigma}\cdot\hat{n}\,dA$,方向不一定沿著 $\hat{n}$——這就是張量比純量豐富的地方。

靜止液體:張量退化為純量

靜態流體沒有剪應力,應力張量必須等向:

$$\boldsymbol{\sigma} = -P\,\mathbf{I} = \begin{pmatrix} -P & 0 & 0 \\ 0 & -P & 0 \\ 0 & 0 & -P \end{pmatrix} \quad\Longrightarrow\quad d\vec{F} = -P\,\hat{n}\,dA$$

力永遠沿 $-\hat{n}$(壓縮方向),大小永遠 $P\,dA$,與面的方向無關。整個張量被單一純量 $P$ 完全決定。

流動液體:純量不夠用

Newtonian 黏性流體的應力張量多了黏性項:

$$\boldsymbol{\sigma} = \underbrace{-P\,\mathbf{I}}_{\text{等向壓力項}} + \underbrace{\mu\!\left(\nabla\vec{v}+(\nabla\vec{v})^T\right) + \lambda(\nabla\cdot\vec{v})\mathbf{I}}_{\text{黏性應力張量}}$$

此時非對角項(剪應力)不為零,純量 $P$ 無法單獨描述應力狀態——這正是 Navier–Stokes 方程需要張量語言的原因。純量壓強的精確定義是應力張量的等向不變量:

$$P = -\tfrac{1}{3}\,\mathrm{tr}(\boldsymbol{\sigma}) = -\tfrac{1}{3}(\sigma_{xx}+\sigma_{yy}+\sigma_{zz})$$

1.6靜態 vs 流動:剪應力的出現

流體的定義就是「靜止時無法承受剪應力」——否則它會持續變形直到剪應力消失。所以:

應力類型靜態液體流動液體(黏性)
法向應力(對角)✓ 有(即壓強 $-P$)✓ 有
剪應力(非對角)✗ 為零(流體定義)✓ 有(黏性產生)
核心邏輯鏈流體靜止 → 無剪應力 → 應力張量等向 → 純量 $P$ 夠用。
流體流動 → 有剪應力 → 應力張量非等向 → 必須用完整張量。
理想流體($\mu=0$)→ 即使流動也無剪應力 → Euler 方程適用。
第二章

應力張量的結構與下標

理解 $\sigma_{ij}$ 兩個下標的意義,是掌握張量的第一道門檻。但在此之前,有一個更根本的問題:我們憑什麼斷定應力「是一個張量」?

定理 · Cauchy 應力定理(1822)

陳述:在連續體內任一點,作用於某面元的牽引向量 $\vec{t}(\hat{n})$(單位面積的力)是該面外法向量 $\hat{n}$ 的線性函數。因此存在唯一的二階張量 $\boldsymbol{\sigma}$,使得對任意方向 $\hat{n}$:

$$\vec{t}(\hat{n}) = \boldsymbol{\sigma}\cdot\hat{n}, \qquad t_i = \sigma_{ij}\,n_j$$

證明(四面體論證)

取一個無窮小四面體,三個面落在座標平面上(外法向分別為 $-\hat{e}_1, -\hat{e}_2, -\hat{e}_3$,面積記為 $dA_1, dA_2, dA_3$),第四個斜面外法向為 $\hat{n}$、面積為 $dA$。由投影幾何,三個座標面是斜面在各軸的投影,故 $dA_i = n_i\,dA$。

對四面體用牛頓第二定律。表面力是各面牽引向量乘面積之和(座標面上牽引為 $\vec{t}(-\hat{e}_i) = -\vec{t}(\hat{e}_i)$);另有體力與慣性項。設四面體線度為 $\ell$,則表面積 $\propto \ell^2$,而體積(體力與 $m\vec{a}$)$\propto \ell^3$。令 $\ell\to 0$,體積項以更高階消失,表面力必須自相平衡:

$$\vec{t}(\hat{n})\,dA - \vec{t}(\hat{e}_1)\,dA_1 - \vec{t}(\hat{e}_2)\,dA_2 - \vec{t}(\hat{e}_3)\,dA_3 = 0$$

代入 $dA_i = n_i\,dA$ 並消去 $dA$:

$$\vec{t}(\hat{n}) = \sum_j \vec{t}(\hat{e}_j)\,n_j$$

定義 $\sigma_{ij} \equiv \big(\vec{t}(\hat{e}_j)\big)_i$(即法向為 $\hat{e}_j$ 的面上,牽引向量的第 $i$ 分量),即得 $t_i = \sigma_{ij}n_j$。由於 $\vec{t}$ 與 $\hat{n}$ 都是向量、此關係在任何座標系皆成立,$\sigma_{ij}$ 必依二階張量法則變換。

這個定理是整章的地基:它告訴我們,描述「任意切面上的受力」不需要記錄無窮多個方向的資料,只要九個數 $\sigma_{ij}$ 就完全決定了。接下來逐一拆解這九個數的意義。

2.1下標的意義

$\sigma_{ij}$ 的兩個下標各代表一件事:第一個下標 $i$ 是面的法向方向,第二個下標 $j$ 是力的作用方向

$$\sigma_{\underset{\text{面的法向}}{i}\,\underset{\text{力的方向}}{j}}$$

所以 $\sigma_{xy}$ 的意思是:「法向量指向 $x$ 方向的面(即 $yz$ 平面那一面)上,沿 $y$ 方向的應力分量」。

2.2立方體的 9 個分量

把應力張量畫在一個立方體元素上,9 個分量分成兩類:

2.3法向應力與剪應力的分解

對任意面元(法向量 $\hat{n}$),作用其上的牽引向量(traction)是 $\vec{t} = \boldsymbol{\sigma}\cdot\hat{n}$。這個向量一般不平行於 $\hat{n}$,可分解為兩部分:

$$\vec{t} = \underbrace{(\vec{t}\cdot\hat{n})\,\hat{n}}_{\text{法向應力 }\sigma_n} + \underbrace{\vec{t} - (\vec{t}\cdot\hat{n})\,\hat{n}}_{\text{剪應力 }\tau}$$

2.4為什麼 $\sigma_{xx}$、$\sigma_{yx}$、$\sigma_{zx}$ 要區分?

這是理解張量的關鍵。三者的力都指向 $x$ 方向,但描述的是「切出哪個面,才能看到這個 $x$ 方向的力?

分量切面法向量力的方向物理意義
$\sigma_{xx}$$x$ 面$x$ 方向法向壓縮/拉伸
$\sigma_{yx}$$y$ 面$x$ 方向$y$ 面上的剪切
$\sigma_{zx}$$z$ 面$x$ 方向$z$ 面上的剪切

這三個值可以完全不同。以 Couette 流(兩板間流體,上板移動)為例:

$$\sigma_{yx} = \mu\frac{dv_x}{dy} \neq 0, \qquad \sigma_{xx} = 0, \qquad \sigma_{zx} = 0$$

即使「方向都是 $x$」,數值截然不同。

直覺說法$\sigma_{yx}$ 的意思是:「如果你用 $y$ 方向的刀切開這個物體,切面上會感受到多少 $x$ 方向的力?」改變切的方向,感受到的力就不同。純量只能記一個數,向量只能記一個方向,而應力需要同時指定「切哪個面」與「問哪個方向的力」,所以必須用張量。

2.5對稱性:9 個減為 6 個

由角動量守恆可證 $\sigma_{ij} = \sigma_{ji}$(張量對稱),所以獨立分量只有 6 個:

$$\sigma_{xx},\ \sigma_{yy},\ \sigma_{zz},\quad \sigma_{xy},\ \sigma_{xz},\ \sigma_{yz}$$

證明(角動量平衡)

取邊長 $\ell$ 的立方體元素,計算繞 $z$ 軸的力矩。剪應力 $\sigma_{xy}$($x$ 面上沿 $y$ 方向的力)在一對相對面上形成力偶,貢獻力矩 $\sigma_{xy}\cdot(\ell^2)\cdot\ell$;剪應力 $\sigma_{yx}$($y$ 面上沿 $x$ 方向)形成反向力偶 $\sigma_{yx}\cdot(\ell^2)\cdot\ell$。淨力矩使元素產生角加速度:

$$(\sigma_{xy} - \sigma_{yx})\,\ell^3 = I\dot{\omega} \propto \rho\,\ell^5\,\dot{\omega}$$

轉動慣量 $I\propto\ell^5$,力矩 $\propto\ell^3$。令 $\ell\to 0$,右邊以 $\ell^5$ 階消失,遠快於左邊的 $\ell^3$;除非 $\sigma_{xy}=\sigma_{yx}$,否則角加速度 $\dot\omega\propto\ell^{-2}\to\infty$,物理上不可能。故 $\sigma_{xy}=\sigma_{yx}$,同理 $\sigma_{ij}=\sigma_{ji}$。

靜態液體更進一步退化:6 個獨立分量全被同一純量 $P$ 決定。

2.6接觸面的統一:正向力與摩擦力是同一個張量

這一節把前面所有概念拉回到高中最熟悉的場景——一塊放在桌面上的木塊。高中物理把接觸面上的作用拆成兩個「不同的力」:垂直於面的正向力 $F_N$,與平行於面的摩擦力 $F_f$。但從應力張量的角度看,它們從來就不是兩個獨立的東西。

由 Cauchy 定理,接觸面(外法向 $\hat{n}$)上的牽引向量是 $\vec{t} = \boldsymbol{\sigma}\cdot\hat{n}$。把它分解成法向與切向兩部分:

$$\vec{t} = \underbrace{\sigma_{nn}\,\hat{n}}_{\text{法向 → 正向力}} + \underbrace{\vec{\tau}}_{\text{切向 → 摩擦力}}, \qquad \sigma_{nn} = \hat{n}\cdot\boldsymbol{\sigma}\cdot\hat{n}, \quad \vec{\tau} = \vec{t} - \sigma_{nn}\hat{n}$$

對整個接觸面積分,就得到巨觀的兩個力:

$$F_N = \iint \sigma_{nn}\,dA, \qquad \vec{F}_f = \iint \vec{\tau}\,dA$$

關鍵洞見正向力與摩擦力是同一個牽引向量 $\vec{t}$ 的法向分量與切向分量,由同一個應力張量 $\boldsymbol{\sigma}$ 決定。它們的「互相獨立」感,是巨觀積分後丟失了方向細節造成的錯覺。高中之所以用兩個力描述一個面,只是因為它沒有追蹤每一點的完整方向資訊——而那正是張量在做的事。

庫侖摩擦定律其實是應力分量的約束

高中教的 $|\vec{F}_f| \leq \mu |\vec{F}_N|$ 是巨觀積分後的版本。連續體層次的表述是逐點成立的莫爾–庫侖準則(Mohr–Coulomb criterion)

$$|\vec{\tau}| \leq \mu\,\sigma_{nn}$$

這個不等式在「莫爾圓」上有極美的幾何意義。先嚴格推導莫爾圓:

莫爾圓推導(二維)

設在主軸座標系中應力張量已對角化,主應力為 $\sigma_1, \sigma_2$。考慮一個切面,其法向量與第一主軸夾角 $\theta$,即 $\hat{n} = (\cos\theta, \sin\theta)$。計算法向應力與剪應力:

$$\sigma_{nn} = \hat{n}\cdot\boldsymbol{\sigma}\cdot\hat{n} = \sigma_1\cos^2\theta + \sigma_2\sin^2\theta$$

用倍角公式 $\cos^2\theta = \tfrac{1+\cos 2\theta}{2}$、$\sin^2\theta = \tfrac{1-\cos 2\theta}{2}$ 整理:

$$\sigma_{nn} = \frac{\sigma_1+\sigma_2}{2} + \frac{\sigma_1-\sigma_2}{2}\cos 2\theta$$

同理,切向分量的大小為:

$$\tau = \frac{\sigma_1-\sigma_2}{2}\sin 2\theta$$

這對 $(\sigma_{nn}, \tau)$ 滿足 $\left(\sigma_{nn} - \tfrac{\sigma_1+\sigma_2}{2}\right)^2 + \tau^2 = \left(\tfrac{\sigma_1-\sigma_2}{2}\right)^2$——這是一個:圓心在 $\big(\tfrac{\sigma_1+\sigma_2}{2}, 0\big)$,半徑 $R = \tfrac{\sigma_1-\sigma_2}{2}$。當切面方向 $\theta$ 改變時,$(\sigma_{nn}, \tau)$ 就沿著這個圓移動。

在 $\sigma_{nn}$–$\tau$ 平面上畫出這個莫爾圓,再畫一條過原點、斜率為 $\mu = \tan\phi$ 的直線($\phi$ 是摩擦角),庫侖準則的幾何意義就一目了然:

高中概念連續體對應在應力張量的哪裡
正向力 $F_N$法向應力 $\sigma_{nn}$ 的面積分$\hat{n}$ 方向的對角分量
摩擦力 $F_f$剪應力 $\vec{\tau}$ 的面積分非對角(切向)分量
庫侖定律 $F_f \leq \mu F_N$Mohr–Coulomb $|\vec{\tau}|\leq\mu\sigma_{nn}$兩類分量之間的約束

同一個結構,遍布物理

這個框架遠遠超出桌面上的木塊:地質斷層的地震,就是岩石接觸面上剪應力超過 Mohr–Coulomb 準則的那一刻,地質學家用莫爾圓預測哪個走向的斷層最易滑動;土壤力學的地基承載分析用同一套,只是多了黏聚力 $c$($|\vec{\tau}|\leq c + \mu\sigma_{nn}$);金屬切削中,刀具界面的正向應力決定刀具壽命、剪應力決定切削力,兩者由同一個接觸應力張量描述。

這正是 Cauchy 1822 年的洞見值得一提的是,Cauchy 在 1822 年提出應力理論時,最關鍵的一步正是認識到「接觸面上的內力不一定垂直於該面,也不是各方向都相同」——換句話說,牽引向量同時含有法向與切向分量。你在教學現場重新想到的這個統一,正是兩百年前連續體力學誕生時的那塊基石。詳見第九章。
第三章

張量微積分:梯度、散度、旋度

$\nabla$ 算符如何升降張量階數?散度與旋度又是什麼的「切片」?這章補上完整證明。

3.1向量場的梯度是二階張量

對向量場 $\vec{F} = (F_x, F_y, F_z)$,它的梯度是:

$$(\nabla\vec{F})_{ij} = \frac{\partial F_i}{\partial x_j}$$

這是一個 $3\times3$ 的二階張量,結構與應力張量相同。散度與旋度都是從這個張量「拆解」出來的。

3.2梯度是張量:完整的座標變換證明

判準是座標變換法則。在旋轉變換 $x'_i = R_{ij}x_j$($R$ 正交,$R^T = R^{-1}$)下,各階張量的變換法則為:

$$\text{rank-0:}\ \phi'=\phi, \qquad \text{rank-1:}\ v'_i = R_{ij}v_j, \qquad \text{rank-2:}\ T'_{ij} = R_{ik}R_{jl}T_{kl}$$

規律:每多一個自由下標,就多一個 $R$ 作用其上。

第一步 · 確立 ∇ 是向量算符

從 $x'_i = R_{ij}x_j$ 反解得 $x_j = R_{ij}x'_i$(因為 $x = R^T x'$,而 $(R^T)_{ji} = R_{ij}$),故:

$$\frac{\partial x_j}{\partial x'_i} = R_{ij}$$

代入連鎖律,得到偏微分算符的變換法則:

$$\frac{\partial}{\partial x'_i} = \sum_j \frac{\partial x_j}{\partial x'_i}\frac{\partial}{\partial x_j} = \sum_j R_{ij}\frac{\partial}{\partial x_j}$$

這與向量變換 $v'_i = R_{ij}v_j$ 完全相同。因此 $\nabla = \partial/\partial x_i$ 是 rank-1 向量算符。

第二步 · ∇φ 是 rank-1 張量

已知 $\phi$ 是純量($\phi'(x') = \phi(x)$)。令 $g_i = \partial\phi/\partial x_i$,$g'_i = \partial\phi/\partial x'_i$。由連鎖律:

$$g'_i = \frac{\partial\phi}{\partial x'_i} = \sum_j \frac{\partial x_j}{\partial x'_i}\cdot\frac{\partial\phi}{\partial x_j} = \sum_j R_{ij}g_j$$

$$\boxed{g'_i = R_{ij}g_j}$$ 符合 rank-1 變換法則。$\therefore\ \nabla\phi$ 是向量。$\square$

第三步 · ∇F 是 rank-2 張量

已知 $F_i$ 是向量($F'_i = R_{ik}F_k$)。令 $T_{ij} = \partial F_i/\partial x_j$。用第一步把 $\partial/\partial x'_j$ 換掉,再把 $F'_i = R_{ik}F_k$ 代入($R$ 為常數矩陣可移出微分):

$$T'_{ij} = \frac{\partial F'_i}{\partial x'_j} = \sum_l R_{jl}\frac{\partial}{\partial x_l}(R_{ik}F_k) = \sum_{k,l} R_{ik}R_{jl}\frac{\partial F_k}{\partial x_l}$$

$$\boxed{T'_{ij} = R_{ik}R_{jl}T_{kl}}$$ 符合 rank-2 變換法則。$\therefore\ \nabla\vec{F}$ 是二階張量。$\square$

3.3階數升降與縮并證明

總規律$\nabla$ 是 rank-1 算符,作用一次使階數 $+1$;縮并(對相同下標求和)使階數 $-2$。

以散度為例,令 $S = T_{ii}$(對角求和),證明它是純量:

$$S' = T'_{ii} = \sum_i R_{ik}R_{il}T_{kl} = \sum_{k,l}\underbrace{\Big(\sum_i R_{ik}R_{il}\Big)}_{(R^TR)_{kl}\,=\,\delta_{kl}} T_{kl} = \sum_k T_{kk} = S$$

正交性 $R^TR = I$ 在此把兩個自由下標「抵消」成零,使跡成為不變量。

3.4散度 = 取跡

$$\nabla\cdot\vec{F} = \frac{\partial F_x}{\partial x}+\frac{\partial F_y}{\partial y}+\frac{\partial F_z}{\partial z} = \mathrm{tr}(\nabla\vec{F})$$

把二階張量壓縮成零階純量,與壓強是應力張量之跡的邏輯完全相同。

3.5旋度 = 反對稱部分的編碼

二階張量可分解為對稱與反對稱部分。反對稱部分有三個獨立分量:

$$\Omega_{ij} = \frac{1}{2}\!\left(\frac{\partial F_i}{\partial x_j} - \frac{\partial F_j}{\partial x_i}\right)$$

旋度透過 Levi-Civita 符號 $\varepsilon_{ijk}$(三階全反對稱張量)把這個反對稱矩陣打包成向量:

$$(\nabla\times\vec{F})_k = \varepsilon_{ijk}\frac{\partial F_j}{\partial x_i}$$

為何旋度只在三維「好用」反對稱 $3\times3$ 矩陣恰有 3 個獨立分量,與三維向量數目相同,才能打包成向量。二維反對稱 $2\times2$ 只有 1 個獨立分量 → 旋度退化成純量;四維反對稱 $4\times4$ 有 6 個獨立分量,無法包成向量 → 旋度必須用反對稱二階張量表示。這正是廣義相對論與電動力學中電磁場張量 $F_{\mu\nu}$ 的由來。

整個結構一覽:

$$\underbrace{\nabla\vec{F}}_{\text{二階張量}} \longrightarrow \begin{cases} \text{跡} &\to\ \nabla\cdot\vec{F}\ \text{(純量)} \\ \text{對稱部分} &\to\ \text{應變率張量} \\ \text{反對稱部分} &\to\ \nabla\times\vec{F}\ \text{(向量)} \end{cases}$$

第四章

正交矩陣:張量語言的基石

為什麼整套張量理論都建立在 $R^TR = I$ 這一行定義上?

4.1數學定義

正交矩陣 $R$ 的核心定義只有一行:

$$\boxed{R^TR = I} \quad\Longleftrightarrow\quad R^T = R^{-1}$$

4.2從定義推導性質

推論一 · 行向量構成標準正交基

設 $R$ 第 $j$ 行為 $\vec{r}_j$,則 $(R^TR)_{ij} = \vec{r}_i\cdot\vec{r}_j = \delta_{ij}$,即各行向量互相垂直且為單位長。

推論二 · 行列式為 ±1

取行列式:$\det(R^T)\det(R) = \det(I) = 1$。因 $\det(R^T)=\det(R)$,故 $[\det(R)]^2 = 1 \Rightarrow \det(R) = \pm 1$。

推論三 · 保持長度與夾角

$(R\vec{u})\cdot(R\vec{v}) = \vec{u}^T R^TR\,\vec{v} = \vec{u}\cdot\vec{v}$。內積不變 $\Rightarrow$ 長度 $|R\vec{u}|=|\vec{u}|$、夾角不變。

4.3物理含義:空間的剛性變換

$R^TR = I$ 在幾何上意味著變換前後任意兩點距離不變:

$$|R\vec{x} - R\vec{y}|^2 = (\vec{x}-\vec{y})^T R^TR\,(\vec{x}-\vec{y}) = |\vec{x}-\vec{y}|^2$$

這正是直覺上「不拉伸、不壓縮」的剛性運動,具體分兩類:

$\det(R)=+1$$\det(R)=-1$
幾何操作純旋轉旋轉 + 鏡射
手性保持(右手系→右手系)翻轉(右手系→左手系)
群名稱$SO(n)$(特殊正交群)$O(n)\setminus SO(n)$

4.4具體的 2D 例子

旋轉角 $\theta$ 的矩陣:

$$R(\theta) = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$$

驗證 $R^TR = I$:

$$R^TR = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix}\!\begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\ \checkmark$$

且 $\det R = \cos^2\theta + \sin^2\theta = 1$,確為旋轉。

4.5與張量討論的連結

第三章的推導有兩處用到正交性:

一句話總結正交矩陣的數學本質是「列向量構成標準正交基」;物理本質是「不拉伸、不壓縮空間的剛性線性變換」(旋轉或鏡射)。正是這個性質使「換座標架、物理量不變」成為可能——也就是張量定義的基礎。
第五章

物理場的例子:梯度與旋度

從電場到颱風,從導熱到時空——梯度與旋度的具體面貌。

5.1純量梯度 → 向量場

所有保守場都有統一骨架,負號是「往低位走」的物理體現:

$$\underbrace{\phi(\vec{r})}_{\text{純量場}} \xrightarrow{\ -\nabla\ } \underbrace{\vec{F}(\vec{r})}_{\text{物理向量場}}$$

純量 $\phi$物理向量場定律名稱
電位 $V$$\vec{E} = -\nabla V$電磁學基本關係
重力位 $\Phi = gz$$\vec{g} = -\nabla\Phi$萬有引力
溫度 $T$$\vec{q} = -\kappa\nabla T$Fourier 導熱定律
壓力 $P$$\vec{F}/V = -\nabla P$Euler 方程壓力項

5.2梯度永遠垂直於等值面

沿等值面移動時 $d\phi = \nabla\phi\cdot d\vec{l} = 0$,所以 $\nabla\phi \perp d\vec{l}$。等值面越密集,梯度越大——這就是為何電荷附近電場最強。

5.3旋度不為零的四個例子

① 剛體旋轉:旋度 = 2ω

$\vec{v} = \omega(-y, x, 0)$ 的旋度:

$$(\nabla\times\vec{v})_z = \frac{\partial v_y}{\partial x} - \frac{\partial v_x}{\partial y} = \omega - (-\omega) = 2\omega$$

為何是 2 倍?用「槳輪實驗」理解:把小十字槳輪放入流體,它的自轉角速度等於 $\frac{1}{2}\nabla\times\vec{v} = \omega$,與流場整體旋轉同步。因子 2 是旋度定義帶來的——旋度是局部自轉率的兩倍。這直接連結到 $\nabla\times\vec{v}$ 正是速度梯度張量反對稱部分的軸向量。

② 自由渦(無旋渦):最深刻的悖論

$\vec{v} = \frac{\Gamma}{2\pi}\frac{\hat\phi}{r}$ 的旋度,在奇點之外:

$$\frac{\partial v_y}{\partial x} - \frac{\partial v_x}{\partial y} = \frac{y^2-x^2}{r^4} - \frac{y^2-x^2}{r^4} = 0$$

兩項精確相消,旋度為零。把槳輪放入這個渦流,它只繞圈公轉、自身不旋轉。但繞中心一圈的環流量 $\oint\vec{v}\cdot d\vec{l} = \Gamma \neq 0$!

矛盾在哪?Stokes 定理說 $\oint\vec{v}\cdot d\vec{l} = \iint(\nabla\times\vec{v})\cdot d\vec{A}$。答案是奇點 $r=0$ 處有 Dirac δ 函數的旋度:$\nabla\times\vec{v} = \Gamma\,\delta^{(2)}(\vec{r})$。這是拓撲障礙,域不是單連通的。

③ 直線電流磁場:Ampère 定律

$$\nabla\times\vec{B} = \mu_0\vec{J}$$

截面外 $\vec{J}=0$,故 $\nabla\times\vec{B}=0$;但 $\vec{B}\neq 0$!與②一樣存在拓撲障礙:無法定義全局純量位使 $\vec{B} = -\nabla\phi$,因為繞導線一圈的積分永遠不為零。這個結構在量子力學中引發 Aharonov–Bohm 效應——帶電粒子即使永不進入有 $\vec{B}$ 的區域,仍能感受到導線的存在。

④ Couette 剪切流:連結黏性張量

$\vec{v} = (Uy/h, 0, 0)$,旋度:

$$(\nabla\times\vec{v})_z = -\frac{\partial v_x}{\partial y} = -\frac{U}{h}$$

這個均勻旋度正是速度梯度張量的反對稱部分。黏性應力 $\tau_{yx} = \mu\,dv_x/dy$ 的產生根源就是它——每個流體微元都在旋轉,相鄰微元間的相對旋轉摩擦出剪切力。

5.4Helmholtz 分解定理

任何足夠光滑的向量場都可唯一分解:

$$\vec{F} = \underbrace{-\nabla\phi}_{\substack{\text{無旋部分}\\\nabla\times\vec{F}=0}} + \underbrace{\nabla\times\vec{A}}_{\substack{\text{無散部分}\\\nabla\cdot\vec{F}=0}}$$

能寫成純量位 $-\nabla\phi$ 的充要條件是 $\nabla\times\vec{F} = 0$(保守場)。靜電場、地球重力場滿足此條件,磁場與黏性流速場一般不滿足。

第六章

梯度張量的完整三重分解

「散度加旋度」並不等於梯度張量的全部——還缺 5 個分量。

6.1分量數量對不上

$\nabla\vec{F}$ 是 9 個獨立分量的二階張量,但:

$$\nabla\cdot\vec{F}\ (\text{純量}) + \nabla\times\vec{F}\ (\text{向量}) = 1 + 3 = 4 \text{ 個分量}$$

$9 \neq 4$,還差 5 個分量,這部分既非散度也非旋度。

6.2三重分解

$$\frac{\partial F_i}{\partial x_j} = \underbrace{\tfrac{1}{3}(\nabla\cdot\vec{F})\delta_{ij}}_{\text{等向部分(1)}} + \underbrace{\tfrac{1}{2}\!\left(\tfrac{\partial F_i}{\partial x_j}-\tfrac{\partial F_j}{\partial x_i}\right)}_{\text{反對稱部分(3)}} + \underbrace{\tfrac{1}{2}\!\left(\tfrac{\partial F_i}{\partial x_j}+\tfrac{\partial F_j}{\partial x_i}\right)-\tfrac{1}{3}(\nabla\cdot\vec{F})\delta_{ij}}_{\text{無跡對稱部分(5)}}$$

部分數學結構對應量分量數
等向部分$\propto\delta_{ij}$散度 $\nabla\cdot\vec{F}$1
反對稱部分$A_{ij}=-A_{ji}$旋度 $\nabla\times\vec{F}$3
無跡對稱部分$S_{ij}=S_{ji}$, $\mathrm{tr}=0$純剪切/應變(無低階對應)5

6.3第三部分的物理意義

在流體力學中,速度梯度張量的三部分各司其職:

∇v(速度梯度張量)
 ├─ 等向部分 ───────→ 體積膨脹/壓縮率(∇·v)
 ├─ 反對稱部分 ──────→ 剛性自轉(渦度 = ½∇×v)
 └─ 無跡對稱部分 ────→ 純剪切變形(不旋轉、不改體積)

第三部分驅動的是無旋轉的純形變——把圓球拉成橢球,但不旋轉、不改體積。這無法用散度(改體積)或旋度(旋轉)描述。

6.4與應力張量的完美對應

這不是巧合——黏性應力張量結構完全一樣:

$$\boldsymbol{\sigma} = \underbrace{-P\,\mathbf{I}}_{\text{等向(散度類)}} + \underbrace{\mu\!\left(\nabla\vec{v}+(\nabla\vec{v})^T\right) - \tfrac{2\mu}{3}(\nabla\cdot\vec{v})\mathbf{I}}_{\text{黏性偏差應力(無跡對稱)}}$$

黏性耗散的來源正是這個無跡對稱部分,而非旋度部分(旋轉不耗散能量)。

6.5群論視角

在三維旋轉群 $SO(3)$ 下,二階張量分解為三個不可約表示:

$$\text{rank-2} = \underbrace{\text{自旋-0}}_{\text{純量,1維}} \oplus \underbrace{\text{自旋-1}}_{\text{(偽)向量,3維}} \oplus \underbrace{\text{自旋-2}}_{\text{對稱無跡,5維}}$$

深層意義散度是自旋-0,旋度是自旋-1,而無跡對稱部分是自旋-2——它是張量特有的結構,在向量語言中根本沒有對應物。這正是為什麼描述完整的應力或應變時,必須用張量而不能只用散度加旋度。
第七章

物理中的張量大觀

按階數巡禮:從慣性張量到黎曼曲率張量。

階數張量方程領域獨立分量
0溫度、壓力、質量所有領域1
1力、速度、電場$F'_i=R_{ij}F_j$力學、電磁3
2應力張量 $\sigma_{ij}$$dF_i=\sigma_{ij}n_j\,dA$連續體力學6
2慣性張量 $I_{ij}$$L_i=I_{ij}\omega_j$剛體力學6
2介電張量 $\varepsilon_{ij}$$D_i=\varepsilon_{ij}E_j$晶體光學6
2電磁場張量 $F_{\mu\nu}$$\partial_\mu F^{\mu\nu}=\mu_0 J^\nu$狹義相對論6
2能量動量張量 $T_{\mu\nu}$$G_{\mu\nu}=\frac{8\pi G}{c^4}T_{\mu\nu}$廣義相對論10
3壓電張量 $d_{ijk}$$P_i=d_{ijk}\sigma_{jk}$固態物理18
4彈性張量 $C_{ijkl}$$\sigma_{ij}=C_{ijkl}\varepsilon_{kl}$固體力學21
4黎曼曲率張量 $R_{\mu\nu\rho\sigma}$廣義相對論20

7.1慣性張量:陀螺進動的根源

$\vec{L} = \mathbf{I}\,\vec{\omega}$,其中 $I_{ij} = \int\rho(|\vec{r}|^2\delta_{ij} - r_ir_j)\,dV$。對稱物體 $\mathbf{I} = I\,\mathbf{1}$,$\vec{L}\parallel\vec{\omega}$;非對稱物體 $\vec{L}$ 與 $\vec{\omega}$ 方向不同——這種「輸入一個方向、輸出另一方向」的映射必須用張量描述。陀螺進動正是 $\vec{L}$ 追不上 $\vec{\omega}$ 所致。

7.2電磁場張量:E 與 B 的統一

$$F_{\mu\nu} = \begin{pmatrix} 0 & -E_x/c & -E_y/c & -E_z/c \\ E_x/c & 0 & -B_z & B_y \\ E_y/c & B_z & 0 & -B_x \\ E_z/c & -B_y & B_x & 0 \end{pmatrix}$$

電場在時間—空間軸上,磁場在空間—空間軸上。E 與 B 其實是同一張量在不同參考系下的切片——高速運動的觀察者看到純電場,靜止觀察者看到磁場分量。四條 Maxwell 方程壓縮為兩條張量方程。

7.3彈性張量:廣義 Hooke 定律

$\sigma_{ij} = C_{ijkl}\varepsilon_{kl}$ 是 rank-2 → rank-2 的映射,需要 rank-4 橋梁。理論上 81 個分量,經對稱性逐步減少:

$$81 \xrightarrow{\sigma\text{對稱}} 54 \xrightarrow{\varepsilon\text{對稱}} 36 \xrightarrow{\text{能量守恆}} 21$$

各向同性材料降到 2 個常數(Lamé $\lambda,\mu$),退化為 $\sigma_{ij} = \lambda(\nabla\cdot\vec{u})\delta_{ij} + 2\mu\varepsilon_{ij}$,正是應力張量的等向項加偏差項。

7.4廣義相對論:幾何即物理

Einstein 場方程 $G_{\mu\nu} = \frac{8\pi G}{c^4}T_{\mu\nu}$ 是兩個 rank-2 張量相等:左邊由黎曼張量(rank-4)縮并兩次得到,描述時空幾何曲率;右邊 $T_{\mu\nu}$ 的對角元素 $T_{00}$ 是能量密度,空間部分 $T_{ij}$ 正是應力張量。黎曼張量的不可消去性是時空真正彎曲(無法用座標變換拉平)的判準。

7.5統一觀點

本質所有這些張量都描述「不同方向有不同回應」的物理關係。系統等向時退化為純量,只在一個方向特殊時退化為向量;唯有當不同方向有本質不同的行為,張量才展現不可替代的描述能力。
第八章

方向耦合、等向性與物理量分類

高中物理的「方向獨立」,其實是張量在高對稱下的退化特例。

8.1高中物理是特例

$F_x = ma_x$、$F_y = ma_y$ 隱含質量張量為對角矩陣:

$$\begin{pmatrix}F_x\\F_y\\F_z\end{pmatrix} = \begin{pmatrix}m&0&0\\0&m&0\\0&0&m\end{pmatrix}\begin{pmatrix}a_x\\a_y\\a_z\end{pmatrix}$$

非對角項一旦出現,方向就耦合:一個方向的輸入產生另一方向的回應。

8.2主軸與對角化

對所有實對稱張量,譜定理保證存在一組主軸使其對角化:

$$\mathbf{T} = \mathbf{R}\begin{pmatrix}\lambda_1&&\\&\lambda_2&\\&&\lambda_3\end{pmatrix}\mathbf{R}^T$$

在主軸座標系中方向解耦。高中教「選座標軸」,其實是不自覺地尋找主軸。

8.3拋體運動的解耦:根源是空間等向性

這裡有重要區分。拋體運動的質量張量 $m\mathbf{I}$ 正比於單位矩陣,在任何座標系下都是對角的——不管旋轉幾度,非對角項都是零。這不是「選對主軸」,而是空間等向性所決定。選 $y$ 軸朝上只是讓重力分解漂亮(使 $F_x=0$)。即使旋轉 45°,方程仍解耦:

標準選軸(y 朝上)旋轉 45° 座標
x 方向$a_x = 0$$a_{x'} = -g/\sqrt{2}$
y 方向$a_y = -g$$a_{y'} = -g/\sqrt{2}$
方向耦合?✗(仍解耦)

但真實世界確實有耦合,一旦放寬近似:

8.4物理量的等向性分類

性質例子
A本質純量,永遠等向溫度、質量、電荷、密度、熵、靜態壓力
B本質向量,有方向不耦合力、動量、加速度、真空電磁場
C依介質而定(純量或張量)介電 $\varepsilon$、電導 $\sigma$、熱導 $\kappa$、擴散 $D$、有效質量 $m^*$
D本質張量,永遠各向異性應力、應變、慣性、彈性、電磁場、曲率張量

群 C 的退化規律

群 C、D 的張量在足夠高對稱時,非對角項逐漸消失:

$$\text{球對稱} \to \text{純量 }(\lambda\mathbf{I}) \quad\to\quad \text{軸對稱} \to 2\text{ 個} \quad\to\quad \text{三斜(最低)} \to 21\text{ 個}$$

8.5是誰打破了等向性

關鍵打破等向性的永遠是物質的內部結構(晶格週期性、纖維排列、質量分佈),不是空間本身。空間的等向性(Noether 定理:旋轉對稱 → 角動量守恆,時間平移 → 能量守恆)保證了質量是純量、動量是向量、能量是純量、各分量獨立。

群 C 揭示了「純量是張量的退化特例」:

$$\underbrace{\lambda_1\hat{e}_1\hat{e}_1 + \lambda_2\hat{e}_2\hat{e}_2 + \lambda_3\hat{e}_3\hat{e}_3}_{\text{一般張量(三個不同特徵值)}} \xrightarrow{\lambda_1=\lambda_2=\lambda_3} \underbrace{\lambda\mathbf{I}}_{\text{純量 × 單位矩陣}}$$

第九章

認識論反思:張量為何難以發現

人類的測量直覺偏好「同向因果」,而耦合恰恰違反這個本能。

9.1「同向因果」的直覺根源

函數的基本概念是 $y = f(x)$,輸入一個數、輸出一個數。推廣到向量時,最自然的想法是各方向獨立,像三條互不干擾的 $y = f(x)$。更深的原因是測量的設計邏輯:實驗者傾向控制一方向輸入、量同方向輸出,因為最乾淨。若回應跑到別的方向,第一反應是「哪裡出錯」而非「這是新物理」。加上日常物體多近似等向,使「同向因果」根深蒂固。

9.2歷史上迫使張量出現的實驗

年份發現違反直覺之處
1669雙折射(Bartholin)一束光入射,兩束不同方向的光射出(冰洲石)
1827泊松比(Poisson)$x$ 方向拉伸 → $y, z$ 方向收縮
19 世紀陀螺進動$z$ 方向扭矩 → $x$ 方向運動
1879霍爾效應(Hall)$x$ 方向電流 → $y$ 方向電壓
1880壓電效應(居里兄弟)$z$ 方向擠壓 → $x$ 方向電荷

這些現象分散在不同領域,各自被當成「特例」處理,缺少統一語言。

歷史的時間差從雙折射被觀察到(1669)到 Ricci 與 Levi-Civita 整理出完整張量微積分(約 1900),中間隔了將近 230 年。Einstein 在 1915 年用它寫出廣義相對論,才讓「張量」廣為人知。

9.3Cauchy 的應力張量:對象先於語言 78 年

本講義從應力張量出發,而應力張量正是這段「對象先於語言」歷史的最佳範例。1822 年 9 月 30 日,Cauchy 在巴黎科學院宣讀了他的應力理論——這場演講後來被稱為「現代連續體力學的出生證明」,在座的有 Fourier、Laplace、Legendre、Poisson 等人。

用現代眼光看,Cauchy 在那篇工作裡完成了驚人的成就:他用四面體論證證明了牽引向量是法向量的線性函數(第二章的 Cauchy 定理)、辨識出九個分量 $\sigma_{ij}$、導出了平衡方程、並證明了對稱性 $\sigma_{ij}=\sigma_{ji}$:

$$\frac{\partial \sigma_{ij}}{\partial x_j} + f_i = \rho\,a_i, \qquad \sigma_{ij} = \sigma_{ji}$$

他甚至明確指出:接觸面上的內力不一定垂直於該面,也不是各方向都相同——這正是「正向力與摩擦力其實是同一個牽引向量的兩個分量」(第二章 §2.6)的最初表述。

對象有了,語言還沒有但 Cauchy 描述這一切的方式,是逐個分量列出方程式,完全是座標形式的。他沒有說「這是一個張量」,也沒有用變換法則來定義它——他甚至沒有用「應力(stress)」這個詞,而是用法文的「pression」(壓力/張力)。應力張量這個數學對象,在 Cauchy 手中已完整成形;但把它識別為「一類特殊數學對象」的語言,還要再等 78 年。

「tensor」這個詞的現代意義是分階段才成熟的:

年代人物事件
1822Cauchy以分量形式建立應力理論——有「張量這個對象」,但無此語言
1843 / 1846Hamilton創造「tensor」一詞,但指的是四元數的模長(伸縮因子),與現代意義無關
約 1898Voigt研究晶體彈性時,首次在接近現代的意義上使用「Tensor」
1900Ricci、Levi-Civita發表《絕對微分計算法》,以變換法則為定義,正式建立張量微積分的語言
1915Einstein廣義相對論大量使用,讓張量成為物理學的核心語言
與牛頓的類比Cauchy 的處境很像牛頓之於微積分:牛頓確實在做微積分,但用的是笨拙的「流數(fluxion)」語言;Leibniz 的 $dy/dx$ 符號之所以勝出,不是因為計算結果不同,而是語言更能讓思維延伸。同樣地,Cauchy 完全掌握了應力這個對象的所有性質,卻是在座標系裡逐一寫出方程,而非說「它服從 $T'_{ij}=R_{ik}R_{jl}T_{kl}$」。自然界「要求」用張量描述應力,比數學家知道「張量是什麼」早了將近一個世紀。這正是本章的核心——工具的誕生,往往落後於它所要描述的物理現實。

9.4你的直覺其實有一半是對的

「同向輸入得同向輸出」在主軸座標系下完全正確——特徵值分解保證對任何對稱張量都存在這樣的座標系,使三個方向各自獨立。問題只在於:自然界不總是把主軸送到方便測量的方向上。晶體的光軸由晶格決定,陀螺的主軸由質量分佈決定,這些往往與實驗座標系不對齊,耦合就出現了。

總結自然界的物理規律其實是張量,而「同向因果」是我們偶然選到好座標系、或面對高對稱系統時的舒適特例。人類的直覺習慣了特例,反而把它當成普遍定律。對稱創造簡單,非對稱需要張量。
第二部代數的源頭:從複數到四元數
向量與張量並非憑空出現。它們的源頭,是一個關於「數能否描述方向」的代數問題——答案藏在複數的幾何與四元數的誕生裡。
第十章

複數的幾何:為何實軸與虛軸必須垂直

在走向四元數之前,必須先看懂複數平面藏著的一個深刻事實:垂直不是規定,而是被代數規則強迫出來的。

10.1複數的代數起源早於幾何詮釋兩百年

16 世紀的數學家(Cardano、Bombelli)發明 $\sqrt{-1}$ 只是為了解方程式,例如 $x^2 + 1 = 0$。它最初只是一個形式符號,沒有人問「這個方向在哪裡」,甚至「虛數(imaginary)」這個名字本身就帶著貶義——當時的人認為它不真實。

直到 1799 年 Wessel、1806 年 Argand、以及 Gauss 才獨立發現:$a + bi$ 可以用二維平面上的點 $(a, b)$ 來表示。這時大家才突然意識到——原來整段時間,「實部」就是橫軸那條本來就存在的實數線,而虛部是額外長出來的新方向。

10.2實部其實也是一個方向

從幾何看,複數就是一個二維向量:

$$a + bi \;\longleftrightarrow\; \begin{pmatrix}a\\b\end{pmatrix}$$

兩個分量都是方向,沒有哪一個更「真實」。之所以有「實」與「虛」之分,純粹是歷史命名的不對稱——實數先存在,虛數後來才加進去,所以新的那條軸就被叫做「虛」。

換個角度想如果當年 Argand 先畫出幾何圖,他可能會直接把兩條軸叫「橫分量」與「縱分量」,完全對稱,根本不會有「虛」的神祕感。實部代表的就是 $\hat{x}$ 方向,與虛部一樣是個堂堂正正的方向。

10.3為何實軸與虛軸必須垂直——由 $i^2=-1$ 強迫

這是最深刻的一點:垂直不是任意選的,而是 $i^2 = -1$ 這條代數規則邏輯地推導出來的。

把「乘以 $i$」看成一種幾何操作。它必須保持長度($|i\cdot z| = |z|$,單位複數乘法不改變模長),所以它是一個純旋轉。設旋轉角度為 $\theta$。現在用 $i^2 = -1$ 這個事實:

$$i^2 = -1 \;\Longleftrightarrow\; \text{旋轉兩次} = 180° \;\Longrightarrow\; 2\theta = 180° \;\Longrightarrow\; \theta = 90°$$

乘以 $i$ 一次就是旋轉 90°。把這個操作連續做下去:

操作結果在複數平面上的位置
$1$起點橫軸正方向
$i\cdot 1 = i$轉 90°必然落在縱軸
$i\cdot i = -1$再轉 90°,共 180°橫軸負方向
$i\cdot(-1) = -i$再轉 90°,共 270°縱軸負方向

$i$ 與 $1$ 之間必然相差 90°,也就是垂直。

關鍵洞見如果你把 $i$ 放在和 $1$ 夾 60° 的方向,那「乘以 $i$」就不再是 90° 旋轉,$i^2$ 也就不等於 $-1$ 了,整個體系自相矛盾。換句話說:垂直性是 $i^2=-1$ 的幾何後果,不是人為的座標選擇。這也解釋了為何複數的模長公式 $|a+bi| = \sqrt{a^2+b^2}$ 恰好是畢氏定理——垂直性保證了複數平面是歐氏平面。
第十一章

四元數的誕生:ij=k 的必然與右手約定

1843 年,Hamilton 想把複數推廣到三維,苦戰十年後發現必須跳到四維。而 ij=k 這個式子,一半是被迫的,一半是選擇。

11.11843 年的閃光

四元數由 William Rowan Hamilton 在 1843 年 10 月 16 日發明。傳說他沿都柏林皇家運河散步時靈光一閃,當場把核心公式刻在 Broom 橋上:

$$i^2 = j^2 = k^2 = ijk = -1$$

一個四元數寫成 $q = a + bi + cj + dk$,有四個實數分量(這就是「四元」的由來)。它是複數的推廣——複數把實數擴展到二維平面,四元數再擴展到四維。最關鍵的性質是乘法不可交換:$ij = k$ 但 $ji = -k$。

「純量」與「向量」都是 Hamilton 創造的詞Hamilton 把四元數拆成兩部分:$q = \underbrace{a}_{\text{純量部分 scalar}} + \underbrace{bi+cj+dk}_{\text{向量部分 vector}}$。我們今天習以為常的 scalar 與 vector 這兩個詞,正是他為了描述四元數的這兩個部分而發明的。

11.2$ij$ 不可能是任何已知的東西

Hamilton 面對的核心問題是:$ij$ 到底等於什麼?把所有可能性逐一排除:

$ij$ 若等於……推導出的矛盾
$0$$j = i^{-1}\cdot 0 = 0$,$j$ 消失了
實數 $a$$j = ai^{-1} = -ai$,$j$ 變成 $i$ 的倍數,不獨立
$\pm i$$ij = i$ 推出 $j = 1$(不是虛數)
$\pm j$$ij = j$ 推出 $i = 1$(不是虛數)
$ai + bj$(兩者的線性組合)代數維度只有 3D,但 3D 除法代數不存在(見第十二章)

排除一切已知元素之後,$ij$ 必然是一個全新的獨立元素。Hamilton 把它叫做 $k$。

11.3是 $ij=k$ 還是 $ij=-k$?這是唯一的自由度

這裡只剩一個選擇:方向感(手性)的約定,相當於選右手座標系還是左手座標系。

$$ij = k \;\Longleftrightarrow\; \hat{x}\times\hat{y} = \hat{z}\ \text{(右手定則)}, \qquad ij = -k \;\Longleftrightarrow\; \hat{x}\times\hat{y} = -\hat{z}\ \text{(左手定則)}$$

兩個選擇在數學上完全等價(把 $k$ 換成 $-k$ 重新命名而已)。Hamilton 選了右手系,與我們慣用的三維座標系一致。

11.4$ij=k$ 確定之後,其餘全部被迫

只需要兩條公理:$i^2=j^2=k^2=-1$ 與結合律,加上一個選擇 $ij=k$,整個乘法表就完全確定,沒有剩餘自由度。

推導其餘乘積

從 $ij=k$ 右乘 $j$:$\;kj = (ij)j = i(j^2) = -i \;\Rightarrow\; kj = -i,\; jk = i$

從 $ij=k$ 左乘 $i^{-1}=-i$:$\;j = (-i)(ij) = (-i)k = -(ik) \;\Rightarrow\; ik = -j,\; ki = j$

以及 $ji = -ij = -k$(因 $i,j$ 正交,$ij+ji=0$)

完整乘法表,全部推導自 $ij=k$ 一個式子:

$$\begin{array}{c|ccc} \times & i & j & k \\\hline i & -1 & k & -j \\ j & -k & -1 & i \\ k & j & -i & -1 \end{array}$$

11.5純向量乘積:點積與叉積的統一

乘法表有一個立即的收穫,它揭示了四元數最深刻的身分。取兩個純向量四元數(實部為零)$\vec{u} = u_1 i + u_2 j + u_3 k$ 與 $\vec{v} = v_1 i + v_2 j + v_3 k$,直接用乘法表展開它們的乘積:

逐分量展開

$\vec{u}\vec{v}$ 展開為九項。先看同類項(用 $i^2=j^2=k^2=-1$):

$$u_1v_1\,i^2 + u_2v_2\,j^2 + u_3v_3\,k^2 = -(u_1v_1+u_2v_2+u_3v_3) = -\vec{u}\cdot\vec{v}$$

再看交叉項(用 $ij=k,\ jk=i,\ ki=j$ 及反交換):

$$u_1v_2\,(ij) + u_2v_1\,(ji) = (u_1v_2 - u_2v_1)\,k, \quad\text{同理另兩組給出 } i,\,j \text{ 分量}$$

三組交叉項合起來正是 $\big((u_2v_3-u_3v_2),\,(u_3v_1-u_1v_3),\,(u_1v_2-u_2v_1)\big) = \vec{u}\times\vec{v}$。合計:

$$\boxed{\ \vec{u}\,\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}\ }\qquad\square$$

關鍵洞見點積(純量部分)與叉積(向量部分)——我們今天當成兩個獨立運算來教——原本統一在同一個四元數乘法裡。這個式子是後續好幾章的樞紐:它解釋了為何純虛四元數相乘會「溢出」實部(第十二章)、為何 Gibbs 能把乘法拆成兩半(第十五章)、以及為何功取實部、力矩取虛部(第十七章)。

11.6物理直覺:旋轉的合成

Hamilton 是從幾何思考這個問題的。他問:「繞 $x$ 軸轉一下,再繞 $y$ 軸轉一下,等效於繞哪個軸轉?」答案由右手定則給出:

$$\text{繞 }x\text{ 軸旋轉}\;\circ\;\text{繞 }y\text{ 軸旋轉}\;=\;\text{繞 }z\text{ 軸旋轉}$$

用 $i, j, k$ 代表三個旋轉算符,合成運算就是乘法,自然得到 $ij = k$。所以 $ij=k$ 本質上就是 $\hat{x}\times\hat{y}=\hat{z}$,用代數語言寫下的右手定則。

小結$ij$ 必須是全新元素——這是代數封閉性強迫的(3D 行不通)。叫它 $k$ 還是 $-k$,是方向感的約定。選定之後,其餘全部被結合律唯一確定,毫無選擇餘地。
第十二章

為何必須保留實部:除法代數、旋轉角與閉合性

既然要描述三維,為何四元數要留下一個「實部」?這牽涉到一個深刻的數學定理:三維除法代數根本不存在。

12.1層次一:乘法的代數閉合性

把兩個純虛四元數(沒有實部)相乘,看看會發生什麼:

$$\underbrace{(bi+cj+dk)}_{\text{純虛}}\cdot\underbrace{(b'i+c'j+d'k)}_{\text{純虛}} = \underbrace{-(bb'+cc'+dd')}_{\text{跑出一個實部!}} + \underbrace{(\cdots)i+(\cdots)j+(\cdots)k}_{\text{虛部}}$$

實部那一項正好是負的內積 $-\vec{u}\cdot\vec{v}$。只要兩個向量不垂直,它們的乘積就會「溢出」到實數部分。如果你強行說「沒有實部」,乘法就不封閉,整個數系就崩潰了。實部是乘法的蓄水池,不能扔掉。

12.2層次二:實部編碼了旋轉的角度

四元數表示三維旋轉的方式是(詳見第十四章):

$$q = \underbrace{\cos\tfrac{\theta}{2}}_{\text{實部}} + \underbrace{\sin\tfrac{\theta}{2}\,(u_x i + u_y j + u_z k)}_{\text{虛部 = 旋轉軸方向}}$$

實部 $\cos(\theta/2)$ 就是旋轉角度的編碼。沒有實部,就只能表示 180° 的旋轉(這時 $\cos 90°=0$,實部剛好消失),失去描述任意角度旋轉的能力。

12.3層次三:三維除法代數根本不存在

這是最根本的原因,而且有兩個彼此呼應的嚴格定理在背後撐著。

定理 · 兩個除法代數定理

Frobenius 定理(1877):實數上的有限維結合除法代數,只有三種——$\mathbb{R}$(1 維)、$\mathbb{C}$(2 維)、$\mathbb{H}$(4 維)。

Hurwitz 定理(1898):實數上的有限維賦範除法代數(乘法保持模長,$|xy|=|x||y|$),只有四種——$\mathbb{R}, \mathbb{C}, \mathbb{H}, \mathbb{O}$(八元數),維度 $1, 2, 4, 8$。

無論用哪個定理,三維都不在清單上。Frobenius 的證明骨架可以這樣理解:

Frobenius 證明要旨

設 $D$ 是有限維結合除法代數,把實數倍的單位元等同於 $\mathbb{R}$。任取 $a\in D\setminus\mathbb{R}$,它在 $\mathbb{R}$ 上滿足某個最低次多項式(由 Cayley–Hamilton 保證存在)。因 $D$ 無零因子(除法代數),此多項式必不可約;而實係數不可約多項式至多二次(代數基本定理的推論)。故每個 $a$ 都滿足一個二次式 $a^2 = \alpha a + \beta$,配方後得到一個平方為負實數的元素 $\hat{a}$,即「虛單位」。

分析這些虛單位張成的子空間:若只有一個,得 $\mathbb{C}$(2 維);若有兩個互相反交換的,第三個被它們的乘積強制生成,得 $\mathbb{H}$(4 維);而想停在「恰好一個額外虛單位」(即 3 維)時,封閉性會逼出第三個獨立元素,使維度跳到 4。3 維在代數上是不穩定的——它總會塌縮回 2 或長大到 4。

Hamilton 的十年苦戰Hamilton 苦思十年,一直嘗試 $a + bi + cj$ 這種三維形式,每次都推導出矛盾。最後他理解到:不是自己不夠聰明,而是三維本身就做不到。維度必須跳過 3。這就是為什麼描述三維旋轉,反而需要一個四維的數系——四元數恰好是 Frobenius 清單上 $\mathbb{C}$ 之後的下一個。

12.4四元數不是張量:旋量的連結

要釐清一個常見誤解:四元數本身不是張量。它是一個「除法代數」,而張量是描述多重線性映射的物件。向量是一階張量,但四元數不是任何階的張量。兩者真正的連結藏在旋轉群的表示論裡,這接回第六章:

物件旋轉群表示與旋轉的關係
旋量 spinorspin-½單位四元數 ≅ SU(2)
向量spin-1SO(3) 基本表示
二階張量spin-0 ⊕ spin-1 ⊕ spin-2可約,分解成三塊

單位四元數構成的群 SU(2),是三維旋轉群 SO(3) 的雙重覆蓋。這個連結會在第五部完整展開。

第三部四元數與三維旋轉
四元數最深刻的能力,是優雅地描述三維旋轉。但為什麼旋轉要用「夾擊」乘法?為什麼公式裡是半角?這一部把計算攤開來看。
第十三章

夾擊乘法:為何旋轉一定要 qpq⁻¹

用四元數旋轉向量,公式是 $p' = qpq^{-1}$,左右各夾一個。為什麼不能只是單邊乘一次?這個問題的答案連結到反射、共軛與維度。

13.1直接用 $qp$ 會發生什麼

試試看:把向量 $(1,0,0)$ 用 $q = \tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,i$(繞 $x$ 軸旋轉 90°)做單邊乘法:

$$q\cdot p = \left(\tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,i\right)\cdot i = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,i^2 = \underbrace{-\tfrac{\sqrt{2}}{2}}_{\text{實部出現了!}} + \tfrac{\sqrt{2}}{2}\,i$$

結果跑出一個非零的實部,意思是向量離開了三維空間,變成一個四維物件,無法再詮釋成任何三維向量。一般地說:只要旋轉軸與被旋轉的向量有平行分量,$qp$ 就一定產生實部洩漏。

13.2夾擊的兩邊各負責一次反射

這裡有一個深刻的幾何事實:任何一個旋轉,都可以分解成兩次反射的合成。這不是巧合,而是一條一般定理。

定理 · Cartan–Dieudonné

陳述:$n$ 維空間中,任何正交變換都可寫成至多 $n$ 次超平面反射的合成。特別地,三維的旋轉($\det=+1$)是恰好兩次反射的合成;含鏡射的瑕旋轉($\det=-1$)則是三次。

為何旋轉是偶數次反射

每次反射的行列式為 $-1$。$k$ 次反射合成的行列式是 $(-1)^k$。旋轉的行列式為 $+1$,故 $k$ 必為偶數;最小的非平凡情形就是 $k=2$。兩個反射平面的交線即為旋轉軸,兩平面夾角 $\theta/2$ 對應旋轉角 $\theta$——這正是後面「半角」出現的幾何根源。

四元數中,「對法向量為 $\hat{n}$ 的平面做反射」可以寫成 $\vec{v}\mapsto -\hat{n}\,\vec{v}\,\hat{n}^{-1}$。先做一次反射(法向量 $\hat{n}$),再做一次(法向量 $\hat{m}$):

$$\vec{v}\;\longmapsto\;-\hat{m}\underbrace{(-\hat{n}\,\vec{v}\,\hat{n}^{-1})}_{\text{第一次反射}}\hat{m}^{-1} = \underbrace{(\hat{m}\hat{n})}_{q}\,\vec{v}\,\underbrace{(\hat{m}\hat{n})^{-1}}_{q^{-1}}$$

這正好就是夾擊公式。所以夾擊的左右兩邊並非多此一舉,它們分別代表合成旋轉所需的兩次反射。$q^{-1}$ 不是在「撤銷」什麼,而是第二次反射的數學形式。

13.3代數證明:夾擊保證結果留在三維

純虛四元數(三維向量)有一個代數特徵:取共軛後變號,$\bar{p}=-p$。計算 $qpq^{-1}$ 的共軛(利用 $\overline{ABC}=\bar{C}\bar{B}\bar{A}$,以及單位四元數 $\bar{q}=q^{-1}$):

$$\overline{qpq^{-1}} = \overline{q^{-1}}\cdot\bar{p}\cdot\bar{q} = q\cdot(-p)\cdot q^{-1} = -(qpq^{-1})$$

結論:$qpq^{-1}$ 取共軛後變號,所以它的實部必然為零,它一定是純虛四元數,也就是一個合法的三維向量。單邊 $qp$ 沒有這個保證,所以實部會洩漏。

13.4三個層次的理解

視角為何需要夾擊
幾何旋轉 = 兩次反射,左右各負責一次
代數夾擊是「共軛運算」,保持純虛子空間封閉;單邊乘法做不到
維度$qp$ 是四維旋轉;$qpq^{-1}$ 把它投影回三維子空間
直覺圖像想像你要讓牆上的影子旋轉:只從一個方向打光($qp$),影子會扭曲變形(跑出三維);從兩個對稱的方向夾住打光($qpq^{-1}$),扭曲互相抵消,影子才是乾淨的旋轉結果。$q^{-1}$ 的任務不是「把 $q$ 的旋轉轉回去」,而是把旋轉從四維代數空間鎖回三維物理空間。
第十四章

實部編碼旋轉角:半角公式與完整計算

第十二章說實部編碼旋轉角度,這一章用一個完整的數學例子把它算出來,並解釋為何用的是半角。

14.1旋轉的四元數公式

用四元數表示「繞軸 $\hat{n}$ 旋轉 $\theta$ 度」:

$$\boxed{\,q = \cos\tfrac{\theta}{2} + \sin\tfrac{\theta}{2}\,(n_x i + n_y j + n_z k)\,}$$

注意用的是半角 $\theta/2$,不是 $\theta$。要旋轉向量 $\vec{v}$,先把它寫成純虛四元數 $p = v_x i + v_y j + v_z k$(實部為 0),然後做夾擊乘法 $p' = qpq^{-1}$,結果 $p'$ 的虛部就是旋轉後的向量。

14.2完整例子:把 $(1,0,0)$ 繞 $z$ 軸旋轉 90°

預期結果:$(1,0,0)$ 旋轉 90° 應得到 $(0,1,0)$。

第一步 · 建立四元數

$\theta=90°$,旋轉軸為 $z$ 軸即 $\hat{n}=k$:$\quad q = \cos 45° + \sin 45°\cdot k = \tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,k$。實部 $=\cos 45°=\tfrac{\sqrt{2}}{2}$,這個數字直接編碼了旋轉角 90°。

第二步 · 向量寫成純虛四元數

$p = 1\cdot i + 0\cdot j + 0\cdot k = i$

第三步 · 算 q · p

$q\cdot p = \left(\tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,k\right)\cdot i = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\underbrace{(k\cdot i)}_{=\,j} = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,j$

第四步 · 算 (q·p) · q⁻¹

單位四元數的逆就是共軛:$q^{-1} = \tfrac{\sqrt{2}}{2} - \tfrac{\sqrt{2}}{2}\,k$

$$\left(\tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,j\right)\left(\tfrac{\sqrt{2}}{2} - \tfrac{\sqrt{2}}{2}\,k\right) = \tfrac{1}{2}\,i - \tfrac{1}{2}\underbrace{(i k)}_{=-j} + \tfrac{1}{2}\,j - \tfrac{1}{2}\underbrace{(j k)}_{=\,i}$$

$$= \tfrac{1}{2}\,i + \tfrac{1}{2}\,j + \tfrac{1}{2}\,j - \tfrac{1}{2}\,i = j$$

結果:$p' = j$,對應向量 $(0,1,0)$。向量被正確地旋轉了 90°。

14.3為何用半角 $\theta/2$

夾擊乘法 $qpq^{-1}$ 裡,$q$ 出現了兩次(左邊一次、右邊一次)。每次各貢獻「一半的旋轉」,合起來才是完整的 $\theta$。如果直接放 $\theta$(不用一半),夾擊就會旋轉 $2\theta$,轉過頭了。

14.4實部直接告訴你旋轉角

從 $q = \cos(\theta/2) + \cdots$ 可以反推:只要看實部的數值,就立刻知道旋轉多少度。

實部值$\theta/2$旋轉角 $\theta$意義
$1$$0°$$0°$完全不轉(單位元)
$\tfrac{\sqrt{2}}{2}\approx 0.707$$45°$$90°$上面的例子
$\tfrac{1}{2}$$60°$$120°$
$0$$90°$$180°$實部消失!純虛四元數
$-\tfrac{\sqrt{2}}{2}$$135°$$270°$
$-1$$180°$$360°$轉一整圈,但 $q=-1$ 不是 $+1$

14.5沒有實部只能旋轉 180°

若強制令實部為 $0$,則 $\cos(\theta/2)=0$,解出 $\theta=180°$。所以沒有實部,四元數只能表示 180° 的翻轉。驗證這個特例——把 $(0,1,0)$ 繞 $x$ 軸旋轉 180°(應得 $(0,-1,0)$):

$$q = \cos 90° + \sin 90°\cdot i = i \quad\text{(實部果然是 0)}, \qquad p' = i\cdot j\cdot(-i) = k\cdot(-i) = -(ki) = -j$$

得到 $(0,-1,0)$,正確。

小結實部 $=\cos(\theta/2)$,是旋轉角度的「餘弦編碼」。旋轉角越大,實部越小;轉到 180° 時實部歸零;轉滿一圈時 $q=-1$(不是 $+1$)——這正是「雙重覆蓋」的物理意涵:自旋 ½ 粒子要轉 720° 才回到原態。
第四部向量分析的抉擇
我們今天熟悉的點積與叉積,是 19 世紀末從四元數中「拆」出來的。這場抉擇有得有失——而被丟棄的部分,正是 spin-2 的物理。
第十五章

向量戰爭:Gibbs 為何拆解四元數

1880 年代,Gibbs 與 Heaviside 把四元數乘法拆成「點積」與「叉積」兩個獨立運算,引發與四元數支持者的激烈論戰。這個拆解有實際好處,也付出了代價。

15.1四元數乘法的「問題」

兩個純虛四元數相乘的結果是:

$$\vec{u}\vec{v} = \underbrace{-\vec{u}\cdot\vec{v}}_{\text{實部(跑出三維)}} + \underbrace{\vec{u}\times\vec{v}}_{\text{虛部(三維向量)}}$$

從物理學家的角度,這個結果很不舒服:輸入兩個向量,得到的卻是「純量+向量」的混合物(型別不一致);內積帶著一個沒有物理意義的負號($-\vec{u}\cdot\vec{v}$);而且「實部洩漏」意味著三維物理的計算偷偷跑到四維去了。

15.2Gibbs 拆解的三個好處

① 型別乾淨。點積永遠回傳純量,叉積永遠回傳向量,物理中的兩種需求分開處理:做功 $W=\vec{F}\cdot d\vec{s}$ 要純量,力矩 $\vec{\tau}=\vec{r}\times\vec{F}$ 要向量,各取所需。

② 對稱性立刻可見。$\vec{u}\cdot\vec{v}=\vec{v}\cdot\vec{u}$(對稱),$\vec{u}\times\vec{v}=-\vec{v}\times\vec{u}$(反對稱)。在四元數乘法裡這兩種對稱性混在一起,拆開後一目了然——這正是第六章「把張量分解成對稱部分加反對稱部分」的精神。

③ Maxwell 方程組變得可讀。Maxwell 原本用四元數混寫,幾乎無法閱讀。Heaviside 用向量語言改寫後變成今天熟悉的形式:

$$\nabla\cdot\vec{E} = \frac{\rho}{\varepsilon_0}, \qquad \nabla\times\vec{B} = \mu_0\vec{J} + \mu_0\varepsilon_0\frac{\partial\vec{E}}{\partial t}$$

15.3Gibbs 拆解失去了什麼

15.4更深的連結:Gibbs 在不自覺中做了張量分解

從現代張量的角度回看,Gibbs 拆出來的兩個操作其實是兩個本質不同的張量:

$$\vec{u}\cdot\vec{v} = g_{ij}u^iv^j\ \text{(度規張量,rank-2 對稱)}, \qquad (\vec{u}\times\vec{v})_k = \varepsilon_{ijk}u^iv^j\ \text{(Levi-Civita 張量,rank-3 全反對稱)}$$

歷史評語Gibbs 是工程師思維:物理學家需要的工具應該「輸入什麼型別,輸出什麼型別」清清楚楚,不能有多餘的混合物。他讓電磁學可以被教、被用,代價是失去了代數的統一性與可推廣性。支持四元數的 Tait 說他「肢解」了四元數,Gibbs 的回答是:「我不需要一把瑞士刀,我需要兩把各司其職的刀。」
第十六章

何時該用四元數:保留統一乘法的物理

既然 Gibbs 把四元數拆了,那還有哪些物理是真正用完整四元數乘法在計算的?答案是:凡是涉及旋轉合成、自旋、規範對稱性的地方。

16.1航太慣性導航:陀螺儀積分

飛機、無人機、智慧型手機的姿態追蹤,核心方程是:

$$\dot{q}(t) = \frac{1}{2}\,q(t)\otimes\omega(t)$$

其中 $q(t)$ 是描述當前姿態的單位四元數,$\omega = \omega_x i + \omega_y j + \omega_z k$ 是陀螺儀測到的角速度。右邊是真正的四元數乘法。改用尤拉角會碰到「萬向鎖(gimbal lock)」——某個轉軸退化導致方程奇異;四元數在四維球面 $S^3$ 上操作,天然沒有座標奇異點。

16.2核磁共振:自旋脈衝序列

MRI 與 NMR 譜儀靠射頻脈衝翻轉原子核自旋,整個過程就是 SU(2) 的群乘法,也就是四元數乘法。一個 $\theta$ 度的翻轉脈衝 $U(\theta,\hat{n}) = \cos\tfrac{\theta}{2}I - i\sin\tfrac{\theta}{2}(\hat{n}\cdot\vec{\sigma})$,連續施加三個脈衝的效果是 $U_{\text{total}} = U_3 U_2 U_1$——純粹的四元數相乘。用向量分析得分開算旋轉矩陣再相乘,遠比直接乘四元數麻煩。

16.3Maxwell 方程組的四元數形式

Maxwell 自己的原始版本就是用四元數寫的。定義四元數算符與場後,對向量位做四元數乘法,可以得到:

$$\partial\circ\partial\circ\mathcal{A} = \mu_0\mathcal{J}$$

一行方程,同時編碼全部四條 Maxwell 方程。關鍵在於 $\partial\circ\mathcal{F}$ 的實部自動出兩條散度方程,虛部自動出兩條旋度方程。四元數乘法同時帶出散度與旋度,正是 Gibbs「拆壞了」的那個整體性在這裡的價值。

16.4弱核力:SU(2) 規範理論

弱交互作用的規範群是 SU(2),同構於單位四元數群。W 玻色子的場 $W_\mu = W_\mu^1 i + W_\mu^2 j + W_\mu^3 k$ 就是一個純虛四元數值的規範場,作用在費米子的弱同位旋二重態上,就是四元數乘法。整個弱力的數學骨架就是四元數代數——Gibbs 的向量語言在這裡完全沒辦法用。

16.5雙四元數:機器人的剛體運動

雙四元數 $\hat{q} = q_r + \varepsilon\,q_t$($\varepsilon^2=0$)同時編碼旋轉($q_r$)與平移($q_t$),一個物件描述六自由度的剛體運動。合成兩個剛體運動就是 $\hat{q}_{\text{total}} = \hat{q}_2\cdot\hat{q}_1$。廣泛用於機器人手臂控制與電影骨骼動畫。

何時用四元數、何時用 Gibbs涉及旋轉合成、自旋、規範對稱性 → 四元數乘法是原生語言。計算做功、力矩等單一型別輸出 → Gibbs 的點積、叉積更直接。Gibbs 的拆法讓三維物理「更好算」,但讓「物理為什麼這樣」變得更難看清楚。
第十七章

功、力矩、角動量為何只是退化情形

功只取四元數乘積的實部,力矩與角動量只取虛部,彷彿它們都是某種「退化」。背後的原因是旋轉群的表示論——而被忽略的 spin-2 部分,正是重力波與潮汐力。

17.1兩個向量的乘積可以分解成三種型別

從表示論出發(第六章的群論視角)。兩個 spin-1 的向量相乘,分解成:

$$\underbrace{1\otimes 1}_{\text{兩個向量}} = \underbrace{0}_{\text{spin-0}} \oplus \underbrace{1}_{\text{spin-1}} \oplus \underbrace{2}_{\text{spin-2}}$$

四元數乘法 $\vec{u}\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}$ 包含 spin-0 加 spin-1,但沒有 spin-2

17.2Noether 定理決定哪種型別對應哪個物理量

守恆量必須是確定的不可約表示,否則在旋轉下沒有一致的變換行為。

對稱性守恆量表示四元數對應
時間平移能量 $E$spin-0(純量)實部
空間平移線動量 $\vec{p}$spin-1(向量)虛部
空間旋轉角動量 $\vec{L}$spin-1(向量)虛部

功取實部(spin-0),因為能量守恆要求能量是純量;角動量取虛部(spin-1),因為旋轉對稱性的生成子本身就是 spin-1 算符。

17.3那 spin-2 去哪了?它也是物理量

Spin-2 並沒有消失,它出現在超出點粒子範疇的物理裡:

① 四極矩輻射——重力波。Einstein 計算重力波輻射的核心量是質量四極矩 $Q_{ij} = \int\rho\left(r_ir_j-\tfrac{1}{3}\delta_{ij}r^2\right)dV$,括號裡正是 $\vec{r}\otimes\vec{r}$ 的 spin-2 部分。輻射功率 $P\propto\dddot{Q}_{ij}\dddot{Q}^{ij}$——純 spin-2 的量,四元數完全無法描述。

② 潮汐力。月球對地球的潮汐力不是一個向量,而是 spin-2 張量 $T_{ij} = -\tfrac{GM}{r^3}(\delta_{ij}-3\hat{r}_i\hat{r}_j)$,描述空間如何被拉伸。這就是為什麼海洋有兩個潮汐隆起(正對與背對月球各一)。

③ 慣性張量。第七章的 $I_{ij}$ 也含 spin-2 結構。角動量 $\vec{L}=\mathbf{I}\vec{\omega}$ 之所以有時不平行於 $\vec{\omega}$(陀螺進動的根源),正是因為 $I_{ij}$ 有 spin-2 成分。

④ 黏性應力張量。Navier-Stokes 的黏性耗散來自速度梯度張量的無跡對稱部分,也是 spin-2,必須用完整二階張量。

17.4為何點粒子力學天然只有 spin-0 與 spin-1

對點粒子,位置 $\vec{r}$ 與動量 $\vec{p}$ 都是單一向量。它們的 spin-0 部分是 $\vec{r}\cdot\vec{p}$(位力定理),spin-1 部分是 $\vec{r}\times\vec{p}=\vec{L}$(軌道角動量)。spin-2 部分對點粒子雖有意義,但在基礎力學中沒被命名,要描述形變、輻射、潮汐才會浮現。

最深的統一圖像四元數乘法是完整張量積的截斷版本——它只保留 spin-0 與 spin-1,悄悄丟棄了 spin-2。在點粒子力學與剛體旋轉的範疇內,spin-2 不貢獻守恆量,所以四元數已足夠;一旦需要描述形變、輻射、潮汐或流體應力,spin-2 不可缺少,必須回到完整的張量語言。這也是為什麼本講義從壓力出發,最終走向廣義相對論——都是因為 spin-2 的物理只有張量才能處理。
第五部對稱的語言:群論
群論是現代物理的骨架。它的核心不是分類,而是:只要知道系統有什麼對稱性,就能直接讀出守恆律、縮并與選擇定則,不必計算。
第十八章

四元數、Pauli 矩陣與量子力學的統一

四元數的夾擊乘法與量子力學的么正變換 $U\hat{O}U^\dagger$ 不是「看起來像」——它們在數學上就是同一件事。這一章揭示這個統一。

18.1四元數旋轉就是量子力學的么正變換

四元數夾擊 $p' = q\,p\,q^{-1}$ 與量子力學么正變換 $\hat{O}' = U\hat{O}U^\dagger$ 結構完全相同,因為它們描述的是同一件物理事情:在旋轉對稱群下,物理量如何變換。

18.2四元數單位就是 Pauli 矩陣(差一個 $-i$)

定義映射:

$$i\;\longleftrightarrow\;-i\sigma_x, \qquad j\;\longleftrightarrow\;-i\sigma_y, \qquad k\;\longleftrightarrow\;-i\sigma_z$$

驗證乘法規則完全吻合:$(-i\sigma_x)(-i\sigma_y) = -\sigma_x\sigma_y = -(i\sigma_z) = -i\sigma_z$,對應 $ij=k$ 在此映射下的像。角動量對易關係 $[\sigma_x,\sigma_y]=2i\sigma_z$ 對應四元數的 $ij-ji = k-(-k) = 2k$——完全同一個代數。旋轉算符也對上了:

$$U = e^{-i\frac{\theta}{2}\hat{n}\cdot\vec{\sigma}} = \cos\tfrac{\theta}{2}I - i\sin\tfrac{\theta}{2}(\hat{n}\cdot\vec{\sigma}), \qquad q = \cos\tfrac{\theta}{2} + \sin\tfrac{\theta}{2}(n_xi+n_yj+n_zk)$$

用映射代入,兩者字面上相等。

18.3SU(2) 矩陣裡的 j 與 k 藏在哪

把四元數寫成 $2\times 2$ 複數矩陣,四個單位各別對應:

四元數單位對應的 $2\times 2$ 矩陣
$\mathbf{1}$$\begin{pmatrix}1&0\\0&1\end{pmatrix}$
$\mathbf{i}$$\begin{pmatrix}0&i\\i&0\end{pmatrix}$(非對角,含複數 $i$)
$\mathbf{j}$$\begin{pmatrix}0&-1\\1&0\end{pmatrix}$(非對角,純實數)
$\mathbf{k}$$\begin{pmatrix}i&0\\0&-i\end{pmatrix}$(對角,含複數 $i$)

把 $q = a\mathbf{1}+b\mathbf{i}+c\mathbf{j}+d\mathbf{k}$ 組合起來:

$$U = \begin{pmatrix}a+di & -c+bi \\ c+bi & a-di\end{pmatrix}$$

這裡的 $i$ 始終是普通複數的 $\sqrt{-1}$。四元數的 $\mathbf{j}$(係數 $c$)藏在非對角線的實數部分(左下 $+c$、右上 $-c$,符號相反);四元數的 $\mathbf{k}$(係數 $d$)藏在對角線的虛數部分(左上 $+di$、右下 $-di$)。$j$ 與 $k$ 沒有以符號出現,而是被編碼成矩陣的結構模式。

18.4ijk:從單位向量升級為旋轉算符

在 3D 向量空間,$\hat{i},\hat{j},\hat{k}$ 是互相正交的單位向量——代表方向。在四元數代數,$\mathbf{i},\mathbf{j},\mathbf{k}$(與 $\mathbf{1}$)是互相正交的基底矩陣——代表旋轉的生成子。

3D 向量空間四元數代數
基底元素$\hat{i},\hat{j},\hat{k}$$\mathbf{1},\mathbf{i},\mathbf{j},\mathbf{k}$(多了第四個)
代表什麼幾何方向旋轉操作子(generator)
維度3 維4 維(多了純量部分)

矩陣的「正交」用跡內積 $\langle A,B\rangle = \mathrm{tr}(A^\dagger B)$ 定義,四個矩陣兩兩正交。$\mathbf{i},\mathbf{j},\mathbf{k}$ 在量子力學裡就是 Pauli 矩陣,正是繞 $x,y,z$ 軸旋轉的生成子——是操作,不是方向。

18.5spin-½ 是單邊、spin-1 是夾擊

表示自旋變換方式數學
旋量 spinor$\tfrac{1}{2}$單邊$|\psi'\rangle = U|\psi\rangle$
向量$1$夾擊$\vec{v}' = U\vec{v}U^\dagger$

Spin-½ 只需 $U$ 作用一次,因為旋量生活在 SU(2) 的基本表示裡;spin-1 需要夾擊,因為向量生活在伴隨表示裡,對應 $\mathrm{Ad}(q):p\mapsto qpq^{-1}$。這就是為什麼電子(spin-½)寫 $\psi\to U\psi$,光子(spin-1)寫 $A_\mu\to UA_\mu U^\dagger$。

令人拍案的歷史巧合漢米爾頓(William Rowan Hamilton)同時做了兩件被量子力學繼承的事:發明四元數(1843)→ SU(2) → 自旋理論的數學基礎;建立漢米爾頓力學 → 量子力學的 $\hat{H}$ 與正則量子化。量子力學的「漢米爾頓運算子 $\hat{H}$」與「四元數的 $i,j,k$」出自同一個人,而我們現在知道它們描述的是同一個數學結構——SU(2) 群及其表示。
第十九章

群論導論:定義、公設與同構

前面一再提到群論,這一章從零開始。群論不是分類學,而是「從對稱性直接讀出物理結論」的工具。它的核心概念是:結構重於外表。

19.1什麼是群?四條公設

群(Group)是一個集合 $G$ 加上一個運算 $\star$,滿足四條規則:

公設內容直覺意思
封閉性$a,b\in G \Rightarrow a\star b\in G$做了運算,結果還在集合裡
結合律$(a\star b)\star c = a\star(b\star c)$括號順序不影響結果
單位元存在 $e$ 使 $e\star a = a\star e = a$有「什麼都不做」的操作
反元素每個 $a$ 都有 $a^{-1}$,$a\star a^{-1}=e$每個操作都可以撤銷

注意:沒有要求 $a\star b = b\star a$(交換律不一定成立)。有交換律的群叫「Abel 群」。

19.2最具體的例子:時鐘的旋轉

只看「旋轉多少度」這件事,允許的操作 $\{0°, 90°, 180°, 270°\}$,運算是「先轉這個、再轉那個」:封閉性($90°+270°=360°=0°$)、結合律、單位元($0°$)、反元素($90°$ 的反元素是 $270°$)全部滿足。這個集合在「轉動合成」下構成一個群,稱為 $\mathbb{Z}_4$。

19.3為何「看起來完全不同」的東西是「同一個群」

這是最關鍵的概念:群同構(isomorphism)。兩個群同構,意思是雖然元素長相不同,但有一個對應關係使它們的乘法表完全一致。例如下面三個集合:

集合運算元素
$\{1, -1\}$普通乘法兩個數字
$\{$不翻轉, 翻轉$\}$動作合成兩個幾何操作
$\left\{\begin{pmatrix}1&0\\0&1\end{pmatrix}, \begin{pmatrix}-1&0\\0&-1\end{pmatrix}\right\}$矩陣乘法兩個矩陣

它們的乘法表完全一樣,所以是同一個群 $\mathbb{Z}_2$,只是「穿了不同的衣服」。群論研究的是脫掉衣服後的裸結構,與元素長什麼樣無關。

回到 SU(2)單位四元數、$2\times 2$ 複數矩陣、NMR 脈衝算符、量子閘——它們的合成規則完全一致,所以是同一個群 SU(2) 的不同表示(representation)。這就是為什麼第十八章裡那些看起來毫不相干的東西,其實是同一件事。

19.4群論不是分類,而是直接給出物理

群論確實把「有相同結構的東西」放在一起,但更重要的是它能從結構推導出物理結論。例如:若一個系統有旋轉對稱性,不需算任何積分,群論直接告訴你角動量守恆、能量不依賴旋轉方向、哪些躍遷被禁止。這套機制是下一章與第二十一章的主題。

第二十章

SU(2) 解碼與物理中的重要群

SU(2) 這個名字的每個字都有精確含義。理解它之後,就可以巡覽物理中最重要的幾個群——它們是所有已知基本力的骨架。

20.1SU(2) 的名字解碼

SU(2) 的全名是「Special Unitary group of degree 2」:

SU(2) 矩陣的一般形式為 $U = \begin{pmatrix}\alpha & -\beta^* \\ \beta & \alpha^*\end{pmatrix}$,$|\alpha|^2+|\beta|^2=1$。四個實數受一條約束,剩下三個自由度——對應旋轉的三個參數。設 $\alpha=a+di$、$\beta=c+bi$,即得第十八章的四元數對應 $q=a+bi+cj+dk$。

20.2$\mathbb{Z}_2$ 與 $\mathbb{Z}_n$:最簡單的群,離散對稱

$\mathbb{Z}_n = \{0,1,\ldots,n{-}1\}$ 加上模 $n$ 加法。$\mathbb{Z}_2=\{+1,-1\}$ 描述「翻轉」型對稱:宇稱 $P$(空間反射)、電荷共軛 $C$、時間反演 $T$ 各自構成 $\mathbb{Z}_2$。最深刻的結果是 CPT 定理:$CPT$ 的組合是所有已知物理定律的精確對稱,不論 $C,P,T$ 各自是否守恆。晶體的 32 種點群也由有限群分類,涵蓋固體的所有宏觀對稱。

20.3U(1):最簡單的連續群

$\mathrm{U}(1)=\{e^{i\theta}\}$,複數平面上的單位圓。這是 Abel 群,1 個生成子,守恆量是電荷。若把這個對稱升格為局域規範對稱(每個時空點的相位可獨立轉動),則必然要引進一個規範場來補償相位梯度——那個規範場正是電磁場,Maxwell 方程組就是從這個群結構推導出來的。

20.4SO(3) 與 SU(2):旋轉群及其雙重覆蓋

$\mathrm{SO}(3)$ 是所有 $3\times 3$ 實正交矩陣、$\det=+1$,三個生成子對應角動量 $L_x,L_y,L_z$,對易關係 $[L_i,L_j]=i\hbar\varepsilon_{ijk}L_k$。SO(3) 不是單連通的——要繞兩圈才能縮回原點。$\mathrm{SU}(2)$ 是它的雙重覆蓋,同一物理旋轉對應兩個 SU(2) 元素($q$ 與 $-q$)。整數自旋粒子(光子)是 SO(3) 的表示;半整數自旋粒子(電子)必須用 SU(2) 的表示——這就是為什麼電子要旋轉 720° 才回到原來的量子態。

20.5SU(3):夸克的顏色語言

$\mathrm{SU}(3)$ 是 $3\times 3$ 複數么正矩陣、$\det=1$,生成子是 8 個 Gell-Mann 矩陣。1961 年 Gell-Mann 用 SU(3) 把強子組織成「八重道(Eightfold Way)」,並預測未發現的 $\Omega^-$,1964 年實驗證實。夸克帶的「色荷」恰好三種(紅綠藍),構成 SU(3) 的基本表示。

SU(3) 與 SU(2) 的根本不同在於它是非 Abel 群,且生成子(膠子)本身帶色荷,膠子彼此有交互作用,導致兩個現象:

20.6Poincaré 群:相對論粒子的分類

Poincaré 群是洛倫茲群加上時空平移,共 10 個生成子:時間平移(→ 能量)、3 個空間平移(→ 動量)、3 個空間旋轉(→ 角動量)、3 個洛倫茲靴推。1939 年 Wigner 證明:基本粒子就是 Poincaré 群的不可約表示,由質量 $m$ 與自旋 $s$ 標記。

$m, s$對應粒子
$m>0,\ s=0$Higgs 玻色子
$m>0,\ s=\tfrac{1}{2}$電子、夸克
$m>0,\ s=1$$W^\pm, Z^0$
$m=0$, 螺旋度 $\pm 1$光子
$m=0$, 螺旋度 $\pm 2$重力子(理論預測)

換言之,「粒子」不是要從外部定義的概念,它就是相對論時空對稱群的數學結構自動產生的物件。

20.7標準模型規範群 $\mathrm{U}(1)\times\mathrm{SU}(2)\times\mathrm{SU}(3)$

把三個群乘在一起,生成子數目 $1+3+8=12$,對應 12 個規範玻色子:

生成子對稱破缺後的力載體
$\mathrm{U}(1)_Y$1光子 $\gamma$電磁力
$\mathrm{SU}(2)_L$3$W^+, W^-, Z^0$弱核力
$\mathrm{SU}(3)_c$88 個膠子強核力

Higgs 機制使 $\mathrm{SU}(2)\times\mathrm{U}(1)$ 破缺至電磁 $\mathrm{U}(1)_{EM}$,賦予 $W,Z$ 質量,光子維持無質量。

全貌所有這些群都是同一個問題的答案:「什麼東西在這個系統下保持不變?」$\mathbb{Z}_2$ 回答宇稱;U(1) 回答電荷;SU(2) 回答自旋;SU(3) 回答色荷;Poincaré 群回答「粒子是什麼」。標準模型用 12 個生成子生成了除重力以外全部已知的基本力。
第二十一章

對稱性如何不靠計算就給出物理

群論最美的能力是:知道系統有某個對稱性,就能直接讀出縮并度、守恆律、禁止躍遷,完全不需解方程或算積分。這一章拆解這個機制。

21.1$[H, U_R]=0$ 是對稱性的定義,不是計算結果

「系統有旋轉對稱性」的數學意思就是:旋轉前後測到的能量不變,$\langle\psi|H|\psi\rangle = \langle\psi|U_R^\dagger H U_R|\psi\rangle$,等價於:

$$U_R^\dagger H U_R = H \quad\Longleftrightarrow\quad [H, U_R]=0$$

這三句話是同一件事的不同寫法,沒有哪個是另一個的計算結果。對具體系統(如氫原子 $H=\tfrac{p^2}{2m}+V(r)$),只需「看一眼」$H$ 是否只依賴旋轉不變量($p^2$、$r$)——這是檢查,不是計算。

21.2對易 → 旋轉後仍是相同能量的本徵態

設 $H|\psi\rangle=E|\psi\rangle$,因 $[H,U_R]=0$:

$$H(U_R|\psi\rangle) = U_R H|\psi\rangle = E(U_R|\psi\rangle)$$

旋轉後的態仍是能量 $E$ 的本徵態。把所有旋轉作用在 $|\psi\rangle$ 上,得到一族等能量的態,自動構成旋轉群的一個表示。

21.3Schur 引理 → 縮并度 = 不可約表示的維度

Schur 引理:若矩陣 $A$ 與一個不可約表示的所有矩陣都對易,則 $A$ 必然是數量矩陣 $\lambda I$。用在物理上:$H$ 與所有旋轉算符對易,所以在每個不可約表示子空間裡 $H=\lambda I$——同一個 irrep 裡的所有態能量完全相同。

Schur 引理證明(複數表示)

設不可約表示 $\{U_R\}$ 作用於複向量空間 $V$,而 $A$ 與所有 $U_R$ 對易。在 $\mathbb{C}$ 上 $A$ 至少有一個本徵值 $\lambda$(代數基本定理)。考慮本徵子空間 $W = \ker(A-\lambda I)\neq\{0\}$。

對任意 $w\in W$ 與任意 $R$:因 $A U_R = U_R A$,有 $A(U_R w) = U_R(Aw) = U_R(\lambda w) = \lambda(U_R w)$,故 $U_R w\in W$。這說明 $W$ 是表示的不變子空間

但表示不可約,唯一的非零不變子空間是 $V$ 自己,故 $W=V$。也就是 $A-\lambda I$ 在整個 $V$ 上為零,即 $A=\lambda I$。

因此 $H$ 在每個 irrep 子空間裡退化為 $\lambda I$,該 irrep 的所有態同能量。群論早已把 SO(3) 的 irrep 分類完了(維度 $2l+1$),所以氫原子每個角動量 $l$ 的能級縮并度必然是 $2l+1$,不解薛丁格方程也知道。

irrep 標籤維度物理意義
$l=0$1$s$ 軌域
$l=1$3$p$ 軌域($m=-1,0,+1$)
$l=2$5$d$ 軌域
$l=n$$2l+1$普遍公式

21.4選擇定則:Clebsch-Gordan 分解

躍遷矩陣元素 $\langle f|\hat{V}|i\rangle$ 中,$|i\rangle$ 屬於 irrep($l$),算符 $\hat{V}$(電偶極 $\vec{r}$)屬於 $l=1$ 的 irrep。Clebsch-Gordan 分解規定 $l\otimes 1 = |l-1|\oplus l\oplus(l+1)$,意思是 $|f\rangle$ 的 irrep 必須出現在這個分解中,否則矩陣元素強制為零。加上宇稱限制,得到電偶極選擇定則:

$$\boxed{\Delta l = \pm 1}$$

完全沒有計算徑向積分,純粹是群論的結果。

21.5什麼要算,什麼不用算

問題需要計算嗎?
$p$ 軌域有幾個縮并態?不需要(irrep 維度 = 3)
電偶極躍遷 $\Delta l=0$ 禁止嗎?不需要(CG 係數 + 宇稱)
躍遷速率具體是多少?需要(仍得算徑向積分)
核心群論告訴你「能不能」(是否為零);計算告訴你「多少」(具體數值)。選擇定則、縮并度、守恆律都屬於「能不能」這一類,全部由對稱群的結構直接讀出,不需對物理系統做任何計算。確認對稱性本身只需看 $H$ 的形式,也沒有積分要算。
第六部最小作用量原理
全書收束於一個反轉:拉格朗日為解約束問題而建立的框架,最終被證明是「對稱性決定動力學」的最自然居所——這是拉格朗日本人都不知道的。
第二十二章

拉格朗日力學:對稱性決定動力學

拉格朗日不是從群論出發的——群論那時還不存在。但他建立的框架後來被群論「認領」,成為整個現代物理的語言。這是理論物理最迷人的歷史反轉。

22.1拉格朗日當時真正的問題

18 世紀力學遇到一個實際困難:有約束的系統很難用牛頓定律處理。一顆在斜面上滑動的球,牛頓要你列出每個力的方向與大小,還必須先求出你根本不感興趣的約束力(支撐力、張力)。拉格朗日想找一套不需考慮約束力、只追蹤系統真正自由度的方法。他的出發點是 d'Alembert 原理(1743):對約束系統,所有力做的虛功之和等於零——這是「在約束允許的運動方向上,力是平衡的」的數學版本。

22.2L = T − V 從何而來

拉格朗日把 d'Alembert 原理推廣後發現,若定義 $L = T - V$(動能減位能),則任何座標系下的運動方程都統一寫成:

$$\frac{d}{dt}\frac{\partial L}{\partial \dot{q}_i} - \frac{\partial L}{\partial q_i} = 0$$

為何是 $T-V$ 而不是 $T+V$?$T+V=E$ 是能量(Hamiltonian),告訴你系統在能量曲面上的位置;$T-V=L$ 告訴你系統在位形空間中如何移動——兩者問的是不同問題。幾何語言:Hamiltonian 是相空間(位置 + 動量)的函數,Lagrangian 是切叢(位置 + 速度)的函數。拉格朗日在《解析力學》(1788)追求把力學完全化約為代數與分析,整本書裡一張圖都沒有。

22.3130 年後:諾特定理

1915 年,Emmy Noether 證明了:$L$ 的每一個連續對稱性,對應一個守恆量。

$L$ 的對稱性對應守恆量
時間平移($t\to t+\varepsilon$)能量
空間平移線動量
空間旋轉(SO(3))角動量
U(1) 相位旋轉($\psi\to e^{i\alpha}\psi$)電荷

拉格朗日完全不知道群論,但他建立的 $L$ 框架偏偏是諾特定理最自然的居所。這是回溯性的「被認領」,不是事先設計的。它的證明短得驚人——核心只是把「對稱性」與「運動方程」兩個條件相減。

諾特定理證明(單參數連續對稱)

設座標的連續變換 $q_i\to q_i + \varepsilon\,\delta q_i$ 使拉格朗日量不變,即 $\delta L = 0$。把 $\delta L$ 用連鎖律展開:

$$\delta L = \sum_i\left(\frac{\partial L}{\partial q_i}\delta q_i + \frac{\partial L}{\partial\dot q_i}\delta\dot q_i\right) = 0$$

代入 Euler–Lagrange 方程 $\dfrac{\partial L}{\partial q_i} = \dfrac{d}{dt}\dfrac{\partial L}{\partial\dot q_i}$(這是「真實運動」的條件):

$$\delta L = \sum_i\left[\left(\frac{d}{dt}\frac{\partial L}{\partial\dot q_i}\right)\delta q_i + \frac{\partial L}{\partial\dot q_i}\frac{d}{dt}\delta q_i\right] = \frac{d}{dt}\!\left(\sum_i\frac{\partial L}{\partial\dot q_i}\,\delta q_i\right)$$

最後一步是乘積微分的逆運算。既然對稱性給出 $\delta L = 0$,括號內的量對時間的導數為零,即它是守恆量

$$Q = \sum_i\frac{\partial L}{\partial\dot q_i}\,\delta q_i = \text{常數}$$

代入具體對稱即得各守恆律:$\delta q_i$ 取常數位移 → 動量 $\sum\partial L/\partial\dot q_i$;取時間平移 → 能量(Hamiltonian);取旋轉 → 角動量。對稱性與守恆律之間,只隔著一行乘積微分。

22.4現代物理把邏輯整個反過來

拉格朗日的邏輯:從牛頓定律出發 → 導出 $L=T-V$。現代量子場論的邏輯:對稱性要求 → 決定 $L$ 的形式。以電動力學為例,要求 $L$ 在 Lorentz 變換下是純量、在局域 U(1) 規範變換下不變、可重整化,這三條幾乎唯一地決定了 QED 的拉格朗日:

$$\mathcal{L}_{\text{QED}} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu} + \bar{\psi}(i\gamma^\mu D_\mu - m)\psi$$

不需要從實驗「猜」這個形式——群論直接告訴你它必須長這個樣子。

22.5路徑積分:為什麼作用量是最小的

哈密頓在 1834 年寫下「自然選取使作用量最小的路徑」,但不知道為什麼。1948 年費曼給出量子力學的答案。粒子從 $A$ 到 $B$ 的振幅是對所有可能路徑求和:

$$\langle B|A\rangle = \int\mathcal{D}q\; e^{iS[q]/\hbar}$$

每條路徑貢獻一個相位 $e^{iS/\hbar}$。當 $\hbar\to 0$(古典極限),只有讓相位靜止($\delta S=0$)的路徑才不會被相消,其他路徑互相抵消。

深層意義古典作用量最小原理不是自然界的「偏好」或目的論——它是量子世界在古典極限下因相位相消而浮現的現象。

22.6歷史的演變

年代人物 / 成果內容
1788拉格朗日處理約束系統,$L=T-V$,Euler-Lagrange 方程
1834哈密頓最小作用量原理 $\delta S=0$
1915諾特對稱性 ↔ 守恆律(關鍵轉折)
1948費曼路徑積分,古典 $\delta S=0$ 是量子相消的極限
20 世紀量子場論對稱性(群論)決定 $L$ 的形式
完整故事拉格朗日是為了解決有約束的力學問題而發明 $L=T-V$ 的,與群論毫無關係——那時群論還不存在。但他偶然建立了一個如此自然的框架,以至於 130 年後諾特發現它恰好是「對稱性↔守恆律」這個深層結構的完美載體。今天的量子場論則把邏輯完全倒轉:不是從動力學推出對稱性,而是從對稱性直接寫下拉格朗日的形式。拉格朗日力學的數學框架是對的,但它成立的真正理由,是拉格朗日本人完全不知道的。
附錄

核心公式總表

隨身速查。

應力與壓力

$$\boldsymbol{\sigma} = -P\,\mathbf{I} + \boldsymbol{\tau}, \qquad P = -\tfrac{1}{3}\mathrm{tr}(\boldsymbol{\sigma}), \qquad d\vec{F} = \boldsymbol{\sigma}\cdot\hat{n}\,dA$$

張量變換法則

$$v'_i = R_{ij}v_j, \qquad T'_{ij} = R_{ik}R_{jl}T_{kl}, \qquad R^TR = I$$

微分算符

$$\nabla\cdot\vec{F} = \mathrm{tr}(\nabla\vec{F}), \qquad (\nabla\times\vec{F})_k = \varepsilon_{ijk}\frac{\partial F_j}{\partial x_i}$$

梯度張量三重分解

$$\nabla\vec{F} = \tfrac{1}{3}(\nabla\cdot\vec{F})\mathbf{I} + \underbrace{\boldsymbol{\Omega}}_{\text{旋度}} + \underbrace{\mathbf{S}^{\text{dev}}}_{\text{純剪切}}$$

兩向量乘積的 spin 分解

$$1\otimes 1 = \underbrace{0}_{\vec{u}\cdot\vec{v}} \oplus \underbrace{1}_{\vec{u}\times\vec{v}} \oplus \underbrace{2}_{\text{對稱無跡}}$$

四元數

$$i^2=j^2=k^2=ijk=-1, \qquad ij=k,\ jk=i,\ ki=j, \qquad \vec{u}\,\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}$$

四元數與旋轉

$$q = \cos\tfrac{\theta}{2}+\sin\tfrac{\theta}{2}\,\hat{n}, \qquad \vec{v}' = q\,\vec{v}\,q^{-1}$$

四元數 ↔ Pauli 矩陣

$$i\leftrightarrow -i\sigma_x, \quad j\leftrightarrow -i\sigma_y, \quad k\leftrightarrow -i\sigma_z, \qquad U = e^{-i\frac{\theta}{2}\hat{n}\cdot\vec{\sigma}}$$

群的四公設

封閉性、結合律、單位元、反元素(交換律非必要;有交換律者為 Abel 群)。

重要的群

$$\mathbb{Z}_n\ \text{(離散)}, \quad \mathrm{U}(1)\ \text{(電荷)}, \quad \mathrm{SU}(2)\ \text{(自旋)}, \quad \mathrm{SU}(3)\ \text{(色荷)}, \quad \text{標準模型}=\mathrm{U}(1)\times\mathrm{SU}(2)\times\mathrm{SU}(3)$$

對稱性與守恆(Noether)

$$[H, U_R]=0 \;\Longleftrightarrow\; \text{對稱};\qquad \text{縮并度}=2l+1;\qquad \text{選擇定則 }\Delta l=\pm 1$$

拉格朗日與作用量

$$L = T - V, \qquad \frac{d}{dt}\frac{\partial L}{\partial\dot{q}_i}-\frac{\partial L}{\partial q_i}=0, \qquad \delta S = \delta\!\int L\,dt = 0, \qquad \langle B|A\rangle = \int\mathcal{D}q\,e^{iS/\hbar}$$

各領域核心方程

$$\vec{L} = \mathbf{I}\vec{\omega}, \quad D_i = \varepsilon_{ij}E_j, \quad \sigma_{ij} = C_{ijkl}\varepsilon_{kl}, \quad G_{\mu\nu} = \tfrac{8\pi G}{c^4}T_{\mu\nu}$$

張量物理導論 · 從應力張量到時空曲率與對稱結構 · 詳解增訂版
從一塊承受壓力的流體,到決定宇宙動力學的對稱群
關鍵定理附嚴格證明 · 核心主旨 對稱創造簡單,非對稱需要張量;對稱性決定動力學