這本講義從一個看似單純的問題出發——「壓力是純量還是向量?」——再沿著它,一路走到時空曲率、量子自旋與規範對稱。表面上主題在變,底層卻只有一個信念貫穿始終:物理的形狀由對稱性決定。對稱創造簡單,非對稱才需要張量。
第一條線是「張量」(第一部):從應力張量切入,建立梯度、散度、旋度的張量本質,最後抵達廣義相對論。這條線回答「當方向之間互相耦合,該用什麼語言描述」。
第二條線是「對稱」(第二至六部):從複數與四元數的代數源頭出發,經由旋轉的夾擊乘法、向量分析的歷史抉擇,進入群論,最後在拉格朗日力學與最小作用量原理收束。這條線回答「為什麼物理定律會長成現在的樣子」。
兩條線在數個節點交會——梯度張量的 spin 分解(第六、十七章)、四元數與 SU(2) 的對應(第十八章)皆是。各章可獨立閱讀,但依序讀下來,會看見一個完整的故事:從一塊承受壓力的流體,到決定宇宙動力學的對稱群。標有「定理」與「證明」的方框,是為希望看到嚴格論證的讀者準備的,初讀可略過而不影響理解。
我們從一個看似簡單的問題出發:力是向量,那壓力呢?這個問題會一路帶我們走到張量。
我們都知道力是向量,壓力理論上似乎也該有方向性,但教學上談壓力時往往不強調方向。這其實源自中文術語的混用——「壓力」同時指稱兩個不同的物理量:
| 術語 | 本質 | 是否為向量 |
|---|---|---|
| 壓力(接觸力意義) | 物體對接觸面施加的法向力 | 是向量 |
| 壓強($P = F/A$) | 單位面積上的正向力大小 | 是純量 |
這正是方向性被模糊的根源:當我們說「壓強是純量」時是對的,但「接觸壓力是向量」也是對的,兩者是不同的量。
壓強是純量並非教學偷懶,而是有深刻的物理原因。在靜態流體中,壓強具有等向性(isotropy):流體內任一點,不論你如何擺放一個面積元素 $dA$,該面上承受的力大小都是 $P\,dA$,方向永遠沿著那個面的法向量 $\hat{n}$:
$$d\vec{F} = P\,dA\,\hat{n}$$
用更底層的語言說:壓強是應力張量的等向部分(trace)。應力張量本身是二階張量,純靜水壓的應力張量恰好是 $-P\,\mathbf{I}$,其全部方向資訊都被單位矩陣 $\mathbf{I}$ 編碼了,所以剩下的 $P$ 才是純量。
那固體接觸的「壓力」(向量意義)為什麼老師也不太強調方向?因為它的方向已被幾何決定——接觸面的壓力永遠垂直於接觸面,方向隱含在「法向」這個字裡。一旦你認出接觸面,方向就確定了,所以不需要額外強調。理論上它仍然是完整的向量。
物體壓地板的「壓力」與地板回推物體的「正向力」,正是牛頓第三定律的作用—反作用對:
物體 A ──── 壓力(A 對地板)────▶ 地板 地板 ──── 正向力(地板對 A)────▶ 物體 A
兩者大小相等、方向相反、作用於不同物體,都垂直於接觸面——這才是真正的第三定律對。
視描述層次而定——底層是張量,靜態特例退化為純量。完整的描述是 Cauchy 應力張量(二階對稱張量):
$$\boldsymbol{\sigma} = \begin{pmatrix} \sigma_{xx} & \sigma_{xy} & \sigma_{xz} \\ \sigma_{yx} & \sigma_{yy} & \sigma_{yz} \\ \sigma_{zx} & \sigma_{zy} & \sigma_{zz} \end{pmatrix}$$
對法向量為 $\hat{n}$ 的面元,受力是 $d\vec{F} = \boldsymbol{\sigma}\cdot\hat{n}\,dA$,方向不一定沿著 $\hat{n}$——這就是張量比純量豐富的地方。
靜態流體沒有剪應力,應力張量必須等向:
$$\boldsymbol{\sigma} = -P\,\mathbf{I} = \begin{pmatrix} -P & 0 & 0 \\ 0 & -P & 0 \\ 0 & 0 & -P \end{pmatrix} \quad\Longrightarrow\quad d\vec{F} = -P\,\hat{n}\,dA$$
力永遠沿 $-\hat{n}$(壓縮方向),大小永遠 $P\,dA$,與面的方向無關。整個張量被單一純量 $P$ 完全決定。
Newtonian 黏性流體的應力張量多了黏性項:
$$\boldsymbol{\sigma} = \underbrace{-P\,\mathbf{I}}_{\text{等向壓力項}} + \underbrace{\mu\!\left(\nabla\vec{v}+(\nabla\vec{v})^T\right) + \lambda(\nabla\cdot\vec{v})\mathbf{I}}_{\text{黏性應力張量}}$$
此時非對角項(剪應力)不為零,純量 $P$ 無法單獨描述應力狀態——這正是 Navier–Stokes 方程需要張量語言的原因。純量壓強的精確定義是應力張量的等向不變量:
$$P = -\tfrac{1}{3}\,\mathrm{tr}(\boldsymbol{\sigma}) = -\tfrac{1}{3}(\sigma_{xx}+\sigma_{yy}+\sigma_{zz})$$
流體的定義就是「靜止時無法承受剪應力」——否則它會持續變形直到剪應力消失。所以:
| 應力類型 | 靜態液體 | 流動液體(黏性) |
|---|---|---|
| 法向應力(對角) | ✓ 有(即壓強 $-P$) | ✓ 有 |
| 剪應力(非對角) | ✗ 為零(流體定義) | ✓ 有(黏性產生) |
理解 $\sigma_{ij}$ 兩個下標的意義,是掌握張量的第一道門檻。但在此之前,有一個更根本的問題:我們憑什麼斷定應力「是一個張量」?
陳述:在連續體內任一點,作用於某面元的牽引向量 $\vec{t}(\hat{n})$(單位面積的力)是該面外法向量 $\hat{n}$ 的線性函數。因此存在唯一的二階張量 $\boldsymbol{\sigma}$,使得對任意方向 $\hat{n}$:
$$\vec{t}(\hat{n}) = \boldsymbol{\sigma}\cdot\hat{n}, \qquad t_i = \sigma_{ij}\,n_j$$
取一個無窮小四面體,三個面落在座標平面上(外法向分別為 $-\hat{e}_1, -\hat{e}_2, -\hat{e}_3$,面積記為 $dA_1, dA_2, dA_3$),第四個斜面外法向為 $\hat{n}$、面積為 $dA$。由投影幾何,三個座標面是斜面在各軸的投影,故 $dA_i = n_i\,dA$。
對四面體用牛頓第二定律。表面力是各面牽引向量乘面積之和(座標面上牽引為 $\vec{t}(-\hat{e}_i) = -\vec{t}(\hat{e}_i)$);另有體力與慣性項。設四面體線度為 $\ell$,則表面積 $\propto \ell^2$,而體積(體力與 $m\vec{a}$)$\propto \ell^3$。令 $\ell\to 0$,體積項以更高階消失,表面力必須自相平衡:
$$\vec{t}(\hat{n})\,dA - \vec{t}(\hat{e}_1)\,dA_1 - \vec{t}(\hat{e}_2)\,dA_2 - \vec{t}(\hat{e}_3)\,dA_3 = 0$$
代入 $dA_i = n_i\,dA$ 並消去 $dA$:
$$\vec{t}(\hat{n}) = \sum_j \vec{t}(\hat{e}_j)\,n_j$$
定義 $\sigma_{ij} \equiv \big(\vec{t}(\hat{e}_j)\big)_i$(即法向為 $\hat{e}_j$ 的面上,牽引向量的第 $i$ 分量),即得 $t_i = \sigma_{ij}n_j$。由於 $\vec{t}$ 與 $\hat{n}$ 都是向量、此關係在任何座標系皆成立,$\sigma_{ij}$ 必依二階張量法則變換。∎
這個定理是整章的地基:它告訴我們,描述「任意切面上的受力」不需要記錄無窮多個方向的資料,只要九個數 $\sigma_{ij}$ 就完全決定了。接下來逐一拆解這九個數的意義。
$\sigma_{ij}$ 的兩個下標各代表一件事:第一個下標 $i$ 是面的法向方向,第二個下標 $j$ 是力的作用方向。
$$\sigma_{\underset{\text{面的法向}}{i}\,\underset{\text{力的方向}}{j}}$$
所以 $\sigma_{xy}$ 的意思是:「法向量指向 $x$ 方向的面(即 $yz$ 平面那一面)上,沿 $y$ 方向的應力分量」。
把應力張量畫在一個立方體元素上,9 個分量分成兩類:
對任意面元(法向量 $\hat{n}$),作用其上的牽引向量(traction)是 $\vec{t} = \boldsymbol{\sigma}\cdot\hat{n}$。這個向量一般不平行於 $\hat{n}$,可分解為兩部分:
$$\vec{t} = \underbrace{(\vec{t}\cdot\hat{n})\,\hat{n}}_{\text{法向應力 }\sigma_n} + \underbrace{\vec{t} - (\vec{t}\cdot\hat{n})\,\hat{n}}_{\text{剪應力 }\tau}$$
這是理解張量的關鍵。三者的力都指向 $x$ 方向,但描述的是「切出哪個面,才能看到這個 $x$ 方向的力?」
| 分量 | 切面法向量 | 力的方向 | 物理意義 |
|---|---|---|---|
| $\sigma_{xx}$ | $x$ 面 | $x$ 方向 | 法向壓縮/拉伸 |
| $\sigma_{yx}$ | $y$ 面 | $x$ 方向 | $y$ 面上的剪切 |
| $\sigma_{zx}$ | $z$ 面 | $x$ 方向 | $z$ 面上的剪切 |
這三個值可以完全不同。以 Couette 流(兩板間流體,上板移動)為例:
$$\sigma_{yx} = \mu\frac{dv_x}{dy} \neq 0, \qquad \sigma_{xx} = 0, \qquad \sigma_{zx} = 0$$
即使「方向都是 $x$」,數值截然不同。
由角動量守恆可證 $\sigma_{ij} = \sigma_{ji}$(張量對稱),所以獨立分量只有 6 個:
$$\sigma_{xx},\ \sigma_{yy},\ \sigma_{zz},\quad \sigma_{xy},\ \sigma_{xz},\ \sigma_{yz}$$
取邊長 $\ell$ 的立方體元素,計算繞 $z$ 軸的力矩。剪應力 $\sigma_{xy}$($x$ 面上沿 $y$ 方向的力)在一對相對面上形成力偶,貢獻力矩 $\sigma_{xy}\cdot(\ell^2)\cdot\ell$;剪應力 $\sigma_{yx}$($y$ 面上沿 $x$ 方向)形成反向力偶 $\sigma_{yx}\cdot(\ell^2)\cdot\ell$。淨力矩使元素產生角加速度:
$$(\sigma_{xy} - \sigma_{yx})\,\ell^3 = I\dot{\omega} \propto \rho\,\ell^5\,\dot{\omega}$$
轉動慣量 $I\propto\ell^5$,力矩 $\propto\ell^3$。令 $\ell\to 0$,右邊以 $\ell^5$ 階消失,遠快於左邊的 $\ell^3$;除非 $\sigma_{xy}=\sigma_{yx}$,否則角加速度 $\dot\omega\propto\ell^{-2}\to\infty$,物理上不可能。故 $\sigma_{xy}=\sigma_{yx}$,同理 $\sigma_{ij}=\sigma_{ji}$。∎
靜態液體更進一步退化:6 個獨立分量全被同一純量 $P$ 決定。
這一節把前面所有概念拉回到高中最熟悉的場景——一塊放在桌面上的木塊。高中物理把接觸面上的作用拆成兩個「不同的力」:垂直於面的正向力 $F_N$,與平行於面的摩擦力 $F_f$。但從應力張量的角度看,它們從來就不是兩個獨立的東西。
由 Cauchy 定理,接觸面(外法向 $\hat{n}$)上的牽引向量是 $\vec{t} = \boldsymbol{\sigma}\cdot\hat{n}$。把它分解成法向與切向兩部分:
$$\vec{t} = \underbrace{\sigma_{nn}\,\hat{n}}_{\text{法向 → 正向力}} + \underbrace{\vec{\tau}}_{\text{切向 → 摩擦力}}, \qquad \sigma_{nn} = \hat{n}\cdot\boldsymbol{\sigma}\cdot\hat{n}, \quad \vec{\tau} = \vec{t} - \sigma_{nn}\hat{n}$$
對整個接觸面積分,就得到巨觀的兩個力:
$$F_N = \iint \sigma_{nn}\,dA, \qquad \vec{F}_f = \iint \vec{\tau}\,dA$$
高中教的 $|\vec{F}_f| \leq \mu |\vec{F}_N|$ 是巨觀積分後的版本。連續體層次的表述是逐點成立的莫爾–庫侖準則(Mohr–Coulomb criterion):
$$|\vec{\tau}| \leq \mu\,\sigma_{nn}$$
這個不等式在「莫爾圓」上有極美的幾何意義。先嚴格推導莫爾圓:
設在主軸座標系中應力張量已對角化,主應力為 $\sigma_1, \sigma_2$。考慮一個切面,其法向量與第一主軸夾角 $\theta$,即 $\hat{n} = (\cos\theta, \sin\theta)$。計算法向應力與剪應力:
$$\sigma_{nn} = \hat{n}\cdot\boldsymbol{\sigma}\cdot\hat{n} = \sigma_1\cos^2\theta + \sigma_2\sin^2\theta$$
用倍角公式 $\cos^2\theta = \tfrac{1+\cos 2\theta}{2}$、$\sin^2\theta = \tfrac{1-\cos 2\theta}{2}$ 整理:
$$\sigma_{nn} = \frac{\sigma_1+\sigma_2}{2} + \frac{\sigma_1-\sigma_2}{2}\cos 2\theta$$
同理,切向分量的大小為:
$$\tau = \frac{\sigma_1-\sigma_2}{2}\sin 2\theta$$
這對 $(\sigma_{nn}, \tau)$ 滿足 $\left(\sigma_{nn} - \tfrac{\sigma_1+\sigma_2}{2}\right)^2 + \tau^2 = \left(\tfrac{\sigma_1-\sigma_2}{2}\right)^2$——這是一個圓:圓心在 $\big(\tfrac{\sigma_1+\sigma_2}{2}, 0\big)$,半徑 $R = \tfrac{\sigma_1-\sigma_2}{2}$。當切面方向 $\theta$ 改變時,$(\sigma_{nn}, \tau)$ 就沿著這個圓移動。∎
在 $\sigma_{nn}$–$\tau$ 平面上畫出這個莫爾圓,再畫一條過原點、斜率為 $\mu = \tan\phi$ 的直線($\phi$ 是摩擦角),庫侖準則的幾何意義就一目了然:
| 高中概念 | 連續體對應 | 在應力張量的哪裡 |
|---|---|---|
| 正向力 $F_N$ | 法向應力 $\sigma_{nn}$ 的面積分 | $\hat{n}$ 方向的對角分量 |
| 摩擦力 $F_f$ | 剪應力 $\vec{\tau}$ 的面積分 | 非對角(切向)分量 |
| 庫侖定律 $F_f \leq \mu F_N$ | Mohr–Coulomb $|\vec{\tau}|\leq\mu\sigma_{nn}$ | 兩類分量之間的約束 |
這個框架遠遠超出桌面上的木塊:地質斷層的地震,就是岩石接觸面上剪應力超過 Mohr–Coulomb 準則的那一刻,地質學家用莫爾圓預測哪個走向的斷層最易滑動;土壤力學的地基承載分析用同一套,只是多了黏聚力 $c$($|\vec{\tau}|\leq c + \mu\sigma_{nn}$);金屬切削中,刀具界面的正向應力決定刀具壽命、剪應力決定切削力,兩者由同一個接觸應力張量描述。
$\nabla$ 算符如何升降張量階數?散度與旋度又是什麼的「切片」?這章補上完整證明。
對向量場 $\vec{F} = (F_x, F_y, F_z)$,它的梯度是:
$$(\nabla\vec{F})_{ij} = \frac{\partial F_i}{\partial x_j}$$
這是一個 $3\times3$ 的二階張量,結構與應力張量相同。散度與旋度都是從這個張量「拆解」出來的。
判準是座標變換法則。在旋轉變換 $x'_i = R_{ij}x_j$($R$ 正交,$R^T = R^{-1}$)下,各階張量的變換法則為:
$$\text{rank-0:}\ \phi'=\phi, \qquad \text{rank-1:}\ v'_i = R_{ij}v_j, \qquad \text{rank-2:}\ T'_{ij} = R_{ik}R_{jl}T_{kl}$$
規律:每多一個自由下標,就多一個 $R$ 作用其上。
從 $x'_i = R_{ij}x_j$ 反解得 $x_j = R_{ij}x'_i$(因為 $x = R^T x'$,而 $(R^T)_{ji} = R_{ij}$),故:
$$\frac{\partial x_j}{\partial x'_i} = R_{ij}$$
代入連鎖律,得到偏微分算符的變換法則:
$$\frac{\partial}{\partial x'_i} = \sum_j \frac{\partial x_j}{\partial x'_i}\frac{\partial}{\partial x_j} = \sum_j R_{ij}\frac{\partial}{\partial x_j}$$
這與向量變換 $v'_i = R_{ij}v_j$ 完全相同。因此 $\nabla = \partial/\partial x_i$ 是 rank-1 向量算符。
已知 $\phi$ 是純量($\phi'(x') = \phi(x)$)。令 $g_i = \partial\phi/\partial x_i$,$g'_i = \partial\phi/\partial x'_i$。由連鎖律:
$$g'_i = \frac{\partial\phi}{\partial x'_i} = \sum_j \frac{\partial x_j}{\partial x'_i}\cdot\frac{\partial\phi}{\partial x_j} = \sum_j R_{ij}g_j$$
$$\boxed{g'_i = R_{ij}g_j}$$ 符合 rank-1 變換法則。$\therefore\ \nabla\phi$ 是向量。$\square$
已知 $F_i$ 是向量($F'_i = R_{ik}F_k$)。令 $T_{ij} = \partial F_i/\partial x_j$。用第一步把 $\partial/\partial x'_j$ 換掉,再把 $F'_i = R_{ik}F_k$ 代入($R$ 為常數矩陣可移出微分):
$$T'_{ij} = \frac{\partial F'_i}{\partial x'_j} = \sum_l R_{jl}\frac{\partial}{\partial x_l}(R_{ik}F_k) = \sum_{k,l} R_{ik}R_{jl}\frac{\partial F_k}{\partial x_l}$$
$$\boxed{T'_{ij} = R_{ik}R_{jl}T_{kl}}$$ 符合 rank-2 變換法則。$\therefore\ \nabla\vec{F}$ 是二階張量。$\square$
以散度為例,令 $S = T_{ii}$(對角求和),證明它是純量:
$$S' = T'_{ii} = \sum_i R_{ik}R_{il}T_{kl} = \sum_{k,l}\underbrace{\Big(\sum_i R_{ik}R_{il}\Big)}_{(R^TR)_{kl}\,=\,\delta_{kl}} T_{kl} = \sum_k T_{kk} = S$$
正交性 $R^TR = I$ 在此把兩個自由下標「抵消」成零,使跡成為不變量。
$$\nabla\cdot\vec{F} = \frac{\partial F_x}{\partial x}+\frac{\partial F_y}{\partial y}+\frac{\partial F_z}{\partial z} = \mathrm{tr}(\nabla\vec{F})$$
把二階張量壓縮成零階純量,與壓強是應力張量之跡的邏輯完全相同。
二階張量可分解為對稱與反對稱部分。反對稱部分有三個獨立分量:
$$\Omega_{ij} = \frac{1}{2}\!\left(\frac{\partial F_i}{\partial x_j} - \frac{\partial F_j}{\partial x_i}\right)$$
旋度透過 Levi-Civita 符號 $\varepsilon_{ijk}$(三階全反對稱張量)把這個反對稱矩陣打包成向量:
$$(\nabla\times\vec{F})_k = \varepsilon_{ijk}\frac{\partial F_j}{\partial x_i}$$
整個結構一覽:
$$\underbrace{\nabla\vec{F}}_{\text{二階張量}} \longrightarrow \begin{cases} \text{跡} &\to\ \nabla\cdot\vec{F}\ \text{(純量)} \\ \text{對稱部分} &\to\ \text{應變率張量} \\ \text{反對稱部分} &\to\ \nabla\times\vec{F}\ \text{(向量)} \end{cases}$$
為什麼整套張量理論都建立在 $R^TR = I$ 這一行定義上?
正交矩陣 $R$ 的核心定義只有一行:
$$\boxed{R^TR = I} \quad\Longleftrightarrow\quad R^T = R^{-1}$$
設 $R$ 第 $j$ 行為 $\vec{r}_j$,則 $(R^TR)_{ij} = \vec{r}_i\cdot\vec{r}_j = \delta_{ij}$,即各行向量互相垂直且為單位長。
取行列式:$\det(R^T)\det(R) = \det(I) = 1$。因 $\det(R^T)=\det(R)$,故 $[\det(R)]^2 = 1 \Rightarrow \det(R) = \pm 1$。
$(R\vec{u})\cdot(R\vec{v}) = \vec{u}^T R^TR\,\vec{v} = \vec{u}\cdot\vec{v}$。內積不變 $\Rightarrow$ 長度 $|R\vec{u}|=|\vec{u}|$、夾角不變。
$R^TR = I$ 在幾何上意味著變換前後任意兩點距離不變:
$$|R\vec{x} - R\vec{y}|^2 = (\vec{x}-\vec{y})^T R^TR\,(\vec{x}-\vec{y}) = |\vec{x}-\vec{y}|^2$$
這正是直覺上「不拉伸、不壓縮」的剛性運動,具體分兩類:
| $\det(R)=+1$ | $\det(R)=-1$ | |
|---|---|---|
| 幾何操作 | 純旋轉 | 旋轉 + 鏡射 |
| 手性 | 保持(右手系→右手系) | 翻轉(右手系→左手系) |
| 群名稱 | $SO(n)$(特殊正交群) | $O(n)\setminus SO(n)$ |
旋轉角 $\theta$ 的矩陣:
$$R(\theta) = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$$
驗證 $R^TR = I$:
$$R^TR = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix}\!\begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\ \checkmark$$
且 $\det R = \cos^2\theta + \sin^2\theta = 1$,確為旋轉。
第三章的推導有兩處用到正交性:
從電場到颱風,從導熱到時空——梯度與旋度的具體面貌。
所有保守場都有統一骨架,負號是「往低位走」的物理體現:
$$\underbrace{\phi(\vec{r})}_{\text{純量場}} \xrightarrow{\ -\nabla\ } \underbrace{\vec{F}(\vec{r})}_{\text{物理向量場}}$$
| 純量 $\phi$ | 物理向量場 | 定律名稱 |
|---|---|---|
| 電位 $V$ | $\vec{E} = -\nabla V$ | 電磁學基本關係 |
| 重力位 $\Phi = gz$ | $\vec{g} = -\nabla\Phi$ | 萬有引力 |
| 溫度 $T$ | $\vec{q} = -\kappa\nabla T$ | Fourier 導熱定律 |
| 壓力 $P$ | $\vec{F}/V = -\nabla P$ | Euler 方程壓力項 |
沿等值面移動時 $d\phi = \nabla\phi\cdot d\vec{l} = 0$,所以 $\nabla\phi \perp d\vec{l}$。等值面越密集,梯度越大——這就是為何電荷附近電場最強。
$\vec{v} = \omega(-y, x, 0)$ 的旋度:
$$(\nabla\times\vec{v})_z = \frac{\partial v_y}{\partial x} - \frac{\partial v_x}{\partial y} = \omega - (-\omega) = 2\omega$$
為何是 2 倍?用「槳輪實驗」理解:把小十字槳輪放入流體,它的自轉角速度等於 $\frac{1}{2}\nabla\times\vec{v} = \omega$,與流場整體旋轉同步。因子 2 是旋度定義帶來的——旋度是局部自轉率的兩倍。這直接連結到 $\nabla\times\vec{v}$ 正是速度梯度張量反對稱部分的軸向量。
$\vec{v} = \frac{\Gamma}{2\pi}\frac{\hat\phi}{r}$ 的旋度,在奇點之外:
$$\frac{\partial v_y}{\partial x} - \frac{\partial v_x}{\partial y} = \frac{y^2-x^2}{r^4} - \frac{y^2-x^2}{r^4} = 0$$
兩項精確相消,旋度為零。把槳輪放入這個渦流,它只繞圈公轉、自身不旋轉。但繞中心一圈的環流量 $\oint\vec{v}\cdot d\vec{l} = \Gamma \neq 0$!
矛盾在哪?Stokes 定理說 $\oint\vec{v}\cdot d\vec{l} = \iint(\nabla\times\vec{v})\cdot d\vec{A}$。答案是奇點 $r=0$ 處有 Dirac δ 函數的旋度:$\nabla\times\vec{v} = \Gamma\,\delta^{(2)}(\vec{r})$。這是拓撲障礙,域不是單連通的。
$$\nabla\times\vec{B} = \mu_0\vec{J}$$
截面外 $\vec{J}=0$,故 $\nabla\times\vec{B}=0$;但 $\vec{B}\neq 0$!與②一樣存在拓撲障礙:無法定義全局純量位使 $\vec{B} = -\nabla\phi$,因為繞導線一圈的積分永遠不為零。這個結構在量子力學中引發 Aharonov–Bohm 效應——帶電粒子即使永不進入有 $\vec{B}$ 的區域,仍能感受到導線的存在。
$\vec{v} = (Uy/h, 0, 0)$,旋度:
$$(\nabla\times\vec{v})_z = -\frac{\partial v_x}{\partial y} = -\frac{U}{h}$$
這個均勻旋度正是速度梯度張量的反對稱部分。黏性應力 $\tau_{yx} = \mu\,dv_x/dy$ 的產生根源就是它——每個流體微元都在旋轉,相鄰微元間的相對旋轉摩擦出剪切力。
任何足夠光滑的向量場都可唯一分解:
$$\vec{F} = \underbrace{-\nabla\phi}_{\substack{\text{無旋部分}\\\nabla\times\vec{F}=0}} + \underbrace{\nabla\times\vec{A}}_{\substack{\text{無散部分}\\\nabla\cdot\vec{F}=0}}$$
能寫成純量位 $-\nabla\phi$ 的充要條件是 $\nabla\times\vec{F} = 0$(保守場)。靜電場、地球重力場滿足此條件,磁場與黏性流速場一般不滿足。
「散度加旋度」並不等於梯度張量的全部——還缺 5 個分量。
$\nabla\vec{F}$ 是 9 個獨立分量的二階張量,但:
$$\nabla\cdot\vec{F}\ (\text{純量}) + \nabla\times\vec{F}\ (\text{向量}) = 1 + 3 = 4 \text{ 個分量}$$
$9 \neq 4$,還差 5 個分量,這部分既非散度也非旋度。
$$\frac{\partial F_i}{\partial x_j} = \underbrace{\tfrac{1}{3}(\nabla\cdot\vec{F})\delta_{ij}}_{\text{等向部分(1)}} + \underbrace{\tfrac{1}{2}\!\left(\tfrac{\partial F_i}{\partial x_j}-\tfrac{\partial F_j}{\partial x_i}\right)}_{\text{反對稱部分(3)}} + \underbrace{\tfrac{1}{2}\!\left(\tfrac{\partial F_i}{\partial x_j}+\tfrac{\partial F_j}{\partial x_i}\right)-\tfrac{1}{3}(\nabla\cdot\vec{F})\delta_{ij}}_{\text{無跡對稱部分(5)}}$$
| 部分 | 數學結構 | 對應量 | 分量數 |
|---|---|---|---|
| 等向部分 | $\propto\delta_{ij}$ | 散度 $\nabla\cdot\vec{F}$ | 1 |
| 反對稱部分 | $A_{ij}=-A_{ji}$ | 旋度 $\nabla\times\vec{F}$ | 3 |
| 無跡對稱部分 | $S_{ij}=S_{ji}$, $\mathrm{tr}=0$ | 純剪切/應變(無低階對應) | 5 |
在流體力學中,速度梯度張量的三部分各司其職:
∇v(速度梯度張量)
├─ 等向部分 ───────→ 體積膨脹/壓縮率(∇·v)
├─ 反對稱部分 ──────→ 剛性自轉(渦度 = ½∇×v)
└─ 無跡對稱部分 ────→ 純剪切變形(不旋轉、不改體積)
第三部分驅動的是無旋轉的純形變——把圓球拉成橢球,但不旋轉、不改體積。這無法用散度(改體積)或旋度(旋轉)描述。
這不是巧合——黏性應力張量結構完全一樣:
$$\boldsymbol{\sigma} = \underbrace{-P\,\mathbf{I}}_{\text{等向(散度類)}} + \underbrace{\mu\!\left(\nabla\vec{v}+(\nabla\vec{v})^T\right) - \tfrac{2\mu}{3}(\nabla\cdot\vec{v})\mathbf{I}}_{\text{黏性偏差應力(無跡對稱)}}$$
黏性耗散的來源正是這個無跡對稱部分,而非旋度部分(旋轉不耗散能量)。
在三維旋轉群 $SO(3)$ 下,二階張量分解為三個不可約表示:
$$\text{rank-2} = \underbrace{\text{自旋-0}}_{\text{純量,1維}} \oplus \underbrace{\text{自旋-1}}_{\text{(偽)向量,3維}} \oplus \underbrace{\text{自旋-2}}_{\text{對稱無跡,5維}}$$
按階數巡禮:從慣性張量到黎曼曲率張量。
| 階數 | 張量 | 方程 | 領域 | 獨立分量 |
|---|---|---|---|---|
| 0 | 溫度、壓力、質量 | — | 所有領域 | 1 |
| 1 | 力、速度、電場 | $F'_i=R_{ij}F_j$ | 力學、電磁 | 3 |
| 2 | 應力張量 $\sigma_{ij}$ | $dF_i=\sigma_{ij}n_j\,dA$ | 連續體力學 | 6 |
| 2 | 慣性張量 $I_{ij}$ | $L_i=I_{ij}\omega_j$ | 剛體力學 | 6 |
| 2 | 介電張量 $\varepsilon_{ij}$ | $D_i=\varepsilon_{ij}E_j$ | 晶體光學 | 6 |
| 2 | 電磁場張量 $F_{\mu\nu}$ | $\partial_\mu F^{\mu\nu}=\mu_0 J^\nu$ | 狹義相對論 | 6 |
| 2 | 能量動量張量 $T_{\mu\nu}$ | $G_{\mu\nu}=\frac{8\pi G}{c^4}T_{\mu\nu}$ | 廣義相對論 | 10 |
| 3 | 壓電張量 $d_{ijk}$ | $P_i=d_{ijk}\sigma_{jk}$ | 固態物理 | 18 |
| 4 | 彈性張量 $C_{ijkl}$ | $\sigma_{ij}=C_{ijkl}\varepsilon_{kl}$ | 固體力學 | 21 |
| 4 | 黎曼曲率張量 $R_{\mu\nu\rho\sigma}$ | — | 廣義相對論 | 20 |
$\vec{L} = \mathbf{I}\,\vec{\omega}$,其中 $I_{ij} = \int\rho(|\vec{r}|^2\delta_{ij} - r_ir_j)\,dV$。對稱物體 $\mathbf{I} = I\,\mathbf{1}$,$\vec{L}\parallel\vec{\omega}$;非對稱物體 $\vec{L}$ 與 $\vec{\omega}$ 方向不同——這種「輸入一個方向、輸出另一方向」的映射必須用張量描述。陀螺進動正是 $\vec{L}$ 追不上 $\vec{\omega}$ 所致。
$$F_{\mu\nu} = \begin{pmatrix} 0 & -E_x/c & -E_y/c & -E_z/c \\ E_x/c & 0 & -B_z & B_y \\ E_y/c & B_z & 0 & -B_x \\ E_z/c & -B_y & B_x & 0 \end{pmatrix}$$
電場在時間—空間軸上,磁場在空間—空間軸上。E 與 B 其實是同一張量在不同參考系下的切片——高速運動的觀察者看到純電場,靜止觀察者看到磁場分量。四條 Maxwell 方程壓縮為兩條張量方程。
$\sigma_{ij} = C_{ijkl}\varepsilon_{kl}$ 是 rank-2 → rank-2 的映射,需要 rank-4 橋梁。理論上 81 個分量,經對稱性逐步減少:
$$81 \xrightarrow{\sigma\text{對稱}} 54 \xrightarrow{\varepsilon\text{對稱}} 36 \xrightarrow{\text{能量守恆}} 21$$
各向同性材料降到 2 個常數(Lamé $\lambda,\mu$),退化為 $\sigma_{ij} = \lambda(\nabla\cdot\vec{u})\delta_{ij} + 2\mu\varepsilon_{ij}$,正是應力張量的等向項加偏差項。
Einstein 場方程 $G_{\mu\nu} = \frac{8\pi G}{c^4}T_{\mu\nu}$ 是兩個 rank-2 張量相等:左邊由黎曼張量(rank-4)縮并兩次得到,描述時空幾何曲率;右邊 $T_{\mu\nu}$ 的對角元素 $T_{00}$ 是能量密度,空間部分 $T_{ij}$ 正是應力張量。黎曼張量的不可消去性是時空真正彎曲(無法用座標變換拉平)的判準。
高中物理的「方向獨立」,其實是張量在高對稱下的退化特例。
$F_x = ma_x$、$F_y = ma_y$ 隱含質量張量為對角矩陣:
$$\begin{pmatrix}F_x\\F_y\\F_z\end{pmatrix} = \begin{pmatrix}m&0&0\\0&m&0\\0&0&m\end{pmatrix}\begin{pmatrix}a_x\\a_y\\a_z\end{pmatrix}$$
非對角項一旦出現,方向就耦合:一個方向的輸入產生另一方向的回應。
對所有實對稱張量,譜定理保證存在一組主軸使其對角化:
$$\mathbf{T} = \mathbf{R}\begin{pmatrix}\lambda_1&&\\&\lambda_2&\\&&\lambda_3\end{pmatrix}\mathbf{R}^T$$
在主軸座標系中方向解耦。高中教「選座標軸」,其實是不自覺地尋找主軸。
這裡有重要區分。拋體運動的質量張量 $m\mathbf{I}$ 正比於單位矩陣,在任何座標系下都是對角的——不管旋轉幾度,非對角項都是零。這不是「選對主軸」,而是空間等向性所決定。選 $y$ 軸朝上只是讓重力分解漂亮(使 $F_x=0$)。即使旋轉 45°,方程仍解耦:
| 標準選軸(y 朝上) | 旋轉 45° 座標 | |
|---|---|---|
| x 方向 | $a_x = 0$ | $a_{x'} = -g/\sqrt{2}$ |
| y 方向 | $a_y = -g$ | $a_{y'} = -g/\sqrt{2}$ |
| 方向耦合? | ✗ | ✗(仍解耦) |
但真實世界確實有耦合,一旦放寬近似:
| 群 | 性質 | 例子 |
|---|---|---|
| A | 本質純量,永遠等向 | 溫度、質量、電荷、密度、熵、靜態壓力 |
| B | 本質向量,有方向不耦合 | 力、動量、加速度、真空電磁場 |
| C | 依介質而定(純量或張量) | 介電 $\varepsilon$、電導 $\sigma$、熱導 $\kappa$、擴散 $D$、有效質量 $m^*$ |
| D | 本質張量,永遠各向異性 | 應力、應變、慣性、彈性、電磁場、曲率張量 |
群 C、D 的張量在足夠高對稱時,非對角項逐漸消失:
$$\text{球對稱} \to \text{純量 }(\lambda\mathbf{I}) \quad\to\quad \text{軸對稱} \to 2\text{ 個} \quad\to\quad \text{三斜(最低)} \to 21\text{ 個}$$
群 C 揭示了「純量是張量的退化特例」:
$$\underbrace{\lambda_1\hat{e}_1\hat{e}_1 + \lambda_2\hat{e}_2\hat{e}_2 + \lambda_3\hat{e}_3\hat{e}_3}_{\text{一般張量(三個不同特徵值)}} \xrightarrow{\lambda_1=\lambda_2=\lambda_3} \underbrace{\lambda\mathbf{I}}_{\text{純量 × 單位矩陣}}$$
人類的測量直覺偏好「同向因果」,而耦合恰恰違反這個本能。
函數的基本概念是 $y = f(x)$,輸入一個數、輸出一個數。推廣到向量時,最自然的想法是各方向獨立,像三條互不干擾的 $y = f(x)$。更深的原因是測量的設計邏輯:實驗者傾向控制一方向輸入、量同方向輸出,因為最乾淨。若回應跑到別的方向,第一反應是「哪裡出錯」而非「這是新物理」。加上日常物體多近似等向,使「同向因果」根深蒂固。
| 年份 | 發現 | 違反直覺之處 |
|---|---|---|
| 1669 | 雙折射(Bartholin) | 一束光入射,兩束不同方向的光射出(冰洲石) |
| 1827 | 泊松比(Poisson) | $x$ 方向拉伸 → $y, z$ 方向收縮 |
| 19 世紀 | 陀螺進動 | $z$ 方向扭矩 → $x$ 方向運動 |
| 1879 | 霍爾效應(Hall) | $x$ 方向電流 → $y$ 方向電壓 |
| 1880 | 壓電效應(居里兄弟) | $z$ 方向擠壓 → $x$ 方向電荷 |
這些現象分散在不同領域,各自被當成「特例」處理,缺少統一語言。
本講義從應力張量出發,而應力張量正是這段「對象先於語言」歷史的最佳範例。1822 年 9 月 30 日,Cauchy 在巴黎科學院宣讀了他的應力理論——這場演講後來被稱為「現代連續體力學的出生證明」,在座的有 Fourier、Laplace、Legendre、Poisson 等人。
用現代眼光看,Cauchy 在那篇工作裡完成了驚人的成就:他用四面體論證證明了牽引向量是法向量的線性函數(第二章的 Cauchy 定理)、辨識出九個分量 $\sigma_{ij}$、導出了平衡方程、並證明了對稱性 $\sigma_{ij}=\sigma_{ji}$:
$$\frac{\partial \sigma_{ij}}{\partial x_j} + f_i = \rho\,a_i, \qquad \sigma_{ij} = \sigma_{ji}$$
他甚至明確指出:接觸面上的內力不一定垂直於該面,也不是各方向都相同——這正是「正向力與摩擦力其實是同一個牽引向量的兩個分量」(第二章 §2.6)的最初表述。
「tensor」這個詞的現代意義是分階段才成熟的:
| 年代 | 人物 | 事件 |
|---|---|---|
| 1822 | Cauchy | 以分量形式建立應力理論——有「張量這個對象」,但無此語言 |
| 1843 / 1846 | Hamilton | 創造「tensor」一詞,但指的是四元數的模長(伸縮因子),與現代意義無關 |
| 約 1898 | Voigt | 研究晶體彈性時,首次在接近現代的意義上使用「Tensor」 |
| 1900 | Ricci、Levi-Civita | 發表《絕對微分計算法》,以變換法則為定義,正式建立張量微積分的語言 |
| 1915 | Einstein | 廣義相對論大量使用,讓張量成為物理學的核心語言 |
「同向輸入得同向輸出」在主軸座標系下完全正確——特徵值分解保證對任何對稱張量都存在這樣的座標系,使三個方向各自獨立。問題只在於:自然界不總是把主軸送到方便測量的方向上。晶體的光軸由晶格決定,陀螺的主軸由質量分佈決定,這些往往與實驗座標系不對齊,耦合就出現了。
在走向四元數之前,必須先看懂複數平面藏著的一個深刻事實:垂直不是規定,而是被代數規則強迫出來的。
16 世紀的數學家(Cardano、Bombelli)發明 $\sqrt{-1}$ 只是為了解方程式,例如 $x^2 + 1 = 0$。它最初只是一個形式符號,沒有人問「這個方向在哪裡」,甚至「虛數(imaginary)」這個名字本身就帶著貶義——當時的人認為它不真實。
直到 1799 年 Wessel、1806 年 Argand、以及 Gauss 才獨立發現:$a + bi$ 可以用二維平面上的點 $(a, b)$ 來表示。這時大家才突然意識到——原來整段時間,「實部」就是橫軸那條本來就存在的實數線,而虛部是額外長出來的新方向。
從幾何看,複數就是一個二維向量:
$$a + bi \;\longleftrightarrow\; \begin{pmatrix}a\\b\end{pmatrix}$$
兩個分量都是方向,沒有哪一個更「真實」。之所以有「實」與「虛」之分,純粹是歷史命名的不對稱——實數先存在,虛數後來才加進去,所以新的那條軸就被叫做「虛」。
這是最深刻的一點:垂直不是任意選的,而是 $i^2 = -1$ 這條代數規則邏輯地推導出來的。
把「乘以 $i$」看成一種幾何操作。它必須保持長度($|i\cdot z| = |z|$,單位複數乘法不改變模長),所以它是一個純旋轉。設旋轉角度為 $\theta$。現在用 $i^2 = -1$ 這個事實:
$$i^2 = -1 \;\Longleftrightarrow\; \text{旋轉兩次} = 180° \;\Longrightarrow\; 2\theta = 180° \;\Longrightarrow\; \theta = 90°$$
乘以 $i$ 一次就是旋轉 90°。把這個操作連續做下去:
| 操作 | 結果 | 在複數平面上的位置 |
|---|---|---|
| $1$ | 起點 | 橫軸正方向 |
| $i\cdot 1 = i$ | 轉 90° | 必然落在縱軸 |
| $i\cdot i = -1$ | 再轉 90°,共 180° | 橫軸負方向 |
| $i\cdot(-1) = -i$ | 再轉 90°,共 270° | 縱軸負方向 |
$i$ 與 $1$ 之間必然相差 90°,也就是垂直。
1843 年,Hamilton 想把複數推廣到三維,苦戰十年後發現必須跳到四維。而 ij=k 這個式子,一半是被迫的,一半是選擇。
四元數由 William Rowan Hamilton 在 1843 年 10 月 16 日發明。傳說他沿都柏林皇家運河散步時靈光一閃,當場把核心公式刻在 Broom 橋上:
$$i^2 = j^2 = k^2 = ijk = -1$$
一個四元數寫成 $q = a + bi + cj + dk$,有四個實數分量(這就是「四元」的由來)。它是複數的推廣——複數把實數擴展到二維平面,四元數再擴展到四維。最關鍵的性質是乘法不可交換:$ij = k$ 但 $ji = -k$。
Hamilton 面對的核心問題是:$ij$ 到底等於什麼?把所有可能性逐一排除:
| $ij$ 若等於…… | 推導出的矛盾 |
|---|---|
| $0$ | $j = i^{-1}\cdot 0 = 0$,$j$ 消失了 |
| 實數 $a$ | $j = ai^{-1} = -ai$,$j$ 變成 $i$ 的倍數,不獨立 |
| $\pm i$ | $ij = i$ 推出 $j = 1$(不是虛數) |
| $\pm j$ | $ij = j$ 推出 $i = 1$(不是虛數) |
| $ai + bj$(兩者的線性組合) | 代數維度只有 3D,但 3D 除法代數不存在(見第十二章) |
排除一切已知元素之後,$ij$ 必然是一個全新的獨立元素。Hamilton 把它叫做 $k$。
這裡只剩一個選擇:方向感(手性)的約定,相當於選右手座標系還是左手座標系。
$$ij = k \;\Longleftrightarrow\; \hat{x}\times\hat{y} = \hat{z}\ \text{(右手定則)}, \qquad ij = -k \;\Longleftrightarrow\; \hat{x}\times\hat{y} = -\hat{z}\ \text{(左手定則)}$$
兩個選擇在數學上完全等價(把 $k$ 換成 $-k$ 重新命名而已)。Hamilton 選了右手系,與我們慣用的三維座標系一致。
只需要兩條公理:$i^2=j^2=k^2=-1$ 與結合律,加上一個選擇 $ij=k$,整個乘法表就完全確定,沒有剩餘自由度。
從 $ij=k$ 右乘 $j$:$\;kj = (ij)j = i(j^2) = -i \;\Rightarrow\; kj = -i,\; jk = i$
從 $ij=k$ 左乘 $i^{-1}=-i$:$\;j = (-i)(ij) = (-i)k = -(ik) \;\Rightarrow\; ik = -j,\; ki = j$
以及 $ji = -ij = -k$(因 $i,j$ 正交,$ij+ji=0$)
完整乘法表,全部推導自 $ij=k$ 一個式子:
$$\begin{array}{c|ccc} \times & i & j & k \\\hline i & -1 & k & -j \\ j & -k & -1 & i \\ k & j & -i & -1 \end{array}$$
乘法表有一個立即的收穫,它揭示了四元數最深刻的身分。取兩個純向量四元數(實部為零)$\vec{u} = u_1 i + u_2 j + u_3 k$ 與 $\vec{v} = v_1 i + v_2 j + v_3 k$,直接用乘法表展開它們的乘積:
$\vec{u}\vec{v}$ 展開為九項。先看同類項(用 $i^2=j^2=k^2=-1$):
$$u_1v_1\,i^2 + u_2v_2\,j^2 + u_3v_3\,k^2 = -(u_1v_1+u_2v_2+u_3v_3) = -\vec{u}\cdot\vec{v}$$
再看交叉項(用 $ij=k,\ jk=i,\ ki=j$ 及反交換):
$$u_1v_2\,(ij) + u_2v_1\,(ji) = (u_1v_2 - u_2v_1)\,k, \quad\text{同理另兩組給出 } i,\,j \text{ 分量}$$
三組交叉項合起來正是 $\big((u_2v_3-u_3v_2),\,(u_3v_1-u_1v_3),\,(u_1v_2-u_2v_1)\big) = \vec{u}\times\vec{v}$。合計:
$$\boxed{\ \vec{u}\,\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}\ }\qquad\square$$
Hamilton 是從幾何思考這個問題的。他問:「繞 $x$ 軸轉一下,再繞 $y$ 軸轉一下,等效於繞哪個軸轉?」答案由右手定則給出:
$$\text{繞 }x\text{ 軸旋轉}\;\circ\;\text{繞 }y\text{ 軸旋轉}\;=\;\text{繞 }z\text{ 軸旋轉}$$
用 $i, j, k$ 代表三個旋轉算符,合成運算就是乘法,自然得到 $ij = k$。所以 $ij=k$ 本質上就是 $\hat{x}\times\hat{y}=\hat{z}$,用代數語言寫下的右手定則。
既然要描述三維,為何四元數要留下一個「實部」?這牽涉到一個深刻的數學定理:三維除法代數根本不存在。
把兩個純虛四元數(沒有實部)相乘,看看會發生什麼:
$$\underbrace{(bi+cj+dk)}_{\text{純虛}}\cdot\underbrace{(b'i+c'j+d'k)}_{\text{純虛}} = \underbrace{-(bb'+cc'+dd')}_{\text{跑出一個實部!}} + \underbrace{(\cdots)i+(\cdots)j+(\cdots)k}_{\text{虛部}}$$
實部那一項正好是負的內積 $-\vec{u}\cdot\vec{v}$。只要兩個向量不垂直,它們的乘積就會「溢出」到實數部分。如果你強行說「沒有實部」,乘法就不封閉,整個數系就崩潰了。實部是乘法的蓄水池,不能扔掉。
四元數表示三維旋轉的方式是(詳見第十四章):
$$q = \underbrace{\cos\tfrac{\theta}{2}}_{\text{實部}} + \underbrace{\sin\tfrac{\theta}{2}\,(u_x i + u_y j + u_z k)}_{\text{虛部 = 旋轉軸方向}}$$
實部 $\cos(\theta/2)$ 就是旋轉角度的編碼。沒有實部,就只能表示 180° 的旋轉(這時 $\cos 90°=0$,實部剛好消失),失去描述任意角度旋轉的能力。
這是最根本的原因,而且有兩個彼此呼應的嚴格定理在背後撐著。
Frobenius 定理(1877):實數上的有限維結合除法代數,只有三種——$\mathbb{R}$(1 維)、$\mathbb{C}$(2 維)、$\mathbb{H}$(4 維)。
Hurwitz 定理(1898):實數上的有限維賦範除法代數(乘法保持模長,$|xy|=|x||y|$),只有四種——$\mathbb{R}, \mathbb{C}, \mathbb{H}, \mathbb{O}$(八元數),維度 $1, 2, 4, 8$。
無論用哪個定理,三維都不在清單上。Frobenius 的證明骨架可以這樣理解:
設 $D$ 是有限維結合除法代數,把實數倍的單位元等同於 $\mathbb{R}$。任取 $a\in D\setminus\mathbb{R}$,它在 $\mathbb{R}$ 上滿足某個最低次多項式(由 Cayley–Hamilton 保證存在)。因 $D$ 無零因子(除法代數),此多項式必不可約;而實係數不可約多項式至多二次(代數基本定理的推論)。故每個 $a$ 都滿足一個二次式 $a^2 = \alpha a + \beta$,配方後得到一個平方為負實數的元素 $\hat{a}$,即「虛單位」。
分析這些虛單位張成的子空間:若只有一個,得 $\mathbb{C}$(2 維);若有兩個互相反交換的,第三個被它們的乘積強制生成,得 $\mathbb{H}$(4 維);而想停在「恰好一個額外虛單位」(即 3 維)時,封閉性會逼出第三個獨立元素,使維度跳到 4。3 維在代數上是不穩定的——它總會塌縮回 2 或長大到 4。∎
要釐清一個常見誤解:四元數本身不是張量。它是一個「除法代數」,而張量是描述多重線性映射的物件。向量是一階張量,但四元數不是任何階的張量。兩者真正的連結藏在旋轉群的表示論裡,這接回第六章:
| 物件 | 旋轉群表示 | 與旋轉的關係 |
|---|---|---|
| 旋量 spinor | spin-½ | 單位四元數 ≅ SU(2) |
| 向量 | spin-1 | SO(3) 基本表示 |
| 二階張量 | spin-0 ⊕ spin-1 ⊕ spin-2 | 可約,分解成三塊 |
單位四元數構成的群 SU(2),是三維旋轉群 SO(3) 的雙重覆蓋。這個連結會在第五部完整展開。
用四元數旋轉向量,公式是 $p' = qpq^{-1}$,左右各夾一個。為什麼不能只是單邊乘一次?這個問題的答案連結到反射、共軛與維度。
試試看:把向量 $(1,0,0)$ 用 $q = \tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,i$(繞 $x$ 軸旋轉 90°)做單邊乘法:
$$q\cdot p = \left(\tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,i\right)\cdot i = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,i^2 = \underbrace{-\tfrac{\sqrt{2}}{2}}_{\text{實部出現了!}} + \tfrac{\sqrt{2}}{2}\,i$$
結果跑出一個非零的實部,意思是向量離開了三維空間,變成一個四維物件,無法再詮釋成任何三維向量。一般地說:只要旋轉軸與被旋轉的向量有平行分量,$qp$ 就一定產生實部洩漏。
這裡有一個深刻的幾何事實:任何一個旋轉,都可以分解成兩次反射的合成。這不是巧合,而是一條一般定理。
陳述:$n$ 維空間中,任何正交變換都可寫成至多 $n$ 次超平面反射的合成。特別地,三維的旋轉($\det=+1$)是恰好兩次反射的合成;含鏡射的瑕旋轉($\det=-1$)則是三次。
每次反射的行列式為 $-1$。$k$ 次反射合成的行列式是 $(-1)^k$。旋轉的行列式為 $+1$,故 $k$ 必為偶數;最小的非平凡情形就是 $k=2$。兩個反射平面的交線即為旋轉軸,兩平面夾角 $\theta/2$ 對應旋轉角 $\theta$——這正是後面「半角」出現的幾何根源。∎
四元數中,「對法向量為 $\hat{n}$ 的平面做反射」可以寫成 $\vec{v}\mapsto -\hat{n}\,\vec{v}\,\hat{n}^{-1}$。先做一次反射(法向量 $\hat{n}$),再做一次(法向量 $\hat{m}$):
$$\vec{v}\;\longmapsto\;-\hat{m}\underbrace{(-\hat{n}\,\vec{v}\,\hat{n}^{-1})}_{\text{第一次反射}}\hat{m}^{-1} = \underbrace{(\hat{m}\hat{n})}_{q}\,\vec{v}\,\underbrace{(\hat{m}\hat{n})^{-1}}_{q^{-1}}$$
這正好就是夾擊公式。所以夾擊的左右兩邊並非多此一舉,它們分別代表合成旋轉所需的兩次反射。$q^{-1}$ 不是在「撤銷」什麼,而是第二次反射的數學形式。
純虛四元數(三維向量)有一個代數特徵:取共軛後變號,$\bar{p}=-p$。計算 $qpq^{-1}$ 的共軛(利用 $\overline{ABC}=\bar{C}\bar{B}\bar{A}$,以及單位四元數 $\bar{q}=q^{-1}$):
$$\overline{qpq^{-1}} = \overline{q^{-1}}\cdot\bar{p}\cdot\bar{q} = q\cdot(-p)\cdot q^{-1} = -(qpq^{-1})$$
結論:$qpq^{-1}$ 取共軛後變號,所以它的實部必然為零,它一定是純虛四元數,也就是一個合法的三維向量。單邊 $qp$ 沒有這個保證,所以實部會洩漏。
| 視角 | 為何需要夾擊 |
|---|---|
| 幾何 | 旋轉 = 兩次反射,左右各負責一次 |
| 代數 | 夾擊是「共軛運算」,保持純虛子空間封閉;單邊乘法做不到 |
| 維度 | $qp$ 是四維旋轉;$qpq^{-1}$ 把它投影回三維子空間 |
第十二章說實部編碼旋轉角度,這一章用一個完整的數學例子把它算出來,並解釋為何用的是半角。
用四元數表示「繞軸 $\hat{n}$ 旋轉 $\theta$ 度」:
$$\boxed{\,q = \cos\tfrac{\theta}{2} + \sin\tfrac{\theta}{2}\,(n_x i + n_y j + n_z k)\,}$$
注意用的是半角 $\theta/2$,不是 $\theta$。要旋轉向量 $\vec{v}$,先把它寫成純虛四元數 $p = v_x i + v_y j + v_z k$(實部為 0),然後做夾擊乘法 $p' = qpq^{-1}$,結果 $p'$ 的虛部就是旋轉後的向量。
預期結果:$(1,0,0)$ 旋轉 90° 應得到 $(0,1,0)$。
$\theta=90°$,旋轉軸為 $z$ 軸即 $\hat{n}=k$:$\quad q = \cos 45° + \sin 45°\cdot k = \tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,k$。實部 $=\cos 45°=\tfrac{\sqrt{2}}{2}$,這個數字直接編碼了旋轉角 90°。
$p = 1\cdot i + 0\cdot j + 0\cdot k = i$
$q\cdot p = \left(\tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,k\right)\cdot i = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\underbrace{(k\cdot i)}_{=\,j} = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,j$
單位四元數的逆就是共軛:$q^{-1} = \tfrac{\sqrt{2}}{2} - \tfrac{\sqrt{2}}{2}\,k$
$$\left(\tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,j\right)\left(\tfrac{\sqrt{2}}{2} - \tfrac{\sqrt{2}}{2}\,k\right) = \tfrac{1}{2}\,i - \tfrac{1}{2}\underbrace{(i k)}_{=-j} + \tfrac{1}{2}\,j - \tfrac{1}{2}\underbrace{(j k)}_{=\,i}$$
$$= \tfrac{1}{2}\,i + \tfrac{1}{2}\,j + \tfrac{1}{2}\,j - \tfrac{1}{2}\,i = j$$
結果:$p' = j$,對應向量 $(0,1,0)$。向量被正確地旋轉了 90°。
夾擊乘法 $qpq^{-1}$ 裡,$q$ 出現了兩次(左邊一次、右邊一次)。每次各貢獻「一半的旋轉」,合起來才是完整的 $\theta$。如果直接放 $\theta$(不用一半),夾擊就會旋轉 $2\theta$,轉過頭了。
從 $q = \cos(\theta/2) + \cdots$ 可以反推:只要看實部的數值,就立刻知道旋轉多少度。
| 實部值 | $\theta/2$ | 旋轉角 $\theta$ | 意義 |
|---|---|---|---|
| $1$ | $0°$ | $0°$ | 完全不轉(單位元) |
| $\tfrac{\sqrt{2}}{2}\approx 0.707$ | $45°$ | $90°$ | 上面的例子 |
| $\tfrac{1}{2}$ | $60°$ | $120°$ | |
| $0$ | $90°$ | $180°$ | 實部消失!純虛四元數 |
| $-\tfrac{\sqrt{2}}{2}$ | $135°$ | $270°$ | |
| $-1$ | $180°$ | $360°$ | 轉一整圈,但 $q=-1$ 不是 $+1$ |
若強制令實部為 $0$,則 $\cos(\theta/2)=0$,解出 $\theta=180°$。所以沒有實部,四元數只能表示 180° 的翻轉。驗證這個特例——把 $(0,1,0)$ 繞 $x$ 軸旋轉 180°(應得 $(0,-1,0)$):
$$q = \cos 90° + \sin 90°\cdot i = i \quad\text{(實部果然是 0)}, \qquad p' = i\cdot j\cdot(-i) = k\cdot(-i) = -(ki) = -j$$
得到 $(0,-1,0)$,正確。
1880 年代,Gibbs 與 Heaviside 把四元數乘法拆成「點積」與「叉積」兩個獨立運算,引發與四元數支持者的激烈論戰。這個拆解有實際好處,也付出了代價。
兩個純虛四元數相乘的結果是:
$$\vec{u}\vec{v} = \underbrace{-\vec{u}\cdot\vec{v}}_{\text{實部(跑出三維)}} + \underbrace{\vec{u}\times\vec{v}}_{\text{虛部(三維向量)}}$$
從物理學家的角度,這個結果很不舒服:輸入兩個向量,得到的卻是「純量+向量」的混合物(型別不一致);內積帶著一個沒有物理意義的負號($-\vec{u}\cdot\vec{v}$);而且「實部洩漏」意味著三維物理的計算偷偷跑到四維去了。
① 型別乾淨。點積永遠回傳純量,叉積永遠回傳向量,物理中的兩種需求分開處理:做功 $W=\vec{F}\cdot d\vec{s}$ 要純量,力矩 $\vec{\tau}=\vec{r}\times\vec{F}$ 要向量,各取所需。
② 對稱性立刻可見。$\vec{u}\cdot\vec{v}=\vec{v}\cdot\vec{u}$(對稱),$\vec{u}\times\vec{v}=-\vec{v}\times\vec{u}$(反對稱)。在四元數乘法裡這兩種對稱性混在一起,拆開後一目了然——這正是第六章「把張量分解成對稱部分加反對稱部分」的精神。
③ Maxwell 方程組變得可讀。Maxwell 原本用四元數混寫,幾乎無法閱讀。Heaviside 用向量語言改寫後變成今天熟悉的形式:
$$\nabla\cdot\vec{E} = \frac{\rho}{\varepsilon_0}, \qquad \nabla\times\vec{B} = \mu_0\vec{J} + \mu_0\varepsilon_0\frac{\partial\vec{E}}{\partial t}$$
從現代張量的角度回看,Gibbs 拆出來的兩個操作其實是兩個本質不同的張量:
$$\vec{u}\cdot\vec{v} = g_{ij}u^iv^j\ \text{(度規張量,rank-2 對稱)}, \qquad (\vec{u}\times\vec{v})_k = \varepsilon_{ijk}u^iv^j\ \text{(Levi-Civita 張量,rank-3 全反對稱)}$$
既然 Gibbs 把四元數拆了,那還有哪些物理是真正用完整四元數乘法在計算的?答案是:凡是涉及旋轉合成、自旋、規範對稱性的地方。
飛機、無人機、智慧型手機的姿態追蹤,核心方程是:
$$\dot{q}(t) = \frac{1}{2}\,q(t)\otimes\omega(t)$$
其中 $q(t)$ 是描述當前姿態的單位四元數,$\omega = \omega_x i + \omega_y j + \omega_z k$ 是陀螺儀測到的角速度。右邊是真正的四元數乘法。改用尤拉角會碰到「萬向鎖(gimbal lock)」——某個轉軸退化導致方程奇異;四元數在四維球面 $S^3$ 上操作,天然沒有座標奇異點。
MRI 與 NMR 譜儀靠射頻脈衝翻轉原子核自旋,整個過程就是 SU(2) 的群乘法,也就是四元數乘法。一個 $\theta$ 度的翻轉脈衝 $U(\theta,\hat{n}) = \cos\tfrac{\theta}{2}I - i\sin\tfrac{\theta}{2}(\hat{n}\cdot\vec{\sigma})$,連續施加三個脈衝的效果是 $U_{\text{total}} = U_3 U_2 U_1$——純粹的四元數相乘。用向量分析得分開算旋轉矩陣再相乘,遠比直接乘四元數麻煩。
Maxwell 自己的原始版本就是用四元數寫的。定義四元數算符與場後,對向量位做四元數乘法,可以得到:
$$\partial\circ\partial\circ\mathcal{A} = \mu_0\mathcal{J}$$
一行方程,同時編碼全部四條 Maxwell 方程。關鍵在於 $\partial\circ\mathcal{F}$ 的實部自動出兩條散度方程,虛部自動出兩條旋度方程。四元數乘法同時帶出散度與旋度,正是 Gibbs「拆壞了」的那個整體性在這裡的價值。
弱交互作用的規範群是 SU(2),同構於單位四元數群。W 玻色子的場 $W_\mu = W_\mu^1 i + W_\mu^2 j + W_\mu^3 k$ 就是一個純虛四元數值的規範場,作用在費米子的弱同位旋二重態上,就是四元數乘法。整個弱力的數學骨架就是四元數代數——Gibbs 的向量語言在這裡完全沒辦法用。
雙四元數 $\hat{q} = q_r + \varepsilon\,q_t$($\varepsilon^2=0$)同時編碼旋轉($q_r$)與平移($q_t$),一個物件描述六自由度的剛體運動。合成兩個剛體運動就是 $\hat{q}_{\text{total}} = \hat{q}_2\cdot\hat{q}_1$。廣泛用於機器人手臂控制與電影骨骼動畫。
功只取四元數乘積的實部,力矩與角動量只取虛部,彷彿它們都是某種「退化」。背後的原因是旋轉群的表示論——而被忽略的 spin-2 部分,正是重力波與潮汐力。
從表示論出發(第六章的群論視角)。兩個 spin-1 的向量相乘,分解成:
$$\underbrace{1\otimes 1}_{\text{兩個向量}} = \underbrace{0}_{\text{spin-0}} \oplus \underbrace{1}_{\text{spin-1}} \oplus \underbrace{2}_{\text{spin-2}}$$
四元數乘法 $\vec{u}\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}$ 包含 spin-0 加 spin-1,但沒有 spin-2。
守恆量必須是確定的不可約表示,否則在旋轉下沒有一致的變換行為。
| 對稱性 | 守恆量 | 表示 | 四元數對應 |
|---|---|---|---|
| 時間平移 | 能量 $E$ | spin-0(純量) | 實部 |
| 空間平移 | 線動量 $\vec{p}$ | spin-1(向量) | 虛部 |
| 空間旋轉 | 角動量 $\vec{L}$ | spin-1(向量) | 虛部 |
功取實部(spin-0),因為能量守恆要求能量是純量;角動量取虛部(spin-1),因為旋轉對稱性的生成子本身就是 spin-1 算符。
Spin-2 並沒有消失,它出現在超出點粒子範疇的物理裡:
① 四極矩輻射——重力波。Einstein 計算重力波輻射的核心量是質量四極矩 $Q_{ij} = \int\rho\left(r_ir_j-\tfrac{1}{3}\delta_{ij}r^2\right)dV$,括號裡正是 $\vec{r}\otimes\vec{r}$ 的 spin-2 部分。輻射功率 $P\propto\dddot{Q}_{ij}\dddot{Q}^{ij}$——純 spin-2 的量,四元數完全無法描述。
② 潮汐力。月球對地球的潮汐力不是一個向量,而是 spin-2 張量 $T_{ij} = -\tfrac{GM}{r^3}(\delta_{ij}-3\hat{r}_i\hat{r}_j)$,描述空間如何被拉伸。這就是為什麼海洋有兩個潮汐隆起(正對與背對月球各一)。
③ 慣性張量。第七章的 $I_{ij}$ 也含 spin-2 結構。角動量 $\vec{L}=\mathbf{I}\vec{\omega}$ 之所以有時不平行於 $\vec{\omega}$(陀螺進動的根源),正是因為 $I_{ij}$ 有 spin-2 成分。
④ 黏性應力張量。Navier-Stokes 的黏性耗散來自速度梯度張量的無跡對稱部分,也是 spin-2,必須用完整二階張量。
對點粒子,位置 $\vec{r}$ 與動量 $\vec{p}$ 都是單一向量。它們的 spin-0 部分是 $\vec{r}\cdot\vec{p}$(位力定理),spin-1 部分是 $\vec{r}\times\vec{p}=\vec{L}$(軌道角動量)。spin-2 部分對點粒子雖有意義,但在基礎力學中沒被命名,要描述形變、輻射、潮汐才會浮現。
四元數的夾擊乘法與量子力學的么正變換 $U\hat{O}U^\dagger$ 不是「看起來像」——它們在數學上就是同一件事。這一章揭示這個統一。
四元數夾擊 $p' = q\,p\,q^{-1}$ 與量子力學么正變換 $\hat{O}' = U\hat{O}U^\dagger$ 結構完全相同,因為它們描述的是同一件物理事情:在旋轉對稱群下,物理量如何變換。
定義映射:
$$i\;\longleftrightarrow\;-i\sigma_x, \qquad j\;\longleftrightarrow\;-i\sigma_y, \qquad k\;\longleftrightarrow\;-i\sigma_z$$
驗證乘法規則完全吻合:$(-i\sigma_x)(-i\sigma_y) = -\sigma_x\sigma_y = -(i\sigma_z) = -i\sigma_z$,對應 $ij=k$ 在此映射下的像。角動量對易關係 $[\sigma_x,\sigma_y]=2i\sigma_z$ 對應四元數的 $ij-ji = k-(-k) = 2k$——完全同一個代數。旋轉算符也對上了:
$$U = e^{-i\frac{\theta}{2}\hat{n}\cdot\vec{\sigma}} = \cos\tfrac{\theta}{2}I - i\sin\tfrac{\theta}{2}(\hat{n}\cdot\vec{\sigma}), \qquad q = \cos\tfrac{\theta}{2} + \sin\tfrac{\theta}{2}(n_xi+n_yj+n_zk)$$
用映射代入,兩者字面上相等。
把四元數寫成 $2\times 2$ 複數矩陣,四個單位各別對應:
| 四元數單位 | 對應的 $2\times 2$ 矩陣 |
|---|---|
| $\mathbf{1}$ | $\begin{pmatrix}1&0\\0&1\end{pmatrix}$ |
| $\mathbf{i}$ | $\begin{pmatrix}0&i\\i&0\end{pmatrix}$(非對角,含複數 $i$) |
| $\mathbf{j}$ | $\begin{pmatrix}0&-1\\1&0\end{pmatrix}$(非對角,純實數) |
| $\mathbf{k}$ | $\begin{pmatrix}i&0\\0&-i\end{pmatrix}$(對角,含複數 $i$) |
把 $q = a\mathbf{1}+b\mathbf{i}+c\mathbf{j}+d\mathbf{k}$ 組合起來:
$$U = \begin{pmatrix}a+di & -c+bi \\ c+bi & a-di\end{pmatrix}$$
這裡的 $i$ 始終是普通複數的 $\sqrt{-1}$。四元數的 $\mathbf{j}$(係數 $c$)藏在非對角線的實數部分(左下 $+c$、右上 $-c$,符號相反);四元數的 $\mathbf{k}$(係數 $d$)藏在對角線的虛數部分(左上 $+di$、右下 $-di$)。$j$ 與 $k$ 沒有以符號出現,而是被編碼成矩陣的結構模式。
在 3D 向量空間,$\hat{i},\hat{j},\hat{k}$ 是互相正交的單位向量——代表方向。在四元數代數,$\mathbf{i},\mathbf{j},\mathbf{k}$(與 $\mathbf{1}$)是互相正交的基底矩陣——代表旋轉的生成子。
| 3D 向量空間 | 四元數代數 | |
|---|---|---|
| 基底元素 | $\hat{i},\hat{j},\hat{k}$ | $\mathbf{1},\mathbf{i},\mathbf{j},\mathbf{k}$(多了第四個) |
| 代表什麼 | 幾何方向 | 旋轉操作子(generator) |
| 維度 | 3 維 | 4 維(多了純量部分) |
矩陣的「正交」用跡內積 $\langle A,B\rangle = \mathrm{tr}(A^\dagger B)$ 定義,四個矩陣兩兩正交。$\mathbf{i},\mathbf{j},\mathbf{k}$ 在量子力學裡就是 Pauli 矩陣,正是繞 $x,y,z$ 軸旋轉的生成子——是操作,不是方向。
| 表示 | 自旋 | 變換方式 | 數學 |
|---|---|---|---|
| 旋量 spinor | $\tfrac{1}{2}$ | 單邊 | $|\psi'\rangle = U|\psi\rangle$ |
| 向量 | $1$ | 夾擊 | $\vec{v}' = U\vec{v}U^\dagger$ |
Spin-½ 只需 $U$ 作用一次,因為旋量生活在 SU(2) 的基本表示裡;spin-1 需要夾擊,因為向量生活在伴隨表示裡,對應 $\mathrm{Ad}(q):p\mapsto qpq^{-1}$。這就是為什麼電子(spin-½)寫 $\psi\to U\psi$,光子(spin-1)寫 $A_\mu\to UA_\mu U^\dagger$。
前面一再提到群論,這一章從零開始。群論不是分類學,而是「從對稱性直接讀出物理結論」的工具。它的核心概念是:結構重於外表。
群(Group)是一個集合 $G$ 加上一個運算 $\star$,滿足四條規則:
| 公設 | 內容 | 直覺意思 |
|---|---|---|
| 封閉性 | $a,b\in G \Rightarrow a\star b\in G$ | 做了運算,結果還在集合裡 |
| 結合律 | $(a\star b)\star c = a\star(b\star c)$ | 括號順序不影響結果 |
| 單位元 | 存在 $e$ 使 $e\star a = a\star e = a$ | 有「什麼都不做」的操作 |
| 反元素 | 每個 $a$ 都有 $a^{-1}$,$a\star a^{-1}=e$ | 每個操作都可以撤銷 |
注意:沒有要求 $a\star b = b\star a$(交換律不一定成立)。有交換律的群叫「Abel 群」。
只看「旋轉多少度」這件事,允許的操作 $\{0°, 90°, 180°, 270°\}$,運算是「先轉這個、再轉那個」:封閉性($90°+270°=360°=0°$)、結合律、單位元($0°$)、反元素($90°$ 的反元素是 $270°$)全部滿足。這個集合在「轉動合成」下構成一個群,稱為 $\mathbb{Z}_4$。
這是最關鍵的概念:群同構(isomorphism)。兩個群同構,意思是雖然元素長相不同,但有一個對應關係使它們的乘法表完全一致。例如下面三個集合:
| 集合 | 運算 | 元素 |
|---|---|---|
| $\{1, -1\}$ | 普通乘法 | 兩個數字 |
| $\{$不翻轉, 翻轉$\}$ | 動作合成 | 兩個幾何操作 |
| $\left\{\begin{pmatrix}1&0\\0&1\end{pmatrix}, \begin{pmatrix}-1&0\\0&-1\end{pmatrix}\right\}$ | 矩陣乘法 | 兩個矩陣 |
它們的乘法表完全一樣,所以是同一個群 $\mathbb{Z}_2$,只是「穿了不同的衣服」。群論研究的是脫掉衣服後的裸結構,與元素長什麼樣無關。
群論確實把「有相同結構的東西」放在一起,但更重要的是它能從結構推導出物理結論。例如:若一個系統有旋轉對稱性,不需算任何積分,群論直接告訴你角動量守恆、能量不依賴旋轉方向、哪些躍遷被禁止。這套機制是下一章與第二十一章的主題。
SU(2) 這個名字的每個字都有精確含義。理解它之後,就可以巡覽物理中最重要的幾個群——它們是所有已知基本力的骨架。
SU(2) 的全名是「Special Unitary group of degree 2」:
SU(2) 矩陣的一般形式為 $U = \begin{pmatrix}\alpha & -\beta^* \\ \beta & \alpha^*\end{pmatrix}$,$|\alpha|^2+|\beta|^2=1$。四個實數受一條約束,剩下三個自由度——對應旋轉的三個參數。設 $\alpha=a+di$、$\beta=c+bi$,即得第十八章的四元數對應 $q=a+bi+cj+dk$。
$\mathbb{Z}_n = \{0,1,\ldots,n{-}1\}$ 加上模 $n$ 加法。$\mathbb{Z}_2=\{+1,-1\}$ 描述「翻轉」型對稱:宇稱 $P$(空間反射)、電荷共軛 $C$、時間反演 $T$ 各自構成 $\mathbb{Z}_2$。最深刻的結果是 CPT 定理:$CPT$ 的組合是所有已知物理定律的精確對稱,不論 $C,P,T$ 各自是否守恆。晶體的 32 種點群也由有限群分類,涵蓋固體的所有宏觀對稱。
$\mathrm{U}(1)=\{e^{i\theta}\}$,複數平面上的單位圓。這是 Abel 群,1 個生成子,守恆量是電荷。若把這個對稱升格為局域規範對稱(每個時空點的相位可獨立轉動),則必然要引進一個規範場來補償相位梯度——那個規範場正是電磁場,Maxwell 方程組就是從這個群結構推導出來的。
$\mathrm{SO}(3)$ 是所有 $3\times 3$ 實正交矩陣、$\det=+1$,三個生成子對應角動量 $L_x,L_y,L_z$,對易關係 $[L_i,L_j]=i\hbar\varepsilon_{ijk}L_k$。SO(3) 不是單連通的——要繞兩圈才能縮回原點。$\mathrm{SU}(2)$ 是它的雙重覆蓋,同一物理旋轉對應兩個 SU(2) 元素($q$ 與 $-q$)。整數自旋粒子(光子)是 SO(3) 的表示;半整數自旋粒子(電子)必須用 SU(2) 的表示——這就是為什麼電子要旋轉 720° 才回到原來的量子態。
$\mathrm{SU}(3)$ 是 $3\times 3$ 複數么正矩陣、$\det=1$,生成子是 8 個 Gell-Mann 矩陣。1961 年 Gell-Mann 用 SU(3) 把強子組織成「八重道(Eightfold Way)」,並預測未發現的 $\Omega^-$,1964 年實驗證實。夸克帶的「色荷」恰好三種(紅綠藍),構成 SU(3) 的基本表示。
SU(3) 與 SU(2) 的根本不同在於它是非 Abel 群,且生成子(膠子)本身帶色荷,膠子彼此有交互作用,導致兩個現象:
Poincaré 群是洛倫茲群加上時空平移,共 10 個生成子:時間平移(→ 能量)、3 個空間平移(→ 動量)、3 個空間旋轉(→ 角動量)、3 個洛倫茲靴推。1939 年 Wigner 證明:基本粒子就是 Poincaré 群的不可約表示,由質量 $m$ 與自旋 $s$ 標記。
| $m, s$ | 對應粒子 |
|---|---|
| $m>0,\ s=0$ | Higgs 玻色子 |
| $m>0,\ s=\tfrac{1}{2}$ | 電子、夸克 |
| $m>0,\ s=1$ | $W^\pm, Z^0$ |
| $m=0$, 螺旋度 $\pm 1$ | 光子 |
| $m=0$, 螺旋度 $\pm 2$ | 重力子(理論預測) |
換言之,「粒子」不是要從外部定義的概念,它就是相對論時空對稱群的數學結構自動產生的物件。
把三個群乘在一起,生成子數目 $1+3+8=12$,對應 12 個規範玻色子:
| 群 | 生成子 | 對稱破缺後的力載體 | 力 |
|---|---|---|---|
| $\mathrm{U}(1)_Y$ | 1 | 光子 $\gamma$ | 電磁力 |
| $\mathrm{SU}(2)_L$ | 3 | $W^+, W^-, Z^0$ | 弱核力 |
| $\mathrm{SU}(3)_c$ | 8 | 8 個膠子 | 強核力 |
Higgs 機制使 $\mathrm{SU}(2)\times\mathrm{U}(1)$ 破缺至電磁 $\mathrm{U}(1)_{EM}$,賦予 $W,Z$ 質量,光子維持無質量。
群論最美的能力是:知道系統有某個對稱性,就能直接讀出縮并度、守恆律、禁止躍遷,完全不需解方程或算積分。這一章拆解這個機制。
「系統有旋轉對稱性」的數學意思就是:旋轉前後測到的能量不變,$\langle\psi|H|\psi\rangle = \langle\psi|U_R^\dagger H U_R|\psi\rangle$,等價於:
$$U_R^\dagger H U_R = H \quad\Longleftrightarrow\quad [H, U_R]=0$$
這三句話是同一件事的不同寫法,沒有哪個是另一個的計算結果。對具體系統(如氫原子 $H=\tfrac{p^2}{2m}+V(r)$),只需「看一眼」$H$ 是否只依賴旋轉不變量($p^2$、$r$)——這是檢查,不是計算。
設 $H|\psi\rangle=E|\psi\rangle$,因 $[H,U_R]=0$:
$$H(U_R|\psi\rangle) = U_R H|\psi\rangle = E(U_R|\psi\rangle)$$
旋轉後的態仍是能量 $E$ 的本徵態。把所有旋轉作用在 $|\psi\rangle$ 上,得到一族等能量的態,自動構成旋轉群的一個表示。
Schur 引理:若矩陣 $A$ 與一個不可約表示的所有矩陣都對易,則 $A$ 必然是數量矩陣 $\lambda I$。用在物理上:$H$ 與所有旋轉算符對易,所以在每個不可約表示子空間裡 $H=\lambda I$——同一個 irrep 裡的所有態能量完全相同。
設不可約表示 $\{U_R\}$ 作用於複向量空間 $V$,而 $A$ 與所有 $U_R$ 對易。在 $\mathbb{C}$ 上 $A$ 至少有一個本徵值 $\lambda$(代數基本定理)。考慮本徵子空間 $W = \ker(A-\lambda I)\neq\{0\}$。
對任意 $w\in W$ 與任意 $R$:因 $A U_R = U_R A$,有 $A(U_R w) = U_R(Aw) = U_R(\lambda w) = \lambda(U_R w)$,故 $U_R w\in W$。這說明 $W$ 是表示的不變子空間。
但表示不可約,唯一的非零不變子空間是 $V$ 自己,故 $W=V$。也就是 $A-\lambda I$ 在整個 $V$ 上為零,即 $A=\lambda I$。∎
因此 $H$ 在每個 irrep 子空間裡退化為 $\lambda I$,該 irrep 的所有態同能量。群論早已把 SO(3) 的 irrep 分類完了(維度 $2l+1$),所以氫原子每個角動量 $l$ 的能級縮并度必然是 $2l+1$,不解薛丁格方程也知道。
| irrep 標籤 | 維度 | 物理意義 |
|---|---|---|
| $l=0$ | 1 | $s$ 軌域 |
| $l=1$ | 3 | $p$ 軌域($m=-1,0,+1$) |
| $l=2$ | 5 | $d$ 軌域 |
| $l=n$ | $2l+1$ | 普遍公式 |
躍遷矩陣元素 $\langle f|\hat{V}|i\rangle$ 中,$|i\rangle$ 屬於 irrep($l$),算符 $\hat{V}$(電偶極 $\vec{r}$)屬於 $l=1$ 的 irrep。Clebsch-Gordan 分解規定 $l\otimes 1 = |l-1|\oplus l\oplus(l+1)$,意思是 $|f\rangle$ 的 irrep 必須出現在這個分解中,否則矩陣元素強制為零。加上宇稱限制,得到電偶極選擇定則:
$$\boxed{\Delta l = \pm 1}$$
完全沒有計算徑向積分,純粹是群論的結果。
| 問題 | 需要計算嗎? |
|---|---|
| $p$ 軌域有幾個縮并態? | 不需要(irrep 維度 = 3) |
| 電偶極躍遷 $\Delta l=0$ 禁止嗎? | 不需要(CG 係數 + 宇稱) |
| 躍遷速率具體是多少? | 需要(仍得算徑向積分) |
拉格朗日不是從群論出發的——群論那時還不存在。但他建立的框架後來被群論「認領」,成為整個現代物理的語言。這是理論物理最迷人的歷史反轉。
18 世紀力學遇到一個實際困難:有約束的系統很難用牛頓定律處理。一顆在斜面上滑動的球,牛頓要你列出每個力的方向與大小,還必須先求出你根本不感興趣的約束力(支撐力、張力)。拉格朗日想找一套不需考慮約束力、只追蹤系統真正自由度的方法。他的出發點是 d'Alembert 原理(1743):對約束系統,所有力做的虛功之和等於零——這是「在約束允許的運動方向上,力是平衡的」的數學版本。
拉格朗日把 d'Alembert 原理推廣後發現,若定義 $L = T - V$(動能減位能),則任何座標系下的運動方程都統一寫成:
$$\frac{d}{dt}\frac{\partial L}{\partial \dot{q}_i} - \frac{\partial L}{\partial q_i} = 0$$
為何是 $T-V$ 而不是 $T+V$?$T+V=E$ 是能量(Hamiltonian),告訴你系統在能量曲面上的位置;$T-V=L$ 告訴你系統在位形空間中如何移動——兩者問的是不同問題。幾何語言:Hamiltonian 是相空間(位置 + 動量)的函數,Lagrangian 是切叢(位置 + 速度)的函數。拉格朗日在《解析力學》(1788)追求把力學完全化約為代數與分析,整本書裡一張圖都沒有。
1915 年,Emmy Noether 證明了:$L$ 的每一個連續對稱性,對應一個守恆量。
| $L$ 的對稱性 | 對應守恆量 |
|---|---|
| 時間平移($t\to t+\varepsilon$) | 能量 |
| 空間平移 | 線動量 |
| 空間旋轉(SO(3)) | 角動量 |
| U(1) 相位旋轉($\psi\to e^{i\alpha}\psi$) | 電荷 |
拉格朗日完全不知道群論,但他建立的 $L$ 框架偏偏是諾特定理最自然的居所。這是回溯性的「被認領」,不是事先設計的。它的證明短得驚人——核心只是把「對稱性」與「運動方程」兩個條件相減。
設座標的連續變換 $q_i\to q_i + \varepsilon\,\delta q_i$ 使拉格朗日量不變,即 $\delta L = 0$。把 $\delta L$ 用連鎖律展開:
$$\delta L = \sum_i\left(\frac{\partial L}{\partial q_i}\delta q_i + \frac{\partial L}{\partial\dot q_i}\delta\dot q_i\right) = 0$$
代入 Euler–Lagrange 方程 $\dfrac{\partial L}{\partial q_i} = \dfrac{d}{dt}\dfrac{\partial L}{\partial\dot q_i}$(這是「真實運動」的條件):
$$\delta L = \sum_i\left[\left(\frac{d}{dt}\frac{\partial L}{\partial\dot q_i}\right)\delta q_i + \frac{\partial L}{\partial\dot q_i}\frac{d}{dt}\delta q_i\right] = \frac{d}{dt}\!\left(\sum_i\frac{\partial L}{\partial\dot q_i}\,\delta q_i\right)$$
最後一步是乘積微分的逆運算。既然對稱性給出 $\delta L = 0$,括號內的量對時間的導數為零,即它是守恆量:
$$Q = \sum_i\frac{\partial L}{\partial\dot q_i}\,\delta q_i = \text{常數}$$
∎
代入具體對稱即得各守恆律:$\delta q_i$ 取常數位移 → 動量 $\sum\partial L/\partial\dot q_i$;取時間平移 → 能量(Hamiltonian);取旋轉 → 角動量。對稱性與守恆律之間,只隔著一行乘積微分。
拉格朗日的邏輯:從牛頓定律出發 → 導出 $L=T-V$。現代量子場論的邏輯:對稱性要求 → 決定 $L$ 的形式。以電動力學為例,要求 $L$ 在 Lorentz 變換下是純量、在局域 U(1) 規範變換下不變、可重整化,這三條幾乎唯一地決定了 QED 的拉格朗日:
$$\mathcal{L}_{\text{QED}} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu} + \bar{\psi}(i\gamma^\mu D_\mu - m)\psi$$
不需要從實驗「猜」這個形式——群論直接告訴你它必須長這個樣子。
哈密頓在 1834 年寫下「自然選取使作用量最小的路徑」,但不知道為什麼。1948 年費曼給出量子力學的答案。粒子從 $A$ 到 $B$ 的振幅是對所有可能路徑求和:
$$\langle B|A\rangle = \int\mathcal{D}q\; e^{iS[q]/\hbar}$$
每條路徑貢獻一個相位 $e^{iS/\hbar}$。當 $\hbar\to 0$(古典極限),只有讓相位靜止($\delta S=0$)的路徑才不會被相消,其他路徑互相抵消。
| 年代 | 人物 / 成果 | 內容 |
|---|---|---|
| 1788 | 拉格朗日 | 處理約束系統,$L=T-V$,Euler-Lagrange 方程 |
| 1834 | 哈密頓 | 最小作用量原理 $\delta S=0$ |
| 1915 | 諾特 | 對稱性 ↔ 守恆律(關鍵轉折) |
| 1948 | 費曼 | 路徑積分,古典 $\delta S=0$ 是量子相消的極限 |
| 20 世紀 | 量子場論 | 對稱性(群論)決定 $L$ 的形式 |
隨身速查。
$$\boldsymbol{\sigma} = -P\,\mathbf{I} + \boldsymbol{\tau}, \qquad P = -\tfrac{1}{3}\mathrm{tr}(\boldsymbol{\sigma}), \qquad d\vec{F} = \boldsymbol{\sigma}\cdot\hat{n}\,dA$$
$$v'_i = R_{ij}v_j, \qquad T'_{ij} = R_{ik}R_{jl}T_{kl}, \qquad R^TR = I$$
$$\nabla\cdot\vec{F} = \mathrm{tr}(\nabla\vec{F}), \qquad (\nabla\times\vec{F})_k = \varepsilon_{ijk}\frac{\partial F_j}{\partial x_i}$$
$$\nabla\vec{F} = \tfrac{1}{3}(\nabla\cdot\vec{F})\mathbf{I} + \underbrace{\boldsymbol{\Omega}}_{\text{旋度}} + \underbrace{\mathbf{S}^{\text{dev}}}_{\text{純剪切}}$$
$$1\otimes 1 = \underbrace{0}_{\vec{u}\cdot\vec{v}} \oplus \underbrace{1}_{\vec{u}\times\vec{v}} \oplus \underbrace{2}_{\text{對稱無跡}}$$
$$i^2=j^2=k^2=ijk=-1, \qquad ij=k,\ jk=i,\ ki=j, \qquad \vec{u}\,\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}$$
$$q = \cos\tfrac{\theta}{2}+\sin\tfrac{\theta}{2}\,\hat{n}, \qquad \vec{v}' = q\,\vec{v}\,q^{-1}$$
$$i\leftrightarrow -i\sigma_x, \quad j\leftrightarrow -i\sigma_y, \quad k\leftrightarrow -i\sigma_z, \qquad U = e^{-i\frac{\theta}{2}\hat{n}\cdot\vec{\sigma}}$$
封閉性、結合律、單位元、反元素(交換律非必要;有交換律者為 Abel 群)。
$$\mathbb{Z}_n\ \text{(離散)}, \quad \mathrm{U}(1)\ \text{(電荷)}, \quad \mathrm{SU}(2)\ \text{(自旋)}, \quad \mathrm{SU}(3)\ \text{(色荷)}, \quad \text{標準模型}=\mathrm{U}(1)\times\mathrm{SU}(2)\times\mathrm{SU}(3)$$
$$[H, U_R]=0 \;\Longleftrightarrow\; \text{對稱};\qquad \text{縮并度}=2l+1;\qquad \text{選擇定則 }\Delta l=\pm 1$$
$$L = T - V, \qquad \frac{d}{dt}\frac{\partial L}{\partial\dot{q}_i}-\frac{\partial L}{\partial q_i}=0, \qquad \delta S = \delta\!\int L\,dt = 0, \qquad \langle B|A\rangle = \int\mathcal{D}q\,e^{iS/\hbar}$$
$$\vec{L} = \mathbf{I}\vec{\omega}, \quad D_i = \varepsilon_{ij}E_j, \quad \sigma_{ij} = C_{ijkl}\varepsilon_{kl}, \quad G_{\mu\nu} = \tfrac{8\pi G}{c^4}T_{\mu\nu}$$