張量物理導論：從應力張量到時空曲率與對稱結構（詳解增訂版）

導讀：本書的兩條主線

這本講義從一個看似單純的問題出發——「壓力是純量還是向量？」——再沿著它，一路走到時空曲率、量子自旋與規範對稱。表面上主題在變，底層卻只有一個信念貫穿始終：物理的形狀由對稱性決定。對稱創造簡單，非對稱才需要張量。

第一條線是「張量」（第一部）：從應力張量切入，建立梯度、散度、旋度的張量本質，最後抵達廣義相對論。這條線回答「當方向之間互相耦合，該用什麼語言描述」。

第二條線是「對稱」（第二至六部）：從複數與四元數的代數源頭出發，經由旋轉的夾擊乘法、向量分析的歷史抉擇，進入群論，最後在拉格朗日力學與最小作用量原理收束。這條線回答「為什麼物理定律會長成現在的樣子」。

兩條線在數個節點交會——梯度張量的 spin 分解（第六、十七章）、四元數與 SU(2) 的對應（第十八章）皆是。各章可獨立閱讀，但依序讀下來，會看見一個完整的故事：從一塊承受壓力的流體，到決定宇宙動力學的對稱群。標有「定理」與「證明」的方框，是為希望看到嚴格論證的讀者準備的，初讀可略過而不影響理解。

第一部張量的世界

力是向量，那壓力呢？這個問題會帶我們認識張量——一種描述「方向之間如何耦合」的語言，並一路通向時空的曲率。

第一章

壓力的本質：純量、向量，還是張量？

我們從一個看似簡單的問題出發：力是向量，那壓力呢？這個問題會一路帶我們走到張量。

1.1中文「壓力」混用了兩個概念

我們都知道力是向量，壓力理論上似乎也該有方向性，但教學上談壓力時往往不強調方向。這其實源自中文術語的混用——「壓力」同時指稱兩個不同的物理量：

術語	本質	是否為向量
壓力（接觸力意義）	物體對接觸面施加的法向力	是向量
壓強（$P = F/A$）	單位面積上的正向力大小	是純量

這正是方向性被模糊的根源：當我們說「壓強是純量」時是對的，但「接觸壓力是向量」也是對的，兩者是不同的量。

1.2壓強為什麼是純量：等向性

壓強是純量並非教學偷懶，而是有深刻的物理原因。在靜態流體中，壓強具有等向性（isotropy）：流體內任一點，不論你如何擺放一個面積元素 $dA$，該面上承受的力大小都是 $P\,dA$，方向永遠沿著那個面的法向量 $\hat{n}$：

$$d\vec{F} = P\,dA\,\hat{n}$$

關鍵洞見方向來自幾何（面的法向量 $\hat{n}$），而非來自 $P$ 本身。因此 $P$ 不需要攜帶方向資訊——它是純量，恰恰是因為它在所有方向上都相等。

用更底層的語言說：壓強是應力張量的等向部分（trace）。應力張量本身是二階張量，純靜水壓的應力張量恰好是 $-P\,\mathbf{I}$，其全部方向資訊都被單位矩陣 $\mathbf{I}$ 編碼了，所以剩下的 $P$ 才是純量。

1.3固體接觸壓力的方向為何被輕描淡寫

那固體接觸的「壓力」（向量意義）為什麼老師也不太強調方向？因為它的方向已被幾何決定——接觸面的壓力永遠垂直於接觸面，方向隱含在「法向」這個字裡。一旦你認出接觸面，方向就確定了，所以不需要額外強調。理論上它仍然是完整的向量。

1.4牛頓第三定律：壓力與正向力

物體壓地板的「壓力」與地板回推物體的「正向力」，正是牛頓第三定律的作用—反作用對：

物體 A ──── 壓力（A 對地板）────▶ 地板
地板 ──── 正向力（地板對 A）────▶ 物體 A

兩者大小相等、方向相反、作用於不同物體，都垂直於接觸面——這才是真正的第三定律對。

常見混淆靜止物體上，正向力與重力大小相等，很多人誤以為它們是第三定律對——不是。它們作用在同一個物體上，屬於平衡力對（第一定律），而非反作用力對。重力的真正反作用力是「物體對地球的引力」，兩者都是萬有引力，方向相反、分別作用在地球與物體上。

1.5液體中的應力：張量還是純量？

視描述層次而定——底層是張量，靜態特例退化為純量。完整的描述是 Cauchy 應力張量（二階對稱張量）：

$$\boldsymbol{\sigma} = \begin{pmatrix} \sigma_{xx} & \sigma_{xy} & \sigma_{xz} \\ \sigma_{yx} & \sigma_{yy} & \sigma_{yz} \\ \sigma_{zx} & \sigma_{zy} & \sigma_{zz} \end{pmatrix}$$

對法向量為 $\hat{n}$ 的面元，受力是 $d\vec{F} = \boldsymbol{\sigma}\cdot\hat{n}\,dA$，方向不一定沿著 $\hat{n}$——這就是張量比純量豐富的地方。

靜止液體：張量退化為純量

靜態流體沒有剪應力，應力張量必須等向：

$$\boldsymbol{\sigma} = -P\,\mathbf{I} = \begin{pmatrix} -P & 0 & 0 \\ 0 & -P & 0 \\ 0 & 0 & -P \end{pmatrix} \quad\Longrightarrow\quad d\vec{F} = -P\,\hat{n}\,dA$$

力永遠沿 $-\hat{n}$（壓縮方向），大小永遠 $P\,dA$，與面的方向無關。整個張量被單一純量 $P$ 完全決定。

流動液體：純量不夠用

Newtonian 黏性流體的應力張量多了黏性項：

$$\boldsymbol{\sigma} = \underbrace{-P\,\mathbf{I}}_{\text{等向壓力項}} + \underbrace{\mu\!\left(\nabla\vec{v}+(\nabla\vec{v})^T\right) + \lambda(\nabla\cdot\vec{v})\mathbf{I}}_{\text{黏性應力張量}}$$

此時非對角項（剪應力）不為零，純量 $P$ 無法單獨描述應力狀態——這正是 Navier–Stokes 方程需要張量語言的原因。純量壓強的精確定義是應力張量的等向不變量：

$$P = -\tfrac{1}{3}\,\mathrm{tr}(\boldsymbol{\sigma}) = -\tfrac{1}{3}(\sigma_{xx}+\sigma_{yy}+\sigma_{zz})$$

1.6靜態 vs 流動：剪應力的出現

流體的定義就是「靜止時無法承受剪應力」——否則它會持續變形直到剪應力消失。所以：

應力類型	靜態液體	流動液體（黏性）
法向應力（對角）	✓ 有（即壓強 $-P$）	✓ 有
剪應力（非對角）	✗ 為零（流體定義）	✓ 有（黏性產生）

核心邏輯鏈流體靜止 → 無剪應力 → 應力張量等向 → 純量 $P$ 夠用。
流體流動 → 有剪應力 → 應力張量非等向 → 必須用完整張量。
理想流體（$\mu=0$）→ 即使流動也無剪應力 → Euler 方程適用。

第二章

應力張量的結構與下標

理解 $\sigma_{ij}$ 兩個下標的意義，是掌握張量的第一道門檻。但在此之前，有一個更根本的問題：我們憑什麼斷定應力「是一個張量」？

定理 · Cauchy 應力定理（1822）

陳述：在連續體內任一點，作用於某面元的牽引向量 $\vec{t}(\hat{n})$（單位面積的力）是該面外法向量 $\hat{n}$ 的線性函數。因此存在唯一的二階張量 $\boldsymbol{\sigma}$，使得對任意方向 $\hat{n}$：

$$\vec{t}(\hat{n}) = \boldsymbol{\sigma}\cdot\hat{n}, \qquad t_i = \sigma_{ij}\,n_j$$

證明（四面體論證）

取一個無窮小四面體，三個面落在座標平面上（外法向分別為 $-\hat{e}_1, -\hat{e}_2, -\hat{e}_3$，面積記為 $dA_1, dA_2, dA_3$），第四個斜面外法向為 $\hat{n}$、面積為 $dA$。由投影幾何，三個座標面是斜面在各軸的投影，故 $dA_i = n_i\,dA$。

對四面體用牛頓第二定律。表面力是各面牽引向量乘面積之和（座標面上牽引為 $\vec{t}(-\hat{e}_i) = -\vec{t}(\hat{e}_i)$）；另有體力與慣性項。設四面體線度為 $\ell$，則表面積 $\propto \ell^2$，而體積（體力與 $m\vec{a}$）$\propto \ell^3$。令 $\ell\to 0$，體積項以更高階消失，表面力必須自相平衡：

$$\vec{t}(\hat{n})\,dA - \vec{t}(\hat{e}_1)\,dA_1 - \vec{t}(\hat{e}_2)\,dA_2 - \vec{t}(\hat{e}_3)\,dA_3 = 0$$

代入 $dA_i = n_i\,dA$ 並消去 $dA$：

$$\vec{t}(\hat{n}) = \sum_j \vec{t}(\hat{e}_j)\,n_j$$

定義 $\sigma_{ij} \equiv \big(\vec{t}(\hat{e}_j)\big)_i$（即法向為 $\hat{e}_j$ 的面上，牽引向量的第 $i$ 分量），即得 $t_i = \sigma_{ij}n_j$。由於 $\vec{t}$ 與 $\hat{n}$ 都是向量、此關係在任何座標系皆成立，$\sigma_{ij}$ 必依二階張量法則變換。∎

這個定理是整章的地基：它告訴我們，描述「任意切面上的受力」不需要記錄無窮多個方向的資料，只要九個數 $\sigma_{ij}$ 就完全決定了。接下來逐一拆解這九個數的意義。

2.1下標的意義

$\sigma_{ij}$ 的兩個下標各代表一件事：第一個下標 $i$ 是面的法向方向，第二個下標 $j$ 是力的作用方向。

$$\sigma_{\underset{\text{面的法向}}{i}\,\underset{\text{力的方向}}{j}}$$

所以 $\sigma_{xy}$ 的意思是：「法向量指向 $x$ 方向的面（即 $yz$ 平面那一面）上，沿 $y$ 方向的應力分量」。

2.2立方體的 9 個分量

把應力張量畫在一個立方體元素上，9 個分量分成兩類：

對角線（$i=j$）= 法向應力，方向垂直於面，造成壓縮或拉伸：$\sigma_{xx}, \sigma_{yy}, \sigma_{zz}$
非對角線（$i\neq j$）= 剪應力，方向平行於面，造成滑動：$\sigma_{xy}, \sigma_{xz}, \sigma_{yx}, \sigma_{yz}, \sigma_{zx}, \sigma_{zy}$

2.3法向應力與剪應力的分解

對任意面元（法向量 $\hat{n}$），作用其上的牽引向量（traction）是 $\vec{t} = \boldsymbol{\sigma}\cdot\hat{n}$。這個向量一般不平行於 $\hat{n}$，可分解為兩部分：

$$\vec{t} = \underbrace{(\vec{t}\cdot\hat{n})\,\hat{n}}_{\text{法向應力 }\sigma_n} + \underbrace{\vec{t} - (\vec{t}\cdot\hat{n})\,\hat{n}}_{\text{剪應力 }\tau}$$

2.4為什麼 $\sigma_{xx}$、$\sigma_{yx}$、$\sigma_{zx}$ 要區分？

這是理解張量的關鍵。三者的力都指向 $x$ 方向，但描述的是「切出哪個面，才能看到這個 $x$ 方向的力？」

分量	切面法向量	力的方向	物理意義
$\sigma_{xx}$	$x$ 面	$x$ 方向	法向壓縮／拉伸
$\sigma_{yx}$	$y$ 面	$x$ 方向	$y$ 面上的剪切
$\sigma_{zx}$	$z$ 面	$x$ 方向	$z$ 面上的剪切

這三個值可以完全不同。以 Couette 流（兩板間流體，上板移動）為例：

$$\sigma_{yx} = \mu\frac{dv_x}{dy} \neq 0, \qquad \sigma_{xx} = 0, \qquad \sigma_{zx} = 0$$

即使「方向都是 $x$」，數值截然不同。

直覺說法$\sigma_{yx}$ 的意思是：「如果你用 $y$ 方向的刀切開這個物體，切面上會感受到多少 $x$ 方向的力？」改變切的方向，感受到的力就不同。純量只能記一個數，向量只能記一個方向，而應力需要同時指定「切哪個面」與「問哪個方向的力」，所以必須用張量。

2.5對稱性：9 個減為 6 個

由角動量守恆可證 $\sigma_{ij} = \sigma_{ji}$（張量對稱），所以獨立分量只有 6 個：

$$\sigma_{xx},\ \sigma_{yy},\ \sigma_{zz},\quad \sigma_{xy},\ \sigma_{xz},\ \sigma_{yz}$$

證明（角動量平衡）

取邊長 $\ell$ 的立方體元素，計算繞 $z$ 軸的力矩。剪應力 $\sigma_{xy}$（$x$ 面上沿 $y$ 方向的力）在一對相對面上形成力偶，貢獻力矩 $\sigma_{xy}\cdot(\ell^2)\cdot\ell$；剪應力 $\sigma_{yx}$（$y$ 面上沿 $x$ 方向）形成反向力偶 $\sigma_{yx}\cdot(\ell^2)\cdot\ell$。淨力矩使元素產生角加速度：

$$(\sigma_{xy} - \sigma_{yx})\,\ell^3 = I\dot{\omega} \propto \rho\,\ell^5\,\dot{\omega}$$

轉動慣量 $I\propto\ell^5$，力矩 $\propto\ell^3$。令 $\ell\to 0$，右邊以 $\ell^5$ 階消失，遠快於左邊的 $\ell^3$；除非 $\sigma_{xy}=\sigma_{yx}$，否則角加速度 $\dot\omega\propto\ell^{-2}\to\infty$，物理上不可能。故 $\sigma_{xy}=\sigma_{yx}$，同理 $\sigma_{ij}=\sigma_{ji}$。∎

靜態液體更進一步退化：6 個獨立分量全被同一純量 $P$ 決定。

2.6接觸面的統一：正向力與摩擦力是同一個張量

這一節把前面所有概念拉回到高中最熟悉的場景——一塊放在桌面上的木塊。高中物理把接觸面上的作用拆成兩個「不同的力」：垂直於面的正向力 $F_N$，與平行於面的摩擦力 $F_f$。但從應力張量的角度看，它們從來就不是兩個獨立的東西。

由 Cauchy 定理，接觸面（外法向 $\hat{n}$）上的牽引向量是 $\vec{t} = \boldsymbol{\sigma}\cdot\hat{n}$。把它分解成法向與切向兩部分：

$$\vec{t} = \underbrace{\sigma_{nn}\,\hat{n}}_{\text{法向 → 正向力}} + \underbrace{\vec{\tau}}_{\text{切向 → 摩擦力}}, \qquad \sigma_{nn} = \hat{n}\cdot\boldsymbol{\sigma}\cdot\hat{n}, \quad \vec{\tau} = \vec{t} - \sigma_{nn}\hat{n}$$

對整個接觸面積分，就得到巨觀的兩個力：

$$F_N = \iint \sigma_{nn}\,dA, \qquad \vec{F}_f = \iint \vec{\tau}\,dA$$

關鍵洞見正向力與摩擦力是同一個牽引向量 $\vec{t}$ 的法向分量與切向分量，由同一個應力張量 $\boldsymbol{\sigma}$ 決定。它們的「互相獨立」感，是巨觀積分後丟失了方向細節造成的錯覺。高中之所以用兩個力描述一個面，只是因為它沒有追蹤每一點的完整方向資訊——而那正是張量在做的事。

庫侖摩擦定律其實是應力分量的約束

高中教的 $|\vec{F}_f| \leq \mu |\vec{F}_N|$ 是巨觀積分後的版本。連續體層次的表述是逐點成立的莫爾–庫侖準則（Mohr–Coulomb criterion）：

$$|\vec{\tau}| \leq \mu\,\sigma_{nn}$$

這個不等式在「莫爾圓」上有極美的幾何意義。先嚴格推導莫爾圓：

莫爾圓推導（二維）

設在主軸座標系中應力張量已對角化，主應力為 $\sigma_1, \sigma_2$。考慮一個切面，其法向量與第一主軸夾角 $\theta$，即 $\hat{n} = (\cos\theta, \sin\theta)$。計算法向應力與剪應力：

$$\sigma_{nn} = \hat{n}\cdot\boldsymbol{\sigma}\cdot\hat{n} = \sigma_1\cos^2\theta + \sigma_2\sin^2\theta$$

用倍角公式 $\cos^2\theta = \tfrac{1+\cos 2\theta}{2}$、$\sin^2\theta = \tfrac{1-\cos 2\theta}{2}$ 整理：

$$\sigma_{nn} = \frac{\sigma_1+\sigma_2}{2} + \frac{\sigma_1-\sigma_2}{2}\cos 2\theta$$

同理，切向分量的大小為：

$$\tau = \frac{\sigma_1-\sigma_2}{2}\sin 2\theta$$

這對 $(\sigma_{nn}, \tau)$ 滿足 $\left(\sigma_{nn} - \tfrac{\sigma_1+\sigma_2}{2}\right)^2 + \tau^2 = \left(\tfrac{\sigma_1-\sigma_2}{2}\right)^2$——這是一個圓：圓心在 $\big(\tfrac{\sigma_1+\sigma_2}{2}, 0\big)$，半徑 $R = \tfrac{\sigma_1-\sigma_2}{2}$。當切面方向 $\theta$ 改變時，$(\sigma_{nn}, \tau)$ 就沿著這個圓移動。∎

在 $\sigma_{nn}$–$\tau$ 平面上畫出這個莫爾圓，再畫一條過原點、斜率為 $\mu = \tan\phi$ 的直線（$\phi$ 是摩擦角），庫侖準則的幾何意義就一目了然：

莫爾圓完全在直線下方：所有切面的剪應力都還撐得住，物體靜止。
莫爾圓與直線相切：某個方向的切面達到 $|\tau| = \mu\sigma_{nn}$，那個面開始滑動。

高中概念	連續體對應	在應力張量的哪裡
正向力 $F_N$	法向應力 $\sigma_{nn}$ 的面積分	$\hat{n}$ 方向的對角分量
摩擦力 $F_f$	剪應力 $\vec{\tau}$ 的面積分	非對角（切向）分量
庫侖定律 $F_f \leq \mu F_N$	Mohr–Coulomb $\|\vec{\tau}\|\leq\mu\sigma_{nn}$	兩類分量之間的約束

同一個結構，遍布物理

這個框架遠遠超出桌面上的木塊：地質斷層的地震，就是岩石接觸面上剪應力超過 Mohr–Coulomb 準則的那一刻，地質學家用莫爾圓預測哪個走向的斷層最易滑動；土壤力學的地基承載分析用同一套，只是多了黏聚力 $c$（$|\vec{\tau}|\leq c + \mu\sigma_{nn}$）；金屬切削中，刀具界面的正向應力決定刀具壽命、剪應力決定切削力，兩者由同一個接觸應力張量描述。

這正是 Cauchy 1822 年的洞見值得一提的是，Cauchy 在 1822 年提出應力理論時，最關鍵的一步正是認識到「接觸面上的內力不一定垂直於該面，也不是各方向都相同」——換句話說，牽引向量同時含有法向與切向分量。你在教學現場重新想到的這個統一，正是兩百年前連續體力學誕生時的那塊基石。詳見第九章。

第三章

張量微積分：梯度、散度、旋度

$\nabla$ 算符如何升降張量階數？散度與旋度又是什麼的「切片」？這章補上完整證明。

3.1向量場的梯度是二階張量

對向量場 $\vec{F} = (F_x, F_y, F_z)$，它的梯度是：

$$(\nabla\vec{F})_{ij} = \frac{\partial F_i}{\partial x_j}$$

這是一個 $3\times3$ 的二階張量，結構與應力張量相同。散度與旋度都是從這個張量「拆解」出來的。

3.2梯度是張量：完整的座標變換證明

判準是座標變換法則。在旋轉變換 $x'_i = R_{ij}x_j$（$R$ 正交，$R^T = R^{-1}$）下，各階張量的變換法則為：

$$\text{rank-0：}\ \phi'=\phi, \qquad \text{rank-1：}\ v'_i = R_{ij}v_j, \qquad \text{rank-2：}\ T'_{ij} = R_{ik}R_{jl}T_{kl}$$

規律：每多一個自由下標，就多一個 $R$ 作用其上。

第一步 · 確立 ∇ 是向量算符

從 $x'_i = R_{ij}x_j$ 反解得 $x_j = R_{ij}x'_i$（因為 $x = R^T x'$，而 $(R^T)_{ji} = R_{ij}$），故：

$$\frac{\partial x_j}{\partial x'_i} = R_{ij}$$

代入連鎖律，得到偏微分算符的變換法則：

$$\frac{\partial}{\partial x'_i} = \sum_j \frac{\partial x_j}{\partial x'_i}\frac{\partial}{\partial x_j} = \sum_j R_{ij}\frac{\partial}{\partial x_j}$$

這與向量變換 $v'_i = R_{ij}v_j$ 完全相同。因此 $\nabla = \partial/\partial x_i$ 是 rank-1 向量算符。

第二步 · ∇φ 是 rank-1 張量

已知 $\phi$ 是純量（$\phi'(x') = \phi(x)$）。令 $g_i = \partial\phi/\partial x_i$，$g'_i = \partial\phi/\partial x'_i$。由連鎖律：

$$g'_i = \frac{\partial\phi}{\partial x'_i} = \sum_j \frac{\partial x_j}{\partial x'_i}\cdot\frac{\partial\phi}{\partial x_j} = \sum_j R_{ij}g_j$$

$$\boxed{g'_i = R_{ij}g_j}$$ 符合 rank-1 變換法則。$\therefore\ \nabla\phi$ 是向量。$\square$

第三步 · ∇F 是 rank-2 張量

已知 $F_i$ 是向量（$F'_i = R_{ik}F_k$）。令 $T_{ij} = \partial F_i/\partial x_j$。用第一步把 $\partial/\partial x'_j$ 換掉，再把 $F'_i = R_{ik}F_k$ 代入（$R$ 為常數矩陣可移出微分）：

$$T'_{ij} = \frac{\partial F'_i}{\partial x'_j} = \sum_l R_{jl}\frac{\partial}{\partial x_l}(R_{ik}F_k) = \sum_{k,l} R_{ik}R_{jl}\frac{\partial F_k}{\partial x_l}$$

$$\boxed{T'_{ij} = R_{ik}R_{jl}T_{kl}}$$ 符合 rank-2 變換法則。$\therefore\ \nabla\vec{F}$ 是二階張量。$\square$

3.3階數升降與縮并證明

總規律$\nabla$ 是 rank-1 算符，作用一次使階數 $+1$；縮并（對相同下標求和）使階數 $-2$。

以散度為例，令 $S = T_{ii}$（對角求和），證明它是純量：

$$S' = T'_{ii} = \sum_i R_{ik}R_{il}T_{kl} = \sum_{k,l}\underbrace{\Big(\sum_i R_{ik}R_{il}\Big)}_{(R^TR)_{kl}\,=\,\delta_{kl}} T_{kl} = \sum_k T_{kk} = S$$

正交性 $R^TR = I$ 在此把兩個自由下標「抵消」成零，使跡成為不變量。

3.4散度 = 取跡

$$\nabla\cdot\vec{F} = \frac{\partial F_x}{\partial x}+\frac{\partial F_y}{\partial y}+\frac{\partial F_z}{\partial z} = \mathrm{tr}(\nabla\vec{F})$$

把二階張量壓縮成零階純量，與壓強是應力張量之跡的邏輯完全相同。

3.5旋度 = 反對稱部分的編碼

二階張量可分解為對稱與反對稱部分。反對稱部分有三個獨立分量：

$$\Omega_{ij} = \frac{1}{2}\!\left(\frac{\partial F_i}{\partial x_j} - \frac{\partial F_j}{\partial x_i}\right)$$

旋度透過 Levi-Civita 符號 $\varepsilon_{ijk}$（三階全反對稱張量）把這個反對稱矩陣打包成向量：

$$(\nabla\times\vec{F})_k = \varepsilon_{ijk}\frac{\partial F_j}{\partial x_i}$$

為何旋度只在三維「好用」反對稱 $3\times3$ 矩陣恰有 3 個獨立分量，與三維向量數目相同，才能打包成向量。二維反對稱 $2\times2$ 只有 1 個獨立分量 → 旋度退化成純量；四維反對稱 $4\times4$ 有 6 個獨立分量，無法包成向量 → 旋度必須用反對稱二階張量表示。這正是廣義相對論與電動力學中電磁場張量 $F_{\mu\nu}$ 的由來。

整個結構一覽：

$$\underbrace{\nabla\vec{F}}_{\text{二階張量}} \longrightarrow \begin{cases} \text{跡} &\to\ \nabla\cdot\vec{F}\ \text{（純量）} \\ \text{對稱部分} &\to\ \text{應變率張量} \\ \text{反對稱部分} &\to\ \nabla\times\vec{F}\ \text{（向量）} \end{cases}$$

第四章

正交矩陣：張量語言的基石

為什麼整套張量理論都建立在 $R^TR = I$ 這一行定義上？

4.1數學定義

正交矩陣 $R$ 的核心定義只有一行：

$$\boxed{R^TR = I} \quad\Longleftrightarrow\quad R^T = R^{-1}$$

4.2從定義推導性質

推論一 · 行向量構成標準正交基

設 $R$ 第 $j$ 行為 $\vec{r}_j$，則 $(R^TR)_{ij} = \vec{r}_i\cdot\vec{r}_j = \delta_{ij}$，即各行向量互相垂直且為單位長。

推論二 · 行列式為 ±1

取行列式：$\det(R^T)\det(R) = \det(I) = 1$。因 $\det(R^T)=\det(R)$，故 $[\det(R)]^2 = 1 \Rightarrow \det(R) = \pm 1$。

推論三 · 保持長度與夾角

$(R\vec{u})\cdot(R\vec{v}) = \vec{u}^T R^TR\,\vec{v} = \vec{u}\cdot\vec{v}$。內積不變 $\Rightarrow$ 長度 $|R\vec{u}|=|\vec{u}|$、夾角不變。

4.3物理含義：空間的剛性變換

$R^TR = I$ 在幾何上意味著變換前後任意兩點距離不變：

$$|R\vec{x} - R\vec{y}|^2 = (\vec{x}-\vec{y})^T R^TR\,(\vec{x}-\vec{y}) = |\vec{x}-\vec{y}|^2$$

這正是直覺上「不拉伸、不壓縮」的剛性運動，具體分兩類：

	$\det(R)=+1$	$\det(R)=-1$
幾何操作	純旋轉	旋轉 + 鏡射
手性	保持（右手系→右手系）	翻轉（右手系→左手系）
群名稱	$SO(n)$（特殊正交群）	$O(n)\setminus SO(n)$

4.4具體的 2D 例子

旋轉角 $\theta$ 的矩陣：

$$R(\theta) = \begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix}$$

驗證 $R^TR = I$：

$$R^TR = \begin{pmatrix} \cos\theta & \sin\theta \\ -\sin\theta & \cos\theta \end{pmatrix}\!\begin{pmatrix} \cos\theta & -\sin\theta \\ \sin\theta & \cos\theta \end{pmatrix} = \begin{pmatrix} 1 & 0 \\ 0 & 1 \end{pmatrix}\ \checkmark$$

且 $\det R = \cos^2\theta + \sin^2\theta = 1$，確為旋轉。

4.5與張量討論的連結

第三章的推導有兩處用到正交性：

偏微分變換法則：$\partial x_j/\partial x'_i = R_{ij}$ 來自 $x = R^T x'$，即 $R^{-1} = R^T$。若 $R$ 非正交，推導要改成更複雜的協變/逆變分量形式。
縮并是純量：$\sum_i R_{ik}R_{il} = (R^TR)_{kl} = \delta_{kl}$ 完全依賴 $R^TR = I$。

一句話總結正交矩陣的數學本質是「列向量構成標準正交基」；物理本質是「不拉伸、不壓縮空間的剛性線性變換」（旋轉或鏡射）。正是這個性質使「換座標架、物理量不變」成為可能——也就是張量定義的基礎。

第五章

物理場的例子：梯度與旋度

從電場到颱風，從導熱到時空——梯度與旋度的具體面貌。

5.1純量梯度 → 向量場

所有保守場都有統一骨架，負號是「往低位走」的物理體現：

$$\underbrace{\phi(\vec{r})}_{\text{純量場}} \xrightarrow{\ -\nabla\ } \underbrace{\vec{F}(\vec{r})}_{\text{物理向量場}}$$

純量 $\phi$	物理向量場	定律名稱
電位 $V$	$\vec{E} = -\nabla V$	電磁學基本關係
重力位 $\Phi = gz$	$\vec{g} = -\nabla\Phi$	萬有引力
溫度 $T$	$\vec{q} = -\kappa\nabla T$	Fourier 導熱定律
壓力 $P$	$\vec{F}/V = -\nabla P$	Euler 方程壓力項

5.2梯度永遠垂直於等值面

沿等值面移動時 $d\phi = \nabla\phi\cdot d\vec{l} = 0$，所以 $\nabla\phi \perp d\vec{l}$。等值面越密集，梯度越大——這就是為何電荷附近電場最強。

5.3旋度不為零的四個例子

① 剛體旋轉：旋度 = 2ω

$\vec{v} = \omega(-y, x, 0)$ 的旋度：

$$(\nabla\times\vec{v})_z = \frac{\partial v_y}{\partial x} - \frac{\partial v_x}{\partial y} = \omega - (-\omega) = 2\omega$$

為何是 2 倍？用「槳輪實驗」理解：把小十字槳輪放入流體，它的自轉角速度等於 $\frac{1}{2}\nabla\times\vec{v} = \omega$，與流場整體旋轉同步。因子 2 是旋度定義帶來的——旋度是局部自轉率的兩倍。這直接連結到 $\nabla\times\vec{v}$ 正是速度梯度張量反對稱部分的軸向量。

② 自由渦（無旋渦）：最深刻的悖論

$\vec{v} = \frac{\Gamma}{2\pi}\frac{\hat\phi}{r}$ 的旋度，在奇點之外：

$$\frac{\partial v_y}{\partial x} - \frac{\partial v_x}{\partial y} = \frac{y^2-x^2}{r^4} - \frac{y^2-x^2}{r^4} = 0$$

兩項精確相消，旋度為零。把槳輪放入這個渦流，它只繞圈公轉、自身不旋轉。但繞中心一圈的環流量 $\oint\vec{v}\cdot d\vec{l} = \Gamma \neq 0$！

矛盾在哪？Stokes 定理說 $\oint\vec{v}\cdot d\vec{l} = \iint(\nabla\times\vec{v})\cdot d\vec{A}$。答案是奇點 $r=0$ 處有 Dirac δ 函數的旋度：$\nabla\times\vec{v} = \Gamma\,\delta^{(2)}(\vec{r})$。這是拓撲障礙，域不是單連通的。

③ 直線電流磁場：Ampère 定律

$$\nabla\times\vec{B} = \mu_0\vec{J}$$

截面外 $\vec{J}=0$，故 $\nabla\times\vec{B}=0$；但 $\vec{B}\neq 0$！與②一樣存在拓撲障礙：無法定義全局純量位使 $\vec{B} = -\nabla\phi$，因為繞導線一圈的積分永遠不為零。這個結構在量子力學中引發 Aharonov–Bohm 效應——帶電粒子即使永不進入有 $\vec{B}$ 的區域，仍能感受到導線的存在。

④ Couette 剪切流：連結黏性張量

$\vec{v} = (Uy/h, 0, 0)$，旋度：

$$(\nabla\times\vec{v})_z = -\frac{\partial v_x}{\partial y} = -\frac{U}{h}$$

這個均勻旋度正是速度梯度張量的反對稱部分。黏性應力 $\tau_{yx} = \mu\,dv_x/dy$ 的產生根源就是它——每個流體微元都在旋轉，相鄰微元間的相對旋轉摩擦出剪切力。

5.4Helmholtz 分解定理

任何足夠光滑的向量場都可唯一分解：

$$\vec{F} = \underbrace{-\nabla\phi}_{\substack{\text{無旋部分}\\\nabla\times\vec{F}=0}} + \underbrace{\nabla\times\vec{A}}_{\substack{\text{無散部分}\\\nabla\cdot\vec{F}=0}}$$

能寫成純量位 $-\nabla\phi$ 的充要條件是 $\nabla\times\vec{F} = 0$（保守場）。靜電場、地球重力場滿足此條件，磁場與黏性流速場一般不滿足。

第六章

梯度張量的完整三重分解

「散度加旋度」並不等於梯度張量的全部——還缺 5 個分量。

6.1分量數量對不上

$\nabla\vec{F}$ 是 9 個獨立分量的二階張量，但：

$$\nabla\cdot\vec{F}\ (\text{純量}) + \nabla\times\vec{F}\ (\text{向量}) = 1 + 3 = 4 \text{ 個分量}$$

$9 \neq 4$，還差 5 個分量，這部分既非散度也非旋度。

6.2三重分解

$$\frac{\partial F_i}{\partial x_j} = \underbrace{\tfrac{1}{3}(\nabla\cdot\vec{F})\delta_{ij}}_{\text{等向部分（1）}} + \underbrace{\tfrac{1}{2}\!\left(\tfrac{\partial F_i}{\partial x_j}-\tfrac{\partial F_j}{\partial x_i}\right)}_{\text{反對稱部分（3）}} + \underbrace{\tfrac{1}{2}\!\left(\tfrac{\partial F_i}{\partial x_j}+\tfrac{\partial F_j}{\partial x_i}\right)-\tfrac{1}{3}(\nabla\cdot\vec{F})\delta_{ij}}_{\text{無跡對稱部分（5）}}$$

部分	數學結構	對應量	分量數
等向部分	$\propto\delta_{ij}$	散度 $\nabla\cdot\vec{F}$	1
反對稱部分	$A_{ij}=-A_{ji}$	旋度 $\nabla\times\vec{F}$	3
無跡對稱部分	$S_{ij}=S_{ji}$, $\mathrm{tr}=0$	純剪切／應變（無低階對應）	5

6.3第三部分的物理意義

在流體力學中，速度梯度張量的三部分各司其職：

∇v（速度梯度張量）
 ├─ 等向部分 ───────→ 體積膨脹／壓縮率（∇·v）
 ├─ 反對稱部分 ──────→ 剛性自轉（渦度 = ½∇×v）
 └─ 無跡對稱部分 ────→ 純剪切變形（不旋轉、不改體積）

第三部分驅動的是無旋轉的純形變——把圓球拉成橢球，但不旋轉、不改體積。這無法用散度（改體積）或旋度（旋轉）描述。

6.4與應力張量的完美對應

這不是巧合——黏性應力張量結構完全一樣：

$$\boldsymbol{\sigma} = \underbrace{-P\,\mathbf{I}}_{\text{等向（散度類）}} + \underbrace{\mu\!\left(\nabla\vec{v}+(\nabla\vec{v})^T\right) - \tfrac{2\mu}{3}(\nabla\cdot\vec{v})\mathbf{I}}_{\text{黏性偏差應力（無跡對稱）}}$$

黏性耗散的來源正是這個無跡對稱部分，而非旋度部分（旋轉不耗散能量）。

6.5群論視角

在三維旋轉群 $SO(3)$ 下，二階張量分解為三個不可約表示：

$$\text{rank-2} = \underbrace{\text{自旋-0}}_{\text{純量,1維}} \oplus \underbrace{\text{自旋-1}}_{\text{（偽）向量,3維}} \oplus \underbrace{\text{自旋-2}}_{\text{對稱無跡,5維}}$$

深層意義散度是自旋-0，旋度是自旋-1，而無跡對稱部分是自旋-2——它是張量特有的結構，在向量語言中根本沒有對應物。這正是為什麼描述完整的應力或應變時，必須用張量而不能只用散度加旋度。

第七章

物理中的張量大觀

按階數巡禮：從慣性張量到黎曼曲率張量。

階數	張量	方程	領域	獨立分量
0	溫度、壓力、質量	—	所有領域	1
1	力、速度、電場	$F'_i=R_{ij}F_j$	力學、電磁	3
2	應力張量 $\sigma_{ij}$	$dF_i=\sigma_{ij}n_j\,dA$	連續體力學	6
2	慣性張量 $I_{ij}$	$L_i=I_{ij}\omega_j$	剛體力學	6
2	介電張量 $\varepsilon_{ij}$	$D_i=\varepsilon_{ij}E_j$	晶體光學	6
2	電磁場張量 $F_{\mu\nu}$	$\partial_\mu F^{\mu\nu}=\mu_0 J^\nu$	狹義相對論	6
2	能量動量張量 $T_{\mu\nu}$	$G_{\mu\nu}=\frac{8\pi G}{c^4}T_{\mu\nu}$	廣義相對論	10
3	壓電張量 $d_{ijk}$	$P_i=d_{ijk}\sigma_{jk}$	固態物理	18
4	彈性張量 $C_{ijkl}$	$\sigma_{ij}=C_{ijkl}\varepsilon_{kl}$	固體力學	21
4	黎曼曲率張量 $R_{\mu\nu\rho\sigma}$	—	廣義相對論	20

7.1慣性張量：陀螺進動的根源

$\vec{L} = \mathbf{I}\,\vec{\omega}$，其中 $I_{ij} = \int\rho(|\vec{r}|^2\delta_{ij} - r_ir_j)\,dV$。對稱物體 $\mathbf{I} = I\,\mathbf{1}$，$\vec{L}\parallel\vec{\omega}$；非對稱物體 $\vec{L}$ 與 $\vec{\omega}$ 方向不同——這種「輸入一個方向、輸出另一方向」的映射必須用張量描述。陀螺進動正是 $\vec{L}$ 追不上 $\vec{\omega}$ 所致。

7.2電磁場張量：E 與 B 的統一

$$F_{\mu\nu} = \begin{pmatrix} 0 & -E_x/c & -E_y/c & -E_z/c \\ E_x/c & 0 & -B_z & B_y \\ E_y/c & B_z & 0 & -B_x \\ E_z/c & -B_y & B_x & 0 \end{pmatrix}$$

電場在時間—空間軸上，磁場在空間—空間軸上。E 與 B 其實是同一張量在不同參考系下的切片——高速運動的觀察者看到純電場，靜止觀察者看到磁場分量。四條 Maxwell 方程壓縮為兩條張量方程。

7.3彈性張量：廣義 Hooke 定律

$\sigma_{ij} = C_{ijkl}\varepsilon_{kl}$ 是 rank-2 → rank-2 的映射，需要 rank-4 橋梁。理論上 81 個分量，經對稱性逐步減少：

$$81 \xrightarrow{\sigma\text{對稱}} 54 \xrightarrow{\varepsilon\text{對稱}} 36 \xrightarrow{\text{能量守恆}} 21$$

各向同性材料降到 2 個常數（Lamé $\lambda,\mu$），退化為 $\sigma_{ij} = \lambda(\nabla\cdot\vec{u})\delta_{ij} + 2\mu\varepsilon_{ij}$，正是應力張量的等向項加偏差項。

7.4廣義相對論：幾何即物理

Einstein 場方程 $G_{\mu\nu} = \frac{8\pi G}{c^4}T_{\mu\nu}$ 是兩個 rank-2 張量相等：左邊由黎曼張量（rank-4）縮并兩次得到，描述時空幾何曲率；右邊 $T_{\mu\nu}$ 的對角元素 $T_{00}$ 是能量密度，空間部分 $T_{ij}$ 正是應力張量。黎曼張量的不可消去性是時空真正彎曲（無法用座標變換拉平）的判準。

7.5統一觀點

本質所有這些張量都描述「不同方向有不同回應」的物理關係。系統等向時退化為純量，只在一個方向特殊時退化為向量；唯有當不同方向有本質不同的行為，張量才展現不可替代的描述能力。

第八章

方向耦合、等向性與物理量分類

高中物理的「方向獨立」，其實是張量在高對稱下的退化特例。

8.1高中物理是特例

$F_x = ma_x$、$F_y = ma_y$ 隱含質量張量為對角矩陣：

$$\begin{pmatrix}F_x\\F_y\\F_z\end{pmatrix} = \begin{pmatrix}m&0&0\\0&m&0\\0&0&m\end{pmatrix}\begin{pmatrix}a_x\\a_y\\a_z\end{pmatrix}$$

非對角項一旦出現，方向就耦合：一個方向的輸入產生另一方向的回應。

8.2主軸與對角化

對所有實對稱張量，譜定理保證存在一組主軸使其對角化：

$$\mathbf{T} = \mathbf{R}\begin{pmatrix}\lambda_1&&\\&\lambda_2&\\&&\lambda_3\end{pmatrix}\mathbf{R}^T$$

在主軸座標系中方向解耦。高中教「選座標軸」，其實是不自覺地尋找主軸。

8.3拋體運動的解耦：根源是空間等向性

這裡有重要區分。拋體運動的質量張量 $m\mathbf{I}$ 正比於單位矩陣，在任何座標系下都是對角的——不管旋轉幾度，非對角項都是零。這不是「選對主軸」，而是空間等向性所決定。選 $y$ 軸朝上只是讓重力分解漂亮（使 $F_x=0$）。即使旋轉 45°，方程仍解耦：

	標準選軸（y 朝上）	旋轉 45° 座標
x 方向	$a_x = 0$	$a_{x'} = -g/\sqrt{2}$
y 方向	$a_y = -g$	$a_{y'} = -g/\sqrt{2}$
方向耦合？	✗	✗（仍解耦）

但真實世界確實有耦合，一旦放寬近似：

地球自轉 → Coriolis 力：$\vec{F}_{\text{Cor}} = -2m(\vec{\omega}\times\vec{v}) = -2m\boldsymbol{\Omega}\cdot\vec{v}$，$x$ 方向速度產生 $y$ 方向的力。颱風、長程炮彈偏轉皆源於此。
晶格中的電子 → 有效質量張量：$F_i = m^*_{ij}a_j$，$m^*_{ij}$ 不再是 $m\mathbf{I}$，是半導體能帶理論核心。
廣義相對論 → 測地線方程：$\frac{d^2x^\mu}{d\tau^2} + \Gamma^\mu_{\nu\rho}\frac{dx^\nu}{d\tau}\frac{dx^\rho}{d\tau} = 0$，四個時空方向完全耦合。

8.4物理量的等向性分類

群	性質	例子
A	本質純量，永遠等向	溫度、質量、電荷、密度、熵、靜態壓力
B	本質向量，有方向不耦合	力、動量、加速度、真空電磁場
C	依介質而定（純量或張量）	介電 $\varepsilon$、電導 $\sigma$、熱導 $\kappa$、擴散 $D$、有效質量 $m^*$
D	本質張量，永遠各向異性	應力、應變、慣性、彈性、電磁場、曲率張量

群 C 的退化規律

群 C、D 的張量在足夠高對稱時，非對角項逐漸消失：

$$\text{球對稱} \to \text{純量 }(\lambda\mathbf{I}) \quad\to\quad \text{軸對稱} \to 2\text{ 個} \quad\to\quad \text{三斜（最低）} \to 21\text{ 個}$$

8.5是誰打破了等向性

關鍵打破等向性的永遠是物質的內部結構（晶格週期性、纖維排列、質量分佈），不是空間本身。空間的等向性（Noether 定理：旋轉對稱 → 角動量守恆，時間平移 → 能量守恆）保證了質量是純量、動量是向量、能量是純量、各分量獨立。

群 C 揭示了「純量是張量的退化特例」：

$$\underbrace{\lambda_1\hat{e}_1\hat{e}_1 + \lambda_2\hat{e}_2\hat{e}_2 + \lambda_3\hat{e}_3\hat{e}_3}_{\text{一般張量（三個不同特徵值）}} \xrightarrow{\lambda_1=\lambda_2=\lambda_3} \underbrace{\lambda\mathbf{I}}_{\text{純量 × 單位矩陣}}$$

第九章

認識論反思：張量為何難以發現

人類的測量直覺偏好「同向因果」，而耦合恰恰違反這個本能。

9.1「同向因果」的直覺根源

函數的基本概念是 $y = f(x)$，輸入一個數、輸出一個數。推廣到向量時，最自然的想法是各方向獨立，像三條互不干擾的 $y = f(x)$。更深的原因是測量的設計邏輯：實驗者傾向控制一方向輸入、量同方向輸出，因為最乾淨。若回應跑到別的方向，第一反應是「哪裡出錯」而非「這是新物理」。加上日常物體多近似等向，使「同向因果」根深蒂固。

9.2歷史上迫使張量出現的實驗

年份	發現	違反直覺之處
1669	雙折射（Bartholin）	一束光入射，兩束不同方向的光射出（冰洲石）
1827	泊松比（Poisson）	$x$ 方向拉伸 → $y, z$ 方向收縮
19 世紀	陀螺進動	$z$ 方向扭矩 → $x$ 方向運動
1879	霍爾效應（Hall）	$x$ 方向電流 → $y$ 方向電壓
1880	壓電效應（居里兄弟）	$z$ 方向擠壓 → $x$ 方向電荷

這些現象分散在不同領域，各自被當成「特例」處理，缺少統一語言。

歷史的時間差從雙折射被觀察到（1669）到 Ricci 與 Levi-Civita 整理出完整張量微積分（約 1900），中間隔了將近 230 年。Einstein 在 1915 年用它寫出廣義相對論，才讓「張量」廣為人知。

9.3Cauchy 的應力張量：對象先於語言 78 年

本講義從應力張量出發，而應力張量正是這段「對象先於語言」歷史的最佳範例。1822 年 9 月 30 日，Cauchy 在巴黎科學院宣讀了他的應力理論——這場演講後來被稱為「現代連續體力學的出生證明」，在座的有 Fourier、Laplace、Legendre、Poisson 等人。

用現代眼光看，Cauchy 在那篇工作裡完成了驚人的成就：他用四面體論證證明了牽引向量是法向量的線性函數（第二章的 Cauchy 定理）、辨識出九個分量 $\sigma_{ij}$、導出了平衡方程、並證明了對稱性 $\sigma_{ij}=\sigma_{ji}$：

$$\frac{\partial \sigma_{ij}}{\partial x_j} + f_i = \rho\,a_i, \qquad \sigma_{ij} = \sigma_{ji}$$

他甚至明確指出：接觸面上的內力不一定垂直於該面，也不是各方向都相同——這正是「正向力與摩擦力其實是同一個牽引向量的兩個分量」（第二章 §2.6）的最初表述。

對象有了，語言還沒有但 Cauchy 描述這一切的方式，是逐個分量列出方程式，完全是座標形式的。他沒有說「這是一個張量」，也沒有用變換法則來定義它——他甚至沒有用「應力（stress）」這個詞，而是用法文的「pression」（壓力／張力）。應力張量這個數學對象，在 Cauchy 手中已完整成形；但把它識別為「一類特殊數學對象」的語言，還要再等 78 年。

「tensor」這個詞的現代意義是分階段才成熟的：

年代	人物	事件
1822	Cauchy	以分量形式建立應力理論——有「張量這個對象」，但無此語言
1843 / 1846	Hamilton	創造「tensor」一詞，但指的是四元數的模長（伸縮因子），與現代意義無關
約 1898	Voigt	研究晶體彈性時，首次在接近現代的意義上使用「Tensor」
1900	Ricci、Levi-Civita	發表《絕對微分計算法》，以變換法則為定義，正式建立張量微積分的語言
1915	Einstein	廣義相對論大量使用，讓張量成為物理學的核心語言

與牛頓的類比Cauchy 的處境很像牛頓之於微積分：牛頓確實在做微積分，但用的是笨拙的「流數（fluxion）」語言；Leibniz 的 $dy/dx$ 符號之所以勝出，不是因為計算結果不同，而是語言更能讓思維延伸。同樣地，Cauchy 完全掌握了應力這個對象的所有性質，卻是在座標系裡逐一寫出方程，而非說「它服從 $T'_{ij}=R_{ik}R_{jl}T_{kl}$」。自然界「要求」用張量描述應力，比數學家知道「張量是什麼」早了將近一個世紀。這正是本章的核心——工具的誕生，往往落後於它所要描述的物理現實。

9.4你的直覺其實有一半是對的

「同向輸入得同向輸出」在主軸座標系下完全正確——特徵值分解保證對任何對稱張量都存在這樣的座標系，使三個方向各自獨立。問題只在於：自然界不總是把主軸送到方便測量的方向上。晶體的光軸由晶格決定，陀螺的主軸由質量分佈決定，這些往往與實驗座標系不對齊，耦合就出現了。

總結自然界的物理規律其實是張量，而「同向因果」是我們偶然選到好座標系、或面對高對稱系統時的舒適特例。人類的直覺習慣了特例，反而把它當成普遍定律。對稱創造簡單，非對稱需要張量。

第二部代數的源頭：從複數到四元數

向量與張量並非憑空出現。它們的源頭，是一個關於「數能否描述方向」的代數問題——答案藏在複數的幾何與四元數的誕生裡。

第十章

複數的幾何：為何實軸與虛軸必須垂直

在走向四元數之前，必須先看懂複數平面藏著的一個深刻事實：垂直不是規定，而是被代數規則強迫出來的。

10.1複數的代數起源早於幾何詮釋兩百年

16 世紀的數學家（Cardano、Bombelli）發明 $\sqrt{-1}$ 只是為了解方程式，例如 $x^2 + 1 = 0$。它最初只是一個形式符號，沒有人問「這個方向在哪裡」，甚至「虛數（imaginary）」這個名字本身就帶著貶義——當時的人認為它不真實。

直到 1799 年 Wessel、1806 年 Argand、以及 Gauss 才獨立發現：$a + bi$ 可以用二維平面上的點 $(a, b)$ 來表示。這時大家才突然意識到——原來整段時間，「實部」就是橫軸那條本來就存在的實數線，而虛部是額外長出來的新方向。

10.2實部其實也是一個方向

從幾何看，複數就是一個二維向量：

$$a + bi \;\longleftrightarrow\; \begin{pmatrix}a\\b\end{pmatrix}$$

兩個分量都是方向，沒有哪一個更「真實」。之所以有「實」與「虛」之分，純粹是歷史命名的不對稱——實數先存在，虛數後來才加進去，所以新的那條軸就被叫做「虛」。

換個角度想如果當年 Argand 先畫出幾何圖，他可能會直接把兩條軸叫「橫分量」與「縱分量」，完全對稱，根本不會有「虛」的神祕感。實部代表的就是 $\hat{x}$ 方向，與虛部一樣是個堂堂正正的方向。

10.3為何實軸與虛軸必須垂直——由 $i^2=-1$ 強迫

這是最深刻的一點：垂直不是任意選的，而是 $i^2 = -1$ 這條代數規則邏輯地推導出來的。

把「乘以 $i$」看成一種幾何操作。它必須保持長度（$|i\cdot z| = |z|$，單位複數乘法不改變模長），所以它是一個純旋轉。設旋轉角度為 $\theta$。現在用 $i^2 = -1$ 這個事實：

$$i^2 = -1 \;\Longleftrightarrow\; \text{旋轉兩次} = 180° \;\Longrightarrow\; 2\theta = 180° \;\Longrightarrow\; \theta = 90°$$

乘以 $i$ 一次就是旋轉 90°。把這個操作連續做下去：

操作	結果	在複數平面上的位置
$1$	起點	橫軸正方向
$i\cdot 1 = i$	轉 90°	必然落在縱軸
$i\cdot i = -1$	再轉 90°，共 180°	橫軸負方向
$i\cdot(-1) = -i$	再轉 90°，共 270°	縱軸負方向

$i$ 與 $1$ 之間必然相差 90°，也就是垂直。

關鍵洞見如果你把 $i$ 放在和 $1$ 夾 60° 的方向，那「乘以 $i$」就不再是 90° 旋轉，$i^2$ 也就不等於 $-1$ 了，整個體系自相矛盾。換句話說：垂直性是 $i^2=-1$ 的幾何後果，不是人為的座標選擇。這也解釋了為何複數的模長公式 $|a+bi| = \sqrt{a^2+b^2}$ 恰好是畢氏定理——垂直性保證了複數平面是歐氏平面。

第十一章

四元數的誕生：ij=k 的必然與右手約定

1843 年，Hamilton 想把複數推廣到三維，苦戰十年後發現必須跳到四維。而 ij=k 這個式子，一半是被迫的，一半是選擇。

11.11843 年的閃光

四元數由 William Rowan Hamilton 在 1843 年 10 月 16 日發明。傳說他沿都柏林皇家運河散步時靈光一閃，當場把核心公式刻在 Broom 橋上：

$$i^2 = j^2 = k^2 = ijk = -1$$

一個四元數寫成 $q = a + bi + cj + dk$，有四個實數分量（這就是「四元」的由來）。它是複數的推廣——複數把實數擴展到二維平面，四元數再擴展到四維。最關鍵的性質是乘法不可交換：$ij = k$ 但 $ji = -k$。

「純量」與「向量」都是 Hamilton 創造的詞Hamilton 把四元數拆成兩部分：$q = \underbrace{a}_{\text{純量部分 scalar}} + \underbrace{bi+cj+dk}_{\text{向量部分 vector}}$。我們今天習以為常的 scalar 與 vector 這兩個詞，正是他為了描述四元數的這兩個部分而發明的。

11.2$ij$ 不可能是任何已知的東西

Hamilton 面對的核心問題是：$ij$ 到底等於什麼？把所有可能性逐一排除：

$ij$ 若等於……	推導出的矛盾
$0$	$j = i^{-1}\cdot 0 = 0$，$j$ 消失了
實數 $a$	$j = ai^{-1} = -ai$，$j$ 變成 $i$ 的倍數，不獨立
$\pm i$	$ij = i$ 推出 $j = 1$（不是虛數）
$\pm j$	$ij = j$ 推出 $i = 1$（不是虛數）
$ai + bj$（兩者的線性組合）	代數維度只有 3D，但 3D 除法代數不存在（見第十二章）

排除一切已知元素之後，$ij$ 必然是一個全新的獨立元素。Hamilton 把它叫做 $k$。

11.3是 $ij=k$ 還是 $ij=-k$？這是唯一的自由度

這裡只剩一個選擇：方向感（手性）的約定，相當於選右手座標系還是左手座標系。

$$ij = k \;\Longleftrightarrow\; \hat{x}\times\hat{y} = \hat{z}\ \text{（右手定則）}, \qquad ij = -k \;\Longleftrightarrow\; \hat{x}\times\hat{y} = -\hat{z}\ \text{（左手定則）}$$

兩個選擇在數學上完全等價（把 $k$ 換成 $-k$ 重新命名而已）。Hamilton 選了右手系，與我們慣用的三維座標系一致。

11.4$ij=k$ 確定之後，其餘全部被迫

只需要兩條公理：$i^2=j^2=k^2=-1$ 與結合律，加上一個選擇 $ij=k$，整個乘法表就完全確定，沒有剩餘自由度。

推導其餘乘積

從 $ij=k$ 右乘 $j$：$\;kj = (ij)j = i(j^2) = -i \;\Rightarrow\; kj = -i,\; jk = i$

從 $ij=k$ 左乘 $i^{-1}=-i$：$\;j = (-i)(ij) = (-i)k = -(ik) \;\Rightarrow\; ik = -j,\; ki = j$

以及 $ji = -ij = -k$（因 $i,j$ 正交，$ij+ji=0$）

完整乘法表，全部推導自 $ij=k$ 一個式子：

$$\begin{array}{c|ccc} \times & i & j & k \\\hline i & -1 & k & -j \\ j & -k & -1 & i \\ k & j & -i & -1 \end{array}$$

11.5純向量乘積：點積與叉積的統一

乘法表有一個立即的收穫，它揭示了四元數最深刻的身分。取兩個純向量四元數（實部為零）$\vec{u} = u_1 i + u_2 j + u_3 k$ 與 $\vec{v} = v_1 i + v_2 j + v_3 k$，直接用乘法表展開它們的乘積：

逐分量展開

$\vec{u}\vec{v}$ 展開為九項。先看同類項（用 $i^2=j^2=k^2=-1$）：

$$u_1v_1\,i^2 + u_2v_2\,j^2 + u_3v_3\,k^2 = -(u_1v_1+u_2v_2+u_3v_3) = -\vec{u}\cdot\vec{v}$$

再看交叉項（用 $ij=k,\ jk=i,\ ki=j$ 及反交換）：

$$u_1v_2\,(ij) + u_2v_1\,(ji) = (u_1v_2 - u_2v_1)\,k, \quad\text{同理另兩組給出 } i,\,j \text{ 分量}$$

三組交叉項合起來正是 $\big((u_2v_3-u_3v_2),\,(u_3v_1-u_1v_3),\,(u_1v_2-u_2v_1)\big) = \vec{u}\times\vec{v}$。合計：

$$\boxed{\ \vec{u}\,\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}\ }\qquad\square$$

關鍵洞見點積（純量部分）與叉積（向量部分）——我們今天當成兩個獨立運算來教——原本統一在同一個四元數乘法裡。這個式子是後續好幾章的樞紐：它解釋了為何純虛四元數相乘會「溢出」實部（第十二章）、為何 Gibbs 能把乘法拆成兩半（第十五章）、以及為何功取實部、力矩取虛部（第十七章）。

11.6物理直覺：旋轉的合成

Hamilton 是從幾何思考這個問題的。他問：「繞 $x$ 軸轉一下，再繞 $y$ 軸轉一下，等效於繞哪個軸轉？」答案由右手定則給出：

$$\text{繞 }x\text{ 軸旋轉}\;\circ\;\text{繞 }y\text{ 軸旋轉}\;=\;\text{繞 }z\text{ 軸旋轉}$$

用 $i, j, k$ 代表三個旋轉算符，合成運算就是乘法，自然得到 $ij = k$。所以 $ij=k$ 本質上就是 $\hat{x}\times\hat{y}=\hat{z}$，用代數語言寫下的右手定則。

小結$ij$ 必須是全新元素——這是代數封閉性強迫的（3D 行不通）。叫它 $k$ 還是 $-k$，是方向感的約定。選定之後，其餘全部被結合律唯一確定，毫無選擇餘地。

第十二章

為何必須保留實部：除法代數、旋轉角與閉合性

既然要描述三維，為何四元數要留下一個「實部」？這牽涉到一個深刻的數學定理：三維除法代數根本不存在。

12.1層次一：乘法的代數閉合性

把兩個純虛四元數（沒有實部）相乘，看看會發生什麼：

$$\underbrace{(bi+cj+dk)}_{\text{純虛}}\cdot\underbrace{(b'i+c'j+d'k)}_{\text{純虛}} = \underbrace{-(bb'+cc'+dd')}_{\text{跑出一個實部！}} + \underbrace{(\cdots)i+(\cdots)j+(\cdots)k}_{\text{虛部}}$$

實部那一項正好是負的內積 $-\vec{u}\cdot\vec{v}$。只要兩個向量不垂直，它們的乘積就會「溢出」到實數部分。如果你強行說「沒有實部」，乘法就不封閉，整個數系就崩潰了。實部是乘法的蓄水池，不能扔掉。

12.2層次二：實部編碼了旋轉的角度

四元數表示三維旋轉的方式是（詳見第十四章）：

$$q = \underbrace{\cos\tfrac{\theta}{2}}_{\text{實部}} + \underbrace{\sin\tfrac{\theta}{2}\,(u_x i + u_y j + u_z k)}_{\text{虛部 = 旋轉軸方向}}$$

實部 $\cos(\theta/2)$ 就是旋轉角度的編碼。沒有實部，就只能表示 180° 的旋轉（這時 $\cos 90°=0$，實部剛好消失），失去描述任意角度旋轉的能力。

12.3層次三：三維除法代數根本不存在

這是最根本的原因，而且有兩個彼此呼應的嚴格定理在背後撐著。

定理 · 兩個除法代數定理

Frobenius 定理（1877）：實數上的有限維結合除法代數，只有三種——$\mathbb{R}$（1 維）、$\mathbb{C}$（2 維）、$\mathbb{H}$（4 維）。

Hurwitz 定理（1898）：實數上的有限維賦範除法代數（乘法保持模長，$|xy|=|x||y|$），只有四種——$\mathbb{R}, \mathbb{C}, \mathbb{H}, \mathbb{O}$（八元數），維度 $1, 2, 4, 8$。

無論用哪個定理，三維都不在清單上。Frobenius 的證明骨架可以這樣理解：

Frobenius 證明要旨

設 $D$ 是有限維結合除法代數，把實數倍的單位元等同於 $\mathbb{R}$。任取 $a\in D\setminus\mathbb{R}$，它在 $\mathbb{R}$ 上滿足某個最低次多項式（由 Cayley–Hamilton 保證存在）。因 $D$ 無零因子（除法代數），此多項式必不可約；而實係數不可約多項式至多二次（代數基本定理的推論）。故每個 $a$ 都滿足一個二次式 $a^2 = \alpha a + \beta$，配方後得到一個平方為負實數的元素 $\hat{a}$，即「虛單位」。

分析這些虛單位張成的子空間：若只有一個，得 $\mathbb{C}$（2 維）；若有兩個互相反交換的，第三個被它們的乘積強制生成，得 $\mathbb{H}$（4 維）；而想停在「恰好一個額外虛單位」（即 3 維）時，封閉性會逼出第三個獨立元素，使維度跳到 4。3 維在代數上是不穩定的——它總會塌縮回 2 或長大到 4。∎

Hamilton 的十年苦戰Hamilton 苦思十年，一直嘗試 $a + bi + cj$ 這種三維形式，每次都推導出矛盾。最後他理解到：不是自己不夠聰明，而是三維本身就做不到。維度必須跳過 3。這就是為什麼描述三維旋轉，反而需要一個四維的數系——四元數恰好是 Frobenius 清單上 $\mathbb{C}$ 之後的下一個。

12.4四元數不是張量：旋量的連結

要釐清一個常見誤解：四元數本身不是張量。它是一個「除法代數」，而張量是描述多重線性映射的物件。向量是一階張量，但四元數不是任何階的張量。兩者真正的連結藏在旋轉群的表示論裡，這接回第六章：

物件	旋轉群表示	與旋轉的關係
旋量 spinor	spin-½	單位四元數 ≅ SU(2)
向量	spin-1	SO(3) 基本表示
二階張量	spin-0 ⊕ spin-1 ⊕ spin-2	可約，分解成三塊

單位四元數構成的群 SU(2)，是三維旋轉群 SO(3) 的雙重覆蓋。這個連結會在第五部完整展開。

第三部四元數與三維旋轉

四元數最深刻的能力，是優雅地描述三維旋轉。但為什麼旋轉要用「夾擊」乘法？為什麼公式裡是半角？這一部把計算攤開來看。

第十三章

夾擊乘法：為何旋轉一定要 qpq⁻¹

用四元數旋轉向量，公式是 $p' = qpq^{-1}$，左右各夾一個。為什麼不能只是單邊乘一次？這個問題的答案連結到反射、共軛與維度。

13.1直接用 $qp$ 會發生什麼

試試看：把向量 $(1,0,0)$ 用 $q = \tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,i$（繞 $x$ 軸旋轉 90°）做單邊乘法：

$$q\cdot p = \left(\tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,i\right)\cdot i = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,i^2 = \underbrace{-\tfrac{\sqrt{2}}{2}}_{\text{實部出現了！}} + \tfrac{\sqrt{2}}{2}\,i$$

結果跑出一個非零的實部，意思是向量離開了三維空間，變成一個四維物件，無法再詮釋成任何三維向量。一般地說：只要旋轉軸與被旋轉的向量有平行分量，$qp$ 就一定產生實部洩漏。

13.2夾擊的兩邊各負責一次反射

這裡有一個深刻的幾何事實：任何一個旋轉，都可以分解成兩次反射的合成。這不是巧合，而是一條一般定理。

定理 · Cartan–Dieudonné

陳述：$n$ 維空間中，任何正交變換都可寫成至多 $n$ 次超平面反射的合成。特別地，三維的旋轉（$\det=+1$）是恰好兩次反射的合成；含鏡射的瑕旋轉（$\det=-1$）則是三次。

為何旋轉是偶數次反射

每次反射的行列式為 $-1$。$k$ 次反射合成的行列式是 $(-1)^k$。旋轉的行列式為 $+1$，故 $k$ 必為偶數；最小的非平凡情形就是 $k=2$。兩個反射平面的交線即為旋轉軸，兩平面夾角 $\theta/2$ 對應旋轉角 $\theta$——這正是後面「半角」出現的幾何根源。∎

四元數中，「對法向量為 $\hat{n}$ 的平面做反射」可以寫成 $\vec{v}\mapsto -\hat{n}\,\vec{v}\,\hat{n}^{-1}$。先做一次反射（法向量 $\hat{n}$），再做一次（法向量 $\hat{m}$）：

$$\vec{v}\;\longmapsto\;-\hat{m}\underbrace{(-\hat{n}\,\vec{v}\,\hat{n}^{-1})}_{\text{第一次反射}}\hat{m}^{-1} = \underbrace{(\hat{m}\hat{n})}_{q}\,\vec{v}\,\underbrace{(\hat{m}\hat{n})^{-1}}_{q^{-1}}$$

這正好就是夾擊公式。所以夾擊的左右兩邊並非多此一舉，它們分別代表合成旋轉所需的兩次反射。$q^{-1}$ 不是在「撤銷」什麼，而是第二次反射的數學形式。

13.3代數證明：夾擊保證結果留在三維

純虛四元數（三維向量）有一個代數特徵：取共軛後變號，$\bar{p}=-p$。計算 $qpq^{-1}$ 的共軛（利用 $\overline{ABC}=\bar{C}\bar{B}\bar{A}$，以及單位四元數 $\bar{q}=q^{-1}$）：

$$\overline{qpq^{-1}} = \overline{q^{-1}}\cdot\bar{p}\cdot\bar{q} = q\cdot(-p)\cdot q^{-1} = -(qpq^{-1})$$

結論：$qpq^{-1}$ 取共軛後變號，所以它的實部必然為零，它一定是純虛四元數，也就是一個合法的三維向量。單邊 $qp$ 沒有這個保證，所以實部會洩漏。

13.4三個層次的理解

視角	為何需要夾擊
幾何	旋轉 = 兩次反射，左右各負責一次
代數	夾擊是「共軛運算」，保持純虛子空間封閉；單邊乘法做不到
維度	$qp$ 是四維旋轉；$qpq^{-1}$ 把它投影回三維子空間

直覺圖像想像你要讓牆上的影子旋轉：只從一個方向打光（$qp$），影子會扭曲變形（跑出三維）；從兩個對稱的方向夾住打光（$qpq^{-1}$），扭曲互相抵消，影子才是乾淨的旋轉結果。$q^{-1}$ 的任務不是「把 $q$ 的旋轉轉回去」，而是把旋轉從四維代數空間鎖回三維物理空間。

第十四章

實部編碼旋轉角：半角公式與完整計算

第十二章說實部編碼旋轉角度，這一章用一個完整的數學例子把它算出來，並解釋為何用的是半角。

14.1旋轉的四元數公式

用四元數表示「繞軸 $\hat{n}$ 旋轉 $\theta$ 度」：

$$\boxed{\,q = \cos\tfrac{\theta}{2} + \sin\tfrac{\theta}{2}\,(n_x i + n_y j + n_z k)\,}$$

注意用的是半角 $\theta/2$，不是 $\theta$。要旋轉向量 $\vec{v}$，先把它寫成純虛四元數 $p = v_x i + v_y j + v_z k$（實部為 0），然後做夾擊乘法 $p' = qpq^{-1}$，結果 $p'$ 的虛部就是旋轉後的向量。

14.2完整例子：把 $(1,0,0)$ 繞 $z$ 軸旋轉 90°

預期結果：$(1,0,0)$ 旋轉 90° 應得到 $(0,1,0)$。

第一步 · 建立四元數

$\theta=90°$，旋轉軸為 $z$ 軸即 $\hat{n}=k$：$\quad q = \cos 45° + \sin 45°\cdot k = \tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,k$。實部 $=\cos 45°=\tfrac{\sqrt{2}}{2}$，這個數字直接編碼了旋轉角 90°。

第二步 · 向量寫成純虛四元數

$p = 1\cdot i + 0\cdot j + 0\cdot k = i$

第三步 · 算 q · p

$q\cdot p = \left(\tfrac{\sqrt{2}}{2} + \tfrac{\sqrt{2}}{2}\,k\right)\cdot i = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\underbrace{(k\cdot i)}_{=\,j} = \tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,j$

第四步 · 算 (q·p) · q⁻¹

單位四元數的逆就是共軛：$q^{-1} = \tfrac{\sqrt{2}}{2} - \tfrac{\sqrt{2}}{2}\,k$

$$\left(\tfrac{\sqrt{2}}{2}\,i + \tfrac{\sqrt{2}}{2}\,j\right)\left(\tfrac{\sqrt{2}}{2} - \tfrac{\sqrt{2}}{2}\,k\right) = \tfrac{1}{2}\,i - \tfrac{1}{2}\underbrace{(i k)}_{=-j} + \tfrac{1}{2}\,j - \tfrac{1}{2}\underbrace{(j k)}_{=\,i}$$

$$= \tfrac{1}{2}\,i + \tfrac{1}{2}\,j + \tfrac{1}{2}\,j - \tfrac{1}{2}\,i = j$$

結果：$p' = j$，對應向量 $(0,1,0)$。向量被正確地旋轉了 90°。

14.3為何用半角 $\theta/2$

夾擊乘法 $qpq^{-1}$ 裡，$q$ 出現了兩次（左邊一次、右邊一次）。每次各貢獻「一半的旋轉」，合起來才是完整的 $\theta$。如果直接放 $\theta$（不用一半），夾擊就會旋轉 $2\theta$，轉過頭了。

14.4實部直接告訴你旋轉角

從 $q = \cos(\theta/2) + \cdots$ 可以反推：只要看實部的數值，就立刻知道旋轉多少度。

實部值	$\theta/2$	旋轉角 $\theta$	意義
$1$	$0°$	$0°$	完全不轉（單位元）
$\tfrac{\sqrt{2}}{2}\approx 0.707$	$45°$	$90°$	上面的例子
$\tfrac{1}{2}$	$60°$	$120°$
$0$	$90°$	$180°$	實部消失！純虛四元數
$-\tfrac{\sqrt{2}}{2}$	$135°$	$270°$
$-1$	$180°$	$360°$	轉一整圈，但 $q=-1$ 不是 $+1$

14.5沒有實部只能旋轉 180°

若強制令實部為 $0$，則 $\cos(\theta/2)=0$，解出 $\theta=180°$。所以沒有實部，四元數只能表示 180° 的翻轉。驗證這個特例——把 $(0,1,0)$ 繞 $x$ 軸旋轉 180°（應得 $(0,-1,0)$）：

$$q = \cos 90° + \sin 90°\cdot i = i \quad\text{（實部果然是 0）}, \qquad p' = i\cdot j\cdot(-i) = k\cdot(-i) = -(ki) = -j$$

得到 $(0,-1,0)$，正確。

小結實部 $=\cos(\theta/2)$，是旋轉角度的「餘弦編碼」。旋轉角越大，實部越小；轉到 180° 時實部歸零；轉滿一圈時 $q=-1$（不是 $+1$）——這正是「雙重覆蓋」的物理意涵：自旋 ½ 粒子要轉 720° 才回到原態。

第四部向量分析的抉擇

我們今天熟悉的點積與叉積，是 19 世紀末從四元數中「拆」出來的。這場抉擇有得有失——而被丟棄的部分，正是 spin-2 的物理。

第十五章

向量戰爭：Gibbs 為何拆解四元數

1880 年代，Gibbs 與 Heaviside 把四元數乘法拆成「點積」與「叉積」兩個獨立運算，引發與四元數支持者的激烈論戰。這個拆解有實際好處，也付出了代價。

15.1四元數乘法的「問題」

兩個純虛四元數相乘的結果是：

$$\vec{u}\vec{v} = \underbrace{-\vec{u}\cdot\vec{v}}_{\text{實部（跑出三維）}} + \underbrace{\vec{u}\times\vec{v}}_{\text{虛部（三維向量）}}$$

從物理學家的角度，這個結果很不舒服：輸入兩個向量，得到的卻是「純量＋向量」的混合物（型別不一致）；內積帶著一個沒有物理意義的負號（$-\vec{u}\cdot\vec{v}$）；而且「實部洩漏」意味著三維物理的計算偷偷跑到四維去了。

15.2Gibbs 拆解的三個好處

① 型別乾淨。點積永遠回傳純量，叉積永遠回傳向量，物理中的兩種需求分開處理：做功 $W=\vec{F}\cdot d\vec{s}$ 要純量，力矩 $\vec{\tau}=\vec{r}\times\vec{F}$ 要向量，各取所需。

② 對稱性立刻可見。$\vec{u}\cdot\vec{v}=\vec{v}\cdot\vec{u}$（對稱），$\vec{u}\times\vec{v}=-\vec{v}\times\vec{u}$（反對稱）。在四元數乘法裡這兩種對稱性混在一起，拆開後一目了然——這正是第六章「把張量分解成對稱部分加反對稱部分」的精神。

③ Maxwell 方程組變得可讀。Maxwell 原本用四元數混寫，幾乎無法閱讀。Heaviside 用向量語言改寫後變成今天熟悉的形式：

$$\nabla\cdot\vec{E} = \frac{\rho}{\varepsilon_0}, \qquad \nabla\times\vec{B} = \mu_0\vec{J} + \mu_0\varepsilon_0\frac{\partial\vec{E}}{\partial t}$$

15.3Gibbs 拆解失去了什麼

失去統一的代數乘法：四元數一個動作包含所有資訊；Gibbs 需要兩個分開的操作，看不出彼此的關聯。
叉積只活在三維：叉積是三維特有的（反對稱 $3\times3$ 矩陣恰有三個獨立分量，剛好打包成向量）。推廣到四維就崩了，必須改用外積或反對稱張量。
失去除法：四元數是除法代數，$\vec{u}^{-1}$ 有定義；Gibbs 的向量空間無法用向量除以向量。
叉積是偽向量：叉積在空間反射下不變號（普通向量變號）。力矩、角速度、磁場都是偽向量，這在四元數框架裡有清楚的代數解釋，在 Gibbs 框架裡卻是容易忽略的陷阱。

15.4更深的連結：Gibbs 在不自覺中做了張量分解

從現代張量的角度回看，Gibbs 拆出來的兩個操作其實是兩個本質不同的張量：

$$\vec{u}\cdot\vec{v} = g_{ij}u^iv^j\ \text{（度規張量，rank-2 對稱）}, \qquad (\vec{u}\times\vec{v})_k = \varepsilon_{ijk}u^iv^j\ \text{（Levi-Civita 張量，rank-3 全反對稱）}$$

歷史評語Gibbs 是工程師思維：物理學家需要的工具應該「輸入什麼型別，輸出什麼型別」清清楚楚，不能有多餘的混合物。他讓電磁學可以被教、被用，代價是失去了代數的統一性與可推廣性。支持四元數的 Tait 說他「肢解」了四元數，Gibbs 的回答是：「我不需要一把瑞士刀，我需要兩把各司其職的刀。」

第十六章

何時該用四元數：保留統一乘法的物理

既然 Gibbs 把四元數拆了，那還有哪些物理是真正用完整四元數乘法在計算的？答案是：凡是涉及旋轉合成、自旋、規範對稱性的地方。

16.1航太慣性導航：陀螺儀積分

飛機、無人機、智慧型手機的姿態追蹤，核心方程是：

$$\dot{q}(t) = \frac{1}{2}\,q(t)\otimes\omega(t)$$

其中 $q(t)$ 是描述當前姿態的單位四元數，$\omega = \omega_x i + \omega_y j + \omega_z k$ 是陀螺儀測到的角速度。右邊是真正的四元數乘法。改用尤拉角會碰到「萬向鎖（gimbal lock）」——某個轉軸退化導致方程奇異；四元數在四維球面 $S^3$ 上操作，天然沒有座標奇異點。

16.2核磁共振：自旋脈衝序列

MRI 與 NMR 譜儀靠射頻脈衝翻轉原子核自旋，整個過程就是 SU(2) 的群乘法，也就是四元數乘法。一個 $\theta$ 度的翻轉脈衝 $U(\theta,\hat{n}) = \cos\tfrac{\theta}{2}I - i\sin\tfrac{\theta}{2}(\hat{n}\cdot\vec{\sigma})$，連續施加三個脈衝的效果是 $U_{\text{total}} = U_3 U_2 U_1$——純粹的四元數相乘。用向量分析得分開算旋轉矩陣再相乘，遠比直接乘四元數麻煩。

16.3Maxwell 方程組的四元數形式

Maxwell 自己的原始版本就是用四元數寫的。定義四元數算符與場後，對向量位做四元數乘法，可以得到：

$$\partial\circ\partial\circ\mathcal{A} = \mu_0\mathcal{J}$$

一行方程，同時編碼全部四條 Maxwell 方程。關鍵在於 $\partial\circ\mathcal{F}$ 的實部自動出兩條散度方程，虛部自動出兩條旋度方程。四元數乘法同時帶出散度與旋度，正是 Gibbs「拆壞了」的那個整體性在這裡的價值。

16.4弱核力：SU(2) 規範理論

弱交互作用的規範群是 SU(2)，同構於單位四元數群。W 玻色子的場 $W_\mu = W_\mu^1 i + W_\mu^2 j + W_\mu^3 k$ 就是一個純虛四元數值的規範場，作用在費米子的弱同位旋二重態上，就是四元數乘法。整個弱力的數學骨架就是四元數代數——Gibbs 的向量語言在這裡完全沒辦法用。

16.5雙四元數：機器人的剛體運動

雙四元數 $\hat{q} = q_r + \varepsilon\,q_t$（$\varepsilon^2=0$）同時編碼旋轉（$q_r$）與平移（$q_t$），一個物件描述六自由度的剛體運動。合成兩個剛體運動就是 $\hat{q}_{\text{total}} = \hat{q}_2\cdot\hat{q}_1$。廣泛用於機器人手臂控制與電影骨骼動畫。

何時用四元數、何時用 Gibbs涉及旋轉合成、自旋、規範對稱性 → 四元數乘法是原生語言。計算做功、力矩等單一型別輸出 → Gibbs 的點積、叉積更直接。Gibbs 的拆法讓三維物理「更好算」，但讓「物理為什麼這樣」變得更難看清楚。

第十七章

功、力矩、角動量為何只是退化情形

功只取四元數乘積的實部，力矩與角動量只取虛部，彷彿它們都是某種「退化」。背後的原因是旋轉群的表示論——而被忽略的 spin-2 部分，正是重力波與潮汐力。

17.1兩個向量的乘積可以分解成三種型別

從表示論出發（第六章的群論視角）。兩個 spin-1 的向量相乘，分解成：

$$\underbrace{1\otimes 1}_{\text{兩個向量}} = \underbrace{0}_{\text{spin-0}} \oplus \underbrace{1}_{\text{spin-1}} \oplus \underbrace{2}_{\text{spin-2}}$$

Spin-0：$\vec{u}\cdot\vec{v}$（點積，旋轉下不變）
Spin-1：$\vec{u}\times\vec{v}$（叉積，旋轉下像向量變換）
Spin-2：對稱無跡張量 $\tfrac{1}{2}(u_iv_j+u_jv_i)-\tfrac{1}{3}\delta_{ij}\vec{u}\cdot\vec{v}$（五個分量）

四元數乘法 $\vec{u}\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}$ 包含 spin-0 加 spin-1，但沒有 spin-2。

17.2Noether 定理決定哪種型別對應哪個物理量

守恆量必須是確定的不可約表示，否則在旋轉下沒有一致的變換行為。

對稱性	守恆量	表示	四元數對應
時間平移	能量 $E$	spin-0（純量）	實部
空間平移	線動量 $\vec{p}$	spin-1（向量）	虛部
空間旋轉	角動量 $\vec{L}$	spin-1（向量）	虛部

功取實部（spin-0），因為能量守恆要求能量是純量；角動量取虛部（spin-1），因為旋轉對稱性的生成子本身就是 spin-1 算符。

17.3那 spin-2 去哪了？它也是物理量

Spin-2 並沒有消失，它出現在超出點粒子範疇的物理裡：

① 四極矩輻射——重力波。Einstein 計算重力波輻射的核心量是質量四極矩 $Q_{ij} = \int\rho\left(r_ir_j-\tfrac{1}{3}\delta_{ij}r^2\right)dV$，括號裡正是 $\vec{r}\otimes\vec{r}$ 的 spin-2 部分。輻射功率 $P\propto\dddot{Q}_{ij}\dddot{Q}^{ij}$——純 spin-2 的量，四元數完全無法描述。

② 潮汐力。月球對地球的潮汐力不是一個向量，而是 spin-2 張量 $T_{ij} = -\tfrac{GM}{r^3}(\delta_{ij}-3\hat{r}_i\hat{r}_j)$，描述空間如何被拉伸。這就是為什麼海洋有兩個潮汐隆起（正對與背對月球各一）。

③ 慣性張量。第七章的 $I_{ij}$ 也含 spin-2 結構。角動量 $\vec{L}=\mathbf{I}\vec{\omega}$ 之所以有時不平行於 $\vec{\omega}$（陀螺進動的根源），正是因為 $I_{ij}$ 有 spin-2 成分。

④ 黏性應力張量。Navier-Stokes 的黏性耗散來自速度梯度張量的無跡對稱部分，也是 spin-2，必須用完整二階張量。

17.4為何點粒子力學天然只有 spin-0 與 spin-1

對點粒子，位置 $\vec{r}$ 與動量 $\vec{p}$ 都是單一向量。它們的 spin-0 部分是 $\vec{r}\cdot\vec{p}$（位力定理），spin-1 部分是 $\vec{r}\times\vec{p}=\vec{L}$（軌道角動量）。spin-2 部分對點粒子雖有意義，但在基礎力學中沒被命名，要描述形變、輻射、潮汐才會浮現。

最深的統一圖像四元數乘法是完整張量積的截斷版本——它只保留 spin-0 與 spin-1，悄悄丟棄了 spin-2。在點粒子力學與剛體旋轉的範疇內，spin-2 不貢獻守恆量，所以四元數已足夠；一旦需要描述形變、輻射、潮汐或流體應力，spin-2 不可缺少，必須回到完整的張量語言。這也是為什麼本講義從壓力出發，最終走向廣義相對論——都是因為 spin-2 的物理只有張量才能處理。

第五部對稱的語言：群論

群論是現代物理的骨架。它的核心不是分類，而是：只要知道系統有什麼對稱性，就能直接讀出守恆律、縮并與選擇定則，不必計算。

第十八章

四元數、Pauli 矩陣與量子力學的統一

四元數的夾擊乘法與量子力學的么正變換 $U\hat{O}U^\dagger$ 不是「看起來像」——它們在數學上就是同一件事。這一章揭示這個統一。

18.1四元數旋轉就是量子力學的么正變換

四元數夾擊 $p' = q\,p\,q^{-1}$ 與量子力學么正變換 $\hat{O}' = U\hat{O}U^\dagger$ 結構完全相同，因為它們描述的是同一件物理事情：在旋轉對稱群下，物理量如何變換。

18.2四元數單位就是 Pauli 矩陣（差一個 $-i$）

定義映射：

$$i\;\longleftrightarrow\;-i\sigma_x, \qquad j\;\longleftrightarrow\;-i\sigma_y, \qquad k\;\longleftrightarrow\;-i\sigma_z$$

驗證乘法規則完全吻合：$(-i\sigma_x)(-i\sigma_y) = -\sigma_x\sigma_y = -(i\sigma_z) = -i\sigma_z$，對應 $ij=k$ 在此映射下的像。角動量對易關係 $[\sigma_x,\sigma_y]=2i\sigma_z$ 對應四元數的 $ij-ji = k-(-k) = 2k$——完全同一個代數。旋轉算符也對上了：

$$U = e^{-i\frac{\theta}{2}\hat{n}\cdot\vec{\sigma}} = \cos\tfrac{\theta}{2}I - i\sin\tfrac{\theta}{2}(\hat{n}\cdot\vec{\sigma}), \qquad q = \cos\tfrac{\theta}{2} + \sin\tfrac{\theta}{2}(n_xi+n_yj+n_zk)$$

用映射代入，兩者字面上相等。

18.3SU(2) 矩陣裡的 j 與 k 藏在哪

把四元數寫成 $2\times 2$ 複數矩陣，四個單位各別對應：

四元數單位	對應的 $2\times 2$ 矩陣
$\mathbf{1}$	$\begin{pmatrix}1&0\\0&1\end{pmatrix}$
$\mathbf{i}$	$\begin{pmatrix}0&i\\i&0\end{pmatrix}$（非對角，含複數 $i$）
$\mathbf{j}$	$\begin{pmatrix}0&-1\\1&0\end{pmatrix}$（非對角，純實數）
$\mathbf{k}$	$\begin{pmatrix}i&0\\0&-i\end{pmatrix}$（對角，含複數 $i$）

把 $q = a\mathbf{1}+b\mathbf{i}+c\mathbf{j}+d\mathbf{k}$ 組合起來：

$$U = \begin{pmatrix}a+di & -c+bi \\ c+bi & a-di\end{pmatrix}$$

這裡的 $i$ 始終是普通複數的 $\sqrt{-1}$。四元數的 $\mathbf{j}$（係數 $c$）藏在非對角線的實數部分（左下 $+c$、右上 $-c$，符號相反）；四元數的 $\mathbf{k}$（係數 $d$）藏在對角線的虛數部分（左上 $+di$、右下 $-di$）。$j$ 與 $k$ 沒有以符號出現，而是被編碼成矩陣的結構模式。

18.4ijk：從單位向量升級為旋轉算符

在 3D 向量空間，$\hat{i},\hat{j},\hat{k}$ 是互相正交的單位向量——代表方向。在四元數代數，$\mathbf{i},\mathbf{j},\mathbf{k}$（與 $\mathbf{1}$）是互相正交的基底矩陣——代表旋轉的生成子。

	3D 向量空間	四元數代數
基底元素	$\hat{i},\hat{j},\hat{k}$	$\mathbf{1},\mathbf{i},\mathbf{j},\mathbf{k}$（多了第四個）
代表什麼	幾何方向	旋轉操作子（generator）
維度	3 維	4 維（多了純量部分）

矩陣的「正交」用跡內積 $\langle A,B\rangle = \mathrm{tr}(A^\dagger B)$ 定義，四個矩陣兩兩正交。$\mathbf{i},\mathbf{j},\mathbf{k}$ 在量子力學裡就是 Pauli 矩陣，正是繞 $x,y,z$ 軸旋轉的生成子——是操作，不是方向。

18.5spin-½ 是單邊、spin-1 是夾擊

表示	自旋	變換方式	數學
旋量 spinor	$\tfrac{1}{2}$	單邊	$\|\psi'\rangle = U\|\psi\rangle$
向量	$1$	夾擊	$\vec{v}' = U\vec{v}U^\dagger$

Spin-½ 只需 $U$ 作用一次，因為旋量生活在 SU(2) 的基本表示裡；spin-1 需要夾擊，因為向量生活在伴隨表示裡，對應 $\mathrm{Ad}(q):p\mapsto qpq^{-1}$。這就是為什麼電子（spin-½）寫 $\psi\to U\psi$，光子（spin-1）寫 $A_\mu\to UA_\mu U^\dagger$。

令人拍案的歷史巧合漢米爾頓（William Rowan Hamilton）同時做了兩件被量子力學繼承的事：發明四元數（1843）→ SU(2) → 自旋理論的數學基礎；建立漢米爾頓力學 → 量子力學的 $\hat{H}$ 與正則量子化。量子力學的「漢米爾頓運算子 $\hat{H}$」與「四元數的 $i,j,k$」出自同一個人，而我們現在知道它們描述的是同一個數學結構——SU(2) 群及其表示。

第十九章

群論導論：定義、公設與同構

前面一再提到群論，這一章從零開始。群論不是分類學，而是「從對稱性直接讀出物理結論」的工具。它的核心概念是：結構重於外表。

19.1什麼是群？四條公設

群（Group）是一個集合 $G$ 加上一個運算 $\star$，滿足四條規則：

公設	內容	直覺意思
封閉性	$a,b\in G \Rightarrow a\star b\in G$	做了運算，結果還在集合裡
結合律	$(a\star b)\star c = a\star(b\star c)$	括號順序不影響結果
單位元	存在 $e$ 使 $e\star a = a\star e = a$	有「什麼都不做」的操作
反元素	每個 $a$ 都有 $a^{-1}$，$a\star a^{-1}=e$	每個操作都可以撤銷

注意：沒有要求 $a\star b = b\star a$（交換律不一定成立）。有交換律的群叫「Abel 群」。

19.2最具體的例子：時鐘的旋轉

只看「旋轉多少度」這件事，允許的操作 $\{0°, 90°, 180°, 270°\}$，運算是「先轉這個、再轉那個」：封閉性（$90°+270°=360°=0°$）、結合律、單位元（$0°$）、反元素（$90°$ 的反元素是 $270°$）全部滿足。這個集合在「轉動合成」下構成一個群，稱為 $\mathbb{Z}_4$。

19.3為何「看起來完全不同」的東西是「同一個群」

這是最關鍵的概念：群同構（isomorphism）。兩個群同構，意思是雖然元素長相不同，但有一個對應關係使它們的乘法表完全一致。例如下面三個集合：

集合	運算	元素
$\{1, -1\}$	普通乘法	兩個數字
$\{$不翻轉, 翻轉$\}$	動作合成	兩個幾何操作
$\left\{\begin{pmatrix}1&0\\0&1\end{pmatrix}, \begin{pmatrix}-1&0\\0&-1\end{pmatrix}\right\}$	矩陣乘法	兩個矩陣

它們的乘法表完全一樣，所以是同一個群 $\mathbb{Z}_2$，只是「穿了不同的衣服」。群論研究的是脫掉衣服後的裸結構，與元素長什麼樣無關。

回到 SU(2)單位四元數、$2\times 2$ 複數矩陣、NMR 脈衝算符、量子閘——它們的合成規則完全一致，所以是同一個群 SU(2) 的不同表示（representation）。這就是為什麼第十八章裡那些看起來毫不相干的東西，其實是同一件事。

19.4群論不是分類，而是直接給出物理

群論確實把「有相同結構的東西」放在一起，但更重要的是它能從結構推導出物理結論。例如：若一個系統有旋轉對稱性，不需算任何積分，群論直接告訴你角動量守恆、能量不依賴旋轉方向、哪些躍遷被禁止。這套機制是下一章與第二十一章的主題。

第二十章

SU(2) 解碼與物理中的重要群

SU(2) 這個名字的每個字都有精確含義。理解它之後，就可以巡覽物理中最重要的幾個群——它們是所有已知基本力的骨架。

20.1SU(2) 的名字解碼

SU(2) 的全名是「Special Unitary group of degree 2」：

U = Unitary（么正）：複數版的正交矩陣。實數正交矩陣滿足 $R^TR=I$；複數么正矩陣滿足 $U^\dagger U = I$（$U^\dagger$ 為轉置再取共軛）。物理意義：保持量子態的機率不變，如同正交矩陣保持幾何長度。
S = Special（特殊）：額外要求 $\det(U)=+1$，對應「保持方向感」。
$(2)$：這些是 $2\times 2$ 矩陣，作用在二維複數空間 $\mathbb{C}^2$ 上。

SU(2) 矩陣的一般形式為 $U = \begin{pmatrix}\alpha & -\beta^* \\ \beta & \alpha^*\end{pmatrix}$，$|\alpha|^2+|\beta|^2=1$。四個實數受一條約束，剩下三個自由度——對應旋轉的三個參數。設 $\alpha=a+di$、$\beta=c+bi$，即得第十八章的四元數對應 $q=a+bi+cj+dk$。

20.2$\mathbb{Z}_2$ 與 $\mathbb{Z}_n$：最簡單的群，離散對稱

$\mathbb{Z}_n = \{0,1,\ldots,n{-}1\}$ 加上模 $n$ 加法。$\mathbb{Z}_2=\{+1,-1\}$ 描述「翻轉」型對稱：宇稱 $P$（空間反射）、電荷共軛 $C$、時間反演 $T$ 各自構成 $\mathbb{Z}_2$。最深刻的結果是 CPT 定理：$CPT$ 的組合是所有已知物理定律的精確對稱，不論 $C,P,T$ 各自是否守恆。晶體的 32 種點群也由有限群分類，涵蓋固體的所有宏觀對稱。

20.3U(1)：最簡單的連續群

$\mathrm{U}(1)=\{e^{i\theta}\}$，複數平面上的單位圓。這是 Abel 群，1 個生成子，守恆量是電荷。若把這個對稱升格為局域規範對稱（每個時空點的相位可獨立轉動），則必然要引進一個規範場來補償相位梯度——那個規範場正是電磁場，Maxwell 方程組就是從這個群結構推導出來的。

20.4SO(3) 與 SU(2)：旋轉群及其雙重覆蓋

$\mathrm{SO}(3)$ 是所有 $3\times 3$ 實正交矩陣、$\det=+1$，三個生成子對應角動量 $L_x,L_y,L_z$，對易關係 $[L_i,L_j]=i\hbar\varepsilon_{ijk}L_k$。SO(3) 不是單連通的——要繞兩圈才能縮回原點。$\mathrm{SU}(2)$ 是它的雙重覆蓋，同一物理旋轉對應兩個 SU(2) 元素（$q$ 與 $-q$）。整數自旋粒子（光子）是 SO(3) 的表示；半整數自旋粒子（電子）必須用 SU(2) 的表示——這就是為什麼電子要旋轉 720° 才回到原來的量子態。

20.5SU(3)：夸克的顏色語言

$\mathrm{SU}(3)$ 是 $3\times 3$ 複數么正矩陣、$\det=1$，生成子是 8 個 Gell-Mann 矩陣。1961 年 Gell-Mann 用 SU(3) 把強子組織成「八重道（Eightfold Way）」，並預測未發現的 $\Omega^-$，1964 年實驗證實。夸克帶的「色荷」恰好三種（紅綠藍），構成 SU(3) 的基本表示。

SU(3) 與 SU(2) 的根本不同在於它是非 Abel 群，且生成子（膠子）本身帶色荷，膠子彼此有交互作用，導致兩個現象：

夸克禁閉：色荷不能單獨存在，只有色中性的組合才能被觀察到。
漸近自由：在極短距離下強力反而變弱（Gross、Politzer、Wilczek，2004 年諾貝爾獎）。

20.6Poincaré 群：相對論粒子的分類

Poincaré 群是洛倫茲群加上時空平移，共 10 個生成子：時間平移（→ 能量）、3 個空間平移（→ 動量）、3 個空間旋轉（→ 角動量）、3 個洛倫茲靴推。1939 年 Wigner 證明：基本粒子就是 Poincaré 群的不可約表示，由質量 $m$ 與自旋 $s$ 標記。

$m, s$	對應粒子
$m>0,\ s=0$	Higgs 玻色子
$m>0,\ s=\tfrac{1}{2}$	電子、夸克
$m>0,\ s=1$	$W^\pm, Z^0$
$m=0$, 螺旋度 $\pm 1$	光子
$m=0$, 螺旋度 $\pm 2$	重力子（理論預測）

換言之，「粒子」不是要從外部定義的概念，它就是相對論時空對稱群的數學結構自動產生的物件。

20.7標準模型規範群 $\mathrm{U}(1)\times\mathrm{SU}(2)\times\mathrm{SU}(3)$

把三個群乘在一起，生成子數目 $1+3+8=12$，對應 12 個規範玻色子：

群	生成子	對稱破缺後的力載體	力
$\mathrm{U}(1)_Y$	1	光子 $\gamma$	電磁力
$\mathrm{SU}(2)_L$	3	$W^+, W^-, Z^0$	弱核力
$\mathrm{SU}(3)_c$	8	8 個膠子	強核力

Higgs 機制使 $\mathrm{SU}(2)\times\mathrm{U}(1)$ 破缺至電磁 $\mathrm{U}(1)_{EM}$，賦予 $W,Z$ 質量，光子維持無質量。

全貌所有這些群都是同一個問題的答案：「什麼東西在這個系統下保持不變？」$\mathbb{Z}_2$ 回答宇稱；U(1) 回答電荷；SU(2) 回答自旋；SU(3) 回答色荷；Poincaré 群回答「粒子是什麼」。標準模型用 12 個生成子生成了除重力以外全部已知的基本力。

第二十一章

對稱性如何不靠計算就給出物理

群論最美的能力是：知道系統有某個對稱性，就能直接讀出縮并度、守恆律、禁止躍遷，完全不需解方程或算積分。這一章拆解這個機制。

21.1$[H, U_R]=0$ 是對稱性的定義，不是計算結果

「系統有旋轉對稱性」的數學意思就是：旋轉前後測到的能量不變，$\langle\psi|H|\psi\rangle = \langle\psi|U_R^\dagger H U_R|\psi\rangle$，等價於：

$$U_R^\dagger H U_R = H \quad\Longleftrightarrow\quad [H, U_R]=0$$

這三句話是同一件事的不同寫法，沒有哪個是另一個的計算結果。對具體系統（如氫原子 $H=\tfrac{p^2}{2m}+V(r)$），只需「看一眼」$H$ 是否只依賴旋轉不變量（$p^2$、$r$）——這是檢查，不是計算。

21.2對易 → 旋轉後仍是相同能量的本徵態

設 $H|\psi\rangle=E|\psi\rangle$，因 $[H,U_R]=0$：

$$H(U_R|\psi\rangle) = U_R H|\psi\rangle = E(U_R|\psi\rangle)$$

旋轉後的態仍是能量 $E$ 的本徵態。把所有旋轉作用在 $|\psi\rangle$ 上，得到一族等能量的態，自動構成旋轉群的一個表示。

21.3Schur 引理 → 縮并度 = 不可約表示的維度

Schur 引理：若矩陣 $A$ 與一個不可約表示的所有矩陣都對易，則 $A$ 必然是數量矩陣 $\lambda I$。用在物理上：$H$ 與所有旋轉算符對易，所以在每個不可約表示子空間裡 $H=\lambda I$——同一個 irrep 裡的所有態能量完全相同。

Schur 引理證明（複數表示）

設不可約表示 $\{U_R\}$ 作用於複向量空間 $V$，而 $A$ 與所有 $U_R$ 對易。在 $\mathbb{C}$ 上 $A$ 至少有一個本徵值 $\lambda$（代數基本定理）。考慮本徵子空間 $W = \ker(A-\lambda I)\neq\{0\}$。

對任意 $w\in W$ 與任意 $R$：因 $A U_R = U_R A$，有 $A(U_R w) = U_R(Aw) = U_R(\lambda w) = \lambda(U_R w)$，故 $U_R w\in W$。這說明 $W$ 是表示的不變子空間。

但表示不可約，唯一的非零不變子空間是 $V$ 自己，故 $W=V$。也就是 $A-\lambda I$ 在整個 $V$ 上為零，即 $A=\lambda I$。∎

因此 $H$ 在每個 irrep 子空間裡退化為 $\lambda I$，該 irrep 的所有態同能量。群論早已把 SO(3) 的 irrep 分類完了（維度 $2l+1$），所以氫原子每個角動量 $l$ 的能級縮并度必然是 $2l+1$，不解薛丁格方程也知道。

irrep 標籤	維度	物理意義
$l=0$	1	$s$ 軌域
$l=1$	3	$p$ 軌域（$m=-1,0,+1$）
$l=2$	5	$d$ 軌域
$l=n$	$2l+1$	普遍公式

21.4選擇定則：Clebsch-Gordan 分解

躍遷矩陣元素 $\langle f|\hat{V}|i\rangle$ 中，$|i\rangle$ 屬於 irrep（$l$），算符 $\hat{V}$（電偶極 $\vec{r}$）屬於 $l=1$ 的 irrep。Clebsch-Gordan 分解規定 $l\otimes 1 = |l-1|\oplus l\oplus(l+1)$，意思是 $|f\rangle$ 的 irrep 必須出現在這個分解中，否則矩陣元素強制為零。加上宇稱限制，得到電偶極選擇定則：

$$\boxed{\Delta l = \pm 1}$$

完全沒有計算徑向積分，純粹是群論的結果。

21.5什麼要算，什麼不用算

問題	需要計算嗎？
$p$ 軌域有幾個縮并態？	不需要（irrep 維度 = 3）
電偶極躍遷 $\Delta l=0$ 禁止嗎？	不需要（CG 係數 + 宇稱）
躍遷速率具體是多少？	需要（仍得算徑向積分）

核心群論告訴你「能不能」（是否為零）；計算告訴你「多少」（具體數值）。選擇定則、縮并度、守恆律都屬於「能不能」這一類，全部由對稱群的結構直接讀出，不需對物理系統做任何計算。確認對稱性本身只需看 $H$ 的形式，也沒有積分要算。

第六部最小作用量原理

全書收束於一個反轉：拉格朗日為解約束問題而建立的框架，最終被證明是「對稱性決定動力學」的最自然居所——這是拉格朗日本人都不知道的。

第二十二章

拉格朗日力學：對稱性決定動力學

拉格朗日不是從群論出發的——群論那時還不存在。但他建立的框架後來被群論「認領」，成為整個現代物理的語言。這是理論物理最迷人的歷史反轉。

22.1拉格朗日當時真正的問題

18 世紀力學遇到一個實際困難：有約束的系統很難用牛頓定律處理。一顆在斜面上滑動的球，牛頓要你列出每個力的方向與大小，還必須先求出你根本不感興趣的約束力（支撐力、張力）。拉格朗日想找一套不需考慮約束力、只追蹤系統真正自由度的方法。他的出發點是 d'Alembert 原理（1743）：對約束系統，所有力做的虛功之和等於零——這是「在約束允許的運動方向上，力是平衡的」的數學版本。

22.2L = T − V 從何而來

拉格朗日把 d'Alembert 原理推廣後發現，若定義 $L = T - V$（動能減位能），則任何座標系下的運動方程都統一寫成：

$$\frac{d}{dt}\frac{\partial L}{\partial \dot{q}_i} - \frac{\partial L}{\partial q_i} = 0$$

為何是 $T-V$ 而不是 $T+V$？$T+V=E$ 是能量（Hamiltonian），告訴你系統在能量曲面上的位置；$T-V=L$ 告訴你系統在位形空間中如何移動——兩者問的是不同問題。幾何語言：Hamiltonian 是相空間（位置 + 動量）的函數，Lagrangian 是切叢（位置 + 速度）的函數。拉格朗日在《解析力學》（1788）追求把力學完全化約為代數與分析，整本書裡一張圖都沒有。

22.3130 年後：諾特定理

1915 年，Emmy Noether 證明了：$L$ 的每一個連續對稱性，對應一個守恆量。

$L$ 的對稱性	對應守恆量
時間平移（$t\to t+\varepsilon$）	能量
空間平移	線動量
空間旋轉（SO(3)）	角動量
U(1) 相位旋轉（$\psi\to e^{i\alpha}\psi$）	電荷

拉格朗日完全不知道群論，但他建立的 $L$ 框架偏偏是諾特定理最自然的居所。這是回溯性的「被認領」，不是事先設計的。它的證明短得驚人——核心只是把「對稱性」與「運動方程」兩個條件相減。

諾特定理證明（單參數連續對稱）

設座標的連續變換 $q_i\to q_i + \varepsilon\,\delta q_i$ 使拉格朗日量不變，即 $\delta L = 0$。把 $\delta L$ 用連鎖律展開：

$$\delta L = \sum_i\left(\frac{\partial L}{\partial q_i}\delta q_i + \frac{\partial L}{\partial\dot q_i}\delta\dot q_i\right) = 0$$

代入 Euler–Lagrange 方程 $\dfrac{\partial L}{\partial q_i} = \dfrac{d}{dt}\dfrac{\partial L}{\partial\dot q_i}$（這是「真實運動」的條件）：

$$\delta L = \sum_i\left[\left(\frac{d}{dt}\frac{\partial L}{\partial\dot q_i}\right)\delta q_i + \frac{\partial L}{\partial\dot q_i}\frac{d}{dt}\delta q_i\right] = \frac{d}{dt}\!\left(\sum_i\frac{\partial L}{\partial\dot q_i}\,\delta q_i\right)$$

最後一步是乘積微分的逆運算。既然對稱性給出 $\delta L = 0$，括號內的量對時間的導數為零，即它是守恆量：

$$Q = \sum_i\frac{\partial L}{\partial\dot q_i}\,\delta q_i = \text{常數}$$

∎

代入具體對稱即得各守恆律：$\delta q_i$ 取常數位移 → 動量 $\sum\partial L/\partial\dot q_i$；取時間平移 → 能量（Hamiltonian）；取旋轉 → 角動量。對稱性與守恆律之間，只隔著一行乘積微分。

22.4現代物理把邏輯整個反過來

拉格朗日的邏輯：從牛頓定律出發 → 導出 $L=T-V$。現代量子場論的邏輯：對稱性要求 → 決定 $L$ 的形式。以電動力學為例，要求 $L$ 在 Lorentz 變換下是純量、在局域 U(1) 規範變換下不變、可重整化，這三條幾乎唯一地決定了 QED 的拉格朗日：

$$\mathcal{L}_{\text{QED}} = -\frac{1}{4}F_{\mu\nu}F^{\mu\nu} + \bar{\psi}(i\gamma^\mu D_\mu - m)\psi$$

不需要從實驗「猜」這個形式——群論直接告訴你它必須長這個樣子。

22.5路徑積分：為什麼作用量是最小的

哈密頓在 1834 年寫下「自然選取使作用量最小的路徑」，但不知道為什麼。1948 年費曼給出量子力學的答案。粒子從 $A$ 到 $B$ 的振幅是對所有可能路徑求和：

$$\langle B|A\rangle = \int\mathcal{D}q\; e^{iS[q]/\hbar}$$

每條路徑貢獻一個相位 $e^{iS/\hbar}$。當 $\hbar\to 0$（古典極限），只有讓相位靜止（$\delta S=0$）的路徑才不會被相消，其他路徑互相抵消。

深層意義古典作用量最小原理不是自然界的「偏好」或目的論——它是量子世界在古典極限下因相位相消而浮現的現象。

22.6歷史的演變

年代	人物 / 成果	內容
1788	拉格朗日	處理約束系統，$L=T-V$，Euler-Lagrange 方程
1834	哈密頓	最小作用量原理 $\delta S=0$
1915	諾特	對稱性 ↔ 守恆律（關鍵轉折）
1948	費曼	路徑積分，古典 $\delta S=0$ 是量子相消的極限
20 世紀	量子場論	對稱性（群論）決定 $L$ 的形式

完整故事拉格朗日是為了解決有約束的力學問題而發明 $L=T-V$ 的，與群論毫無關係——那時群論還不存在。但他偶然建立了一個如此自然的框架，以至於 130 年後諾特發現它恰好是「對稱性↔守恆律」這個深層結構的完美載體。今天的量子場論則把邏輯完全倒轉：不是從動力學推出對稱性，而是從對稱性直接寫下拉格朗日的形式。拉格朗日力學的數學框架是對的，但它成立的真正理由，是拉格朗日本人完全不知道的。

附錄

核心公式總表

隨身速查。

應力與壓力

$$\boldsymbol{\sigma} = -P\,\mathbf{I} + \boldsymbol{\tau}, \qquad P = -\tfrac{1}{3}\mathrm{tr}(\boldsymbol{\sigma}), \qquad d\vec{F} = \boldsymbol{\sigma}\cdot\hat{n}\,dA$$

張量變換法則

$$v'_i = R_{ij}v_j, \qquad T'_{ij} = R_{ik}R_{jl}T_{kl}, \qquad R^TR = I$$

微分算符

$$\nabla\cdot\vec{F} = \mathrm{tr}(\nabla\vec{F}), \qquad (\nabla\times\vec{F})_k = \varepsilon_{ijk}\frac{\partial F_j}{\partial x_i}$$

梯度張量三重分解

$$\nabla\vec{F} = \tfrac{1}{3}(\nabla\cdot\vec{F})\mathbf{I} + \underbrace{\boldsymbol{\Omega}}_{\text{旋度}} + \underbrace{\mathbf{S}^{\text{dev}}}_{\text{純剪切}}$$

兩向量乘積的 spin 分解

$$1\otimes 1 = \underbrace{0}_{\vec{u}\cdot\vec{v}} \oplus \underbrace{1}_{\vec{u}\times\vec{v}} \oplus \underbrace{2}_{\text{對稱無跡}}$$

四元數

$$i^2=j^2=k^2=ijk=-1, \qquad ij=k,\ jk=i,\ ki=j, \qquad \vec{u}\,\vec{v} = -\vec{u}\cdot\vec{v} + \vec{u}\times\vec{v}$$

四元數與旋轉

$$q = \cos\tfrac{\theta}{2}+\sin\tfrac{\theta}{2}\,\hat{n}, \qquad \vec{v}' = q\,\vec{v}\,q^{-1}$$

四元數 ↔ Pauli 矩陣

$$i\leftrightarrow -i\sigma_x, \quad j\leftrightarrow -i\sigma_y, \quad k\leftrightarrow -i\sigma_z, \qquad U = e^{-i\frac{\theta}{2}\hat{n}\cdot\vec{\sigma}}$$

群的四公設

封閉性、結合律、單位元、反元素（交換律非必要；有交換律者為 Abel 群）。

重要的群

$$\mathbb{Z}_n\ \text{（離散）}, \quad \mathrm{U}(1)\ \text{（電荷）}, \quad \mathrm{SU}(2)\ \text{（自旋）}, \quad \mathrm{SU}(3)\ \text{（色荷）}, \quad \text{標準模型}=\mathrm{U}(1)\times\mathrm{SU}(2)\times\mathrm{SU}(3)$$

對稱性與守恆（Noether）

$$[H, U_R]=0 \;\Longleftrightarrow\; \text{對稱};\qquad \text{縮并度}=2l+1;\qquad \text{選擇定則 }\Delta l=\pm 1$$

拉格朗日與作用量

$$L = T - V, \qquad \frac{d}{dt}\frac{\partial L}{\partial\dot{q}_i}-\frac{\partial L}{\partial q_i}=0, \qquad \delta S = \delta\!\int L\,dt = 0, \qquad \langle B|A\rangle = \int\mathcal{D}q\,e^{iS/\hbar}$$

各領域核心方程

$$\vec{L} = \mathbf{I}\vec{\omega}, \quad D_i = \varepsilon_{ij}E_j, \quad \sigma_{ij} = C_{ijkl}\varepsilon_{kl}, \quad G_{\mu\nu} = \tfrac{8\pi G}{c^4}T_{\mu\nu}$$

張量物理導論 · 從應力張量到時空曲率與對稱結構 · 詳解增訂版
從一塊承受壓力的流體，到決定宇宙動力學的對稱群
關鍵定理附嚴格證明　·　核心主旨　對稱創造簡單，非對稱需要張量；對稱性決定動力學