19.4 按秩合并与路径压缩的分析

知识结构总览

graph TB
    A["19.4 按秩合并与路径压缩的分析"] --> B["快速增长函数 A_k(j)"]
    A --> C["反阿克曼函数 α(n)"]
    A --> D["秩的性质"]
    A --> E["势能函数与摊还分析"]
    A --> F["最终定理"]

    B --> B1["A_0(j) = j + 1"]
    B --> B2["A_1(j) = 2j + 1"]
    B --> B3["A_2(j) = 2^(j+1) · (j+1) - 1"]
    B --> B4["A_k(j) = A_(k-1)^(j+1)(j)<br/>对j+1次迭代"]
    B --> B5["A_4(1) >> 10^80<br/>远超宇宙原子数"]

    C --> C1["α(n) = min{k : A_k(1) ≥ n}"]
    C --> C2["α(n) ≤ 4 对所有实际n"]
    C --> C3["实际等价于常数"]

    D --> D1["引理19.4：秩的性质"]
    D --> D2["推论19.5：路径上秩严格递增"]
    D --> D3["引理19.6：rank ≤ ⌊lg n⌋"]
    D --> D4["引理19.7：rank为r的节点至多n/2^r个"]

    E --> E1["level(x) 的定义与性质"]
    E --> E2["iter(x) 的定义与性质"]
    E --> E3["节点势能 φ(x)"]
    E --> E4["引理19.10：势能单调不增"]
    E --> E5["引理19.11：MAKE-SET O(1)"]
    E --> E6["引理19.12：LINK O(α(n))"]
    E --> E7["引理19.13：FIND-SET O(α(n))"]

    F --> F1["定理19.14：O(m α(n))"]
    F --> F2["习题19.4-7：改进上界 O(m α'(n))"]

核心思想

本节的目标是证明：使用按秩合并和路径压缩， $m$ 次不相交集合操作（其中 $n$ 次为 MAKE-SET）的总运行时间为 $O (m α (n))$ 。证明使用势能方法（potential method），这是势能方法中的核心工具。

证明的整体策略分为四个层次：

定义快速增长函数 $A_{k} (j)$ 及其逆函数 $α (n)$ ：建立”级别”的数学基础
证明秩的基本性质：为后续分析提供不等式工具
设计势能函数：基于 level 和 iter 两个辅助函数，为每个节点分配势能
分析每种操作的摊还代价：证明 MAKE-SET 为 $O (1)$ ，LINK 和 FIND-SET 均为 $O (α (n))$

快速增长函数 $A_{k} (j)$ 的定义

对于整数 $j \geq 1, k \geq 0$ ，函数 $A_{k} (j)$ 的递归定义为：

$A_{0} (j) = j + 1$

$A_{k} (j) = A_{k - 1}^{(j + 1)} (j) (k \geq 1)$

其中 $A_{k - 1}^{(i)} (j)$ 表示将函数 $A_{k - 1}$ 迭代作用 $i$ 次于 $j$ ，即：

$A_{k - 1}^{(1)} (j) = A_{k - 1} (j)$ $A_{k - 1}^{(i)} (j) = A_{k - 1} (A_{k - 1}^{(i - 1)} (j)) (i \geq 2)$

参数 $k$ 称为函数 $A$ 的层级（level）。

前几层的计算与闭式表达

第0层：由定义直接可得

$A_{0} (j) = j + 1$

第1层： $A_{1} (j) = A_{0}^{(j + 1)} (j)$ 。先求 $A_{0}^{(i)} (j)$ 的闭式。 $A_{0}$ 每次作用将参数加 1，因此迭代 $i$ 次后：

$A_{0}^{(i)} (j) = j + i$

由此：

$A_{1} (j) = A_{0}^{(j + 1)} (j) = j + (j + 1) = 2 j + 1$

引理19.2

对任意整数 $j \geq 1$ ， $A_{1} (j) = 2 j + 1$ 。

第2层： $A_{2} (j) = A_{1}^{(j + 1)} (j)$ 。先求 $A_{1}^{(i)} (j)$ 的闭式。 $A_{1}$ 每次作用将参数做线性变换 $x \mapsto 2 x + 1$ ，因此：

$A_{1}^{(i)} (j) = 2^{i} (j + 1) - 1$

用归纳法验证：基础 $i = 1$ 时， $A_{1}^{(1)} (j) = A_{1} (j) = 2 j + 1 = 2^{1} (j + 1) - 1$ 。归纳步骤： $A_{1}^{(i + 1)} (j) = A_{1} (A_{1}^{(i)} (j)) = A_{1} (2^{i} (j + 1) - 1) = 2 (2^{i} (j + 1) - 1) + 1 = 2^{i + 1} (j + 1) - 1$ 。

由此：

$A_{2} (j) = A_{1}^{(j + 1)} (j) = 2^{j + 1} (j + 1) - 1$

引理19.3

对任意整数 $j \geq 1$ ， $A_{2} (j) = 2^{j + 1} (j + 1) - 1$ 。

第3层： $A_{3} (j) = A_{2}^{(j + 1)} (j)$ 。 $A_{2}$ 的增长速度已经是指数级的， $A_{3}$ 的增长速度远超指数。教材给出：

$A_{3} (1) = A_{2}^{(2)} (1) = A_{2} (A_{2} (1)) = A_{2} (7) = 2^{8} \cdot 8 - 1 = 2047$

第4层：

$A_{4} (1) = A_{3}^{(2)} (1) = A_{3} (A_{3} (1)) = A_{3} (2047) ≫ 2^{65536}$

$A_{4} (1)$ 是一个远超可观测宇宙中原子数（约 $1 0^{80}$ ）的巨大数字。

各层 $A_{k} (1)$ 的值汇总：

$k$	$A_{k} (1)$	增长速度
0	2	线性
1	3	线性
2	7	指数
3	2047	超指数
4	$≫ 2^{65536}$	不可想象

反阿克曼函数 $α (n)$

$α (n) = min {k : A_{k} (1) \geq n}$

换言之， $α (n)$ 是使得 $A_{k} (1) \geq n$ 的最小层级 $k$ 。

根据 $A_{k} (1)$ 的值：

$k$	$A_{k} (1)$	$α (n)$ 的范围
0	2	$α (n) = 0$ 当 $n = 1$
1	3	$α (n) = 1$ 当 $n = 2$
2	7	$α (n) = 2$ 当 $3 \leq n \leq 7$
3	2047	$α (n) = 3$ 当 $8 \leq n \leq 2047$
4	$≫ 1 0^{80}$	$α (n) = 4$ 当 $2048 \leq n \leq A_{4} (1)$

$α (n) \leq 4$ 对所有实际可能的 $n$ 值成立。 $A_{4} (1)$ 是一个远超宇宙中原子数（约 $1 0^{80}$ ）的巨大数字，因此任何 conceivable 的应用中 $α (n)$ 都不超过 4。在实际编程中，并查集操作可以安全地视为 $O (1)$ 常数时间。

秩的性质

引理19.4（秩的性质）

对于所有节点 $x$ ，有 $x .rank \leq x .p.rank$ ，且若 $x \neq = x .p$ （ $x$ 不是根），则严格不等。 $x .rank$ 初始为 0，随时间递增直到 $x \neq = x .p$ ，此后 $x .rank$ 不再改变。 $x .p.rank$ 随时间单调递增。

证明

【对操作次数归纳：基础 MAKE-SET 满足，归纳步分 MAKE-SET/LINK/FIND-SET 三种情况】 对操作次数进行归纳。

基础情况：MAKE-SET( $x$ ) 创建节点 $x$ ， $x .p = x$ ， $x .rank = 0$ 。 $x .rank = x .p.rank = 0$ ，满足 $x .rank \leq x .p.rank$ 。

归纳步骤：考虑三种操作。

MAKE-SET：创建新节点 $y$ ， $y .p = y$ ， $y .rank = 0$ 。对 $y$ 满足条件。其他节点的 parent 和 rank 不变，由归纳假设条件成立。

LINK( $x$ , $y$ )：LINK 使 $y$ 成为 $x$ 的父节点（ $x .p = y$ ）。

若 $x .rank < y .rank$ ： $x .rank < x .p.rank = y .rank$ ，严格不等成立。

若 $x .rank = y .rank$ ： $y .rank$ 增加 1，所以 $x .rank = y .rank_{old} < y .rank_{old} + 1 = y .rank_{new} = x .p.rank$ ，严格不等成立。

对于 $y$ 的原有子节点 $z$ （ $z .p = y$ ），LINK 后 $z .p$ 不变， $z .rank$ 不变。但 $y .rank$ 可能增加 1，所以 $z .rank \leq y .rank_{old} \leq y .rank_{new} = z .p.rank$ 仍然成立。

FIND-SET：FIND-SET 只改变 parent 指针（路径压缩），不改变任何 rank。路径压缩使某些节点的 parent 变为根，而根的 rank 是最大的，所以 $x .rank \leq x .p.rank$ 仍然成立。

秩的单调性： $x .rank$ 只在 LINK 中可能增加（当 $x$ 是根且被选为父节点时）。一旦 $x$ 不再是根（ $x \neq = x .p$ ）， $x .rank$ 永远不再改变（因为 LINK 只操作根节点，FIND-SET 不改变 rank）。

$x .p.rank$ 的单调递增性：如果 $x .p$ 是根，其 rank 只增不减。如果 $x .p$ 不是根，其 rank 不变，但 $x .p$ 的 parent 的 rank 单调递增。综合来看， $x .p.rank$ 随时间单调递增。 $■$

推论19.5

从任意节点向上到根的简单路径上，节点秩严格递增。

证明

【由引理19.4：路径上每对相邻节点 $x .rank < x .p.rank$ ，传递即得秩严格递增】 由引理19.4，路径上每个非根节点 $x$ 满足 $x .rank < x .p.rank$ 。沿路径逐节点应用此不等式即得。 $■$

引理19.6（秩上界 $⌊ l g n ⌋$ ）

每个节点的秩最多为 $⌊ l g n ⌋$ 。

证明

【对 $r$ 归纳：rank $r$ 的根至少 $2^{r}$ 棵初始树合并，故 $2^{r} \leq n$ 】 关键观察是 rank 为 $r$ 的根至少是 $2^{r}$ 棵初始树的根的后代。

对 $r$ 进行归纳。基础情况 $r = 0$ ：rank 为 0 的根本身就是一棵树， $1 \geq 2^{0} = 1$ 。

归纳步骤：假设 rank 为 $r$ 的根至少是 $2^{r}$ 棵不同树的根的后代。考虑 rank 为 $r + 1$ 的根 $x$ 。 $x$ 的 rank 从 $r$ 增加到 $r + 1$ 是在某次 LINK 操作中，此时 $x$ 与另一个 rank 也为 $r$ 的根 $y$ 合并。由归纳假设， $x$ 之前至少是 $2^{r}$ 棵树的根的后代， $y$ 也至少是 $2^{r}$ 棵树的根的后代。合并后， $x$ （rank 增加到 $r + 1$ ）至少是 $2^{r} + 2^{r} = 2^{r + 1}$ 棵树的根的后代。

由于总共有 $n$ 个节点（即 $n$ 棵初始树），rank 为 $r$ 的根至少需要 $2^{r}$ 个节点。因此 $2^{r} \leq n$ ，即 $r \leq l g n$ ，即 $r \leq ⌊ l g n ⌋$ 。 $■$

引理19.7（rank 为 $r$ 的节点个数上界）

在 $n$ 个节点的森林中，至多有 $n / 2^{r}$ 个 rank 为 $r$ 的节点。

证明

【rank $r$ 的根子树至少 $2^{r}$ 个节点，不同子树不相交，故 $N_{r} \leq n / 2^{r}$ 】 由引理19.6 的归纳证明可知，rank 为 $r$ 的根至少是 $2^{r}$ 棵初始树合并而来的，即以 rank 为 $r$ 的根为根的子树中至少有 $2^{r}$ 个节点。由于不同根的子树不相交，所有 rank 为 $r$ 的根的子树中的节点总数至少为 $2^{r} \cdot N_{r}$ ，其中 $N_{r}$ 是 rank 为 $r$ 的根的个数。这个总数不超过 $n$ ，因此 $N_{r} \leq n / 2^{r}$ 。

对于非根节点，其 rank 在成为非根后不再改变，而成为非根前的 rank 与某个根的历史 rank 值相同。因此 rank 为 $r$ 的非根节点的个数也不超过 $n / 2^{r}$ 。综合来看，rank 为 $r$ 的节点总数至多为 $n / 2^{r}$ 。 $■$

势能函数设计

为了使用势能方法证明 $O (m α (n))$ 的上界，教材设计了一个精巧的势能函数。假设操作序列已被转换为 MAKE-SET、LINK、FIND-SET 序列（每个 UNION 被替换为两次 FIND-SET 加一次 LINK）。

辅助函数 level( $x$ )（仅对非根节点且 $x .rank \geq 1$ 定义）：

$level (x) = max {k : A_{k} (x .rank) \leq x .p.rank}$

即 level( $x$ ) 是满足 $A_{k}$ 作用于 $x .rank$ 后不超过 $x .p.rank$ 的最大层级 $k$ 。

level( $x$ ) 的性质：

下界： $A_{0} (x .rank) = x .rank + 1 \leq x .p.rank$ （由引理19.4， $x .rank < x .p.rank$ ，而 rank 为整数），因此 level( $x$ ) $\geq 0$ 。
上界： $A_{α (n)} (x .rank) \geq A_{α (n)} (1) \geq n > x .p.rank$ （因为 $x .p.rank \leq ⌊ l g n ⌋ < n$ ），因此 level( $x$ ) $< α (n)$ 。

综上， $0 \leq level (x) < α (n)$ 。

单调性：对于给定的非根节点 $x$ ，level( $x$ ) 随时间单调递增。这是因为 $x .rank$ 不变（ $x$ 不是根），而 $x .p.rank$ 单调递增（引理19.4）。

辅助函数 iter( $x$ )（仅对非根节点且 $x .rank \geq 1$ 定义）：

$iter (x) = max {i : A_{level (x)}^{(i)} (x .rank) \leq x .p.rank}$

即 iter( $x$ ) 是在层级 level( $x$ ) 上，将 $A_{level (x)}$ 迭代作用于 $x .rank$ 后仍不超过 $x .p.rank$ 的最大迭代次数。

iter( $x$ ) 的性质：

下界： $A_{level (x)}^{(1)} (x .rank) = A_{level (x)} (x .rank) \leq x .p.rank$ （由 level 的定义），因此 iter( $x$ ) $\geq 1$ 。
上界：由 level 的定义， $A_{level (x) + 1} (x .rank) > x .p.rank$ 。而 $A_{level (x) + 1} (x .rank) = A_{level (x)}^{(x .rank + 1)} (x .rank)$ ，所以 $A_{level (x)}^{(x .rank + 1)} (x .rank) > x .p.rank$ ，即 iter( $x$ ) $\leq x .rank$ 。

综上， $1 \leq iter (x) \leq x .rank$ 。

单调性：只要 level( $x$ ) 不变，iter( $x$ ) 随时间单调递增或不变（因为 $x .p.rank$ 单调递增）。

节点势能：

$ϕ_{q} (x) = {α (n) \cdot x .rank (α (n) - level (x)) \cdot x .rank - iter (x) 若 x 是根或 x .rank = 0 若 x 不是根且 x .rank \geq 1$

引理19.8（势能有界性）

对每个节点 $x$ 和所有操作计数 $q$ ，有 $0 \leq ϕ_{q} (x) \leq α (n) \cdot x .rank$ 。

证明

【分情况：根/rank=0 直接得界；非根 rank≥1 时 level≤α(n)-1 且 iter≤rank 保证非负】

若 $x$ 是根或 $x .rank = 0$ ： $ϕ_{q} (x) = α (n) \cdot x .rank \geq 0$ ，且显然 $ϕ_{q} (x) \leq α (n) \cdot x .rank$ 。

若 $x$ 不是根且 $x .rank \geq 1$ ：

$ϕ_{q} (x) \geq 0$ ：因为 $level (x) \leq α (n) - 1$ （level( $x$ ) $< α (n)$ ），所以 $α (n) - level (x) \geq 1$ 。又 $iter (x) \leq x .rank$ ，所以 $(α (n) - level (x)) \cdot x .rank - iter (x) \geq 1 \cdot x .rank - x .rank = 0$ 。

$ϕ_{q} (x) \leq α (n) \cdot x .rank$ ：因为 $level (x) \geq 0$ 且 $iter (x) \geq 1$ ，所以 $(α (n) - level (x)) \cdot x .rank - iter (x) \leq α (n) \cdot x .rank - 1 < α (n) \cdot x .rank$ 。 $■$

摊还代价分析

引理19.10（势能变化）

设 $x$ 是非根节点，第 $q$ 次操作是 LINK 或 FIND-SET。则 $ϕ_{q} (x) \leq ϕ_{q - 1} (x)$ 。进一步，若 $x .rank \geq 1$ 且 level( $x$ ) 或 iter( $x$ ) 因第 $q$ 次操作而变化，则 $ϕ_{q} (x) \leq ϕ_{q - 1} (x) - 1$ 。

证明

【LINK：非根节点势能不增（p.rank 单调递增使 level/iter 递增）；FIND-SET：路径压缩后 p 变为根，势能不增】 分情况讨论。

LINK 操作：LINK 只改变根节点的 parent 指针。对于非根节点 $x$ ，LINK 不改变 $x .p$ （除非 $x .p$ 是被链接的根，但此时 $x .p$ 仍然是根，只是 rank 可能增加）。 $x .rank$ 不变。

若 $x .p$ 是 LINK 的父节点（被选为父的根），则 $x .p.rank$ 增加 1。由于 $x .p.rank$ 单调递增，level( $x$ ) 和 iter( $x$ ) 均单调递增或不变。若 level( $x$ ) 或 iter( $x$ ) 增加，则势能减少至少 1。

若 $x .p$ 不是 LINK 涉及的节点，则 $x .p.rank$ 不变，level( $x$ ) 和 iter( $x$ ) 均不变，势能不变。

FIND-SET 操作：路径压缩将路径上节点的 parent 指向根。对于路径上的非根节点 $x$ （非根节点）， $x .p$ 变为根。根的 rank 是最大的，因此 $x .p.rank$ 增加（或不变）。level( $x$ ) 和 iter( $x$ ) 均单调递增或不变。若发生变化，势能减少至少 1。 $■$

引理19.11（MAKE-SET 摊还代价）

每次 MAKE-SET 的摊还代价为 $O (1)$ 。

证明

【MAKE-SET 创建 rank=0 节点，势能=0，实际代价 $O (1)$ ，摊还 $O (1)$ 】 MAKE-SET 创建 rank 为 0 的节点 $x$ ，势能 $ϕ_{q} (x) = α (n) \cdot 0 = 0$ 。其他节点的势能不变。实际代价 $O (1)$ ，势能变化为 0。摊还代价 = 实际代价 + 势能变化 = $O (1) + 0 = O (1)$ 。 $■$

引理19.12（LINK 摊还代价）

每次 LINK 的摊还代价为 $O (α (n))$ 。

证明

【LINK 实际 $O (1)$ ， $x$ 从根变非根势能不增， $y$ rank 增加最多贡献 $α (n)$ 势能增量】 LINK 的实际代价为 $O (1)$ 。设 LINK 使 $y$ 成为 $x$ 的父节点（ $x .p = y$ ）。

节点 $x$ 从根变为非根。 $x$ 的势能从 $α (n) \cdot x .rank$ 变为 $(α (n) - level (x)) \cdot x .rank - iter (x) \leq α (n) \cdot x .rank$ 。因此 $x$ 的势能不增加。

节点 $y$ 的 rank 可能增加 1（当 $x .rank = y .rank$ 时）。 $y$ 是根，其势能为 $α (n) \cdot y .rank$ ，增加最多 $α (n)$ 。

$y$ 的子节点（ $z .p = y$ ）的势能： $z .p.rank$ 可能增加 1，由引理19.10，这些节点的势能不增加。

其他节点的势能不变。

总势能增量最多为 $α (n)$ （来自 $y$ 的 rank 增加）。摊还代价 = $O (1) + α (n) = O (α (n))$ 。 $■$

引理19.13（FIND-SET 摊还代价）

每次 FIND-SET 的摊还代价为 $O (α (n))$ 。

证明

【 $s$ 个节点中至少 $s - (α (n) + 2)$ 个势能减少≥1，摊还代价 $O (s) - (s - α (n) - 2) = O (α (n))$ 】 设查找路径上有 $s$ 个节点（不含根）。实际代价为 $O (s)$ 。

关键结论：至少 $max {0, s - (α (n) + 2)}$ 个节点的势能减少至少 1。

论证如下。查找路径上的节点按从叶到根的顺序排列为 $x_{1}, x_{2}, \dots, x_{s}, r$ ，其中 $r$ 是根。路径压缩后， $x_{1}, x_{2}, \dots, x_{s}$ 全部直接指向 $r$ 。

将路径上的非根节点按 rank 值分组。由推论19.5，路径上节点秩严格递增，因此每个 rank 值最多出现一次。考虑路径上 rank $\geq 1$ 的节点（至多 $s$ 个），按 level 值分组。

对于每个 level 值 $k$ （ $0 \leq k < α (n)$ ），路径上 level 为 $k$ 的节点中，除最后一个外，每个节点 $x$ 后面都跟着某个非根节点 $y$ （ $y$ 在路径上且 $y$ 在 $x$ 和 $r$ 之间），使得路径压缩后 $x .p = r$ 且 $y .p = r$ 。由于 $y .rank > x .rank$ （推论19.5），且路径压缩后 $x$ 和 $y$ 有相同的父节点 $r$ ，level( $x$ ) 不变（因为 $x .p.rank$ 增加到 $r .rank$ ），但 iter( $x$ ) 至少增加 1（因为 $A_{level (x)}^{(iter (x) + 1)} (x .rank) \leq r .rank$ ）。由引理19.10， $ϕ (x)$ 至少减少 1。

每个 level 值至多有 1 个”最后一个”节点不满足上述条件。level 值共有 $α (n)$ 个可能的取值（ $0$ 到 $α (n) - 1$ ），因此至多有 $α (n)$ 个”最后一个”节点。加上 rank 为 0 的节点（至多 1 个）和路径上紧跟根的节点（至多 1 个），总共有至多 $α (n) + 2$ 个节点不保证势能减少。

因此，至少 $s - (α (n) + 2)$ 个节点的势能减少至少 1。总势能变化 $ΔΦ \leq - (s - (α (n) + 2))$ 。

摊还代价 = $O (s) + ΔΦ \leq O (s) - (s - α (n) - 2) = O (α (n))$ 。 $■$

最终定理

定理19.14

使用按秩合并和路径压缩， $m$ 次 MAKE-SET、UNION 和 FIND-SET 操作（其中 $n$ 次为 MAKE-SET）可以在 $O (m α (n))$ 时间内完成。

证明

【UNION→2×FIND-SET+LINK，总摊还 $n \cdot O (1) + (f + ℓ) \cdot O (α (n)) = O (m α (n))$ 】 将每个 UNION 替换为两次 FIND-SET 加一次 LINK，得到等价的 MAKE-SET、FIND-SET、LINK 操作序列。设 MAKE-SET 有 $n$ 次，FIND-SET 有 $f$ 次，LINK 有 $ℓ$ 次，则 $m = n + f + 2 ℓ$ （因为每个 UNION 贡献 2 次 FIND-SET 和 1 次 LINK）。

总摊还代价 = $n \cdot O (1) + f \cdot O (α (n)) + ℓ \cdot O (α (n)) = O (n + (f + ℓ) \cdot α (n)) = O (m α (n))$ （因为 $n \leq m$ 且 $f + ℓ \leq m$ ）。

由于初始势能 $Φ_{0} = 0$ 且势能始终非负，总实际代价不超过总摊还代价，即 $O (m α (n))$ 。 $■$

补充理解与拓展

补充：α(n) 增长极其缓慢

来源： 教材第19.4节，pp. 533-534

$α (n)$ 是所有实用数据结构分析中出现的增长最慢的非常数函数。具体来说：

$α (n) = 0$ 当 $n = 1$

$α (n) = 1$ 当 $n = 2$

$α (n) = 2$ 当 $3 \leq n \leq 7$

$α (n) = 3$ 当 $8 \leq n \leq 2047$

$α (n) = 4$ 当 $2048 \leq n \leq A_{4} (1)$

$A_{4} (1) = A_{3}^{(2)} (1) = A_{3} (2047) ≫ 2^{65536}$ ，远超宇宙中可观测原子数（约 $1 0^{80}$ ）。因此 $α (n) \leq 4$ 对所有”天文数字”级别的 $n$ 都成立。在实际编程中，并查集操作可以安全地视为 $O (1)$ 常数时间。

补充：Ackermann 函数的历史

来源： Wilhelm Ackermann, “Zum Hilbertschen Aufbau der reellen Zahlen”, Mathematische Annalen, 1928

Ackermann 函数是最早被发现的不是原始递归的递归函数之一，由数学家 Wilhelm Ackermann 于 1928 年提出。原始的 Ackermann 函数 $A (m, n)$ 是一个双参数函数，增长速度极快——远超指数函数和阶乘函数。

教材中使用的快速增长函数 $A_{k} (j)$ 是 Ackermann 函数的一个变体，经过调整以便于并查集的分析。两者本质相同：都通过函数迭代来定义更高层级的增长速度。 $A_{k} (j)$ 可以看作是将 Ackermann 函数”展平”为单参数层级 $k$ 的版本。

补充：Tarjan 1975 的原始证明

来源： Robert E. Tarjan, “Efficiency of a Good But Not Linear Set Union Algorithm”, Journal of the ACM, 22(2), 1975, pp. 215-225

Tarjan 在 1975 年首次证明了按秩合并+路径压缩的 $O (m α (n))$ 上界。原始证明使用了不同的势能函数和 level 定义，但核心思想相同：利用快速增长函数的逆函数来”分级”节点，使得每个 level 的摊还代价有界。

Tarjan 的原始证明中使用的函数定义与教材略有不同（使用的是 Ackermann 函数的另一个变体），但最终得到的上界在量级上是相同的。这篇论文是摊还分析在数据结构中应用的经典范例之一。

补充：Fredman & Saks 的下界证明

来源： M. Fredman and M. Saks, “The Cell Probe Complexity of Dynamic Data Structures”, Proceedings of the 21st Annual ACM Symposium on Theory of Computing (STOC), 1989, pp. 345-354

Fredman 和 Saks 在 1989 年证明了并查集在 cell probe 模型下的下界：任何实现不相交集合 MAINTAINABLE 操作的动态数据结构，每次操作至少需要 $Ω (α (n))$ 的时间。这意味着 Tarjan 的 $O (m α (n))$ 上界在 cell probe 模型下是最优的——不可能有渐近更快的算法。

Cell probe 模型是一种非常强的计算模型，它只计算算法读取或写入内存单元的次数，不考虑计算开销。因此， $Ω (α (n))$ 的下界是非常强的结论。

补充：实际意义——α(n) = O(1)

来源： 教材第19.3节，p. 531

教材明确指出：“在任何可以想象的不相交集合数据结构的应用中， $α (n) \leq 4$ 。“这意味着：

在实际工程中，并查集的每次操作可以视为常数时间 $O (1)$

Kruskal 最小生成树算法中使用并查集时，总时间由排序步骤的 $O (E l g E)$ 主导，并查集部分为 $O (E α (V)) = O (E)$

竞赛编程中，并查集被视为”近乎常数时间”的数据结构，与哈希表同级

即使 $n = 2^{65536}$ （远超任何实际输入）， $α (n)$ 仍然只有 4

易混淆点与辨析

误区：A_k(j) 的定义中 A_0(j) = 2j

错误理解： $A_{0} (j) = 2 j$ ，这是第3版的定义。 正确理解： 在第4版中， $A_{0} (j) = j + 1$ ， $A_{k} (j) = A_{k - 1}^{(j + 1)} (j)$ （ $k \geq 1, j \geq 1$ ）。这与第3版的定义不同。 辨析： 第3版使用 $A_{0} (j) = 2 j$ ， $A_{k} (j) = A_{k - 1}^{(j)} (j)$ 。第4版修改了定义使得 $A_{1} (j) = 2 j + 1$ （而非第3版的 $2^{j} j$ ），分析结构更加简洁。两版最终得到的 $α (n)$ 在量级上相同，但具体数值有差异。阅读时务必确认使用的是哪个版本的教材。

误区：level(x) 沿查找路径单调递增

错误理解： 因为节点秩沿路径严格递增，所以 level 也一定沿路径单调递增。 正确理解： level( $x$ ) 不一定沿查找路径单调递增。习题19.4-5要求给出反例。 辨析： level( $x$ ) 依赖于 $x .rank$ 和 $x .p.rank$ 之间的差距。虽然 $x .p.rank$ 沿路径递增，但 $x .rank$ 也沿路径递增，因此 $A_{k} (x .rank)$ 和 $x .p.rank$ 之间的相对关系可能非常复杂。具体来说，当路径上两个相邻节点的 rank 差距恰好使得低 rank 节点的 level 较高时，就会出现 level 不单调的情况。

误区：势能函数中的 α(n) 可以替换为任意常数

错误理解： 既然 $α (n) \leq 4$ ，势能函数中直接用 4 替代 $α (n)$ 就行了。 正确理解： 在理论分析中， $α (n)$ 不能简单替换为常数。势能函数的设计依赖于 $α (n)$ 的定义（即 $A_{α (n)} (1) \geq n$ ），这个性质在证明 level( $x$ ) $< α (n)$ 时被使用。 辨析： 虽然在实际中 $α (n)$ 等价于常数，但在数学证明中， $α (n)$ 的精确定义和性质是证明正确性的基础。如果直接替换为 4，level( $x$ ) $< 4$ 这个界在 $n > A_{4} (1)$ 时可能不成立，证明就会失效。当然，对于任何实际输入， $n ≪ A_{4} (1)$ ，所以替换为 4 在实践中是安全的。

习题精选

习题概览

题号来源核心考点难度
19.4-1 教材习题证明引理19.4（秩的性质） ⭐⭐
19.4-2 教材习题证明 rank ≤ ⌊lg n⌋ ⭐⭐
19.4-3 教材习题存储 rank 需要的位数 ⭐
19.4-4 教材习题仅按秩合并的 O(m lg n) 证明 ⭐⭐
19.4-5 教材习题 level 是否沿路径单调递增 ⭐⭐⭐
19.4-7 教材习题 α’(n) 的改进上界 ⭐⭐⭐

题号	来源	核心考点	难度
19.4-1	教材习题	证明引理19.4（秩的性质）	⭐⭐
19.4-2	教材习题	证明 rank ≤ ⌊lg n⌋	⭐⭐
19.4-3	教材习题	存储 rank 需要的位数	⭐
19.4-4	教材习题	仅按秩合并的 O(m lg n) 证明	⭐⭐
19.4-5	教材习题	level 是否沿路径单调递增	⭐⭐⭐
19.4-7	教材习题	α’(n) 的改进上界	⭐⭐⭐

题1：19.4-1 证明引理19.4

题目

证明引理19.4：对于所有节点 $x$ ，有 $x .rank \leq x .p.rank$ ，且若 $x \neq = x .p$ 则严格不等。 $x .rank$ 初始为 0，随时间递增直到 $x \neq = x .p$ ，此后不再改变。 $x .p.rank$ 随时间单调递增。

解答

见上文”核心思想”中引理19.4的完整证明。证明采用对操作次数的归纳法，分 MAKE-SET、LINK、FIND-SET 三种情况讨论。

$■$

解题思路提示

对操作次数进行归纳，分 MAKE-SET、LINK、FIND-SET 三种情况讨论。注意 LINK 只操作根节点，FIND-SET 只改变 parent 指针不改变 rank。

题2：19.4-2 证明 rank ≤ ⌊lg n⌋

题目

证明每个节点的秩最多为 $⌊ l g n ⌋$ 。

解答

见上文”核心思想”中引理19.6的完整证明。核心思路是证明”rank 为 $r$ 的根至少是 $2^{r}$ 棵初始树合并而来的”，通过归纳法完成。

$■$

解题思路提示

核心思路是证明”rank 为 r 的根至少是 2^r 棵初始树合并而来的”。这通过归纳法完成，利用了 LINK 只在两个 rank 相等的根合并时才增加 rank 这一事实。

题3：19.4-3 存储 rank 需要的位数

题目

根据练习19.4-2，存储 $x .rank$ 需要多少位？

解答

由习题19.4-2， $x .rank \leq ⌊ l g n ⌋$ 。因此 $x .rank$ 的取值范围为 ${0, 1, 2, \dots, ⌊ l g n ⌋}$ 。

表示这个范围需要 $⌈ l g (⌊ l g n ⌋ + 1)⌉$ 位，即 $Θ (l g l g n)$ 位。

$■$

解题思路提示

rank 的最大值是 floor(lg n)，因此需要表示 0 到 floor(lg n) 共 floor(lg n)+1 个值。对其取对数即得所需位数。

题4：19.4-4 仅按秩合并的 O(m lg n) 证明

题目

利用习题19.4-2，给出一个简单的证明：仅使用按秩合并（不使用路径压缩）的不相交集合森林上的操作在 $O (m l g n)$ 时间内运行。

解答

【rank ≤ ⌊lg n⌋ 保证路径长度 $O (l g n)$ ，每次操作 $O (l g n)$ ，总计 $O (m l g n)$ 】 由习题19.4-2，每个节点的 rank 最多为 $⌊ l g n ⌋$ 。由于路径上秩严格递增（推论19.5），从任何节点到根的路径长度最多为 $⌊ l g n ⌋$ 。

MAKE-SET： $O (1)$ 时间。

UNION = FIND-SET + FIND-SET + LINK。两次 FIND-SET 各需 $O (l g n)$ ，LINK 需 $O (1)$ 。总计 $O (l g n)$ 。

FIND-SET：沿 parent 指针走到根，路径长度最多 $⌊ l g n ⌋ = O (l g n)$ 。

$m$ 次操作的总时间：每次操作最多 $O (l g n)$ ，总时间为 $O (m l g n)$ 。

$■$

解题思路提示

关键在于：按秩合并保证树高为 O(lg n)（因为 rank 不超过 floor(lg n) 且路径上秩严格递增），因此每次 FIND-SET 为 O(lg n)。没有路径压缩时，这个界不会被打破。

题5：19.4-5 level 是否沿路径单调递增

题目

Dante 教授认为，因为节点秩沿到根的简单路径严格递增，所以节点 level 也必须沿路径单调递增。换言之，如果 $x .rank > 0$ 且 $x .p$ 不是根，则 level( $x$ ) $\leq$ level( $x .p$ )。教授正确吗？

解答

【反例： $x . rank = 1, x . p.rank = 3 \Rightarrow level (x) = 1$ ； $x . p.rank = 3, (x . p) . p.rank = 4 \Rightarrow level (x . p) = 0$ 】 教授不正确。level 不一定沿路径单调递增。

构造反例。考虑以下森林结构（经过特定的 UNION 和路径压缩操作后）：

设 $x .rank = 1$ ， $x .p.rank = 3$ 。计算 level( $x$ )：

$A_{0} (1) = 2 \leq 3$ ，所以 level( $x$ ) $\geq 0$

$A_{1} (1) = 3 \leq 3$ ，所以 level( $x$ ) $\geq 1$

$A_{2} (1) = 7 > 3$ ，所以 level( $x$ ) $< 2$

因此 level( $x$ ) $= 1$

设 $x .p.rank = 3$ ， $(x .p) .p.rank = 4$ 。计算 level( $x .p$ )：

$A_{0} (3) = 4 \leq 4$ ，所以 level( $x .p$ ) $\geq 0$

$A_{1} (3) = 7 > 4$ ，所以 level( $x .p$ ) $< 1$

因此 level( $x .p$ ) $= 0$

此时 level( $x$ ) $= 1 > 0 =$ level( $x .p$ )，level 沿路径递减而非递增。

直觉解释：level 衡量的是 $x .rank$ 和 $x .p.rank$ 之间的”函数迭代距离”。虽然 $x .p.rank$ 沿路径递增，但 $x .rank$ 也递增，且 $A_{k} (j)$ 随 $j$ 增长很快。当 $x .rank$ 较小而 $x .p.rank$ 相对较大时，level 可以较高；而当 $x .p.rank$ 较大但 $(x .p) .p.rank$ 只大一点点时，level 可能反而较低。

$■$

解题思路提示

要证明”不单调”，只需构造一个具体的反例。关键是找到 rank 差距”恰到好处”的相邻节点对，使得低 rank 节点的 level 反而更高。从 A_k 的定义出发，选择使 A_1 作用于 x.rank 不超过 x.p.rank 但 A_2 作用于 x.rank 超过 x.p.rank，同时 A_0 作用于 x.p.rank 不超过其父节点 rank 但 A_1 作用于 x.p.rank 超过其父节点 rank 的数值。

题6：19.4-7 α’(n) 的改进上界

题目

考虑函数 $α^{'} (n) = min {k : A_{k} (1) \geq l g (n + 1)}$ 。证明 $α^{'} (n) \leq 3$ 对所有实际 $n$ 成立，并利用习题19.4-2，说明如何修改势能函数的论证来证明：使用按秩合并和路径压缩， $m$ 次 MAKE-SET、UNION 和 FIND-SET 操作（其中 $n$ 次为 MAKE-SET）可以在 $O (m α^{'} (n))$ 时间内完成。

解答

【 $A_{3} (1) = 2047 \geq l g (n + 1)$ 对所有实际 $n$ ，替换 $α (n)$ 为 $α^{'} (n)$ 其余分析平行】 证明 $α^{'} (n) \leq 3$ 对所有实际 $n$ ：

$A_{3} (1) = 2047$

$α^{'} (n) \leq 3$ 当 $A_{3} (1) \geq l g (n + 1)$ ，即 $l g (n + 1) \leq 2047$ ，即 $n + 1 \leq 2^{2047}$

$2^{2047}$ 是一个天文数字，远超任何实际可能的 $n$

因此 $α^{'} (n) \leq 3$ 对所有实际 $n$ 成立

修改势能函数论证：

关键变化是将 $α (n)$ 替换为 $α^{'} (n)$ ，并相应调整 level 的上界。

由习题19.4-2， $x .p.rank \leq ⌊ l g n ⌋$ 。

level( $x$ ) 的上界调整：

$A_{α^{'} (n)} (x .rank) \geq A_{α^{'} (n)} (1) \geq l g (n + 1) > ⌊ l g n ⌋ \geq x .p.rank$

因此 level( $x$ ) $< α^{'} (n)$

势能函数修改为： $ϕ_{q}^{'} (x) = (α^{'} (n) - level (x)) \cdot x .rank - iter (x)$

其余分析与原始证明完全平行：

势能有界性： $0 \leq ϕ_{q}^{'} (x) \leq α^{'} (n) \cdot x .rank$

势能变化：势能不能增加，level 或 iter 变化时势能至少减少 1

MAKE-SET 为 $O (1)$ ，LINK 和 FIND-SET 为 $O (α^{'} (n))$

最终定理：总时间为 $O (m α^{'} (n))$

由于 $α^{'} (n) \leq α (n)$ （因为 $l g (n + 1) \leq n$ ），这是一个更紧的上界。

$■$

解题思路提示

核心思路是将分析中的 n 替换为 lg(n+1)，利用 rank 不超过 floor(lg n) 这一更紧的界。由于 rank 的最大值本身就是 O(lg n)，用 lg(n+1) 作为 level 的上界更加”紧凑”，从而得到更小的 alpha’(n)。

视频学习指南

视频资源

资源链接对应内容备注
MIT 6.046 Lecture 11 YouTube 并查集的摊还分析含 α(n) 的直观解释
Erik Demaine - Advanced Data Structures MIT OCW 不相交集合的完整分析更深入的数学推导
Tarjan 1975 原论文 ACM DL 原始 O(mα(n)) 证明历史文献，了解原始方法

资源	链接	对应内容	备注
MIT 6.046 Lecture 11	YouTube	并查集的摊还分析	含 α(n) 的直观解释
Erik Demaine - Advanced Data Structures	MIT OCW	不相交集合的完整分析	更深入的数学推导
Tarjan 1975 原论文	ACM DL	原始 O(mα(n)) 证明	历史文献，了解原始方法

教材原文(中文翻译)

教材原文

来源： Introduction to Algorithms, 4th Edition, Section 19.4, pp. 532-540 译者： 殷建平、徐云、王刚、刘晓光、苏明、邹恒明、王宏志

按秩合并与路径压缩的分析

如第19.3节所述，结合按秩合并和路径压缩的启发式策略在 $n$ 个元素上执行 $m$ 次不相交集合操作的运行时间为 $O (m α (n))$ 。在本节中，我们将探讨函数 $α$ 以了解它增长得有多慢。然后我们将使用摊还分析的势能方法来分析运行时间。

一个非常快速增长的函数及其非常缓慢增长的逆函数

对于整数 $j, k \geq 0$ ，我们定义函数 $A_{k} (j)$ 为： $A_{0} (j) = j + 1$ ， $A_{k} (j) = A_{k - 1}^{(j + 1)} (j)$ （ $k \geq 1$ ）。我们称参数 $k$ 为函数 $A$ 的层级。

函数 $A_{k} (j)$ 随 $j$ 和 $k$ 严格递增。为了了解这个函数增长得有多快，我们首先获得 $A_{1} (j)$ 和 $A_{2} (j)$ 的闭式表达式。

引理19.2：对任意整数 $j \geq 1$ ， $A_{1} (j) = 2 j + 1$ 。

引理19.3：对任意整数 $j \geq 1$ ， $A_{2} (j) = 2^{j + 1} (j + 1) - 1$ 。

现在我们可以通过简单地考察 $k = 0, 1, 2, 3, 4$ 时的 $A_{k} (1)$ 来了解 $A_{k} (j)$ 增长得有多快。由 $A_{0} (j)$ 的定义和上述引理，我们有 $A_{0} (1) = 2$ ， $A_{1} (1) = 3$ ， $A_{2} (1) = 7$ 。我们还有 $A_{3} (1) = A_{2} (A_{2} (1)) = A_{2} (7) = 2^{8} \cdot 8 - 1 = 2047$ ，以及 $A_{4} (1) = A_{3} (A_{3} (1)) = A_{3} (2047) ≫ A_{2} (2047) = 2^{2048} \cdot 2048 - 1 = 2^{2059} - 1 > 2^{2056} = (2^{4})^{514} = 1 6^{514} ≫ 1 0^{80}$ ，后者是可观测宇宙中估计的原子数。

我们定义函数 $A_{k} (n)$ （ $n \geq 0$ 为整数）的逆为 $α (n) = min {k : A_{k} (1) \geq n}$ 。换言之， $α (n)$ 是使 $A_{k} (1)$ 至少为 $n$ 的最低层级 $k$ 。只有当 $n$ 大到”天文数字”这个词都低估了它（大于 $A_{4} (1)$ ，一个巨大的数字）时， $α (n) > 4$ ，因此 $α (n) \leq 4$ 对所有实际目的成立。

秩的性质

引理19.4：对于所有节点 $x$ ， $x .rank \leq x .p.rank$ ，且若 $x \neq = x .p$ （ $x$ 不是根），则严格不等。 $x .rank$ 初始为 0，随时间递增直到 $x \neq = x .p$ ，此后 $x .rank$ 不再改变。 $x .p.rank$ 随时间单调递增。

推论19.5：从任意节点向上到根的简单路径上，节点秩严格递增。

引理19.6：每个节点的秩最多为 $n - 1$ 。

引理19.6提供了一个较弱的秩的界。事实上，每个节点的秩最多为 $⌊ l g n ⌋$ （见练习19.4-2）。然而，引理19.6的较松界对我们的目的已经足够。

证明时间界

为了证明 $O (m α (n))$ 的时间界，我们将使用第16.3节的摊还分析势能方法。在执行摊还分析时，假设我们调用 LINK 操作而非 UNION 操作会比较方便。也就是说，由于 LINK 过程的参数是指向两个根的指针，我们表现得好像分别执行了相应的 FIND-SET 操作。

势能函数

我们使用的势能函数在第 $q$ 次操作后为不相交集合森林中的每个节点 $x$ 分配一个势能 $ϕ_{q} (x)$ 。对于第 $q$ 次操作后整个森林的势能 $Φ_{q}$ ，对所有节点的势能求和。因为在第一次操作之前森林为空，求和在一个空集上进行，所以 $Φ_{0} = 0$ 。任何势能 $Φ_{q}$ 都不会为负。

$ϕ_{q} (x)$ 的值取决于 $x$ 在第 $q$ 次操作后是否为树根。如果是，或者 $x .rank = 0$ ，则 $ϕ_{q} (x) = α (n) \cdot x .rank$ 。

现在假设在第 $q$ 次操作后 $x$ 不是根且 $x .rank \geq 1$ 。我们需要在定义 $ϕ_{q} (x)$ 之前先定义 $x$ 上的两个辅助函数。首先定义 level( $x$ ) $= max {k : A_{k} (x .rank) \leq x .p.rank}$ 。即 level( $x$ ) 是使得 $A_{k}$ 作用于 $x$ 的秩后不超过 $x$ 的父节点秩的最大层级 $k$ 。

第二个辅助函数在 $x .rank \geq 1$ 时应用：iter( $x$ ) $= max {i : A_{level (x)}^{(i)} (x .rank) \leq x .p.rank}$ 。即 iter( $x$ ) 是在层级 level( $x$ ) 上，将 $A_{level (x)}$ 迭代作用于 $x$ 的秩后仍不超过 $x$ 的父节点秩的最大迭代次数。

有了这些辅助函数，我们准备定义节点 $x$ 在 $q$ 次操作后的势能： $ϕ_{q} (x) = (α (n) - level (x)) \cdot x .rank - iter (x)$ （当 $x$ 不是根且 $x .rank \geq 1$ 时）。

势能变化与操作的摊还代价

引理19.10：设 $x$ 是非根节点，假设第 $q$ 次操作是 LINK 或 FIND-SET。则在第 $q$ 次操作后， $ϕ_{q} (x) \leq ϕ_{q - 1} (x)$ 。进一步，若 $x .rank \geq 1$ 且 level( $x$ ) 或 iter( $x$ ) 因第 $q$ 次操作而变化，则 $ϕ_{q} (x) \leq ϕ_{q - 1} (x) - 1$ 。

引理19.11：每次 MAKE-SET 操作的摊还代价为 $O (1)$ 。

引理19.12：每次 LINK 操作的摊还代价为 $O (α (n))$ 。

引理19.13：每次 FIND-SET 操作的摊还代价为 $O (α (n))$ 。

定理19.14：使用按秩合并和路径压缩， $m$ 次 MAKE-SET、UNION 和 FIND-SET 操作（其中 $n$ 次为 MAKE-SET）可以在 $O (m α (n))$ 时间内完成。

证明：直接由引理19.7、19.11、19.12和19.13得出。【总摊还代价 = 各操作摊还代价之和，初始势能=0 且势能非负】

参见Wiki： 按秩合并 — 按秩合并的定义与性质 | 路径压缩 — 路径压缩的定义与效果 | 反阿克曼函数 — 复杂度分析中的关键函数 α(n) | 按秩合并与路径压缩定理

第19章-用于不相交集合的数据结构 #学习/算法导论/不相交集合/按秩合并与路径压缩的分析

CS Wiki

探索

19.4 按秩合并与路径压缩的分析

相关笔记

知识结构总览

核心思想

快速增长函数 $A_{k} (j)$ 的定义

前几层的计算与闭式表达

反阿克曼函数 $α (n)$

秩的性质

势能函数设计

摊还代价分析

最终定理

补充理解与拓展

易混淆点与辨析

习题精选

题1：19.4-1 证明引理19.4

题2：19.4-2 证明 rank ≤ ⌊lg n⌋

题3：19.4-3 存储 rank 需要的位数

题4：19.4-4 仅按秩合并的 O(m lg n) 证明

题5：19.4-5 level 是否沿路径单调递增

题6：19.4-7 α’(n) 的改进上界

视频学习指南

教材原文(中文翻译)

关系图谱

目录

反向链接

CS Wiki

探索

19.4 按秩合并与路径压缩的分析

相关笔记

知识结构总览

核心思想

快速增长函数 Ak​(j) 的定义

前几层的计算与闭式表达

反阿克曼函数 α(n)

秩的性质

势能函数设计

摊还代价分析

最终定理

补充理解与拓展

易混淆点与辨析

习题精选

题1：19.4-1 证明引理19.4

题2：19.4-2 证明 rank ≤ ⌊lg n⌋

题3：19.4-3 存储 rank 需要的位数

题4：19.4-4 仅按秩合并的 O(m lg n) 证明

题5：19.4-5 level 是否沿路径单调递增

题6：19.4-7 α’(n) 的改进上界

视频学习指南

教材原文(中文翻译)

关系图谱

目录

反向链接

快速增长函数 $A_{k} (j)$ 的定义

反阿克曼函数 $α (n)$