8.1 排序的下界

相关笔记

概览

本节通过决策树模型（decision-tree model）严格证明了一个 fundamental 的结论：任何比较排序算法在最坏情况下至少需要 == $Ω (n l g n)$ == 次比较。这意味着归并排序和6.4 堆排序算法是渐近最优的比较排序算法，不存在渐近更快的比较排序。

要点列表：

比较排序仅通过元素间的比较操作来确定排序顺序

决策树是分析比较排序的抽象模型——每个内部节点代表一次比较，每个叶节点代表一种排列

正确的比较排序其决策树必须覆盖所有 $n!$ 种排列

由此推导出最坏情况下界： $h \geq l g (n!) = Ω (n l g n)$

此下界不适用于非比较排序（如计数排序、基数排序、桶排序）

知识结构总览

flowchart TD
    A["8.1 排序的下界"] --> B["比较排序的定义"]
    A --> C["决策树模型"]
    A --> D["下界证明"]
    A --> E["推论与意义"]

    B --> B1["仅使用比较操作"]
    B --> B2["归并排序、堆排序、快速排序等"]

    C --> C1["内部节点: 比较 a_i ≤ a_j"]
    C --> C2["叶节点: 排列 π(1), π(2), ..., π(n)"]
    C --> C3["路径: 算法的执行过程"]
    C --> C4["树高: 最坏情况比较次数"]

    D --> D1["叶节点数 ≥ n!"]
    D --> D2["二叉树叶节点数 ≤ 2^h"]
    D --> D3["h ≥ lg(n!)"]
    D --> D4["lg(n!) = Ω(n lg n)"]

    E --> E1["归并排序、堆排序渐近最优"]
    E --> E2["非比较排序可突破此下界"]

核心思想

比较排序的定义

比较排序（Comparison Sort）

比较排序是指仅通过元素之间的比较操作来获取输入序列 $⟨ a_{1}, a_{2}, \dots, a_{n} ⟩$ 的顺序信息的排序算法。具体来说，给定两个元素 $a_{i}$ 和 $a_{j}$ ，比较排序只能执行以下五种测试之一：

$a_{i} < a_{j}$

$a_{i} \leq a_{j}$

$a_{i} = a_{j}$

$a_{i} \geq a_{j}$

$a_{i} > a_{j}$

比较排序不能以其他方式检查元素的值或获取顺序信息。

常见比较排序： 插入排序、归并排序、6.4 堆排序算法、快速排序等。

简化假设（不失一般性）：

假设所有输入元素互不相同（对互异元素的下界自然适用于可能有重复元素的情况）
因此 $a_{i} = a_{j}$ 的比较无意义，可假设不发生
$a_{i} \leq a_{j}$ 、 $a_{i} \geq a_{j}$ 、 $a_{i} > a_{j}$ 、 $a_{i} < a_{j}$ 提供相同的相对顺序信息
统一假设所有比较的形式为 $a_{i} \leq a_{j}$

决策树模型

核心思路

决策树模型将比较排序算法抽象为一棵满二叉树（full binary tree），使得我们可以用组合论证来分析排序算法的信息论极限：

每个内部节点标注一次比较 $i : j$ （即比较 $a_{i} \leq a_{j}$ ）

每个叶节点标注一种排列 $⟨ π (1), π (2), \dots, π (n)⟩$

算法的执行对应从根到某个叶节点的一条路径

树的高度等于最坏情况下的比较次数

关键洞察：正确的排序算法必须能处理所有可能的输入，因此决策树必须覆盖全部 $n!$ 种排列。

决策树的详细结构：

            1:2
           /    \
       a₁≤a₂    a₁>a₂
        /          \
      2:3          2:3
      / \          / \
   a₂≤a₃ a₂>a₃ a₂≤a₃ a₂>a₃
    /     \     /     \
  <1,2,3> <1,3,2> <2,1,3> ...

内部节点：标注 $i : j$ ，表示比较 $a_{i}$ 和 $a_{j}$
- 左子树： $a_{i} \leq a_{j}$ 时的后续比较
- 右子树： $a_{i} > a_{j}$ 时的后续比较
叶节点：标注排列 $⟨ π (1), π (2), \dots, π (n)⟩$ ，表示排序结果为 $a_{π (1)} \leq a_{π (2)} \leq \dots \leq a_{π (n)}$
路径：从根到叶的路径代表算法的一次完整执行
索引含义：内部节点和叶节点中的索引始终引用数组元素的初始位置

关键性质：

每种排列必须作为决策树的至少一个叶节点出现（否则算法无法处理该输入）
每个叶节点必须是从根可达的（对应算法的实际执行路径）
决策树是满二叉树：每个节点要么是叶节点，要么恰好有两个子节点

最坏情况下界证明

定理 8.1（Theorem 8.1）

任何比较排序算法在最坏情况下至少需要 $Ω (n l g n)$ 次比较。

证明：

【决策树模型（叶节点数下界+二叉树上界+合并推导）】

由前面的讨论，只需确定一棵”每种排列都作为可达叶节点出现”的决策树的高度。

设有一棵高度为 $h$ 、具有 $l$ 个可达叶节点的决策树，对应于对 $n$ 个元素的比较排序。

第一步：叶节点数下界

【排列覆盖论证（n!种排列对应n!个叶节点）】

由于 $n$ 个输入元素的 $n!$ 种排列中的每一种都必须作为至少一个叶节点出现，因此：

$n! \leq l$

第二步：二叉树叶节点数上界

【二叉树性质（高度h的二叉树至多2^h个叶节点）】

一棵高度为 $h$ 的二叉树至多有 $2^{h}$ 个叶节点：

$l \leq 2^{h}$

第三步：合并两个不等式

$n! \leq l \leq 2^{h}$

第四步：取对数

【单调函数性质（lg函数单调递增保持不等式方向）】

由于 $l g$ 函数是单调递增的：

$h \geq l g (n!)$

第五步：渐近分析

【Stirling近似推论（lg(n!)=Omega(n lg n)）】

由教材公式 (3.28)（Stirling 近似的推论或积分界定理）：

$l g (n!) = Ω (n l g n)$

因此：

$h = Ω (n l g n) ■$

推论 8.2（Corollary 8.2）

归并排序和6.4 堆排序算法是渐近最优的比较排序。

【上下界匹配论证（O(n lg n)上界与Omega(n lg n)下界重合得Theta）】

证明： 归并排序和堆排序的最坏情况运行时间上界为 $O (n l g n)$ ，与定理 8.1 的最坏情况下界 $Ω (n l g n)$ 匹配。因此它们的最坏情况运行时间为 $Θ (n l g n)$ ，是渐近最优的比较排序。 $■$

$l g (n!) = Ω (n l g n)$ 的严格推导

补充证明： $l g (n!) = Ω (n l g n)$

【积分界定理（单调递增函数的积分-求和上下界）】

不使用 Stirling 近似，直接用积分界定理（教材 A.2 节）证明：

$l g (n!) = \sum_{i = 1}^{n} l g i$

由于 $l g x$ 是单调递增函数，利用积分界定理：

$\int_{1}^{n} l g x d x \leq \sum_{i = 1}^{n} l g i \leq \int_{1}^{n + 1} l g x d x$

计算积分：

【换元积分法（u=ln x, du=dx/x求int lg x dx）】

$\int l g x d x = x l g x - x ln 2 + C = \frac{x l n x - x}{l n 2} + C$

因此：

$\int_{1}^{n} l g x d x = n l g n - n l g e + l g e = Ω (n l g n)$

所以 $l g (n!) = Ω (n l g n)$ 。类似地可得上界 $l g (n!) = O (n l g n)$ ，综合得 $l g (n!) = Θ (n l g n)$ 。

补充理解与拓展

信息论视角：排序的信息论极限

决策树模型是信息论下界（information-theoretic lower bound）的经典应用。从 Shannon 信息论的角度来看：

排序 $n$ 个不同元素需要区分 $n!$ 种可能的排列

每种排列出现的概率为 $1/ n!$ （假设均匀分布）

排序所需的信息量为 $l g (n!)$ bits

每次二路比较最多提供 1 bit 信息（将可能性空间减半）

因此至少需要 $l g (n!) = Ω (n l g n)$ 次比较

这一框架与 Shannon 1948 年开创的信息论中的决策问题复杂度理论完全一致。Edinburgh 大学 ADS（Algorithms and Data Structures）课程和 Vassar 学院 CS241 课程均使用此模型作为比较排序下界的标准教学方法。

关键洞察： $Ω (n l g n)$ 不是某个特定算法的限制，而是信息本身的限制——要从 $n!$ 种等可能状态中确定唯一正确的排列，任何仅使用二路比较的算法都不可避免地需要 $Ω (n l g n)$ 步。

来源：Shannon, C. E. (1948). “A Mathematical Theory of Communication”; Edinburgh University INF2B course notes; Vassar College CS241 lecture materials

突破下界：非比较排序如何绕过 $Ω (n l g n)$

定理 8.1 的下界仅适用于比较排序。非比较排序利用输入的额外信息突破了此下界：

算法时间复杂度利用信息适用条件
8.2 计数排序 $Θ (n + k)$ 元素为 $[0, k]$ 范围内的整数 $k = O (n)$ 时为线性
基数排序 $Θ (d (n + k))$ 元素可按位分解 $d$ 位、每位 $k$ 个值
桶排序期望 $O (n)$ 输入均匀分布在 $[0, 1)$ 均匀分布假设

为什么它们能更快？ 这些算法不再通过”比较两个元素谁大谁小”来获取信息，而是直接利用元素的实际值作为索引（计数排序）、按位分解（基数排序）或分桶（桶排序）。它们获取信息的方式从”每次 1 bit”变成了”每次 $l g k$ bits”甚至更多。

但非比较排序并非万能：

计数排序需要 $O (n + k)$ 额外空间，当 $k ≫ n$ 时效率反而低于比较排序

基数排序的正确性依赖于计数排序的稳定性

桶排序的期望线性时间依赖于均匀分布假设，最坏情况退化为 $O (n^{2})$

非比较排序通常不适用于浮点数、字符串等复杂数据类型的通用排序

算法	时间复杂度	利用信息	适用条件
8.2 计数排序	$Θ (n + k)$	元素为 $[0, k]$ 范围内的整数	$k = O (n)$ 时为线性
基数排序	$Θ (d (n + k))$	元素可按位分解	$d$ 位、每位 $k$ 个值
桶排序	期望 $O (n)$	输入均匀分布在 $[0, 1)$	均匀分布假设

易混淆点与辨析

误区： $Ω (n l g n)$ 下界适用于所有排序算法

❌ 错误理解： “所有排序算法都至少需要 $Ω (n l g n)$ 时间，不可能更快”

✅ 正确理解： $Ω (n l g n)$ 下界仅适用于比较排序——即仅通过元素间比较来确定顺序的排序算法。8.2 计数排序（ $Θ (n + k)$ ）、基数排序（ $Θ (d (n + k))$ ）、桶排序（期望 $O (n)$ ）等非比较排序可以突破此下界，因为它们利用了元素的实际值来直接确定位置，而非仅依赖比较。

类比： 比较排序就像蒙着眼睛用天平称重来给物品排序——每次只能比较两个物品的重量。非比较排序就像摘下眼罩，直接读取物品上的重量标签——信息获取效率完全不同。

误区：决策树的高度等于平均比较次数

❌ 错误理解： “决策树的高度就是排序算法的平均比较次数”

✅ 正确理解： 决策树的高度（从根到最远叶节点的路径长度）等于排序算法的最坏情况比较次数。决策树的平均叶节点深度（从根到所有叶节点路径长度的加权平均）才对应平均比较次数。

举例： 对 $n = 3$ 个元素，决策树至少有 $3! = 6$ 个叶节点。一棵高度为 3 的决策树的最坏情况比较次数为 3，但平均比较次数可能小于 3（取决于叶节点的分布）。

定理 8.1 证明的是最坏情况下界——即使是最优的比较排序，也存在某些输入需要 $Ω (n l g n)$ 次比较。这并不排除算法在大多数输入上运行更快。

习题精选

题号	题目描述	难度
8.1-1	比较排序的决策树中，叶节点的最小可能深度是多少？	⭐
8.1-2	不使用 Stirling 近似，用 A.2 节的方法求 $l g (n!)$ 的渐近紧界	⭐⭐
8.1-3	证明不存在对至少一半的 $n!$ 输入运行时间为线性的比较排序。对 $1/ n$ 和 $1/ 2^{n}$ 的输入比例呢？	⭐⭐⭐
8.1-4	已知输入部分有序（ $i mod 4 = 0$ 的元素最多偏离正确位置一位），证明 $Ω (n l g n)$ 下界仍然成立	⭐⭐⭐

8.1-1 解答

目标： 求比较排序决策树中叶节点的最小可能深度。

分析：

决策树中叶节点的最小深度对应于最好情况下的比较次数。

对于 $n = 1$ ：无需比较，最小深度为 0

对于 $n = 2$ ：至少需要 1 次比较，最小深度为 1

对于 $n \geq 2$ ：即使输入已经有序，算法也需要至少 $⌈ l g n!⌉$ 次比较才能确认它是有序的

但这里问的是单个叶节点的最小深度，不是所有叶节点的最小深度。

答案： 最小可能深度为 $⌈ l g n!⌉$ 。这是因为决策树有 $n!$ 个叶节点，一棵二叉树要容纳 $n!$ 个叶节点，其高度至少为 $⌈ l g n!⌉$ 。但某些叶节点可以在较浅的深度——最小深度可以低至 $⌈ l g n!⌉ - (树的最大深度 - ⌈ l g n!⌉)$ ，具体取决于决策树的形状。

更精确地说，最小深度至少为 $⌊ l g n!⌋$ （因为深度为 $d$ 的二叉树至多有 $2^{d}$ 个叶节点，而我们需要 $n!$ 个叶节点，所以最浅的叶节点深度至少为 $⌈ l g n!⌉$ ）。

结论： 叶节点的最小可能深度为 $⌈ l g n!⌉$ 。

8.1-2 解答

目标： 不使用 Stirling 近似，求 $l g (n!)$ 的渐近紧界。

证明：

【积分界定理（单调递增函数f(x)的求和-积分夹逼）】

由积分界定理（教材 A.2 节定理 A.9），对于单调递增函数 $f (x)$ ：

$\int_{1}^{n} f (x) d x \leq \sum_{i = 1}^{n} f (i) \leq \int_{1}^{n + 1} f (x) d x$

取 $f (x) = l g x$ ：

$\int_{1}^{n} l g x d x \leq l g (n!) = \sum_{i = 1}^{n} l g i \leq \int_{1}^{n + 1} l g x d x$

计算积分（换元 $u = ln x$ ， $d u = d x / x$ ）：

【分部积分法（int lg x dx = x lg x - x/ln 2 + C）】

$\int l g x d x = \int \frac{l n x}{l n 2} d x = \frac{1}{l n 2} (x ln x - x) + C = x l g x - \frac{x}{l n 2} + C$

下界：

$\int_{1}^{n} l g x d x = n l g n - \frac{n}{l n 2} + \frac{1}{l n 2} = n l g n - n l g e + l g e$

上界：

$\int_{1}^{n + 1} l g x d x = (n + 1) l g (n + 1) - \frac{n + 1}{l n 2} + \frac{1}{l n 2}$

因此：

【渐近紧界（上下界均为Theta(n lg n)）】

$n l g n - n l g e + l g e \leq l g (n!) \leq (n + 1) l g (n + 1) - (n + 1) l g e + l g e$

上下界均为 $Θ (n l g n)$ ，因此：

$l g (n!) = Θ (n l g n) ■$

8.1-3 解答

目标： 证明不存在对至少一半输入运行时间为线性的比较排序。

证明：

【反证法（线性深度决策树无法容纳n!/2个叶节点）】

设比较排序算法 $A$ 的决策树高度为 $h$ ，叶节点数为 $l$ 。

情况一：对至少一半的 $n!$ 输入运行时间为线性

【叶节点计数矛盾（2^(cn) < n!/2当n充分大）】

即至少 $n! /2$ 个叶节点的深度 $\leq c n$ （对某个常数 $c$ ）。

深度不超过 $c n$ 的叶节点数最多为 $2^{c n}$ 。因此：

$\frac{n !}{2} \leq 2^{c n}$

即 $n! \leq 2^{c n + 1}$ ，取对数得 $l g (n!) \leq c n + 1$ 。

但 $l g (n!) = Θ (n l g n)$ ，当 $n$ 足够大时 $n l g n > c n + 1$ ，矛盾。

情况二：对 $1/ n$ 的输入运行时间为线性

【阶乘增长超越指数（(n-1)! > 2^(cn)当n充分大）】

至少 $n! / n = (n - 1)!$ 个叶节点深度 $\leq c n$ 。

$(n - 1)! \leq 2^{c n}$ ，取对数得 $l g ((n - 1)!) \leq c n$ 。

$l g ((n - 1)!) = Θ (n l g n)$ ，当 $n$ 足够大时仍产生矛盾。

情况三：对 $1/ 2^{n}$ 的输入运行时间为线性

【推广矛盾（任意固定比例alpha的n!个叶节点均超出线性深度容量）】

至少 $n! / 2^{n}$ 个叶节点深度 $\leq c n$ 。

$n! / 2^{n} \leq 2^{c n}$ ，即 $n! \leq 2^{(c + 1) n}$ 。

$l g (n!) = Θ (n l g n) > (c + 1) n$ （当 $n$ 足够大），矛盾。

结论： 对于任何固定比例 $α > 0$ （包括 $1/ 2^{n}$ ），当 $n$ 足够大时，不存在比较排序能对 $α \cdot n!$ 个输入在线性时间内完成排序。这是因为线性深度的决策树无法容纳足够多的叶节点。

视频学习指南

资源	主题	链接	说明
MIT 6.006 Lecture 7	Counting Sort, Radix Sort, Lower Bounds for Sorting	https://www.youtube.com/watch?v=0VqawBtG0Zg	Erik Demaine 讲授，从比较模型推导下界，再到计数排序和基数排序，一气呵成
Abdul Bari	Decision Tree for Comparison Based Sorting	https://www.youtube.com/watch?v=4VEmnD5VKqI	用具体例子展示决策树结构，直观易懂
WilliamFiset	Sorting Lower Bounds	https://www.youtube.com/watch?v=ta3dGZGJUYM	从信息论角度解释为什么比较排序需要 $Ω (n l g n)$
ravindrababuravula	Comparison Sorting Lower Bound Proof	https://www.youtube.com/watch?v=ONShiVJnF2o	完整的数学证明过程，逐步推导
GeeksforGeeks	Why Comparison Based Sorting Requires Ω(n log n)	https://www.youtube.com/watch?v=uvF1VnPaG5s	简洁清晰的证明讲解，适合快速复习

教材原文

CLRS 第4版 8.1节原文

A comparison sort uses only comparisons between elements to gain order information about an input sequence $⟨ a_{1}, a_{2}, \dots, a_{n} ⟩$ . That is, given two elements $a_{i}$ and $a_{j}$ , it performs one of the tests $a_{i} < a_{j}$ , $a_{i} \leq a_{j}$ , $a_{i} = a_{j}$ , $a_{i} \geq a_{j}$ , or $a_{i} > a_{j}$ to determine their relative order. It may not inspect the values of the elements or gain order information about them in any other way.

Theorem 8.1: Any comparison sort algorithm requires $Ω (n l g n)$ comparisons in the worst case.

Proof: From the preceding discussion, it suffices to determine the height of a decision tree in which each permutation appears as a reachable leaf. Consider a decision tree of height $h$ with $l$ reachable leaves corresponding to a comparison sort on $n$ elements. Because each of the $n!$ permutations of the input appears as one or more leaves, we have $n! \leq l$ . Since a binary tree of height $h$ has no more than $2^{h}$ leaves, we have $n! \leq l \leq 2^{h}$ , which, by taking logarithms, implies $h \geq l g (n!) = Ω (n l g n)$ .

参见Wiki

比较排序 — 基于比较的排序算法下界
排序下界定理

第08章-线性时间排序比较排序下界

CS Wiki

探索

8.1 排序的下界

相关笔记

比较排序的定义

决策树模型

最坏情况下界证明

$l g (n!) = Ω (n l g n)$ 的严格推导

参见Wiki

关系图谱

目录

反向链接

CS Wiki

探索

8.1 排序的下界

相关笔记

比较排序的定义

决策树模型

最坏情况下界证明

lg(n!)=Ω(nlgn) 的严格推导

参见Wiki

关系图谱

目录

反向链接

$l g (n!) = Ω (n l g n)$ 的严格推导