链地址法

概述

链地址法（Chaining）是一种处理散列表冲突的经典方法。其核心思想是：在散列表 $T [0.. m - 1]$ 的每个槽位上维护一个链表（或其它动态集合结构），所有被散列函数映射到同一槽位的关键字都存储在该槽位对应的链表中。链地址法实现简单，且对装载因子不敏感，是最常用的冲突处理策略之一。

定义

链地址法

设散列表 $T [0.. m - 1]$ ，散列函数 $h$ 。链地址法将 $T [i]$ 定义为一个链表的头指针，用于存储所有满足 $h (k) = i$ 的元素。当插入关键字为 $k$ 的元素 $x$ 时，将 $x$ 插入到链表 $T [h (k)]$ 中；搜索时，在链表 $T [h (k)]$ 中顺序查找关键字为 $k$ 的元素。

数据结构示意

散列表 T[0..m-1]:
  T[0] -> [元素] -> [元素] -> NIL
  T[1] -> NIL
  T[2] -> [元素] -> NIL
  T[3] -> [元素] -> [元素] -> [元素] -> NIL
  ...
  T[m-1] -> [元素] -> NIL

每个槽位 $T [i]$ 指向一个链表，链表中存储所有散列值等于 $i$ 的元素。

伪代码

搜索：

CHAINED-HASH-SEARCH(T, k)
    x = T[h(k)]
    while x != NIL and x.key != k
        x = x.next
    return x

插入（插入到链表头部，O(1)）：

CHAINED-HASH-INSERT(T, x)
    x.next = T[h(x.key)]
    T[h(x.key)] = x

删除：

CHAINED-HASH-DELETE(T, x)
    // 需要先找到 x 的前驱元素 prev
    // 如果 x 是链表头：T[h(x.key)] = x.next
    // 否则：prev.next = x.next

插入位置的选择

将新元素插入到链表头部可以在 $O (1)$ 时间内完成插入操作（无需遍历链表）。如果插入到尾部，则需要 $O (链表长度)$ 的时间。

核心性质

时间复杂度分析

链地址法的性能取决于链表的平均长度。给定装载因子 $α = n / m$ ：

简单均匀散列假设（Simple Uniform Hashing）：每个关键字等概率地散列到 $m$ 个槽位中的任何一个，且独立于其它关键字的散列位置。

在此假设下：

操作	期望时间	最坏时间
搜索（成功）	$O (1 + α)$	$O (n)$
搜索（失败）	$O (1 + α)$	$O (n)$
插入	$O (1)$	$O (1)$ （插入链表头部）
删除	$O (1 + α)$	$O (n)$ （需要先找到前驱）

其中 $O (1 + α)$ 的含义是： $O (1)$ 用于计算散列值， $O (α)$ 用于在链表中搜索。

成功搜索的期望代价推导

在简单均匀散列假设下，搜索关键字 $k$ 的期望时间为：

$E [搜索 k 的时间] = O (1 + \frac{n _{h} ( k )}{n _{h} ( k )}) = O (1)$

不对，更精确地：

设 $n_{i}$ 为链表 $T [i]$ 的长度，则 $\sum_{i = 0}^{m - 1} n_{i} = n$ 。
在简单均匀散列假设下， $E [n_{i}] = n / m = α$ 。
不成功搜索的期望代价： $O (1 + α)$ （需要遍历整个链表）。
成功搜索的期望代价： $O (1 + α /2) = O (1 + α)$ （平均只需遍历链表的一半）。

装载因子的影响

当 $α$ 较小时（例如 $α < 1$ ），链表很短，操作接近 $O (1)$ 。
当 $α$ 较大时，链表变长，性能退化。
与开放寻址法不同，链地址法允许 $α > 1$ （元素数可以超过槽数）。
实际应用中，通常保持 $α$ 在一个合理范围内（如 0.75 ~ 3），必要时进行扩容（rehashing）。

空间复杂度

散列表数组： $O (m)$
链表节点： $O (n)$
总空间： $O (m + n)$

章节扩展

链地址法 vs. 开放寻址法

特性	链地址法	开放寻址法
装载因子	$α$ 可 $> 1$	必须 $α < 1$
删除操作	简单（直接删除链表节点）	复杂（需要特殊标记）
缓存性能	较差（链表节点不连续）	较好（数据在数组内连续）
指针开销	需要额外指针空间	无额外指针
聚类问题	无	可能出现一次/二次聚类

链表的替代实现

除了单链表，每个槽位还可以使用：

双向链表：使删除操作变为 $O (1)$ （已知目标节点时）
动态数组：当链表很短时，数组的缓存友好性更好
平衡搜索树：当链表很长时（ $α$ 很大），可用树替代链表，保证 $O (l g n)$ 最坏搜索

参见

散列表 —— 链地址法所服务的散列表结构
散列函数 —— 决定元素分布到哪个链表
开放寻址法 —— 另一种冲突处理方法，与链地址法互补
直接寻址表 —— 无冲突的简单字典实现

CS Wiki

📖 知识导航

链地址法

链地址法

定义

数据结构示意

伪代码

核心性质

时间复杂度分析

成功搜索的期望代价推导

装载因子的影响

空间复杂度

章节扩展

链地址法 vs. 开放寻址法

链表的替代实现

参见

关系图谱

大纲

反向链接

📝 最近更新

知识库健康报告 2026-04-24

BFS-vs-DFS

排列-vs-组合

数学归纳法-vs-强归纳法

普通图-vs-二部图