指示器随机变量

概述

指示器随机变量（Indicator Random Variable）是对某个事件 $A$ 定义的取值为 0 或 1 的随机变量： $A$ 发生时取 1，否则取 0。其核心优势在于将事件的概率转化为期望，并利用期望的线性性简化复杂概率计算。

定义

形式化定义

给定样本空间 $Ω$ 上的事件 $A$ ，对应的指示器随机变量 $I {A}$ 定义为： $I {A} = {10 若事件 A 发生若事件 A 不发生$

也常记为 $1_{A}$ 或 $X_{A}$ 。

核心性质

期望与概率的关系

$E [I {A}] = 1 \cdot P (A) + 0 \cdot P (\overset{ˉ}{A}) = P (A)$

这是指示器随机变量最重要的性质：期望等于概率。因此，计算某个量的期望时，可以先将其表示为指示器随机变量之和，再利用期望的线性性。

方差

$Var (I {A}) = E [I {A}^{2}] - (E [I {A}])^{2} = P (A) - P (A)^{2} = P (A) (1 - P (A))$

期望的线性性（核心优势）

关键性质

对任意随机变量 $X_{1}, X_{2}, \dots, X_{n}$ （不要求独立），都有： $E [\sum_{i = 1}^{n} X_{i}] = \sum_{i = 1}^{n} E [X_{i}]$

这意味着即使事件之间有依赖关系，仍然可以通过分别计算每个指示器变量的期望再求和来得到总和的期望。

求和的指示器表示

若 $X = \sum_{i = 1}^{n} I {A_{i}}$ ，则：

$E [X] = \sum_{i = 1}^{n} P (A_{i})$
$X$ 的值表示事件 $A_{1}, \dots, A_{n}$ 中发生的事件个数

经典应用：随机化快速排序的期望比较次数

问题建模

对 $n$ 个元素的数组执行 RANDOMIZED-QUICKSORT，求期望的总比较次数。

分析步骤

定义指示器变量 $X_{ij} = I {z_{i} 与 z_{j} 被比较}$ ，其中 $z_{1} \leq z_{2} \leq \dots \leq z_{n}$ 为排序后的元素
总比较次数 $X = \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^{n} X_{ij}$
计算单个期望： $E [X_{ij}] = P (z_{i} 与 z_{j} 被比较)$
$z_{i}$ 与 $z_{j}$ 被比较，当且仅当在递归过程中， $z_{i}$ 或 $z_{j}$ 是 $z_{i}, z_{i + 1}, \dots, z_{j}$ 中第一个被选为 pivot 的元素
因此 $P (z_{i} 与 z_{j} 被比较) = \frac{2}{j - i + 1}$
利用期望的线性性： $E [X] = \sum_{i = 1}^{n - 1} \sum_{j = i + 1}^{n} \frac{2}{j - i + 1} \leq \sum_{k = 2}^{n} n \cdot \frac{2}{k} = 2 n \sum_{k = 2}^{n} \frac{1}{k} = O (n ln n)$

应用场景

随机化快速排序分析：如上所述，证明期望比较次数为 $O (n ln n)$
哈希表分析：分析链地址法和开放寻址法中的期望冲突次数、期望探查次数
雇佣问题（Hiring Problem）：分析面试 $n$ 个候选人后期望的雇佣次数
随机算法分析：任何需要计算”满足某条件的事件个数”的期望的场景

参见

布尔代数

CS Wiki

📖 知识导航

指示器随机变量

指示器随机变量

定义

核心性质

期望与概率的关系

方差

期望的线性性（核心优势）

求和的指示器表示

经典应用：随机化快速排序的期望比较次数

问题建模

分析步骤

应用场景

参见

关系图谱

大纲

反向链接

📝 最近更新

知识库健康报告 2026-04-24

BFS-vs-DFS

排列-vs-组合

数学归纳法-vs-强归纳法

普通图-vs-二部图