期望值
Abstract
定义
期望值(Expected Value)
设 为离散随机变量,其取值集合为 (或可数无穷集),则 的期望值定义为:
其中 为 取值 的概率。
直观含义:期望值是 所有可能取值以其概率为权重的加权平均,代表在大量重复试验中 取值的”中心位置”。
期望值的线性性质(Linearity of Expectation)
指示随机变量的期望
设事件 的指示随机变量 定义为:
则 。
应用意义:将复杂计数问题分解为若干指示随机变量之和,利用线性性质求期望,是解决复杂期望问题的核心技巧。
经典应用:帽子检查问题(Hat-Check Problem)
位宾客参加宴会,随机取回帽子。设 为取回自己帽子的宾客人数,求 。
解法:定义指示随机变量 表示第 位宾客取回自己的帽子,则 。
- (在随机排列中第 个位置恰好是 的概率)
- 由线性性质:
结论:无论 多大,平均恰好有1人取回自己的帽子。
经典应用:逆序数期望
设 是 的一个均匀随机排列, 为 中的逆序对数量,求 。
解法:对每一对 (),定义指示随机变量 :
则 ,共有 对。
- ( 和 大小关系对称)
核心性质
| 编号 | 性质 | 公式/说明 |
|---|---|---|
| P1 | 加权平均 | ,是取值以概率为权重的平均 |
| P2 | 线性性质 | ,不要求独立性 |
| P3 | 期望的期望 | 若 ,则 (单调性) |
| P4 | 常数的期望 | ,其中 为常数 |
| P5 | 乘积的期望 | 若 独立,则 |
| P6 | 指示变量技巧 | ,将计数转化为概率求和 |
| P7 | 函数的期望 | ,可直接对函数求期望 |
关系网络
graph LR A[期望值] B[随机变量] C[方差] D[二项分布] E[几何分布] F[马尔可夫不等式] B -- "数字特征" --> A A -- "E(X²)-[E(X)]²" --> C A -- "np" --> D A -- "1/p" --> E A -- "E(X)/a 上界" --> F C -- "依赖期望" --> A
章节扩展
- 方差:方差定义为 ,是度量随机变量离散程度的数字特征,完全依赖期望值
- 几何分布:几何分布的期望值为 ,是期望值在特定分布中的直接应用
- 马尔可夫不等式:马尔可夫不等式利用期望值给出概率的上界,是期望值的重要应用方向
补充
生活类比
想象你反复掷一枚公平的骰子,记录每次的点数。如果你掷了10000次,把所有点数加起来除以10000,结果会非常接近3.5——这就是掷骰子的”期望值”。期望值不是”最可能出现的结果”(骰子不可能掷出3.5),而是大量重复试验后的平均趋势。就像天气预报说某天平均温度25度,并不意味着温度一定是25度,而是长期来看围绕25度波动。
线性性质的威力
期望值的线性性质之所以强大,在于它不需要随机变量之间独立。例如在帽子检查问题中,各个 之间显然不独立(如果第1个人拿了自己的帽子,第2个人拿自己帽子的概率就变了),但我们仍然可以直接对期望求和。这使得”指示变量+线性性质”成为解决复杂期望问题的通用策略。
几何分布的期望推导
设 服从参数为 的几何分布,则: 利用求和技巧(令 ,对几何级数求导):
直观理解:如果每次试验成功概率为 ,平均需要 次试验才能首次成功。例如抛硬币首次出现正面的期望次数为 次。