期望值

Abstract

期望值(Expected Value)是概率论中最重要的数字特征之一,它度量了随机变量在大量重复试验中取值的加权平均。对于离散随机变量 ,其期望值定义为 ,其中求和遍历 的所有可能取值, 为对应概率。期望值具有线性性质,是解决概率问题、分析算法平均性能的核心工具。

定义

期望值(Expected Value)

为离散随机变量,其取值集合为 (或可数无穷集),则 期望值定义为:

其中 取值 的概率。

直观含义:期望值是 所有可能取值以其概率为权重的加权平均,代表在大量重复试验中 取值的”中心位置”。

期望值的线性性质(Linearity of Expectation)

对任意随机变量 及常数

重要特性:该性质不要求 相互独立,这是期望值最强大的性质之一。

推广到 个随机变量:

指示随机变量的期望

设事件 的指示随机变量 定义为:

应用意义:将复杂计数问题分解为若干指示随机变量之和,利用线性性质求期望,是解决复杂期望问题的核心技巧。

经典应用:帽子检查问题(Hat-Check Problem)

位宾客参加宴会,随机取回帽子。设 为取回自己帽子的宾客人数,求

解法:定义指示随机变量 表示第 位宾客取回自己的帽子,则

  • (在随机排列中第 个位置恰好是 的概率)
  • 由线性性质:

结论:无论 多大,平均恰好有1人取回自己的帽子。

经典应用:逆序数期望

的一个均匀随机排列, 中的逆序对数量,求

解法:对每一对 ),定义指示随机变量

,共有 对。

  • 大小关系对称)

核心性质

编号性质公式/说明
P1加权平均,是取值以概率为权重的平均
P2线性性质,不要求独立性
P3期望的期望,则 (单调性)
P4常数的期望,其中 为常数
P5乘积的期望 独立,则
P6指示变量技巧,将计数转化为概率求和
P7函数的期望,可直接对函数求期望

关系网络

graph LR
    A[期望值]
    B[随机变量]
    C[方差]
    D[二项分布]
    E[几何分布]
    F[马尔可夫不等式]

    B -- "数字特征" --> A
    A -- "E(X²)-[E(X)]²" --> C
    A -- "np" --> D
    A -- "1/p" --> E
    A -- "E(X)/a 上界" --> F
    C -- "依赖期望" --> A

章节扩展

  • 方差方差定义为 ,是度量随机变量离散程度的数字特征,完全依赖期望值
  • 几何分布几何分布的期望值为 ,是期望值在特定分布中的直接应用
  • 马尔可夫不等式马尔可夫不等式利用期望值给出概率的上界,是期望值的重要应用方向

补充

生活类比

想象你反复掷一枚公平的骰子,记录每次的点数。如果你掷了10000次,把所有点数加起来除以10000,结果会非常接近3.5——这就是掷骰子的”期望值”。期望值不是”最可能出现的结果”(骰子不可能掷出3.5),而是大量重复试验后的平均趋势。就像天气预报说某天平均温度25度,并不意味着温度一定是25度,而是长期来看围绕25度波动。

线性性质的威力

期望值的线性性质之所以强大,在于它不需要随机变量之间独立。例如在帽子检查问题中,各个 之间显然不独立(如果第1个人拿了自己的帽子,第2个人拿自己帽子的概率就变了),但我们仍然可以直接对期望求和。这使得”指示变量+线性性质”成为解决复杂期望问题的通用策略。

几何分布的期望推导

服从参数为 几何分布,则: 利用求和技巧(令 ,对几何级数求导):

直观理解:如果每次试验成功概率为 ,平均需要 次试验才能首次成功。例如抛硬币首次出现正面的期望次数为 次。

参见