马尔可夫不等式

Abstract

马尔可夫不等式(Markov's Inequality)是概率论中最基本的不等式,它利用非负随机变量期望值给出”随机变量取大值”的概率上界。具体而言,若 是非负随机变量,则对任意 ,有 。马尔可夫不等式是切比雪夫不等式的基础——切比雪夫不等式本质上是将马尔可夫不等式应用于 的结果。

定义

马尔可夫不等式(Markov's Inequality)

非负随机变量(即 ), 为任意正实数,则:

等价形式 也可以写为 (令 替换为 )。

直观含义:如果 的平均值很小,那么 取很大值的概率必然很低。

马尔可夫不等式的证明

证明

由于 ,将期望值拆分为两部分:

由于 ,第一项非负,故:

在第二项中,由于 ,用 替换 只会使求和变小:

两边除以

应用示例

问题:某考试的平均分为75分,求得分超过90分的比例最多是多少?

解法:设 为考试成绩(非负随机变量),。 由马尔可夫不等式:

注意:这个上界非常宽松,因为马尔可夫不等式只利用了期望值信息。如果还知道方差,可以使用切比雪夫不等式得到更紧的上界。

与切比雪夫不等式的关系

马尔可夫不等式应用于 (其中 )即可得到切比雪夫不等式

,则

由马尔可夫不等式:

,这正是切比雪夫不等式。

核心性质

编号性质说明
P1非负性要求仅适用于非负随机变量 ,这是使用的前提条件
P2仅需期望信息只需要知道 ,不需要方差或其他高阶矩
P3上界的宽松性给出的上界通常比较宽松,因为利用的信息最少
P4切比雪夫不等式的基础切比雪夫不等式是马尔可夫不等式应用于 的推论
P5单调性 越大,上界 越小,即”取更大值的概率更小”

关系网络

graph LR
    A[马尔可夫不等式]
    B[期望值]
    C[切比雪夫不等式]
    D[方差]

    B -- "E(X) 参数" --> A
    A -- "应用于 (X-μ)²" --> C
    D -- "σ² 参数" --> C
    C -- "推论自" --> A

章节扩展

  • 期望值期望值是马尔可夫不等式中唯一的参数,
  • 切比雪夫不等式切比雪夫不等式是马尔可夫不等式最重要的推论,利用方差信息给出更紧的上界
  • 方差方差信息可以弥补马尔可夫不等式的不足,通过切比雪夫不等式提供更好的估计

补充

生活类比

想象你知道一个班级的平均身高是170厘米。马尔可夫不等式告诉你:身高超过340厘米的学生比例不超过 。这个结论虽然正确但没什么用——因为实际上不可能有人身高超过340厘米。马尔可夫不等式就像一个”只看平均值”的粗略估计器:它只利用最有限的信息(平均值),所以给出的结论虽然一定正确,但往往非常保守。

马尔可夫不等式的局限性

马尔可夫不等式有两个主要局限:

  1. 只适用于非负随机变量:对于可能取负值的随机变量不能直接使用
  2. 上界过于宽松:因为它只利用期望值信息,完全忽略了分布的形状

正因如此,在实际应用中,如果还知道方差信息,通常优先使用切比雪夫不等式;如果知道具体分布(如正态分布),则使用分布特有的精确概率计算。

马尔可夫不等式的推广

马尔可夫不等式可以推广为:对任意单调递增的非负函数

常见选择:

  • :标准马尔可夫不等式
  • :应用于 得到切比雪夫不等式
  • :应用于指数函数得到切尔诺夫界(Chernoff Bound),这是概率论中最强大的集中不等式之一

参见

  • 期望值:马尔可夫不等式中唯一的参数
  • 切比雪夫不等式:马尔可夫不等式最重要的推论
  • 方差:切比雪夫不等式的核心参数,弥补马尔可夫不等式的不足