几何分布

Abstract

几何分布(Geometric Distribution)描述在一系列独立的伯努利试验中,首次成功所需的试验次数。若每次试验成功的概率为 ),则首次成功出现在第 次试验的概率为 。几何分布的期望值方差。几何分布具有独特的无记忆性——过去的失败不影响未来的成功概率。

定义

几何分布(Geometric Distribution)

设进行一系列独立的伯努利试验,每次试验成功的概率为 ),失败的概率为 。令 表示首次成功所需的试验次数,则 服从参数为 的几何分布:

直观含义:首次成功出现在第 次试验,意味着前 次全部失败(概率 ),第 次成功(概率 )。

几何分布的期望值

推导:令 ,利用几何级数 )对两边求导:

因此 ,故:

直观理解:如果每次成功概率为 ,平均需要 次试验才能首次成功。例如抛硬币首次出现正面平均需要 次。

几何分布的方差

推导:先求

利用恒等式

因此:

无记忆性(Memoryless Property)

几何分布是唯一具有无记忆性的离散分布。其含义为:

对所有非负整数 成立。

直观含义:在已经失败了 次的条件下,还需要再试验 次以上才能成功的概率,等于从一开始就需要 次以上才能成功的概率。过去的失败不影响未来的成功概率——每次试验都是”全新开始”。

证明

其中

因此:

累积分布函数

直观含义:前 次试验中至少成功一次的概率为

推论,即前 次全部失败的概率。

核心性质

编号性质公式/说明
P1概率质量函数
P2期望值,成功概率越大,首次成功越快
P3方差,成功概率越小,波动越大
P4无记忆性,过去不影响未来
P5累积分布,前 次至少成功一次的概率
P6唯一性几何分布是唯一具有无记忆性的离散分布

关系网络

graph LR
    A[几何分布]
    B[伯努利试验]
    C[期望值]
    D[方差]
    E[二项分布]

    B -- "首次成功" --> A
    A -- "E(X) = 1/p" --> C
    A -- "V(X) = (1-p)/p²" --> D
    B -- "n次中成功次数" --> E
    A -- "特殊情形" --> E

章节扩展

  • 伯努利试验伯努利试验是几何分布的基础模型,几何分布描述的是伯努利试验序列中首次成功的等待时间
  • 期望值期望值 是几何分布最重要的数字特征
  • 方差方差 度量了几何分布的离散程度

补充

生活类比

想象你在玩一个中奖率为 的抽奖游戏。几何分布告诉我们:你平均需要抽 次才能首次中奖。但更重要的是”无记忆性”:如果你已经抽了50次都没中奖,不要觉得”下次该中了”——你从第51次开始,仍然平均需要再抽100次才能中奖。过去的失败不会让你”积攒运气”,每次抽奖都是独立的。

几何分布与二项分布的关系

几何分布和二项分布都基于伯努利试验,但回答不同的问题:

  • 几何分布:首次成功需要多少次试验?(“等待时间”问题)
  • 二项分布:固定 次试验中有多少次成功?(“计数”问题)

两者的联系: 恰好是二项分布中 次试验全部失败的概率。

几何分布的两种定义

注意:几何分布有两种常见的参数化方式:

  1. 本笔记采用的形式 为首次成功的试验次数,
  2. 另一种形式 为首次成功之前的失败次数,

两者关系为 ,因此 。阅读文献时需注意使用的是哪种定义。

参见