概率分布

Abstract

概率分布(Probability Distribution)描述随机变量取各个可能值的概率规律。对于离散随机变量,概率分布由概率质量函数(Probability Mass Function, PMF)完全刻画:。概率分布是概率论的核心概念,是连接随机变量与具体概率计算的桥梁。

定义

概率分布(离散情形)

是一个定义在样本空间 上的离散随机变量, 其可能取值为 (有限或可列无限个)。 概率分布由其概率质量函数(PMF)给出:

概率质量函数的基本要求 必须满足以下两个条件:

概率质量函数

  1. 非负性:对所有
  2. 归一性

这两个条件保证了 确实构成一个合法的概率分配。

核心性质

编号性质数学表达 / 说明
1非负性对所有
2归一性,所有可能取值的概率之和为 1
3累积分布函数,单调不减、右连续
4期望值,描述分布的”中心位置”
5方差,描述分布的”离散程度”
6唯一性概率质量函数 完全确定了随机变量 的概率特性

关系网络

graph LR
    A["随机变量"] -->|"由其决定"| B["概率分布"]
    B -->|"用 PMF 描述"| C["概率质量函数"]
    B -->|"累积形式"| D["累积分布函数 CDF"]
    B -->|"数值特征"| E["期望值"]
    B -->|"数值特征"| F["方差"]
    B -->|"具体分布"| G["二项分布"]
    B -->|"具体分布"| H["几何分布"]
    B -->|"具体分布"| I["泊松分布"]
    B -->|"具体分布"| J["均匀分布"]
    A -->|"离散型"| K["离散概率分布"]
    A -->|"连续型"| L["概率密度函数 PDF"]

章节扩展

  • 常见离散分布
    • 二项分布,描述 次独立伯努利试验中的成功次数
    • 几何分布:首次成功所需的试验次数
    • 泊松分布:单位时间/空间内稀有事件发生的次数
    • 均匀分布:各取值等概率
  • 累积分布函数(CDF) 给出随机变量不超过某值的概率,是概率分布的另一种等价描述方式。
  • 概率密度函数(PDF):对于连续随机变量,概率分布由概率密度函数 描述,

补充

概率分布 vs 概率密度

  • 离散随机变量:使用概率质量函数(PMF), 直接给出取某值的概率
  • 连续随机变量:使用概率密度函数(PDF), 本身不是概率,需通过积分得到概率
  • 两者的统一框架是累积分布函数(CDF),对离散和连续情形都适用

[!info] 生活类比

概率分布就像一张”成绩分布表”:列出每个可能分数出现的概率。 例如掷两枚骰子,点数之和 的概率分布为: ,…… 这张表完整地描述了 的所有概率信息。

参见

  • 随机变量:概率分布所描述的对象
  • 概率:概率分布中每个概率值的基本定义
  • 二项分布:最重要的离散概率分布之一
  • 期望值:概率分布的数字特征——中心位置
  • 方差:概率分布的数字特征——离散程度
  • 伯努利试验:二项分布的产生来源