概率

概述

概率(probability)是归纳逻辑的核心评价性概念,为归纳论证的强度提供了量化度量。皮尔斯(C.S. Peirce)曾指出:“概率理论就是定量地研究逻辑的科学。“与演绎论证追求结论的必然性(确定性)不同,归纳论证的结论只具有概然性(probability),而概率正是刻画这种概然性的精确工具。在逻辑学的框架中,概率连接了演绎论证归纳论证——当概率达到 1 时,归纳强度达到演绎确定性的极限;当概率介于 0 与 1 之间时,它度量了归纳论证的支持程度。概率理论是第14章的核心主题,也是整个归纳逻辑体系的量化基础。

定义

概率(Probability)

概率是一个介于 0 和 1 之间的数值,用于度量某个事件发生的可能性或某个命题为真的程度。概率为 0 表示事件不可能发生(或命题必然为假),概率为 1 表示事件必然发生(或命题必然为真),概率介于 0 和 1 之间表示事件可能发生但不确定。

验前解释(古典理论)

古典概率(Classical / A Priori Probability)

古典概率(又称验前概率、先验概率)基于等可能性假设,将概率定义为:

适用条件: 所有基本结果必须是互斥的(mutually exclusive)且等可能的(equally probable)。

示例: 掷一枚公平的骰子,出现偶数的概率为: 因为偶数结果(2, 4, 6)有 3 个,总结果数(1, 2, 3, 4, 5, 6)有 6 个,且每个结果等可能。

古典概率的局限

古典概率的等可能性假设本身无法通过古典概率来证明——它依赖于对称性或无差别原则(principle of indifference),而这在某些情况下会导致悖论(如贝特朗悖论)。当”等可能”假设不成立时(如骰子不均匀),古典概率就不再适用。

相对频率解释

相对频率概率(Relative Frequency Probability)

相对频率概率基于经验统计,将概率定义为事件在长期重复试验中出现的频率极限:

其中 是事件 发生的次数, 是试验总次数。

示例: 某城市过去 10 年中记录了 3650 天的天气数据,其中 1095 天下雨,则该城市某天下雨的相对频率概率为:

两种解释的对比

维度古典概率相对频率概率
基础等可能性假设(先验的)经验数据(后验的)
计算方式有利结果 / 总结果频率统计
适用范围对称情境(骰子、扑克等)统计情境(气象、医学等)
代表人物拉普拉斯、帕斯卡、费马冯·米塞斯、赖兴巴赫
局限等可能假设难以证明需要大量数据,无法处理单次事件

概率公理(Kolmogorov 公理体系)

概率公理(Kolmogorov Axioms, 1933)

Andrey Kolmogorov 在《概率论基础论》(Grundbegriffe der Wahrscheinlichkeitsrechnung, 1933)中建立了概率的公理体系,为概率论提供了严格的数学基础。三条公理如下:

  1. 非负性公理:对于任何事件
  2. 规范性公理,其中 必然事件(样本空间)
  3. 可加性公理:对于互斥(mutually exclusive)事件 推广到可数多个互斥事件:

公理体系的地位

Kolmogorov 公理体系是概率论的数学基础,但它本身不回答”概率是什么”的哲学问题——古典解释、频率解释和主观解释都可以在这套公理体系下运作。公理体系规定了概率必须满足的形式约束,但不同解释对这些约束给出了不同的哲学解读。

核心性质

性质说明
概率相对于证据概率不是事件本身的固有属性,而是相对于给定证据的——同一事件在不同证据下可以有不同的概率值
概率在 0 到 1 之间由非负性公理和规范性公理保证:
演绎确定性 vs 归纳概然性演绎论证中结论的概率为 1(,确定性),归纳论证中结论的概率介于 0 和 1 之间(,概然性)
验前理论 vs 相对频率理论古典理论基于先验的等可能性假设,适用于对称情境;频率理论基于后验的经验统计,适用于统计情境
互补事件事件 不发生的概率为
概率的单调性 蕴涵 ),则

常见误区

  • 概率不是事件的固有属性:说”明天下雨的概率是 30%“是相对于当前气象数据的,如果获得新的数据(如卫星云图),这个概率值会改变
  • 概率为 0 不等于不可能:在连续概率空间中,概率为 0 的事件仍有可能发生(如指针恰好指向某个精确点)
  • 高概率不等于确定性:即使 ,事件 仍然可能不发生——这正是归纳论证与演绎论证的根本区别

关系网络

graph TB
    A["概率<br/>归纳逻辑的量化工具"] --> B["归纳逻辑<br/>概率是其核心评价概念"]
    A --> C["演绎论证<br/>P=1 时的极限情形"]
    A --> D["归纳论证<br/>0&lt;P&lt;1 度量归纳强度"]

    A --> E["概率演算"]
    E --> E1["加法定理<br/>P(A∪B) = P(A) + P(B) - P(A∩B)"]
    E --> E2["乘法定理<br/>P(A∩B) = P(A) × P(B|A)"]

    A --> F["概率解释"]
    F --> F1["古典概率<br/>验前/等可能性"]
    F --> F2["相对频率概率<br/>经验统计"]
    F --> F3["主观概率<br/>贝叶斯主义"]

    A --> G["因果联系<br/>概率因果:P(B|A) > P(B)"]
    A --> H["休谟问题<br/>归纳合理性的概率辩护"]
    A --> I["密尔五法<br/>因果发现的归纳方法"]
    A --> J["科学说明<br/>假说的概率确证"]
    A --> K["假说-演绎法<br/>概率化的假说检验"]

    A --> L["期望值<br/>EV = Σ Pᵢ × Vᵢ"]
    A --> M["条件概率<br/>P(B|A) = P(A∩B)/P(A)"]

    style A fill:#e3f2fd,stroke:#1565c0,stroke-width:2px
    style E fill:#fff3e0,stroke:#e65100,stroke-width:2px
    style F fill:#f3e5f5,stroke:#6a1b9a,stroke-width:2px
  • 归纳逻辑:概率是归纳逻辑的核心评价工具,为归纳论证的强度提供量化度量
  • 演绎论证:演绎论证中,前提为真时结论的概率为 1——演绎是概率的极限情形
  • 归纳论证:归纳论证中,前提为真时结论的概率介于 0 和 1 之间,概率越高论证越强
  • 因果联系:概率因果定义: 的原因
  • 休谟问题:概率理论(尤其是贝叶斯主义)为归纳合理性提供了可能的辩护路径
  • 密尔五法:密尔五法通过受控比较发现因果联系,其结论具有概率性而非确定性
  • 科学说明:科学假说的确证程度可以用概率来度量
  • 假说-演绎法:假说-演绎法中,证据对假说的支持度可以用贝叶斯概率计算
  • 期望值:期望值是概率与价值的乘积之和,是决策理论的核心概念
  • 条件概率:条件概率 是概率演算的核心工具,也是贝叶斯定理的基础

章节扩展

第14章:概率理论

第14章系统阐述了概率理论,为整个归纳逻辑体系提供量化基础。

概率的两种解释

第14章详细讨论了概率的两种主要解释:

  1. 验前解释(古典理论):基于等可能性假设,适用于具有对称性的情境(如掷骰子、抽牌)。概率等于有利结果数除以等可能结果总数。

  2. 相对频率解释:基于经验统计,适用于可以通过重复观察获得数据的情境。概率等于事件发生的次数除以观察总次数(在观察次数趋于无穷时的极限)。

两种解释的互补性

两种解释并非互相排斥,而是互补的。古典理论适用于理论分析(如计算公平赌博的概率),频率理论适用于经验研究(如计算疾病发病率)。在实际应用中,我们经常需要结合两种解释:先用古典理论建立理论模型,再用频率数据来检验和校准模型。

概率演算基本定理

概率演算(Probability Calculus)

概率演算是基于 Kolmogorov 公理体系推导出的概率计算规则,核心包括加法定理乘法定理

加法定理(General Addition Rule):

对于任意两个事件 (不要求互斥):

  • 互斥时,,公式简化为
  • 推广到一般情形: 不能超过 1,因此当 时,必须减去重叠部分

示例: 从一副标准扑克牌中随机抽取一张,抽到红心或国王的概率为:

乘法定理(General Multiplication Rule):

对于任意两个事件

其中 条件概率——在事件 发生的条件下事件 发生的概率。

  • 独立时,,公式简化为

示例: 连续掷两次骰子,两次都出现 6 的概率为(假设两次掷骰子独立):

加法定理与乘法定理的关系

加法定理处理的是""关系( 至少一个发生),乘法定理处理的是""关系( 同时发生)。两者共同构成了概率演算的基础,可以组合使用来计算复杂事件的概率。参见 条件概率

补充

主观概率与贝叶斯主义

来源: de Finetti (1937), Savage (1954), Jeffrey (1965)

除了古典解释和频率解释外,还有一种重要的概率解释——主观概率(subjective probability),又称认知概率(epistemic probability)或信念度(degree of belief)。

  • 核心思想:概率反映的是个人在给定证据下对某个命题的确信程度,而非事件本身的客观属性
  • 贝叶斯定理是主观主义学派的核心工具: 其中 是先验概率(prior probability), 是后验概率(posterior probability), 是似然性(likelihood)
  • 贝叶斯更新:当获得新证据 时,通过贝叶斯定理将先验概率 更新为后验概率 ,实现信念的理性修正

贝叶斯主义在当代归纳逻辑和科学哲学中占据主导地位,它为假说-演绎法中的假说确证问题提供了精确的量化框架。

概率解释的统一趋势

来源: Copi, Introduction to Logic, Ch.14

虽然古典解释、频率解释和主观解释在哲学上存在分歧,但在实际应用中,三种解释往往相互补充而非相互排斥:

  1. 古典概率适用于理论建模和对称情境中的先验计算
  2. 频率概率适用于经验数据的统计分析和预测
  3. 主观概率适用于单次事件的判断和决策(如”明天是否下雨”)

Kolmogorov 公理体系为三种解释提供了统一的数学框架——无论采用哪种解释,概率计算都必须遵循同一套公理和定理。这种”数学统一、哲学多元”的局面是当代概率哲学的基本特征。

应用

概率理论在以下领域有广泛的应用:

  • 科学研究:统计推断、假设检验、置信区间——量化实验数据对科学假说的支持程度
  • 因果推理:通过概率因果定义 来识别因果联系,为密尔五法提供数学基础
  • 决策理论:结合概率与价值计算期望值,指导理性决策。参见 期望值
  • 风险评估:保险精算、金融风险管理、工程安全评估
  • 人工智能:概率图模型、贝叶斯网络、机器学习中的概率分类
  • 法律推理:评估证据的概率力度,如”排除合理怀疑”标准的概率解读
  • 医学诊断:根据症状和检查结果计算疾病的后验概率(贝叶斯诊断)

参见