相关笔记: 12.1 因果联系与密尔方法 | 12.4 密尔五法 | 11.1 归纳与演绎再探 | 13.1 假说与科学方法

概览

本节系统审视了密尔方法(Mill’s Methods)作为科学发现工具和证明工具的双重局限,揭示归纳推理在因果探究中的真实地位。核心知识点包括:

  • 密尔方法作为发现工具的局限:不能确定”仅有一个事态相同”或”仅一个事态不同”——任何两个物体都有很多相同点和不同点
  • 相关事态问题:密尔方法预设我们已知道哪些因素是”相关的”,但方法本身不能告诉我们这一点
  • 隐含假说依赖:使用密尔方法前必须先确定哪些因素是”相关的”,这需要背景知识和假说
  • 塞麦尔维斯案例:产褥热的真正原因(医生不洗手)在很长时间内未被识别,因为没人认为脏手是相关因素
  • 观察不完全:即使观察精确也可能不完整、具有欺骗性
  • 密尔方法作为证明工具的局限:由于依赖在先假说且不能考虑所有事态,不能提供确定性证明
  • 归纳vs演绎:归纳技术的结论总是概率性的,不能达到演绎的确定性

一、知识结构总览

graph TB
    A["12.5 归纳技术的局限"] --> B["作为发现工具的局限"]
    A --> C["作为证明工具的局限"]
    A --> D["根本原因:归纳与演绎的鸿沟"]
    A --> E["密尔方法的真实定位"]
    A --> F["经典案例"]

    B --> B1["事态不可穷尽<br/>任何两个物体都有无数相同点和不同点"]
    B --> B2["相关事态问题<br/>方法本身不能识别哪些因素是相关的"]
    B --> B3["隐含假说依赖<br/>需要背景知识预先确定候选原因"]

    C --> C1["在先假说可能错误<br/>因果分析可能不充分"]
    C --> C2["观察可能不完全<br/>即使精确也具有欺骗性"]
    C --> C3["不能提供确定性证明<br/>结论总是概率性的"]

    D --> D1["演绎:有效论证=证明/笃证"]
    D --> D2["归纳:充其量高度概然<br/>绝不是笃证"]
    D --> D3["休谟问题<br/>归纳推理的合理性本身无法被证明"]

    E --> E1["不是发现的通路"]
    E --> E2["不是证明的规则"]
    E --> E3["是检验假说的工具"]
    E --> E4["描述了对照实验的普遍方法"]

    F --> F1["科学的酒鬼<br/>误将汽水识别为醉酒原因"]
    F --> F2["塞麦尔维斯与产褥热<br/>脏手未被识别为相关因素"]
    F --> F3["黄热病与蚊子<br/>蚊子叮咬起初被认为是荒唐的假说"]

二、核心思想与论证结构

核心思想

密尔过高评价了归纳方法的威力——他相信这些方法既是”发现因果关系的工具”,又是”证明因果联系的准则”。本节论证了这两点主张都不能成立:密尔方法不是发现的通路,也不是证明的规则。它们的真正力量在于检验假说,而假说的形成依赖于背景知识和科学洞察力。归纳推理的结论充其量是高度概然的,绝不是笃证的

密尔方法作为发现工具的局限

事态不可穷尽问题

密尔在阐述其方法时,假定人们可以确定"仅有一个事态相同"的场合或者"除了一个事态外其余的每个事态都相同"的其他场合。但这一假定从字面上看是无法成立的:

事态不可穷尽

  • 任何两个物体无论它们看上去多么不同,均具有许多相同的事态
  • 没有两个事物可以只在一个方面不同——一个事物离北方更远,一个事物离太阳更近,如此等等
  • 我们不能检查所有可能的事态,以确定它们是否只在一个方面存在差别

因此,科学家在应用这些技术时心中所想的不是”所有事态”,而是相关事态的集合——是否仅有一个共同的相关事态,还是除了一个其他所有相关事态都是共同的。

相关事态问题

相关事态问题(The Problem of Relevant Circumstances)

哪些是相关事态呢?仅用密尔方法本身我们不能知道哪些因素是相关的。要使用这些方法,我们必须关注这些方法将要应用的语境,此时我们心中已经对因果因素做出了一些分析。

这意味着密尔方法不能独立运作——它必须依赖在先的因果假说,而假说的形成需要背景知识、科学洞察力和想象力。

科学的酒鬼(The Scientific Drunkard)

漫画《科学的酒鬼》生动地示例了这个困难:

  • 第一个晚上:喝的是苏格兰威士忌汽水 → 喝醉了
  • 第二个晚上:喝的是波旁威士忌汽水 → 喝醉了
  • 接下来的晚上:白兰地酒汽水 → 喝醉了
  • 然后:朗姆酒汽水 → 喝醉了
  • 再然后:杜松子酒汽水 → 喝醉了

他喝醉的原因是什么呢?一次又一次地喝醉之后,他发誓再也不碰汽水了!

分析: 这个酒鬼确实在应用求同法的时候遵守了规则——他正确地识别出所有场合下的共同因素是”汽水”。但是他这么做是没用的,因为在那些先行事态中真正相关的因素没有得到确定,因而那些因素没有得到利用。假如酒精已经被确定为是所有场合下的共同因素之一,那就有可能非常迅速地将汽水排除出去——使用的是求异法

黄热病与蚊子

我们之前讨论的、与求异法相关的寻找黄热病原因的研究,确证了以下结论:黄热病是由受感染的蚊子的叮咬而传播的。我们现在知道了那一点,正如我们现在知道使人醉的是酒精而非汽水。

但是黄热病实验需要洞察力和想象力,也需要勇气;黄热病是由蚊子传播的这个观念起初被认为是愚蠢的,或者是荒唐的,或者根本没有被想到过

关键教训: 现实世界中的事态并没有贴上”有关的”或”无关的”标签。对把蚊子叮咬作为原因的检验需要一些前期整理的可能相关因素,然后归纳方法才可能应用于这些因素。当我们手边有了这样前期的分析之后,可以表明这些方法是十分有帮助的——但是如果背景知识中没有一些假说的话,这些方法本身作为科学发现的工具并不充分

密尔方法作为证明工具的局限

隐含假说依赖

隐含假说依赖

由于我们着手应用这些方法总是根据一些关于因果因素的在先假说,并且由于我们不能考虑所有的事态,所以我们的注意力将限定在那些被认为是正在考虑的、可能的原因上。但是关于应该研究哪些事态这个判断可能被证明是错误的

塞麦尔维斯与产褥热(Semmelweis and Childbed Fever)

在很长一段时间里,医学家甚至没有把脏手看作传染的可能媒介,因而不可能将脏手确定为疾病的原因。内科医生没有洗手(因为他们不明白传染病是如何传播的)导致了数世纪以来的无数苦难和无数死亡,尤其是产褥热带来的后果。

  • 产褥热细菌携带在医生的手上,由一个母亲传染到另一个母亲
  • 直到19世纪中叶,匈牙利内科医生伊戈奈克·塞麦尔维斯(Ignaz Semmelweis)给出了那个灾难性因果联系的证明
  • 当研究者没能将在他们面前的事态分解成恰当的元素——这些元素不能提前被知晓——的时候,研究就会陷入困境

由于应用这些方法所预设的分析可能是错误的或不充分的,基于这些分析的推论可能同样是错误的。归纳的这种对隐含假说的依赖,表明归纳技术本身不能如密尔所希望的那样提供因果证明。

观察不完全问题

观察不完全

归纳方法的应用总是依赖于观察到的相关性,并且即使观察已经十分精确,这样的观察也可能是不完全的,因而具有欺骗性。观察的数量越大,我们观察到的关联是真正因果律的明示的可能性就越大——但是无论那个数量有多大,我们不能从那些已观察到的事例中确定地推出因果联系

归纳与演绎的根本鸿沟

归纳vs演绎:确定性之差

这些局限再一次说明了归纳和演绎之间存在的鸿沟

  • 一个有效的演绎推理构成一个证明,或笃证(demonstration)
  • 每一个归纳推理充其量是高度概然的(highly probable),绝不是笃证的

因此,密尔关于他的准则是"证明的方法"的断言,以及它们是"全部发现的方法"的断言,都必须被拒绝

密尔方法的真实定位

密尔方法的真正力量

尽管密尔方法不能起到密尔所声称的全部作用,但它们在科学中仍然处于中心地位并且十分有力:

  1. 本质上是排除性方法:归纳五法所能让我们确定的是——如果对先行事态的某个特定分析是正确的,那么这些因素中的一个因素不可能是(或必定是)被研究现象的原因(或部分原因)
  2. 演绎的有效性:这可能是演绎出来的,并且这个演绎可能是有效的,但是那个论证的可靠性(soundness)总是取决于假定的先行分析的正确性
  3. 检验假说的工具:归纳方法是极好的,但是仅当它们试图证实(或证伪)的假说确实正确地识别出因果相关事态的时候,这些方法才能产生可靠的结果
  4. 对照实验的逻辑基础:这些归纳技术的主张合起来描述了对照实验(controlled experiment)的普遍方法,这是在所有现代科学中的一个普遍的和不可缺少的工具

核心结论

“它们不是发现的通路,也不是证明的规则。它们是检验假说的工具。“


三、补充理解与易混淆点

补充理解

补充1:密尔方法预设的两个关键假定

来源: University of Hong Kong, Philosophy Department. (2023). Mill’s Methods. https://philosophy.hku.hk/think/sci/mill.php

密尔方法的运作依赖两个关键预设,而这两个预设恰恰是方法本身无法满足的:

预设1:候选原因列表已知

  • 密尔方法预设我们已有一个候选原因列表可供考虑
  • 但方法本身不告诉我们如何得出这样的列表
  • 在现实中,这依赖于我们的知识或对可能原因的有根据的猜测
  • 例如:在黄热病案例中,“蚊子叮咬”必须首先被列入候选原因列表,然后密尔方法才能发挥作用

预设2:唯一原因假定

  • 密尔方法还预设:在所考虑的因素中,只有一个因素是结果的唯一原因
  • 但这一假定并不总是成立——一个结果可能有多个独立的原因(原因多元性问题)
  • 有时原因之间还会相互影响(效果混合问题),使得情况更加复杂

实践意义: 这两个预设意味着密尔方法不能独立运作——它们需要与科学直觉、背景理论和创造性假说形成配合。

补充2:密尔方法与对照实验——从归纳准则到科学工具

来源: Stanford Encyclopedia of Philosophy. (2014). Experiment in Biology. https://plato.stanford.edu/archives/spr2014/entries/biology-experiment/

密尔方法虽然不能作为独立的发现工具或证明工具,但它们描述了现代对照实验的逻辑结构:

密尔方法→对照实验的对应关系:

密尔方法对照实验设计核心逻辑
求同法多案例比较研究在不同条件下寻找共同因素
求异法随机对照试验(RCT)控制组与实验组的唯一差异
求同求异并用法多组对照设计结合求同和求异的逻辑
共变法剂量-反应研究系统变化一个因素观察效应变化
剩余法多因素回归分析控制已知因素后考察剩余效应

关键洞察: 因果推理方法”可能也有局限,它们通常被限制在唯一目标是建立因果相关性关系的情境中”(Stanford Encyclopedia of Philosophy)。这意味着密尔方法的价值在于检验已提出的因果假说,而非从零开始发现因果关系

补充3:休谟问题与归纳的哲学困境

来源: Stanford Encyclopedia of Philosophy. (2025). The Problem of Induction. https://plato.stanford.edu/archives/sum2025/entries/induction-problem/

本节所讨论的归纳技术的局限,其哲学根源可以追溯到休谟问题(The Problem of Induction):

休谟的核心论证:

  • 归纳推理依赖于"未来将符合过去"这一假定(自然齐一性原理)
  • 但这一假定本身只能通过归纳来证明——这构成了循环论证
  • 因此,归纳推理的合理性无法被演绎地证明,也无法被非循环地归纳证明

与本节的关联:

  • 密尔方法作为”证明的准则”的失败,正是休谟问题的一个具体体现
  • 即使密尔方法被完美地应用,其结论仍然不能达到演绎的确定性
  • 这不是密尔方法本身的缺陷,而是所有归纳推理的本性——归纳推理”充其量是高度概然的,绝不是笃证的”

科学回应: 现代科学哲学通过假说-演绎法(Hypothetico-Deductive Method)来应对这一困境:科学家提出假说,从中演绎出可检验的预测,然后通过实验检验。密尔方法在这一框架中扮演的是检验工具的角色,而非证明工具。

补充4:塞麦尔维斯案例的深层逻辑分析

来源: Scholl, R. (2013). Causal inference, mechanisms, and the Semmelweis case. Philosophy of Science, 80(5). https://philsci-archive.pitt.edu/9556/1/scholl-shps-2013.pdf

塞麦尔维斯案例不仅仅是一个历史故事,它揭示了归纳推理的深层逻辑结构:

案例时间线:

  1. 19世纪中叶,维也纳总医院第一产科(由医学生和医生接生)的产褥热死亡率高达10%以上
  2. 第二产科(由助产士接生)的死亡率仅为2-3%
  3. 塞麦尔维斯系统排除了”拥挤程度”、“饮食”、“通风”等各种假说
  4. 关键转折:他的同事科莱奇卡(Kolletschka)在尸检时被手术刀割伤后死于类似症状
  5. 塞麦尔维斯推断:尸体上的"尸体颗粒"通过医生的手传播给产妇
  6. 实施漂白水洗手后,死亡率骤降至1%以下

逻辑教训:

  • 在塞麦尔维斯之前,没有人将”脏手”列为候选原因——密尔方法无法帮助识别这个因素
  • 塞麦尔维斯的成功依赖于创造性洞察(从同事的死亡中类比推断),而非机械地应用密尔方法
  • 即使在证明阶段,他的发现也遭到了当时医学界的强烈抵制——因为”医生的手可能携带疾病”这一假说与当时的医学教条相矛盾

现代回响: 这一案例在当代科学哲学中被反复讨论,因为它完美地展示了"假说形成需要科学洞察力,而不仅仅是方法论的机械应用"这一核心论点。

易混淆点

误区:密尔方法是独立的科学发现工具

错误理解: 只要严格按照密尔方法的规则操作,就能从观察数据中自动发现因果关系。密尔方法是”全部发现的方法”。

正确理解: 密尔方法不能独立运作。它们需要:

  • 一个预先确定的候选原因列表
  • 关于哪些因素是”相关的”的在先判断
  • 足够的背景知识科学假说

辨析:

  • 密尔方法本质上是排除性方法——它们帮助我们从候选列表中排除或确认因素
  • 候选列表本身从何而来? 这需要科学直觉、类比推理、理论推测等非密尔方法的能力
  • 在”科学的酒鬼”案例中,酒鬼正确应用了求同法,但候选列表中缺少了”酒精”这一关键因素
  • 在塞麦尔维斯案例中,“脏手”根本不在当时的候选原因列表中
特征密尔的宣称实际情况
发现因果关系是”全部发现的方法”需要在先假说和背景知识
证明因果联系是”证明的方法”结论是概率性的,非确定性
独立运作可以独立使用必须依赖预设的候选原因列表

误区:归纳推理可以提供与演绎推理同等的确定性

错误理解: 当归纳推理的样本量足够大、观察足够精确时,归纳结论可以达到与演绎结论同等的确定性。

正确理解: 无论观察数量多大、观察多么精确,归纳推理的结论永远不能达到演绎的确定性。这是归纳推理的本性所决定的。

辨析:

  • 演绎推理:前提为真 → 结论必定为真(确定性保证)
  • 归纳推理:前提为真 → 结论可能为真(概率性保证)
  • 观察数量越大,归纳结论的概率越高,但永远不会达到100%的确定性
  • 这不是归纳方法的”缺陷”,而是归纳与演绎之间存在不可逾越的鸿沟
  • 密尔称其方法为”证明的方法”(Methods of Proof),这一断言必须被拒绝

与休谟问题的关联: 这一鸿沟的哲学根源就是休谟问题——归纳推理的合理性本身无法被非循环地证明。无论我们收集多少正面事例,“太阳明天会升起”这一命题都不能被确定性地证明。

误区:对照实验可以完全克服归纳的局限

错误理解: 现代科学使用的随机对照试验(RCT)等严格实验设计已经克服了密尔方法的局限,可以提供确定性的因果证明。

正确理解: 对照实验确实大大提高了归纳推理的可靠性,但它仍然不能提供确定性证明。对照实验是密尔方法的精细化应用,而非对归纳局限的根本克服。

辨析:

  • 对照实验的逻辑基础仍然是密尔的求异法——控制组与实验组的唯一差异
  • 对照实验仍然需要预先确定候选因素——实验设计者必须决定控制哪些变量
  • 对照实验仍然面临观察不完全的问题——实验结果可能受到未控制的混杂因素影响
  • 对照实验的结论仍然是概率性的——统计显著性不等于确定性证明
  • 对照实验的优势在于系统化和标准化,而非克服了归纳的根本局限

四、习题精选

习题概览

题号核心考点难度
1识别归纳推理中的隐含假说⭐⭐
2分析密尔方法的应用局限⭐⭐⭐

题1:识别归纳推理中的隐含假说

题目

一位研究者发现,在经常食用橄榄油的地中海国家,心脏病发病率较低。据此,他得出结论:橄榄油能预防心脏病。请分析这一推理中可能存在的隐含假说,以及密尔方法在此应用中的局限。

题2:分析密尔方法的应用局限

题目

在塞麦尔维斯发现产褥热原因之前,医学界提出了多种假说来解释产褥热的高死亡率,包括”瘴气理论”(认为空气中的有害物质是原因)。请运用本节所学的知识,分析为什么密尔方法不能帮助当时的医学界发现产褥热的真正原因。

解题思路提示

分析密尔方法局限的通用框架:

  1. 检查候选原因列表——是否遗漏了可能的关键因素?
  2. 识别隐含假说——研究者预设了哪些”显而易见”但实际上可能有问题的假定?
  3. 评估唯一原因假定——结果是否可能有多个原因?
  4. 考虑观察不完全——是否有未控制的混杂变量?
  5. 区分发现与证明——密尔方法在此是用于发现因果关系还是检验已有假说?

五、视频学习指南

视频资源

资源链接对应内容备注
Wireless Philosophy: Mill’s Methods链接密尔五法概述英文,简明讲解
Crash Course Philosophy: Inductive Reasoning链接归纳推理与局限英文,适合入门
Semmelweis Documentary链接塞麦尔维斯案例英文,历史纪录片

六、教材原文

教材原文

来源: 逻辑学导论 第15版,第12章第5节

密尔方法作为发现工具的局限: 一个实质性困难源于以下事实:在密尔对这些方法的阐述中,他假定人们可以确定”仅有一个事态相同的”场合或者”除了一个事态外其余的每个事态都相同”的其他场合。但是不能从字面上理解这些表述:任何两个物体无论它们看上去多么不同,它们均具有许多相同的事态;没有两个事物可以只在一个方面不同——一个事物离北方更远,一个事物离太阳更近,如此等等。我们甚至也不能检查所有可能的事态,以确定它们是否只在一个方面存在差别。科学家在应用这些技术时心中所想的不是所有事态,而是相关事态的集合。

相关事态问题: 哪些是相关事态呢?仅用这些方法我们不能知道哪些因素是相关的。要使用这些方法,我们必须关注这些方法将要应用的语境,此时我们心中已经对因果因素做出了一些分析。

隐含假说依赖与塞麦尔维斯案例: 由于我们着手应用这些方法总是根据一些关于因果因素的在先假说,正如上面已经提到的,并且由于我们不能考虑所有的事态,所以我们的注意力将限定在那些被认为是正在考虑的、可能的原因上。但是关于应该研究哪些事态这个判断可能被证明是错误的。在很长一段时间里,医学家甚至没有把脏手看作传染的可能媒介,因而不可能将脏手确定为疾病的原因。

归纳与演绎的鸿沟: 一个有效的演绎推理构成一个证明,或笃证;但是每一个归纳推理充其量是高度概然的,绝不是笃证的。因而,密尔关于他的准则是”证明的方法”的断言,以及它们是”全部发现的方法”的断言,都必须被拒绝。

密尔方法的真正力量: 它们不是发现的通路,也不是证明的规则。它们是检验假说的工具。这些归纳技术的主张合起来描述了对照实验的普遍方法,这是在所有现代科学中的一个普遍的和不可缺少的工具。


参见 Wiki

因果推理