中位数

概述

中位数 时的序统计量,即将有序集合分为大小相等(或相差1)的两部分的元素。它比均值更鲁棒,是工程实践中最常用的集中趋势度量之一。

定义

中位数

给定一个包含 个元素的集合 下中位数(lower median)是第 序统计量,上中位数(upper median)是第 序统计量。当 为奇数时两者相同;当 为偶数时,中位数通常取两者的平均值。

  • CLRS 主要讨论下中位数,即

核心性质

  • 鲁棒性:中位数不受极端值(outlier)影响,比均值更稳健。例如,数据集 的均值是 334.3,但中位数是 2。
  • 工程实践:P50(中位数)、P95、P99 是 SRE(站点可靠性工程)中衡量延迟和性能的核心指标。
  • 分治关键:中位数将集合精确地分为两半,这使得它在分治算法中具有天然优势。
  • 中位数可以在 时间内找到(无需排序),这是选择算法的核心成果。

章节扩展

第9章:中位数与序统计

参见