ARTICLE

充分统计量

充分统计量 (Sufficient Statistic) 充分统计量 (Sufficient Statistic) 是数理统计学中的核心概念，由统计学家罗纳德·费雪 (Ronald Fisher) 于1920年提出。其基本思想是无损数据压缩：一个统计量如果包含了样本中关于未知参数的全部信息，则被称为的充分统计量。一旦获知该统计量的值，原始样本数据对于推断

浏览 34 更新 2026-07-14

充分统计量 (Sufficient Statistic)

充分统计量 (Sufficient Statistic) 是数理统计学中的核心概念，由统计学家罗纳德·费雪 (Ronald Fisher) 于1920年提出。其基本思想是无损数据压缩：一个统计量如果包含了样本中关于未知参数 $\theta$ 的全部信息，则被称为 $\theta$ 的充分统计量。一旦获知该统计量的值，原始样本数据对于推断 $\theta$ 不再提供任何额外信息。

形式化定义

设 $X = (X_1,\ldots,X_n)$ 为来自分布族 $\{f(x;\theta):\theta\in\Theta\}$ 的样本。统计量 $T(X)$ 是 $\theta$ 的充分统计量，当且仅当给定 $T(X)=t$ 时，样本 $X$ 的条件概率分布与 $\theta$ 无关：

P(X=x\mid T(X)=t;\theta) \text{ 不依赖于 } \theta

这一条件概率定义虽含义清晰，但在实践中难以直接验证。费雪-奈曼分解定理 (Fisher-Neyman Factorization Theorem) 提供了更便捷的判别方法： $T(X)$ 是 $\theta$ 的充分统计量，当且仅当联合密度（或质量）函数可分解为：

f(x;\theta) = g(T(x);\theta) \cdot h(x)

其中 $g$ 通过 $T(x)$ 依赖于数据且可含 $\theta$ ， $h$ 仅依赖于数据而与 $\theta$ 无关。

例：伯努利分布

设 $X_1,\ldots,X_n \stackrel{\text{i.i.d.}}{\sim} \text{Bern}(p)$ ，联合PMF为：

f(x;p) = p^{\sum x_i}(1-p)^{n-\sum x_i}

令 $T(X)=\sum X_i$ ，则 $f(x;p) = \underbrace{p^{T(x)}(1-p)^{n-T(x)}}_{g(T(x);p)} \cdot \underbrace{1}_{h(x)}$ ，故 $T(X)$ 是 $p$ 的充分统计量。

最小充分统计量

一个参数可能存在多个充分统计量（如整个样本本身即是平庸的充分统计量）。最小充分统计量 (Minimal Sufficient Statistic) 实现了最大程度的数据压缩——它能表示为任何其他充分统计量的函数。对于伯努利分布， $\sum X_i$ 即为最小充分统计量。

理论意义

充分统计量的重要性体现在以下方面：其一，数据压缩使得大规模样本处理成为可能，而信息无损；其二，Rao-Blackwell定理指出，对任何无偏估计量取关于充分统计量的条件期望，可得到方差更小的改进估计量；其三，Lehmann-Scheffé定理进一步指出，基于完备最小充分统计量的无偏估计量是最小方差无偏估计量 (UMVUE)。这些理论共同构成了经典估计理论的基石。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。