ARTICLE
充分性
充分性 (Sufficiency) 充分性 (Sufficiency) 是数理统计和统计推断中的核心概念,由 R.A. Fisher 引入。一个统计量若包含样本中关于未知参数的全部信息,则称为该参数的 充分统计量 (sufficient statistic)。在获得充分统计量后,原始样本数据对推断该参数不再提供额外信息。充分性原则实现了对数据的有效压缩与降维
充分性 (Sufficiency)
充分性 (Sufficiency) 是数理统计和统计推断中的核心概念,由 R.A. Fisher 引入。一个统计量若包含样本中关于未知参数的全部信息,则称为该参数的 充分统计量 (sufficient statistic)。在获得充分统计量后,原始样本数据对推断该参数不再提供额外信息。充分性原则实现了对数据的有效压缩与降维,在不损失推断信息的前提下用一个或少数几个值代替整个数据集。
Fisher-Neyman 因子分解定理
设 来自概率密度函数或概率质量函数 的随机样本, 为未知参数。统计量 是 的充分统计量,当且仅当联合概率函数可分解为:
其中 对数据 的依赖完全通过 体现, 完全不依赖 。该定理将似然函数中与 相关的部分隔离在 中,对 的推断(如最大似然估计)仅依赖于 。
典型示例
伯努利分布: ,联合 PMF 为 。定义 ,则 ,。故成功总次数即为 的充分统计量——估计硬币正面概率只需知道正面总次数,无需记录抛掷顺序。
正态分布(均值未知,方差已知): ,联合 PDF 分解得 (或样本均值 )为 的充分统计量。若 和 均未知,充分统计量为二维向量 。
重要性与应用
数据压缩: 充分性使海量数据集可无损缩减至少数统计量。
Rao-Blackwell 定理: 对任意无偏估计量,计算其在充分统计量下的条件期望,可获得方差更小的新无偏估计量,为寻找最小方差无偏估计量 (MVUE) 提供系统路径。
估计理论基础: 最大似然估计量 (MLE) 若存在,必然是充分统计量的函数。
相关概念
- 最小充分统计量: 达到最大数据压缩的充分统计量,是任何其他充分统计量的函数。
- 完备统计量: 若 对所有 成立则 。
- Lehmann-Scheffé 定理: 若统计量同时充分且完备,基于其构造的任何无偏估计量即为唯一 MVUE。
- 辅助统计量: 分布完全不依赖 。巴苏定理指出完备最小充分统计量与任何辅助统计量独立。