ARTICLE
冗余参数
冗余参数 冗余参数(nuisance parameter)又称讨厌参数,是指在统计推断中存在于模型之中、但并非直接感兴趣、却必须加以处理才能对关注参数进行有效推断的模型参数。这一概念贯穿于假设检验、区间估计、点估计和模型选择等多个领域。 定义与基本概念 设统计模型参数为 = ( , ) ,其中 是关注参数(parameter of interest), 是冗
冗余参数
冗余参数(nuisance parameter)又称讨厌参数,是指在统计推断中存在于模型之中、但并非直接感兴趣、却必须加以处理才能对关注参数进行有效推断的模型参数。这一概念贯穿于假设检验、区间估计、点估计和模型选择等多个领域。
定义与基本概念
设统计模型参数为 ,其中 是关注参数(parameter of interest), 是冗余参数(nuisance parameter)。似然函数 同时依赖于二者,因此必须对 采取策略才能获得关于 的有效推断。
经典例子:正态分布 中若关注参数是均值 ,则方差 即为冗余参数。[线性回归](/wikis/线性回归) 中,若关注参数是 ,则误差方差 是冗余参数。
处理冗余参数的主要方法
轮廓似然法
对于每个 ,在 上最大化似然函数,得到轮廓似然函数:
其中 是给定 下 的[最大似然估计](/wikis/最大似然估计)。然后基于 对 推断。轮廓似然的渐近性质与普通似然类似,但小样本下可能存在偏差。
条件似然法
寻找关于 的充分统计量 ,使得给定 的条件下样本的条件分布不再依赖于 ,从而基于条件似然 推断 。在指数族分布中特别有效。例如, 列联表中分析优势比时,[Fisher精确检验](/wikis/Fisher精确检验)通过固定边际和来消除冗余参数。
边际似然法
在贝叶斯框架下对冗余参数积分:
其中 是 在 下的先验分布。
得分检验
[拉格朗日乘数检验](/wikis/拉格朗日乘数检验)仅需在原假设下估计模型,即在 约束下估计 ,避免了对无约束模型的估计。
冗余参数与推断精度
冗余参数的存在会增加关注参数估计的不确定性。以 为例: 已知时 方差为 ;未知时使用 分布,置信区间更宽,反映了估计 的代价。
从信息论角度,Fisher信息矩阵为:
已知时 的 Fisher 信息量为 ; 未知时有效 Fisher 信息量为 ,后者总是不大于前者。
面板数据中的冗余参数问题
在[面板数据](/wikis/面板数据)中,个体固定效应 是典型冗余参数。当 固定而 时,冗余参数数量随样本量增长,导致偶然参数问题(incidental parameters problem)。固定效应 Logit 模型可通过条件似然消除 ;线性面板模型则使用组内变换。
与半参数方法的关系
在半参数模型中,冗余参数可能是无穷维的 nuisance function。例如部分线性模型 中, 是有限维关注参数,非参数函数 是冗余的。需使用非参数方法消除冗余成分,以得到 的 一致估计量。
参见
- [关注参数](/wikis/关注参数)
- [最大似然估计](/wikis/最大似然估计)
- [Fisher信息量](/wikis/Fisher信息量)
- [充分统计量](/wikis/充分统计量)
- [偶然参数问题](/wikis/偶然参数问题)
- [面板数据](/wikis/面板数据)
参考文献
- Cox, D. R. \& Reid, N. (1987). Parameter orthogonality and approximate conditional inference. *JRSS-B*, 49(1), 1–39.
- Lehmann, E. L. \& Romano, J. P. (2005). *Testing Statistical Hypotheses* (3rd ed.). Springer.
- Neyman, J. \& Scott, E. L. (1948). Consistent estimates based on partially consistent observations. *Econometrica*, 16(1), 1–32.
- Severini, T. A. (2000). *Likelihood Methods in Statistics*. Oxford University Press.