ARTICLE

冗余参数

冗余参数冗余参数（nuisance parameter）又称讨厌参数，是指在统计推断中存在于模型之中、但并非直接感兴趣、却必须加以处理才能对关注参数进行有效推断的模型参数。这一概念贯穿于假设检验、区间估计、点估计和模型选择等多个领域。定义与基本概念设统计模型参数为 = ( , ) ，其中是关注参数（parameter of interest），是冗

浏览 0 更新 2025-11-08

冗余参数

冗余参数（nuisance parameter）又称讨厌参数，是指在统计推断中存在于模型之中、但并非直接感兴趣、却必须加以处理才能对关注参数进行有效推断的模型参数。这一概念贯穿于假设检验、区间估计、点估计和模型选择等多个领域。

定义与基本概念

设统计模型参数为 $\theta = (\psi, \lambda)$ ，其中 $\psi$ 是关注参数（parameter of interest）， $\lambda$ 是冗余参数（nuisance parameter）。似然函数 $L(\psi, \lambda \mid X)$ 同时依赖于二者，因此必须对 $\lambda$ 采取策略才能获得关于 $\psi$ 的有效推断。

经典例子：正态分布 $N(\mu, \sigma^2)$ 中若关注参数是均值 $\mu$ ，则方差 $\sigma^2$ 即为冗余参数。[线性回归](/wikis/线性回归) $Y = X\beta + \varepsilon$ 中，若关注参数是 $\beta$ ，则误差方差 $\sigma^2$ 是冗余参数。

处理冗余参数的主要方法

轮廓似然法

对于每个 $\psi$ ，在 $\lambda$ 上最大化似然函数，得到轮廓似然函数：

L_p(\psi \mid X) = \max_{\lambda} L(\psi, \lambda \mid X) = L(\psi, \hat{\lambda}_\psi \mid X),

其中 $\hat{\lambda}_\psi$ 是给定 $\psi$ 下 $\lambda$ 的[最大似然估计](/wikis/最大似然估计)。然后基于 $L_p(\psi \mid X)$ 对 $\psi$ 推断。轮廓似然的渐近性质与普通似然类似，但小样本下可能存在偏差。

条件似然法

寻找关于 $\lambda$ 的充分统计量 $T$ ，使得给定 $T$ 的条件下样本的条件分布不再依赖于 $\lambda$ ，从而基于条件似然 $L_c(\psi \mid X, T)$ 推断 $\psi$ 。在指数族分布中特别有效。例如， $2 \times 2$ 列联表中分析优势比时，[Fisher精确检验](/wikis/Fisher精确检验)通过固定边际和来消除冗余参数。

边际似然法

在贝叶斯框架下对冗余参数积分：

L_m(\psi \mid X) = \int L(\psi, \lambda \mid X) \, \pi(\lambda \mid \psi) \, d\lambda,

其中 $\pi(\lambda \mid \psi)$ 是 $\lambda$ 在 $\psi$ 下的先验分布。

得分检验

[拉格朗日乘数检验](/wikis/拉格朗日乘数检验)仅需在原假设下估计模型，即在 $\psi = \psi_0$ 约束下估计 $\lambda$ ，避免了对无约束模型的估计。

冗余参数与推断精度

冗余参数的存在会增加关注参数估计的不确定性。以 $N(\mu, \sigma^2)$ 为例： $\sigma^2$ 已知时 $\hat{\mu}$ 方差为 $\sigma^2/n$ ；未知时使用 $t$ 分布，置信区间更宽，反映了估计 $\sigma^2$ 的代价。

从信息论角度，Fisher信息矩阵为：

I(\psi, \lambda) = \begin{pmatrix} I_{\psi\psi} & I_{\psi\lambda} \\ I_{\lambda\psi} & I_{\lambda\lambda} \end{pmatrix}.

$\lambda$ 已知时 $\psi$ 的 Fisher 信息量为 $I_{\psi\psi}$ ； $\lambda$ 未知时有效 Fisher 信息量为 $I_{\psi\psi} - I_{\psi\lambda} I_{\lambda\lambda}^{-1} I_{\lambda\psi}$ ，后者总是不大于前者。

面板数据中的冗余参数问题

在[面板数据](/wikis/面板数据)中，个体固定效应 $\alpha_i$ 是典型冗余参数。当 $T$ 固定而 $N \to \infty$ 时，冗余参数数量随样本量增长，导致偶然参数问题（incidental parameters problem）。固定效应 Logit 模型可通过条件似然消除 $\alpha_i$ ；线性面板模型则使用组内变换。

与半参数方法的关系

在半参数模型中，冗余参数可能是无穷维的 nuisance function。例如部分线性模型 $Y = X\beta + g(Z) + \varepsilon$ 中， $\beta$ 是有限维关注参数，非参数函数 $g(\cdot)$ 是冗余的。需使用非参数方法消除冗余成分，以得到 $\beta$ 的 $\sqrt{n}$ 一致估计量。

参见

[关注参数](/wikis/关注参数)
[最大似然估计](/wikis/最大似然估计)
[Fisher信息量](/wikis/Fisher信息量)
[充分统计量](/wikis/充分统计量)
[偶然参数问题](/wikis/偶然参数问题)
[面板数据](/wikis/面板数据)

参考文献

Cox, D. R. \& Reid, N. (1987). Parameter orthogonality and approximate conditional inference. *JRSS-B*, 49(1), 1–39.
Lehmann, E. L. \& Romano, J. P. (2005). *Testing Statistical Hypotheses* (3rd ed.). Springer.
Neyman, J. \& Scott, E. L. (1948). Consistent estimates based on partially consistent observations. *Econometrica*, 16(1), 1–32.
Severini, T. A. (2000). *Likelihood Methods in Statistics*. Oxford University Press.

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。