# 线性组合的分布 (Distribution of a Linear Combination)
在线性组合的分布这一主题中,我们探讨一个在{{{概率论}}}和{{{统计学}}}中极为核心的问题:当我们将多个{{{随机变量}}} (random variables) 通过加权求和(即线性组合)的方式结合起来时,这个新的随机变量的{{{概率分布}}}是什么样的。对这一问题的理解是掌握诸多高级统计概念,如{{{中心极限定理}}} (Central Limit Theorem)、{{{抽样分布}}} (sampling distribution) 以及金融中的{{{投资组合理论}}} (portfolio theory) 的基石。
一个随机变量的线性组合 (Linear Combination) 是指形如: $$ Y = a_1 X_1 + a_2 X_2 + \dots + a_n X_n = \sum_{i=1}^n a_i X_i $$ 的表达式。其中,$X_1, X_2, \dots, X_n$ 是 $n$ 个随机变量,而 $a_1, a_2, \dots, a_n$ 是已知的常数,被称为权重 (weights) 或系数 (coefficients)。
我们的核心任务是,在已知每个 $X_i$ 的概率分布以及它们之间相互关系(如{{{协方差}}}) 的情况下,确定 $Y$ 的概率分布及其关键特征,例如它的{{{期望}}} (expectation) 和{{{方差}}} (variance)。
## 通用性质:期望与方-差
无论构成线性组合的随机变量 $X_i$ 服从何种分布,其期望和方差都遵循明确的数学法则。这些法则是普适的,不要求变量是独立的或服从特定分布。
### 线性组合的期望
期望算子 $E[\cdot]$ 具有{{{线性}}}性质。这意味着线性组合的期望等于各随机变量期望的线性组合。
定理:对于任意随机变量 $X_1, \dots, X_n$ 和任意常数 $a_1, \dots, a_n$,线性组合 $Y = \sum_{i=1}^n a_i X_i$ 的期望为: $$ E[Y] = E\left[\sum_{i=1}^n a_i X_i\right] = \sum_{i=1}^n a_i E[X_i] $$ 这个性质极为强大,因为它不要求随机变量之间是{{{统计独立}}}的。
### 线性组合的方差
与期望不同,方差 $\text{Var}(\cdot)$ 不具备完全的线性。线性组合的方差不仅取决于每个随机变量自身的方差,还取决于它们两两之间的{{{协方差}}} (Covariance)。协方差度量了两个随机变量一同变化的趋势。
定理:对于任意随机变量 $X_1, \dots, X_n$ 和任意常数 $a_1, \dots, a_n$,线性组合 $Y = \sum_{i=1}^n a_i X_i$ 的方差为: $$ \text{Var}(Y) = \text{Var}\left(\sum_{i=1}^n a_i X_i\right) = \sum_{i=1}^n a_i^2 \text{Var}(X_i) + 2 \sum_{1 \le i < j \le n} a_i a_j \text{Cov}(X_i, X_j) $$ 这个公式可以被更紧凑地写作: $$ \text{Var}(Y) = \sum_{i=1}^n \sum_{j=1}^n a_i a_j \text{Cov}(X_i, X_j) $$ 这里我们利用了 $\text{Cov}(X_i, X_i) = \text{Var}(X_i)$。
特殊情况:独立的随机变量
当随机变量 $X_1, \dots, X_n$ 是相互独立的 (mutually independent) 时,它们之间的协方差为零,即对于所有 $i \neq j$,$\text{Cov}(X_i, X_j) = 0$。在这种重要的特殊情况下,方差公式得到极大简化:
$$ \text{Var}(Y) = \sum_{i=1}^n a_i^2 \text{Var}(X_i) $$ 这个简化的公式在实践中被广泛使用,因为在许多统计模型中,我们都假设样本数据是独立同分布的。
示例: 考虑两个相关的随机变量 $X$ 和 $Z$,令 $Y = 3X - 2Z$。 $E[Y] = 3E[X] - 2E[Z]$ $\text{Var}(Y) = 3^2\text{Var}(X) + (-2)^2\text{Var}(Z) + 2(3)(-2)\text{Cov}(X, Z) = 9\text{Var}(X) + 4\text{Var}(Z) - 12\text{Cov}(X, Z)$
## 特定分布族的线性组合
虽然期望和方差的公式是通用的,但线性组合 $Y$ 的确切概率分布形式则依赖于原始随机变量 $X_i$ 的分布族。只有少数分布族在线性组合下具有“封闭性”(closure property),即线性组合的结果仍然属于同一个分布族。
### 正态分布 (Normal Distribution)
{{{正态分布}}}是表现出最强封闭性的分布,这也是其在统计学中占据核心地位的原因之一。
定理:如果 $X_1, \dots, X_n$ 是独立的正态随机变量,其中 $X_i \sim N(\mu_i, \sigma_i^2)$,那么它们的任意线性组合 $Y = \sum_{i=1}^n a_i X_i$ 也服从正态分布。
$Y$ 的分布参数可以直接通过上述期望和方差公式计算得出: * 均值: $\mu_Y = E[Y] = \sum_{i=1}^n a_i \mu_i$ * 方差: $\sigma_Y^2 = \text{Var}(Y) = \sum_{i=1}^n a_i^2 \sigma_i^2$
因此,$Y \sim N\left(\sum a_i \mu_i, \sum a_i^2 \sigma_i^2\right)$。
拓展:这个性质可以推广到非独立的情况。如果随机向量 $(X_1, \dots, X_n)$ 服从{{{多元正态分布}}} (Multivariate Normal Distribution),那么它们的任意线性组合 $Y$ 仍然服从(一元)正态分布。
### 其他具有“可加性”的分布
对于其他一些常见的分布,其封闭性通常只在求和(即所有系数 $a_i=1$)且变量独立的情况下成立。这种性质更准确地称为可再生性 (reproducibility) 或可加性 (additivity)。
* {{{泊松分布}}} (Poisson Distribution): 如果 $X_i \sim \text{Poisson}(\lambda_i)$ 且相互独立,那么它们的和 $S = \sum X_i$ 服从泊松分布 $S \sim \text{Poisson}(\sum \lambda_i)$。 * {{{卡方分布}}} (Chi-squared Distribution): 如果 $X_i \sim \chi^2(k_i)$ 且相互独立,其中 $k_i$ 是自由度,那么它们的和 $S = \sum X_i$ 服从卡方分布 $S \sim \chi^2(\sum k_i)$。 * {{{伽马分布}}} (Gamma Distribution): 如果 $X_i \sim \text{Gamma}(\alpha_i, \beta)$ 且相互独立(注意:它们必须有相同的率参数 $\beta$),那么它们的和 $S = \sum X_i$ 服从伽马分布 $S \sim \text{Gamma}(\sum \alpha_i, \beta)$。 * {{{二项分布}}} (Binomial Distribution): 如果 $X_i \sim B(n_i, p)$ 且相互独立(注意:它们必须有相同的成功概率 $p$),那么它们的和 $S = \sum X_i$ 服从二项分布 $S \sim B(\sum n_i, p)$。
重要区别:除正态分布外,上述分布的封闭性通常不适用于系数 $a_i$ 不全为1的任意线性组合。例如,若 $X$ 服从泊松分布,则 $2X$ 不再服从泊松分布。
## 确定分布的方法
当一个线性组合的分布形式不明显时,我们可以使用一些更通用的数学工具来推导它。
### 矩生成函数法 (Moment-Generating Function, MGF)
{{{矩生成函数}}} (MGF) 是一个强大的工具,其定义为 $M_X(t) = E[e^{tX}]$。
核心性质: 1. 唯一性: 如果两个随机变量的MGF在 $t=0$ 的一个邻域内相等,那么它们的概率分布也相同。 2. 独立变量线性组合的MGF: 如果 $X_1, \dots, X_n$ 相互独立,且 $Y = \sum_{i=1}^n a_i X_i$,那么 $Y$ 的MGF是: $$ M_Y(t) = \prod_{i=1}^n M_{X_i}(a_i t) $$
通过计算出 $M_Y(t)$ 的表达式,然后将其与已知分布的MGF形式进行匹配,我们就可以确定 $Y$ 的分布。例如,可以用此方法轻易地证明正态分布、泊松分布等的可加性。
### 卷积法 (Convolution)
对于两个独立随机变量的和 $Z = X+Y$,如果它们是连续的,其{{{概率密度函数}}} (PDF) $f_Z(z)$ 可以通过{{{卷积}}}积分得到: $$ f_Z(z) = \int_{-\infty}^{\infty} f_X(x) f_Y(z-x) \,dx $$ 对于离散变量,卷积则是一个求和的形式。这种方法在概念上清晰,但计算上通常比MGF法更复杂,且不易推广到多于两个变量的组合。
## 应用实例
线性组合的分布理论在许多领域都有着至关重要的应用。
* 统计推断 (Statistical Inference): 在进行{{{假设检验}}}或构造{{{置信区间}}}时,我们常常需要知道{{{样本均值}}} $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$ 的分布。由于 $\bar{X}$ 是随机样本 $X_i$ 的一个线性组合(其中 $a_i = 1/n$),其分布特性可以直接从本文讨论的理论中导出。例如,如果从一个 $N(\mu, \sigma^2)$ 的总体中抽样,那么样本均值将精确服从 $N(\mu, \sigma^2/n)$。
* 金融学 (Finance): 在{{{现代投资组合理论}}}中,一个投资组合的总回报率被建模为单个资产回报率的加权平均。设 $R_i$ 是资产 $i$ 的回报率,$w_i$ 是其在组合中的权重,则组合回报率 $R_p = \sum w_i R_i$ 是一个线性组合。理解 $R_p$ 的期望(预期回报)和方差(风险)是进行{{{资产配置}}}和风险管理的核心。资产之间的协方差在计算组合风险时起着决定性作用。