# 连续随机变量 (Continuous Random Variable)
连续随机变量 (Continuous Random Variable) 是{{{概率论}}}和{{{统计学}}}中的一个基本概念,用于描述其可能取值可以覆盖一个或多个区间的{{{随机变量}}}。与只能取有限个或可数无穷个离散值的{{{离散随机变量}}}不同,连续随机变量可以在一个给定的范围内取任意实数值。
从更严格的{{{测度论}}}角度来看,如果一个随机变量的{{{累积分布函数}}}是{{{连续函数}}},那么这个随机变量就是连续随机变量。
## 核心特征
一个连续随机变量 $X$ 的最核心、也最违反直觉的特征是:它取任何一个特定值的概率都为零。
$$ P(X = c) = 0, \quad \text{对于任意常数 } c $$
这个概念的理解至关重要。我们可以这样理解:在一个连续的区间(例如 $[0, 1]$)内,存在着无穷多个实数。如果我们给其中任何一个特定的数值(比如 $0.5$)分配一个大于零的概率,那么为了使所有无穷多个点的概率之和等于1(概率公理的要求),这个总和将发散到无穷大,这与概率的定义相矛盾。因此,对于连续随机变量,我们不讨论其在某一个“点”的概率,而是讨论其落入某一个“区间”的概率。
例如,一个随机生成的身高(以米为单位),我们关心它在 $1.70$ 米到 $1.80$ 米之间的概率 $P(1.70 \le X \le 1.80)$,而不是它恰好等于 $1.7500000$...$$ 米的概率。
由于 $P(X=c)=0$,因此对于连续随机变量 $X$ 和任意常数 $a,b$ ($a < b$),以下四个区间的概率是相等的: $$ P(a \le X \le b) = P(a < X \le b) = P(a \le X < b) = P(a < X < b) $$ 这一点与离散随机变量有着本质区别。
## 概率密度函数 (Probability Density Function, PDF)
由于无法为单个点分配概率,我们引入一个新工具来描述连续随机变量的概率分布,这就是概率密度函数 (Probability Density Function),通常记为 $f(x)$ 或 $f_X(x)$。
PDF 本身不是概率。$f(x)$ 的值可以大于1。它描述的是随机变量在点 $x$ 附近的“概率密度”或“概率集中程度”。一个点 $x$ 对应的 $f(x)$ 值越大,意味着随机变量的取值落在 $x$ 附近的微小区间内的概率就越大。
连续随机变量 $X$ 落在区间 $[a, b]$ 内的概率,等于其PDF曲线在 $[a, b]$ 区间上与x轴围成的面积。这个面积通过{{{积分}}}计算得到: $$ P(a \le X \le b) = \int_a^b f(x) \, dx $$
一个合法的PDF必须满足以下两个条件: 1. 非负性:对于所有可能的取值 $x$,函数值必须为非负。 $$ f(x) \ge 0 $$ 2. 归一性:PDF曲线下的总面积必须等于1。这意味着随机变量的所有可能取值构成的总概率为1。 $$ \int_{-\infty}^{\infty} f(x) \, dx = 1 $$
## 累积分布函数 (Cumulative Distribution Function, CDF)
与离散随机变量一样,连续随机变量也有累积分布函数 (Cumulative Distribution Function),记为 $F(x)$ 或 $F_X(x)$。它被定义为随机变量 $X$ 的取值小于或等于 $x$ 的概率。
$$ F(x) = P(X \le x) $$
CDF是通过对PDF从负无穷到 $x$ 进行积分得到的: $$ F(x) = \int_{-\infty}^x f(t) \, dt $$ 其中 $t$ 是一个虚拟的积分变量。
从这个关系可以看出,CDF是PDF的积分,反之,PDF是CDF的导数(在CDF可导的点上): $$ f(x) = \frac{dF(x)}{dx} = F'(x) $$
CDF 非常有用,因为它可以方便地计算任意区间的概率: $$ P(a < X \le b) = F(b) - F(a) $$
CDF $F(x)$ 具有以下通用属性: 1. 范围:$0 \le F(x) \le 1$。 2. 单调性:$F(x)$ 是一个非递减函数。如果 $x_1 < x_2$,则 $F(x_1) \le F(x_2)$。 3. 极限:$\lim_{x \to -\infty} F(x) = 0$ 且 $\lim_{x \to \infty} F(x) = 1$。 4. 连续性:对于连续随机变量,其CDF是连续函数。
## 期望与方差 (Expected Value and Variance)
连续随机变量的{{{期望值}}}(或均值)和{{{方差}}}的定义与离散型类似,但求和符号 $\Sigma$ 被积分符号 $\int$ 替代。
#### 期望值 (Expected Value)
{{{期望值}}} $E[X]$ 是随机变量的“长期平均值”,由其所有可能取值 $x$ 按其概率密度 $f(x)$ 加权平均得到。
$$ E[X] = \mu_X = \int_{-\infty}^{\infty} x f(x) \, dx $$
#### 方差 (Variance)
{{{方差}}} $\text{Var}(X)$ 衡量随机变量取值的分散程度,即其取值偏离其期望值的平均平方距离。
$$ \text{Var}(X) = \sigma^2_X = E[(X - \mu_X)^2] = \int_{-\infty}^{\infty} (x - \mu_X)^2 f(x) \, dx $$
在实际计算中,使用下面的公式通常更为便捷: $$ \text{Var}(X) = E[X^2] - (E[X])^2 $$ 其中,$E[X^2]$ 的计算方式为: $$ E[X^2] = \int_{-\infty}^{\infty} x^2 f(x) \, dx $$
## 常见的连续概率分布
在统计学和相关领域中有许多重要的连续概率分布,每种分布都适用于描述特定类型的随机现象。
* {{{均匀分布}}} (Uniform Distribution):在指定区间 $[a, b]$ 内,所有值的概率密度都相等。 * {{{正态分布}}} (Normal Distribution):也称高斯分布,是自然界和科学研究中最常见的分布,其PDF呈钟形曲线。它是{{{中心极限定理}}}的核心。 * {{{指数分布}}} (Exponential Distribution):常用于描述独立随机事件发生的时间间隔,如设备寿命或客户到达时间。 * {{{卡方分布}}} (Chi-squared Distribution), {{{t-分布}}} (t-Distribution), 和 {{{F-分布}}} (F-Distribution):这些是由正态分布派生出的抽样分布,在{{{假设检验}}}和{{{置信区间}}}的构建中至关重要。
## 与离散随机变量的对比
| 特征 | 离散随机变量 | 连续随机变量 | | --- | --- | --- | | 可能取值 | 有限个或可数无穷个 (如 $0, 1, 2, $...$$) | 不可数无穷个,覆盖一个或多个区间 (如 $[0, 1]$) | | 概率描述 | {{{概率质量函数}}} (PMF), $p(x) = P(X=x)$ | {{{概率密度函数}}} (PDF), $f(x)$ | | 单点概率 | $P(X=x)$ 可以大于 0 | $P(X=x) = 0$ | | 区间概率 | $P(a \le X \le b) = \sum_{x=a}^b p(x)$ | $P(a \le X \le b) = \int_a^b f(x) \, dx$ | | 不等号 | $P(X \le b)$ 与 $P(X < b)$ 通常不同 | $P(X \le b) = P(X < b)$ | | CDF | 阶梯函数,不连续 | 连续函数 | | 期望值 | $E[X] = \sum_x x \cdot p(x)$ | $E[X] = \int x \cdot f(x) \, dx$ | | 核心运算 | 求和 (Summation, $\Sigma$) | 积分 (Integration, $\int$) |