ARTICLE
离散随机变量
离散随机变量 (Discrete Random Variable) 在 概率论 和 统计学 中,随机变量 (Random Variable) 是核心概念之一。它是一个将 样本空间(即随机试验所有可能结果的集合)中的每个结果映射到实数值的函数。简而言之,它的取值由随机事件的结果决定。随机变量分为两大类:离散随机变量和 连续随机变量。 离散随机变量 (Discr
离散随机变量 (Discrete Random Variable)
在 概率论 和 统计学 中,随机变量 (Random Variable) 是核心概念之一。它是一个将 样本空间(即随机试验所有可能结果的集合)中的每个结果映射到实数值的函数。简而言之,它的取值由随机事件的结果决定。随机变量分为两大类:离散随机变量和 连续随机变量。
离散随机变量 (Discrete Random Variable) 是指其可能取值为有限个或可数无穷个的随机变量。"可数"意味着所有可能的取值可以被一一列举,如同整数 一般。
典型例子:
- 掷一枚六面骰子的点数:取值集合为 ,是 有限的。
- 抛掷硬币 10 次,正面朝上的次数:取值集合为 ,是 有限的。
- 某一小时内到达银行的客户数量:取值集合为 ,是 可数无穷的——因为理论上客户数没有上限,但可以逐一计数。
与之相对的,连续随机变量 (Continuous Random Variable) 可取某一区间内的任意实数值,其可能取值是不可数的。例如,一个人的身高、室外温度或股票收益率——这些量可以在一个连续区间内取无穷多个值。
概率质量函数 (PMF)
概率质量函数 (Probability Mass Function, PMF) 是描述离散随机变量概率分布的核心工具。它将随机变量的每一个可能取值映射到该值出现的概率。记随机变量为 ,其 PMF 通常记为 或 。
合法的 PMF 必须满足两个条件:
- 对每个可能的取值 ,概率值必须在 0 和 1 之间:。
- 所有可能取值 的概率之和等于 1: \[ \sum_{i=1}^{n} P(X=x_i) = 1 \] 若可能取值为可数无穷,则上式变为无穷级数求和。
示例(公平六面骰子):令 表示骰子的点数,其可能取值为 。由于骰子是公平的,每个点数出现的概率相等,因此 PMF 为 ()。容易验证:。
累积分布函数 (CDF)
累积分布函数 (Cumulative Distribution Function, CDF) 描述随机变量 的取值不超过某一特定值 的概率,对离散和连续随机变量均有定义:
对于离散随机变量,CDF 是对 PMF 的累加求和:
离散随机变量的 CDF 具有如下特征:
- 它是 非递减函数,且为 阶梯函数 (Step Function)。
- 在每个可能取值点发生跳跃,跳跃高度等于该点的概率质量:。
- 当 时,;当 时,。
示例(公平骰子):
- 若 ,
- 若 ,
- 若 ,
- 若 ,
该函数在 六个点上发生跳跃,每次跳跃高度均为 。
期望 (Expected Value)
期望 (Expected Value),也称 均值 (Mean),是离散随机变量所有可能取值按其概率加权的平均,反映该变量在大量重复试验中的长期平均表现:
示例(公平骰子):
注意,期望值 3.5 本身并非一个可能的试验结果,但它准确刻画了该分布的中心位置——设想反复掷骰子并记录平均值,结果将趋近 3.5。
期望具有线性性质:对任意常数 和随机变量 ,有 。这一性质在统计推断与计量经济学中极为重要。
方差与标准差 (Variance and Standard Deviation)
方差 (Variance) 衡量随机变量取值相对于其期望的离散程度,方差越大表示数据越分散:
计算中常用以下简化公式:
标准差 (Standard Deviation) 是方差的算术平方根 。标准差与随机变量本身量纲相同,因此在实际解释中比方差更直观。
示例(公平骰子):
常见离散概率分布
许多现实随机现象遵循经典的离散分布模型,以下为最常用的几种:
- 伯努利分布 (Bernoulli Distribution):描述单次只有两种结果(成功/失败)的试验。例如抛一次硬币的结果。
- 二项分布 (Binomial Distribution): 次独立 伯努利试验 中成功的总次数。例如抛 10 次硬币正面朝上的次数,记为 。
- 泊松分布 (Poisson Distribution):固定时间或空间单位内某随机事件发生的次数。例如网站服务器每分钟收到的请求数,常记为 。
- 几何分布 (Geometric Distribution):一系列独立伯努利试验中,为获得首次成功所需的试验次数。例如反复掷骰子直到第一次出现 6 点所需的次数。
- 超几何分布 (Hypergeometric Distribution):从有限总体中进行不放回抽样时,样本中具有特定特征的个体数。例如从一副扑克牌中抽取 5 张,其中 A 牌的数量。
与连续随机变量的对比
离散与连续随机变量的核心区别不在于取值的有限性,而在于概率的描述方式。离散情形用 PMF 直接给出单点概率,而连续情形下,单点的概率恒为零——必须通过 概率密度函数 (Probability Density Function, PDF) 和积分来描述区间概率。此外,离散变量的 CDF 呈阶梯状,连续变量的 CDF 则是光滑连续曲线。
高阶矩与分布特征
除期望(一阶矩)和方差(二阶中心矩)外,离散随机变量的分布特征还可通过更高阶矩来刻画。偏度 (Skewness) 基于三阶中心矩度量分布的非对称性:正偏意味着右尾更长,大部分概率质量集中在左侧;负偏则相反。峰度 (Kurtosis) 基于四阶中心矩描述分布的尾部厚度——高峰度意味着极端值出现的概率较正态分布更大。对于离散分布而言,泊松分布是右偏的(偏度 ),而对称的二项分布在 时偏度为零。这些数字特征在选择模型和诊断数据分布时具有重要参考价值。
离散随机变量是概率论的基石概念,理解其定义与性质是掌握 概率分布、统计推断 和计量经济学方法论的基础,也是学习 随机过程 以及金融工程中 期权定价 二叉树模型等进阶内容的前提。