观察频数 (Observed Frequency)
观察频数(Observed Frequency),通常记为 O 或 Oi,是统计学与概率论中的基本概念,指在随机抽样或实验过程中,某一特定事件、类别或取值在样本中实际出现的次数。观察频数与期望频数构成统计推断的核心对比对,尤其在卡方拟合度检验和独立性检验中,两者的偏离程度直接构成检验统计量的基础。
定义与数学表示
设随机样本包含 n 个观测值,每个观测值可被归类到 k 个互斥且完备的类别之一。令 Oi 表示落入第 i 类的实际观测次数(i=1,…,k),则:
i=1∑kOi=n
观察频数 Oi 本身是随机变量,其抽样性质取决于总体的真实类别概率。若第 i 类在总体中的真实概率为 pi,则 Oi 服从二项分布或更广义的多项分布:在独立同分布抽样下,(O1,…,Ok)∼Multinomial(n,p1,…,pk)。
期望频数 Ei=n⋅pi,代表理论计数。观察频数与期望频数的对比是判断样本是否来自假定总体的关键。
皮尔逊卡方统计量
在皮尔逊卡方检验中,检验统计量为:
χ2=i=1∑kEi(Oi−Ei)2
该统计量在大样本下近似服从自由度为 k−1−m 的卡方分布,m 为估计参数个数。Karl Pearson 于 1900 年首次提出该框架。
列联表分析
对 r×c 列联表,Oij 表示第 i 行第 j 列的观察频数。独立性假设下期望频数为:
Eij=nRi⋅Cj
其中 Ri=∑jOij,Cj=∑iOij。检验自由度 (r−1)(c−1)。
使用条件与注意事项
样本量:所有 Ei≥5 且 n≥30。小期望频数时使用费雪精确检验或合并相邻类别。非整数期望:Ei 通常非整数,无需四舍五入。观察频数非概率:Oi 是绝对计数而非比例。关联非因果:显著 χ2 仅表明观察模式与独立性不一致,需结合克莱姆V系数等进一步考察。
观察频数与期望频数的对比是非参数统计与分类数据分析的核心分析框架,在社会科学和生物统计学中应用广泛。