ARTICLE
点二列相关系数
\% 点二列相关系数(point-biserial correlation coefficient)是一种衡量二元变量与连续变量之间线性相关程度的统计量。它本质上是皮尔逊积矩相关系数的特例,适用于其中一个变量为天然二分变量(如性别、通过/未通过),另一个变量为连续变量(如考试成绩、反应时间)的情形。在心理测量学和教育评估中,点二列相关系数被广泛用于评估测验项
\%}
点二列相关系数(point-biserial correlation coefficient)是一种衡量二元变量与连续变量之间线性相关程度的统计量。它本质上是皮尔逊积矩相关系数的特例,适用于其中一个变量为天然二分变量(如性别、通过/未通过),另一个变量为连续变量(如考试成绩、反应时间)的情形。在心理测量学和教育评估中,点二列相关系数被广泛用于评估测验项目的区分度,即某一题目能否有效地区分高分组和低分组的被试。
定义与基本公式
设 为连续变量, 为二元变量(通常编码为 和 )。点二列相关系数 的定义式为:
其中, 是 组中 的均值, 是 组中 的均值, 是 的样本标准差, 为 组所占比例,。上述公式可以等价地表示为皮尔逊相关系数的标准形式,表明点二列相关系数并不引入任何新的数学概念,而是皮尔逊相关系数在特定数据情境下的自然应用。
点二列相关系数的取值区间为 。当 时,表示两组数据完全分离且所有 组中的 值均大于 组中的 值; 表示两组在连续变量上不存在均值差异。符号仅反映编码方向,绝对值的大小才是关联强度的关键指标。
与二列相关系数的区别
点二列相关系数容易与二列相关系数(biserial correlation)混淆。二列相关系数假设潜在的连续变量服从正态分布,而观察到的二元变量是对该潜在变量进行人为阈值分割的结果。相比之下,点二列相关系数适用于天然二分变量,不对潜在分布做出正态性假设。在数值上,二列相关系数的绝对值通常大于点二列相关系数,因为它对人为二分造成的信息损失进行了校正。
假设条件
点二列相关系数的有效性依赖于以下假设。第一,连续变量 在两组内的分布应当具有同方差性,即两组方差大致相等;若方差异较大,相关系数的估计可能产生偏误。第二,连续变量在每组内部应近似服从正态分布,尽管该条件对点二列相关系数的稳健性较强,中度偏离仍可接受。第三,观测值之间相互独立,这对基于假设检验的显著性判断尤为重要。第四,两组之间在连续变量上应存在线性关系——尽管二元变量只有两个取值点,线性假设仍体现在均值差异的方向一致性上。违背这些假设时,可能会高估或低估真实的关联程度。
假设检验
点二列相关系数的显著性可通过 检验进行判断:
该统计量服从自由度为 的 分布。原假设 表示总体中点二列相关系数为零。这一检验与对两组均值的独立样本 检验在数学上是等价的——两种方法的 值完全一致,反映点二列相关系数的实质是检验两组在连续变量上的均值差异是否显著。
效应量解释
在效应量的解释上,点二列相关系数可以套用皮尔逊相关系数的经验准则: 为小效应, 为中等效应, 为大效应。在心理测量学的项目分析中,有更为精细的判断标准: 通常被认为是良好的区分度;介于 和 之间表示可接受但需要改进;低于 则表明区分度不足。需要注意的是,点二列相关系数作为区分度指标时,会受到题目难度( 值)的影响:当难度处于极端水平时, 的上限会被压缩,研究者应结合难度指标综合判断。
应用场景
点二列相关系数的应用范围涵盖多个领域。在教育测量中,它被广泛用于标准化考试的项目分析,将每题得分与总分计算点二列相关以评估区分度。在心理量表开发中,可用于评估条目与量表总分的一致性。在临床诊断中,可用于衡量生物标志物与疾病状态的关联。在经济学中,可用于分析政策实施与经济指标之间的相关性。在机器学习特征选择中,可作为筛选二分类目标与数值型特征线性关系的快捷工具。
局限性与注意事项
使用点二列相关系数时需要注意以下局限性。首先,它仅能捕捉线性关系,无法检测非线性关联——如果两组均值相近但分布形态不同,相关系数可能接近于零,从而低估真实关联。其次,它对异常值较为敏感,尤其是小样本情况下,一个极端值就可能导致相关系数发生显著变化。第三,编码方式会影响符号但不影响绝对值,翻转编码后解读应保持一致。第四,样本量不均衡( 接近0或1)时,估计的稳定性下降。最后,点二列相关系数描述的是相关关系而非因果关系——即使观测到较强的相关也无法断定二元变量与连续变量之间存在因果作用。
计算示例
假设10名学生的总分与其在某选择题上的作答情况(1=答对,0=答错)。答对组总分的均值为85,答错组为70,全体总分的标准差为10,答对比例0.5。代入公式:
该结果表明本题具有良好的区分度,在该题上答对的学生总分显著高于答错的学生。
总结
点二列相关系数是一个简洁而实用的统计工具,它将皮尔逊相关系数的思想延伸至二元变量的情形,在教育测量、心理统计和生物医学研究中扮演着重要角色。其计算简单、解释直观,与 检验在理论上相互贯通。正确理解其假设条件、适用范围与局限性,有助于研究者做出准确的数据推断,避免误用和滥用。