ARTICLE
定序尺度
定序尺度 (Ordinal Scale) 定序尺度(Ordinal Scale),又称顺序尺度或等级尺度,是测量尺度(Levels of Measurement)分类中的第二等级,由心理学家 S. S. Stevens 于 1946 年在其经典论文《On the Theory of Scales of Measurement》中系统定义。定序尺度不仅具备定类
定序尺度 (Ordinal Scale)
定序尺度(Ordinal Scale),又称顺序尺度或等级尺度,是测量尺度(Levels of Measurement)分类中的第二等级,由心理学家 S. S. Stevens 于 1946 年在其经典论文《On the Theory of Scales of Measurement》中系统定义。定序尺度不仅具备定类尺度(Nominal Scale)的类别区分功能,还引入了类别间的相对次序关系——即可以判定不同类别之间"大于"或"小于"的关系,但无法量化相邻类别之间的精确差异大小。定序尺度是社会科学、经济学、市场研究和医学领域中应用最为广泛的测量层次之一,其核心价值在于在仅保留排序信息的前提下,仍然能够进行有意义的统计推断。
定序尺度的数学结构
从数学角度看,定序尺度的测量值仅保留序数性质(Ordinal Properties)。若用 表示定序变量, 和 为两个观测值,则定序尺度满足以下关系:
- 可区分性:可判断 或 (继承定类尺度的功能)。
- 可排序性:可判断 、 或 (序关系的三分性)。
- 传递性:若 且 ,则 。
然而,定序尺度不保留距离信息。对于任意保序变换(Monotonic Transformation) 作用于所有观测值,若 严格单调递增,则变换前后的序关系完全等价。这意味着定序尺度在数学上仅定义到保序变换群(Monotonic Transformation Group)的层次,区别于定距尺度(Interval Scale)的线性变换群和定比尺度(Ratio Scale)的相似变换群。简言之,若将满意度评分从 重新编码为 ,只要保留原有顺序,定序尺度的全部信息并未损失。
典型实例
经济学与社会科学中,定序尺度随处可见:
- 李克特量表(Likert Scale):最常见的社会调查工具,要求受访者对陈述表明态度,如"非常不同意"、"不同意"、"中立"、"同意"、"非常同意"。这五个选项构成典型定序变量——我们知道"同意"强于"中立",但无法断言"非常同意"与"同意"之间的态度差距等于"同意"与"中立"之间的差距。在实践应用中,研究者常将五点李克特量表直接赋值为 1\~5 并当作连续变量处理,这一做法在计量经济学中颇具争议。
- 教育程度:如"初中"、"高中"、"本科"、"硕士"、"博士"构成有序分类。教育年限虽可等距测量,但学位等级本身仅为序数关系。
- 社会经济地位:将人群分为"低"、"中"、"高"三档,反映了收入与社会地位的层次关系,是分层研究中常用的简化分类。
- 信用评级:AAA、AA、A、BBB、BB、B、CCC 等评级构成标准的序数排列,评级机构仅保证顺序而非级差相等——AAA 与 AA 之间的违约风险差异远小于 B 与 CCC 之间的差异。
- 竞赛排名:第一名、第二名、第三名是纯粹序数信息,冠军与亚军的实际成绩差距可能极小也可能巨大。
适用的统计方法
定序尺度的统计处理需谨慎,因其不满足等距假定,许多参数统计方法(如计算算术平均数、进行 t 检验)在逻辑上并不适用。适用的方法包括:
描述统计
- 众数(Mode):最常见类别,反映最集中的定性趋势。
- 中位数(Median):位于排序序列中间的类别,是定序数据的最佳中心趋势度量,因它仅依赖排序而非具体数值。
- 百分位数(Percentiles):如第 25、第 75 百分位,给分布的分位位置。
- 频数分布与柱状图:展示各类别的频次或百分比,是定序数据最直观的可视化方式。
需特别注意:定序数据的算术平均数缺乏数学合法性,因为类别间的编码数字(如 1\~5)仅为标签而非真实数量,对它们求和再取均值隐含了等距的假定。教育程度的例子尤其能说明问题——若将"高中"=1、"本科"=2、"硕士"=3,则平均教育程度为 2.3 并无实际意义,因为"硕士"与"本科"之间的知识差距未必等于"本科"与"高中"之间的差距。
推断统计
- 秩和检验(Wilcoxon Rank-Sum Test / Mann-Whitney U Test):比较两组定序数据分布差异的非参数检验,是独立样本 t 检验的非参数替代。
- 符号秩检验(Wilcoxon Signed-Rank Test):配对设计下两组定序数据的比较,等效于配对 t 检验的非参数版本。
- 克鲁斯卡尔-沃利斯检验(Kruskal-Wallis Test):多组定序数据的非参数方差分析,是单因素方差分析(ANOVA)的序数替代。
- 斯皮尔曼秩相关系数(Spearman's Rank Correlation Coefficient, ):衡量两个定序变量间单调关系的强度,取值范围 ,对异常值具有稳健性。
- 肯德尔秩相关系数(Kendall's Tau, ):另一种秩相关度量,对小样本和含结(Tied Ranks)的数据表现更稳定,且对偏态分布更不敏感。
这些方法仅依赖于数据的秩次(Rank Order)而非原始数值,因此与定序尺度完全兼容,在统计功效上虽略低于对应的参数方法,但具有很强的稳健性和通用性。
在测量尺度体系中的位置
Stevens 的四层次测量体系——定类、定序、定距、定比——构成嵌套递进结构。定序尺度在定类的基础上增加排序信息,牺牲了定距尺度所需的等距性和定比尺度所需的绝对零点。在实际研究中,定序变量与定距变量的界限有时存在争议。例如,5 点或 7 点李克特量表的原始得分经常被当作定距数据直接进入回归分析或因子分析,这一做法虽有广泛学术争议,但大量研究表明在适当条件下(如对称分布、选项数 ≥ 5、样本量较大)其偏差在可接受范围内。计量经济学家倾向于使用有序逻辑回归(Ordered Logistic Regression)或有序概率回归(Ordered Probit Regression)来恰当地处理定序因变量。
经济与金融中的应用
在经济调查中,消费者信心指数、商业景气指数等多源于定序问卷,汇总后常被视为连续变量处理,需注意其原始数据的序数性质。在劳动经济学中,工作满意度、职业声望评分等核心变量本质为定序测量。在市场营销中,品牌偏好排序(如"请将以下品牌按喜好程度排序")产生纯序数数据,适合使用秩相关和逻辑回归(Logistic Regression)分析。行为经济学领域的实验研究大量依赖定序尺度的测量工具,如风险偏好等级和跨期选择偏好排序。
局限与注意事项
定序尺度的主要局限在于信息损失。将连续变量粗化为有序类别(如将精确收入转换为"低收入/中等收入/高收入")会丢弃大量信息,降低统计功效和效应量的检测能力。此外,对定序变量的编码(如将"低"=1、"中"=2、"高"=3)虽是常见操作,但这组数字的选择具有任意性——改用 1、10、100 的编码不影响任何基于秩次的非参数分析结果,但若误将其作为定距数据使用,则编码选择会直接影响回归系数的估计。研究者应始终明确:定序数据的数字编码仅代表排序关系,不具算术运算的数学基础,在实践中应依据变量性质和研究目的审慎选择统计方法。