ARTICLE
测量尺度
测量尺度 (Scales of Measurement / Levels of Measurement) 测量尺度→统计学与计量经济学中变量属性分类框架→心理学家Stanley Smith Stevens于1946年《Science》发表On the Theory of Scales of Measurement正式提出→将数据按信息丰富度划分为四个递进层级
测量尺度 (Scales of Measurement / Levels of Measurement)
测量尺度→统计学与计量经济学中变量属性分类框架→心理学家Stanley Smith Stevens于1946年《Science》发表On the Theory of Scales of Measurement正式提出→将数据按信息丰富度划分为四个递进层级:定类 (Nominal)、定序 (Ordinal)、定距 (Interval)、定比 (Ratio)。该分类决定每类变量所适用的描述统计量、可视化方法与推断统计(假设检验)工具选择,是实证研究设计的基石。
四层尺度体系详解
一、定类尺度 (Nominal Scale):最低信息层级→仅按属性将对象归入互斥且穷尽的类别→无顺序、无大小、无可加性。允许的操作:相等性判断(、)。示例:性别(男女)、血型(A/B/AB/O)、国籍、行业代码(SIC/NAICS)、颜色。核心描述统计限于频数、众数(唯一有意义的集中趋势测度)及各类别比例。可视化适用条形图、饼图。推理仅用非参数法:卡方检验(独立性/拟合优度)、Fisher精确检验。禁止:均值、中位数、加减乘除。
二、定序尺度 (Ordinal Scale):在类别基础上引入全序关系(、、)→对象可排优劣高低,但相邻等级间距未必相等。示例:教育程度(小学<中学<本科<研究生)、满意度Likert量表(1-5分)、比赛名次、信用评级(AAA>AA>A>BBB)。允许:中位数、百分位数、Spearman秩相关系数、Kendall τ、Mann-Whitney U检验、Kruskal-Wallis检验。禁止:加减运算("满意"减"一般"无定义)、均值的严格解释(虽然实践中常被近似使用,见后文争议)。可视化适用箱线图、累积分布图。
三、定距尺度 (Interval Scale):除序关系外,任意两值之差具有可比性→等距单位成立→但无绝对零点(零点为人为约定,非"属性不存在")。此特性使加减法合法而比值无意义。示例:摄氏与华氏温度(为水冰点而非"无热")、IQ分数(均值100、标准差15的设计标尺)、日历日期(公元纪年零点为约定)。允许:加减、算术均值、方差、标准差、Pearson相关系数、t检验、ANOVA、线性回归。禁止:比值陈述(不可称为"的两倍热度"),但温差比值有意义。
四、定比尺度 (Ratio Scale):最高层级→兼具等距单位与绝对零点(零点对应属性的客观不存在)。该零点使比值合法且可诠释。示例:身高、体重、年龄、收入、价格、数量、开尔文温度(0K即绝对零度,分子运动停止)、利率、持续时间。允许全部算术运算与统计方法→均值、几何均值、变异系数均合法。几乎所有经济学核心变量(GDP、消费、投资、货币供给)均为定比尺度。
层级嵌套与降级使用
四层尺度呈严格嵌套包含:定比定距定序定类。每一高层级自动继承低层级全部信息特征并增添新的约束条件。据此有一条实用原则:高尺度数据可安全降级(将定比收入按区间编码为定序收入档),但低尺度数据不可升级(不能将定序满意度视同定距进行均值比较而不做论证)。这种降级在计量经济学中常见:引入虚拟变量表示定类分组,或将连续变量离散化为分段常数函数以捕捉非线性效应。
争议、批评与实践灵活
Stevens分类虽为教科书标准,但在方法论与实践中持续受检视。核心批评有三:其一,Lord (1953)的"橄榄球号码悖论"指出,即使定类"号码"经统计检验也可拒绝零假设,暗示尺度归属不应机械决定方法;其二,心理测量学中Likert量表得分常被当作定距变量使用(计算Cronbach's 、因子分析),虽严格上仅为定序;其三,Velleman与Wilkinson (1993)在The American Statistician撰文主张尺度选择应服从研究问题的实质内涵,而非对Stevens分类做教条式套用。计量实践中,稳健做法是:先报告数据原生尺度,若升格使用(定序定距方法)则附稳健性检验或非参数对照。