ARTICLE
智商
智商 (Intelligence Quotient, IQ) 智商 (Intelligence Quotient,简称 IQ) 是通过标准化测试得出的、衡量个体认知能力在同龄群体中相对位置的量化指标。它是一个以 100 为均值、通常以 15 为标准差的 正态分布 随机变量,旨在将"智力"这一潜在特质映射为可比较的数值。 起源与定义 智商的概念起源于法国心理学
智商 (Intelligence Quotient, IQ)
智商 (Intelligence Quotient,简称 IQ) 是通过标准化测试得出的、衡量个体认知能力在同龄群体中相对位置的量化指标。它是一个以 100 为均值、通常以 15 为标准差的 正态分布 随机变量,旨在将"智力"这一潜在特质映射为可比较的数值。
起源与定义
智商的概念起源于法国心理学家 Alfred Binet 在 1905 年开发的比奈-西蒙量表,用以识别需要特殊教育的儿童。1912 年,德国心理学家 William Stern 首次提出"智力商数"一词,定义为:
此后,Lewis Terman 将比奈量表修订为斯坦福-比奈量表,并推广了比率 IQ 公式。然而,比率 IQ 对不同年龄段方差不等的问题使得其逐渐被 离差智商 (Deviation IQ) 取代——后者直接将个体得分标准化为均值为 100、标准差为 15(或 16,如斯坦福-比奈)的正态分布。这一标准化方法的核心在于:
其中 为原始得分, 与 分别为同龄常模的均值与标准差。
测量工具与结构
现代主流 IQ 测试包括:
- 韦克斯勒成人智力量表 (WAIS):将智力分解为言语理解、知觉推理、工作记忆和加工速度四个指数,并结合为全量表智商 (FSIQ)。
- 斯坦福-比奈智力量表 (SB5):基于 CHC 理论(Cattell-Horn-Carroll),涵盖流体推理、知识、数量推理、视觉空间加工和工作记忆五个因子。
- 瑞文推理测验 (Raven's Matrices):非语言测试,侧重 流体智力 (Fluid Intelligence),广泛应用于跨文化比较。
这些测试的共同理论基础是 Charles Spearman 提出的 g 因子 (General Factor)。Spearman 发现,不同认知测试之间的得分呈正相关,这一共同方差可由单一潜在因子 g 解释。后续的 John B. Carroll 将智力结构层次化为三层:g 因子位于顶层,八大广泛能力(如流体智力 、晶体智力 )居中,具体测验得分在底层。
统计性质与分布
IQ 分数在人群中近似服从 的正态分布。约有 68\% 的人口 IQ 落在 85–115 之间,95\% 落在 70–130 之间。极端区间的概率密度急剧下降:IQ > 130 者约占 2.5\%,IQ < 70 者同样约占 2.5\%。后者常被用于智力障碍 (Intellectual Disability) 的诊断参考(需结合适应功能评估)。
稳定性、遗传与环境
IQ 在个体生命周期中表现出高度稳定性。纵向研究表明,11 岁时的 IQ 与 80 岁时的 IQ 相关系数可达 0.6–0.7。行为遗传学中的双生子研究为 IQ 的遗传力 (Heritability) 提供了关键证据:同卵双胞胎分开抚养的 IQ 相关约为 0.74,异卵双胞胎同养约为 0.45。遗传力随年龄增加而上升,在成年期可达 0.6–0.8。
然而,IQ 同样受到环境因素的显著影响。Flynn 效应 (Flynn Effect) 指出,自 20 世纪初以来,全球人口 IQ 以每十年约 3 个百分点的速度持续上升,这一幅度远非遗传漂变所能解释,反映了营养改善、教育普及和社会复杂化等环境因素的作用。该发现同时说明,IQ 常模需要定期重新标准化以维持均值 100 的参照意义。
争议与局限
IQ 作为智力衡量工具面临多重批评:一、文化公平性——测试题不可避免依赖特定语言和文化背景;二、智力范围的狭窄性——IQ 不涵盖创造力、情商、实践智力等 Robert Sternberg 三元理论所强调的其他维度;三、标签效应——低 IQ 标签可能通过教师期望和刻板印象威胁产生负反馈循环。
尽管如此,在 劳动经济学 中,IQ 仍是预测教育年限、职业成就和工资收入的稳健变量之一,其效应在经济模型中常被纳入 人力资本 的不可观测异质性部分。