ARTICLE
可重复性危机
可重复性危机 (Replicability Crisis / Reproducibility Crisis) 指大量已发表研究成果无法被独立重复验证的现象,在心理学、生物医学、经济学等依赖统计推断的实证领域尤为突出,深刻动摇了科学知识的可信根基。 2015年开放科学协作中心尝试重复100项顶级心理学期刊实验,仅36\%获统计显著,原始阳性率却达97\%;安进
可重复性危机 (Replicability Crisis / Reproducibility Crisis) 指大量已发表研究成果无法被独立重复验证的现象,在心理学、生物医学、经济学等依赖统计推断的实证领域尤为突出,深刻动摇了科学知识的可信根基。
2015年开放科学协作中心尝试重复100项顶级心理学期刊实验,仅36\%获统计显著,原始阳性率却达97\%;安进公司报告53项癌症研究仅6项可重复。这些数据暴露了学术生态的系统性缺陷。危机后果包括:大量统计假阳性浪费科研资源;公众对科学信任下降;可疑研究实践(选择性报告、p值操纵)污染学术文献。
核心成因有三方面。统计层面,标准意味着每次检验有至多5\%假阳性率,而多重检验、中途停止、灵活分析使实际假阳性率远超名义水平。低统计功效导致"赢者诅咒"——已发表效应量被系统性高估。制度层面,"不发表就灭亡"文化偏好新颖显著结果,零结果和复制研究难以发表,造成"文件抽屉问题",研究者缺乏验证他人成果的激励。实践层面,数据与代码极少公开,使第三方无法核查分析正确性。
应对措施包括:预注册制度要求数据收集前提交分析方案;注册报告期刊在研究实施前即依据方法质量决定录用,消除出版偏倚;开放科学运动推动数据、材料、代码共享;大规模重复项目(如Many Labs)系统评估可重复性;统计改革推广效应量、置信区间和贝叶斯方法替代机械的p值依赖。
这场危机与其说是科学的失败,不如说是科学自纠机制的觉醒——通过主动揭露缺陷,科学正在进化出更严格的质量标准与更高的透明度。