ARTICLE

交叉验证

交叉验证 (Cross-Validation) 交叉验证是统计学/机器学习模型评估技术→评估预测模型对未见数据的泛化能力→避免单一划分不稳→防过拟合（模型记训练噪声→训集完美新数据极差）。留出法单分训/测→数据利用低+随机性高→交叉验证以多次划分训练测试克服。 K-折交叉验证 ①随机打乱数据→不重叠分K折等大子集。②K次循环：第k折作验证集→其余K-1折作训

浏览 49 更新 2025-10-26

交叉验证 (Cross-Validation)

交叉验证是统计学/机器学习模型评估技术→评估预测模型对未见数据的泛化能力→避免单一划分不稳→防过拟合（模型记训练噪声→训集完美新数据极差）。留出法单分训/测→数据利用低+随机性高→交叉验证以多次划分训练测试克服。

K-折交叉验证

①随机打乱数据→不重叠分K折等大子集。②K次循环：第k折作验证集→其余K-1折作训练集→训练→测→录性能 $E_k$ 。③最终评估=均值 $(1/K)\sum E_k$ +标准差测稳定性。常用K=5/10→K大→训练用数据多→偏差↓但计算高且训集重合→方差↑。

变体

留一法LOOCV：K=N极端→每次留一验证→低偏差（近全数据训练）且无随机性→但高计算成本+高方差（N次训集高度相似→评果强相关性→均结果方差大）。

分层K-折：分类问题+类别不平衡→划每折保持各类比同原始→每折能代表整数据分布→更可靠低偏。

时间序列交叉验证：时间依赖→防"用未来预过去"数据泄露→前向链式/滚动预测原点：用初始段预测下一点→不断扩大窗口向前→始终用历史预测未来→模拟真实预测场景。

应用

模型评估：为最终模提供泛化可靠估→比较逻辑回归/SVM/决策树→每模同K-折→选均性能最优。模型选择与超参数调优：设定超参数候选值网→每值完整K-折→最高均性能者最优（注：调优数据≠最终测试→更严谨用嵌套交叉验证外评估泛化+内寻最优超参）。正则化参数 $\lambda$ /KNN的K值典型应用。

关于知经 KNOWECON

知经 KNOWECON 是深圳市卢可教育科技有限公司旗下的教育科技品牌，长期面向北京大学、清华大学、中国人民大学等顶尖院校，提供经济学、金融学、统计学、管理学等相关科目的专业课考研辅导与复试辅导。每年都有数十名同学在我们的帮助下完成系统备考，并成功进入理想院校。

知经主讲人喵喵学长毕业于北京大学汇丰商学院经济学专业和新加坡国立大学金融工程专业，获经济学硕士与金融工程硕士学位。他同时也是软件工程师和教育科技创业者，长期探索用讲义、题库、记忆系统、智能答疑与学习数据工具改善专业课学习体验。

我们相信，好的考研辅导不只是押题和陪跑，更是把复杂知识讲清楚、把复习路径设计清楚，并用技术让学习过程更可追踪、更可反馈、更可坚持。