ARTICLE
交叉验证
交叉验证 (Cross-Validation) 交叉验证是统计学/机器学习模型评估技术→评估预测模型对未见数据的泛化能力→避免单一划分不稳→防过拟合(模型记训练噪声→训集完美新数据极差)。留出法单分训/测→数据利用低+随机性高→交叉验证以多次划分训练测试克服。 K-折交叉验证 ①随机打乱数据→不重叠分K折等大子集。②K次循环:第k折作验证集→其余K-1折作训
浏览 49
更新 2025-10-26
交叉验证 (Cross-Validation)
交叉验证是统计学/机器学习模型评估技术→评估预测模型对未见数据的泛化能力→避免单一划分不稳→防过拟合(模型记训练噪声→训集完美新数据极差)。留出法单分训/测→数据利用低+随机性高→交叉验证以多次划分训练测试克服。
K-折交叉验证
①随机打乱数据→不重叠分K折等大子集。②K次循环:第k折作验证集→其余K-1折作训练集→训练→测→录性能。③最终评估=均值+标准差测稳定性。常用K=5/10→K大→训练用数据多→偏差↓但计算高且训集重合→方差↑。
变体
留一法LOOCV:K=N极端→每次留一验证→低偏差(近全数据训练)且无随机性→但高计算成本+高方差(N次训集高度相似→评果强相关性→均结果方差大)。
分层K-折:分类问题+类别不平衡→划每折保持各类比同原始→每折能代表整数据分布→更可靠低偏。
时间序列交叉验证:时间依赖→防"用未来预过去"数据泄露→前向链式/滚动预测原点:用初始段预测下一点→不断扩大窗口向前→始终用历史预测未来→模拟真实预测场景。
应用
模型评估:为最终模提供泛化可靠估→比较逻辑回归/SVM/决策树→每模同K-折→选均性能最优。模型选择与超参数调优:设定超参数候选值网→每值完整K-折→最高均性能者最优(注:调优数据≠最终测试→更严谨用嵌套交叉验证外评估泛化+内寻最优超参)。正则化参数/KNN的K值典型应用。