汤姆卜丽波
需要的,要在内部验证的基础上再做校正曲线,才更有说服力
sswei
Bootstrap是一种基于重采样的统计方法,它可以通过对原始数据样本进行有放回的重新采样,生成新的数据样本,从而得到原始样本的分布情况和相关统计指标。Bootstrap方法是在缺乏大量数据的情况下,可以帮助我们更好地估计总体参数和相关统计指标。交叉验证使用部分样本预测没有使用的样本,并计算误差,其作用主要是考察预测的好坏,Bootstrap 从全部样本中反复抽取样本,以获得统计量的经验分布,主要用于假设检验。抽样分组方法上,交叉验证通过随机分组将数据随机分成多组,而 Bootstrap使用的是又放回抽样。故需要进行内部交叉验证后再绘制曲线。
土井挞克树
需要先进行内部交叉验证然后再进行曲线绘制
loveliufudan
对于使用自助法(bootstrap)进行模型校正的情况,内部交叉验证通常是一个有用的补充步骤。Bootstrap是一种通过从原始数据集中有放回地抽样来创建多个"伪"数据集的方法,以评估模型的稳定性和准确性。校正曲线是一种可视化工具,用于显示模型在不同超参数设置下的性能。
在绘制校正曲线之前,你可以使用内部交叉验证来评估每个超参数设置的模型性能。内部交叉验证可以帮助你确定在每个超参数设置下,模型在不同训练集和验证集上的表现如何。通过这种方式,你可以选择最佳的超参数设置,以在整个训练集上训练最佳模型。
一种常见的做法是,在使用自助法创建伪数据集时,对每个伪数据集应用内部交叉验证。也就是说,在每次创建伪数据集时,将该数据集划分为训练集和验证集,然后在验证集上评估模型性能。重复这个过程多次,以获得每个超参数设置下的平均性能评估。然后,可以使用这些平均性能评估绘制校正曲线,以便在超参数空间中找到最佳值。
因此,结合自助法和内部交叉验证可以提供更准确和稳健的模型评估,帮助你选择最佳的超参数设置。
相关产品推荐
相关问答