丁香实验_LOGO
登录
提问
提问
我要登录
|免费注册
丁香通

有关于校正曲线的绘制

相关实验:细胞生长曲线实验

user-title

山风晚晚

最近在了解bootstrap内部验证,请问大家,如果对训练集进行bootstrap的校正曲线的绘制,还需要进行内部的交叉验证之类的嘛??

wx-share
分享

4 个回答

user-title

汤姆卜丽波

有帮助

需要的,要在内部验证的基础上再做校正曲线,才更有说服力

user-title

sswei

有帮助

Bootstrap是一种基于重采样的统计方法,它可以通过对原始数据样本进行有放回的重新采样,生成新的数据样本,从而得到原始样本的分布情况和相关统计指标。Bootstrap方法是在缺乏大量数据的情况下,可以帮助我们更好地估计总体参数和相关统计指标。交叉验证使用部分样本预测没有使用的样本,并计算误差,其作用主要是考察预测的好坏,Bootstrap 从全部样本中反复抽取样本,以获得统计量的经验分布,主要用于假设检验。抽样分组方法上,交叉验证通过随机分组将数据随机分成多组,而 Bootstrap使用的是又放回抽样。故需要进行内部交叉验证后再绘制曲线。

user-title

毛利小五郎的徒弟

有帮助

需要先进行内部交叉验证然后再进行曲线绘制

user-title

loveliufudan

有帮助

对于使用自助法(bootstrap)进行模型校正的情况,内部交叉验证通常是一个有用的补充步骤。Bootstrap是一种通过从原始数据集中有放回地抽样来创建多个"伪"数据集的方法,以评估模型的稳定性和准确性。校正曲线是一种可视化工具,用于显示模型在不同超参数设置下的性能。

在绘制校正曲线之前,你可以使用内部交叉验证来评估每个超参数设置的模型性能。内部交叉验证可以帮助你确定在每个超参数设置下,模型在不同训练集和验证集上的表现如何。通过这种方式,你可以选择最佳的超参数设置,以在整个训练集上训练最佳模型。

一种常见的做法是,在使用自助法创建伪数据集时,对每个伪数据集应用内部交叉验证。也就是说,在每次创建伪数据集时,将该数据集划分为训练集和验证集,然后在验证集上评估模型性能。重复这个过程多次,以获得每个超参数设置下的平均性能评估。然后,可以使用这些平均性能评估绘制校正曲线,以便在超参数空间中找到最佳值。

因此,结合自助法和内部交叉验证可以提供更准确和稳健的模型评估,帮助你选择最佳的超参数设置。

提问
扫一扫
丁香实验小程序二维码
实验小助手
丁香实验公众号二维码
关注公众号
反馈
TOP
打开小程序