2021-03-22
阅读量:
2221
关于网格搜索模型性能降低的问题
老师,决策树中,利用网格搜索进行了整体调参,为什么调参后的模型在测试集上的得分会降低?而且降低了近10个百分点。模型已经设置了随机数种子。
答:这里需要明确两个问题,1、网格搜索的方法获得的最优参数为交叉验证中分数最高的一组参数,对于整体数据不一定适用。
2、要想模型能有更好的参数,那就需要保证要搜索的参数网格范围足够的大,因为网格搜索只能找到给定范围内的最优参数组合。
当然具体问题具体分析,还需根据代码具体确定问题。代码见文件:
可以使用 clf.get_params( ) 方法查看模型的超参数情况,并与网格搜索中的params比对,params的参数范围不能囊括clf.get_params( ) 的值,所以有可能导致无法获得最优参数。并且网格搜索使用了交叉验证,因此最优参数是在交叉数据集上的表现,与整体训练数据的表现也会有些出入的。
200.0000
1
0
关注作者
收藏
评论(0)
发表评论
暂无数据
推荐帖子
0条评论
0条评论
0条评论