关于网格搜索模型性能降低的问题

老师，决策树中，利用网格搜索进行了整体调参，为什么调参后的模型在测试集上的得分会降低？而且降低了近10个百分点。模型已经设置了随机数种子。

答：这里需要明确两个问题，1、网格搜索的方法获得的最优参数为交叉验证中分数最高的一组参数，对于整体数据不一定适用。

2、要想模型能有更好的参数，那就需要保证要搜索的参数网格范围足够的大，因为网格搜索只能找到给定范围内的最优参数组合。

当然具体问题具体分析，还需根据代码具体确定问题。代码见文件：

可以使用 clf.get_params( ) 方法查看模型的超参数情况，并与网格搜索中的params比对，params的参数范围不能囊括clf.get_params( ) 的值，所以有可能导致无法获得最优参数。并且网格搜索使用了交叉验证，因此最优参数是在交叉数据集上的表现，与整体训练数据的表现也会有些出入的。