nnet包执行单隐层前馈神经网络, nnet() 函数涉及的主要参数有隐层
节点数(size) 、 节点权重(weights) 、 最大迭代次数(maxit) 等, 为了达
到最好的分类效果, 这些都是需要用户根据经验或者不断地尝试来确定的;
随机森林分类器利用基于Breiman随机森林理论的R语言软件包randomForest
中的randomForest() 函数来实现, 需要设置三个主要的参数: 森林中决策
树的数量(ntree) 、 内部节点随机选择属性的个数(mtry) 及终节点的最小
样本数(nodesize) 。
支持向量机分类器采用R语言软件包e1071实现, 该软件包是以台湾大
学林智仁教授的LIBSVM源代码为基础开发的。 svm() 函数提供了R与
LIBSVM的接口, 涉及的参数主要有类型(type, “C”实现支持向量机分
类, “eps-regression”实现支持向量机回归) 、 核函数(kernel) 。 SVM包含
了4种主要的核函数: 线性核函数(Linear) 、 多项式核函数
(Polynomial) 、 径向基核函数(RBF) 以及Sigmoid核函数。 一般情况下会
选择径向基核函数, 这主要源于: 其一, 线性核函数只能处理线性关系, 且
被证明是径向基核函数的一个特例; 其二, Sigmoid核函数在某些参数上近
似径向基核函数的功能, 径向基核函数取一定参数也可得到Sigmoid核函数
的性能; 其三, 多项式核函数参数较多, 不易于参数优选。 而径向基核函数
支持向量机包含两个重要的参数: 惩罚参数Cost和核参数Gamma, tune()
函数可以对两者进行网格寻优(Grid-search) 确定最优值。
暂无数据