一、回顾
介绍了支持向量机的基本概念,线性可分支持向量机的原理以及线性支持向量机的原理,线性可分支持向量机是线性支持向量机的基础。对于线性支持向量机,选择一个合适的惩罚参数,并构造凸二次规划问题:
求得原始问题的对偶问题的最优解,由此可求出原始问题的最优解:
其中中满足的分量。这样便可以求得分离超平面
以及分类决策函数:
线性可分支持向量机算法是线性支持向量机算法的特殊情况。
二、非线性问题的处理方法
在处理非线性问题时,可以通过将分线性问题转化成线性问题,并通过已经构建的线性支持向量机来处理。如下图所示:
(非线性转成线性问题)
通过一种映射可以将输入空间转换到对应的特征空间,体现在特征空间中的是对应的线性问题。核技巧就可以完成这样的映射工作。
1、核函数的定义(摘自《统计机器学习》)
设是输入空间(欧式空间的子集或离散集合),又设为特征空间(希尔伯特空间),如果存在一个从到的映射
使得对所有,函数满足条件
则称为核函数,为映射函数。
在实际的问题中,通常使用已有的核函数。
2、常用核函数
多项式核函数(Polynomial Kernel Function)
高斯核函数(Gaussian Kernel Function)
三、非线性支持向量机
1、选取适当的核函数和适当的参数,构造原始问题的对偶问题:
求得对应的最优解。
2、选择的一个满足的分量,求:
3、构造决策函数
四、实验仿真
对于非线性可分问题,其图像为:
(原始空间中的图像)
MATLAB代码
主程序
[plain] view plain copy 在CODE上查看代码片派生到我的代码片
%% 非线性支持向量机
% 清空内存
clear all;
clc;
% 导入测试数据
A = load('testSetRBF.txt');
%% 区分开训练数据与测试数据
m = size(A);%得到整个数据集的大小
trainA = A(11:m(1,1),:);
testA = A(1:10,:);
% 训练和测试数据集的大小
mTrain = size(trainA);
mTest = size(testA);
% 区分开特征与标签
Xtrain = trainA(:,1:2);
Ytrain = trainA(:,mTrain(1,2))';
Xtest = testA(:,1:2);
Ytest = testA(:,mTest(1,2))';
%% 对偶问题,用二次规划来求解,以求得训练模型
sigma = 0.5;%高斯核中的参数
H = zeros(mTrain(1,1),mTrain(1,1));
for i = 1:mTrain(1,1)
for j = 1:mTrain(1,1)
H(i,j) = GaussianKernalFunction(Xtrain(i,:),Xtrain(j,:),sigma);
H(i,j) = H(i,j)*Ytrain(i)*Ytrain(j);
end
end
f = ones(mTrain(1,1),1)*(-1);
B = Ytrain;
b = 0;
lb = zeros(mTrain(1,1),1);
% 调用二次规划的函数
[x,fval,exitflag,output,lambda] = quadprog(H,f,[],[],B,b,lb);
% 定义C
C = max(x);
% 求解原问题
n = size(x);
k = 1;
for i = 1:n(1,1)
Kernel = zeros(n(1,1),1);
if x(i,1) > 0 && x(i,1)<C
for j = 1:n(1,1)
Kernel(j,:) = GaussianKernalFunction(Xtrain(j,:),Xtrain(i,:),sigma);
Kernel(j,:) = Kernel(j,:)*Ytrain(j);
end
b(k,1) = Ytrain(1,i)-x'*Kernel;
k = k +1;
end
end
b = mean(b);
%% 决策函数来验证训练准确性
trainOutput = zeros(mTrain(1,1),1);
for i = 1:mTrain(1,1)
Kernel_train = zeros(mTrain(1,1),1);
for j = 1:mTrain(1,1)
Kernel_train(j,:) = GaussianKernalFunction(Xtrain(j,:),Xtrain(i,:),sigma);
Kernel_train(j,:) = Kernel_train(j,:)*Ytrain(j);
end
trainOutput(i,1) = x'*Kernel_train+b;
end
for i = 1:mTrain(1,1)
if trainOutput(i,1)>0
trainOutput(i,1)=1;
elseif trainOutput(i,1)<0
trainOutput(i,1)=-1;
end
end
% 统计正确个数
countTrain = 0;
for i = 1:mTrain(1,1)
if trainOutput(i,1) == Ytrain(i)
countTrain = countTrain+1;
end
end
trainCorrect = countTrain./mTrain(1,1);
%% 决策函数来验证测试准确性
testOutput = zeros(mTest(1,1),1);
for i = 1:mTest(1,1)
Kernel_test = zeros(mTrain(1,1),1);
for j = 1:mTrain(1,1)
Kernel_test(j,:) = GaussianKernalFunction(Xtrain(j,:),Xtest(i,:),sigma);
Kernel_test(j,:) = Kernel_test(j,:)*Ytrain(j);
end
testOutput(i,1) = x'*Kernel_train+b;
end
for i = 1:mTest(1,1)
if testOutput(i,1)>0
testOutput(i,1)=1;
elseif testOutput(i,1)<0
testOutput(i,1)=-1;
end
end
% 统计正确个数
countTest = 0;
for i = 1:mTest(1,1)
if testOutput(i,1) == Ytest(i)
countTest = countTest+1;
end
end
testCorrect = countTest./mTest(1,1);
disp(['训练的准确性:',num2str(trainCorrect)]);
disp(['测试的准确性:',num2str(testCorrect)]);
核函数
[plain] view plain copy 在CODE上查看代码片派生到我的代码片
%% 高斯核函数,其中输入x和y都是行向量
function [ output ] = GaussianKernalFunction( x,y,sigma )
output = exp(-(x-y)*(x-y)'./(2*sigma^2));
end
最终的结果为:
注:在这个问题中,有两个参数需要调整,即核参数和惩罚参数,选取合适的参数对模型的训练起着很重要的作用。在程序中,我是指定的参数。这里的程序只是为帮助理解算法的过程。数据分析师培训
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“用户旅程分析”概念 用户旅程图又叫做用户体验地图,它是用于描述用户在与产品或服务互动的过程中所经历的各个阶段、触点和情 ...
2025-01-22在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-22在数据分析领域,Excel作为一种普及率极高且功能强大的工具,无疑为无数专业人士提供了便捷的解决方案。尽管Excel自带了丰富的功 ...
2025-01-17在这个瞬息万变的时代,许多人都在寻找能让他们脱颖而出的职业。而数据分析师,作为大数据和人工智能时代的热门职业,自然吸引了 ...
2025-01-14Python作为一门功能强大的编程语言,已经成为数据分析和可视化领域的重要工具。无论你是数据分析的新手,还是经验丰富的专业人士 ...
2025-01-10完全靠数据决策,真的靠谱吗? 最近几年,“数据驱动”成了商界最火的关键词之一,但靠数据就能走天下?其实不然!那些真正成功 ...
2025-01-09SparkSQL 结构化数据处理流程及原理是什么?Spark SQL 可以使用现有的Hive元存储、SerDes 和 UDF。它可以使用 JDBC/ODB ...
2025-01-09在如今这个信息爆炸的时代,数据已然成为企业的生命线。无论是科技公司还是传统行业,数据分析正在深刻地影响着商业决策以及未来 ...
2025-01-08“数据为王”相信大家都听说过。当前,数据信息不再仅仅是传递的媒介,它成为了驱动经济发展的新燃料。对于企业而言,数据指标体 ...
2025-01-07在职场中,当你遇到问题的时候,如果感到无从下手,或者抓不到重点,可能是因为你掌握的思维模型不够多。 一个好用的思维模型, ...
2025-01-06在现代企业中,数据分析师扮演着至关重要的角色。每天都有大量数据涌入,从社交媒体到交易平台,数据以空前的速度和规模生成。面 ...
2025-01-06在职场中,许多言辞并非表面意思那么简单,有时需要听懂背后的“潜台词”。尤其在数据分析的领域里,掌握常用术语就像掌握一门新 ...
2025-01-04在当今信息化社会,数据分析已成为各行各业的核心驱动力。它不仅仅是对数字进行整理与计算,而是在数据的海洋中探寻规律,从而指 ...
2025-01-03又到一年年终时,各位打工人也迎来了展示成果的关键时刻 —— 年终述职。一份出色的年终述职报告,不仅能全面呈现你的工作价值, ...
2025-01-03在竞争激烈的商业世界中,竞品分析对于企业的发展至关重要。今天,我们就来详细聊聊数据分析师写竞品分析的那些事儿。 一、明确 ...
2025-01-03在数据分析的江湖里,有两个阵营总是争论不休。一派信奉“大即是美”,认为数据越多越好;另一派坚守“小而精”,力挺质量胜于规 ...
2025-01-02数据分析是一个复杂且多维度的过程,从数据收集到分析结果应用,每一步都是对信息的提炼与升华。可视化分析结果,以图表的形式展 ...
2025-01-02在当今的数字化时代,数据分析师扮演着一个至关重要的角色。他们如同现代企业的“解密专家”,通过解析数据为企业提供决策支持。 ...
2025-01-02数据分析报告至关重要 一份高质量的数据分析报告不仅能够揭示数据背后的真相,还能为企业决策者提供有价值的洞察和建议。 年薪 ...
2024-12-31数据分析,听起来好像是技术大咖的专属技能,但其实是一项人人都能学会的职场硬核能力!今天,我们来聊聊数据分析的核心流程,拆 ...
2024-12-31