机器学习 (8)——支持向量机 (SVM)

本贴最后更新于 2488 天前,其中的信息可能已经时过境迁

0x00 支持向量机

在机器学习中,支持向量机(support vector machine,常简称为 SVM,又名支持向量网络)是在分类与回归分析中分析数据的监督式学习模型与相关的学习算法。给定一组训练实例,每个训练实例被标记为属于两个类别中的一个或另一个,SVM 训练算法建立一个将新的实例分配给两个类别之一的模型,使其成为非概率二元(binary classifier)线性分类器。SVM 模型是将实例表示为空间中的点,这样映射就使得单独类别的实例被尽可能宽的明显的间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。

0x01 间隔与支持向量
首先看一张图:

如果要用一条直线将两种类型的图形分开,那这样的直线我们可以找到很多条。那么哪条才是最好的分割线?

我们可以设想一下,目前的样本并不代表所有可能发生的情况,如果进入新样本,很有可能会存在向直线贴近的样本,那么如果选择的直线到两边最近的点间隔越长,输入新样本时越过这条线的机会就越小,泛化能力就越强。

图中距离这条分割线最近的这几个点,就被称为支持向量。

两个异类支持向量到这条直线的距离之和,就被称为间隔。

假设我们分割线的方程如下:

其中 w 是法向量。

我们的可以通过它将训练样本正确分类,即

留出间隔,令:

则间隔的数学表示为:

我们为了找到最大间隔,也就是使 γ 最大,也就是使 ||w||² 最小,就可以转换成找

的最小值。这被称为支持向量机的基本型。
0x02 对偶问题

上面的问题最终转换成求支持向量机基本型的最小值问题,这是一个凸二次规划问题,可以直接求解,但是我们有更优的计算方法。那就是通过拉格朗日乘子法得到其”对偶问题“。

具体做法是对每条约束都增加拉格朗日乘子 αi,则该问题可以写成:

这个时候要求其最小值,从之前转换成最小值的模型前加了 1/2 这点就可以想到,我们接下来肯定要通过求导,求导数零点,找极值点来完成。

所以分别对 w 和 b 求导可以得出:

将其结论代回 L 中可得对偶问题:

这个结果,我们就可以直接交给机器去处理数据求这个式子的最大值了。

0x03 核函数

线性可分的训练样本我们可以通过直线将其正确分类,但是如果遇到线性不可分的训练样本,或许就不能通过一条直线来进行分割。

这种情况下,我们可以将样本从原本的空间映射到一个更高维度的空间,使样本在这个空间内线性可分。

比如二维平面中的样本投影到三维空间中,就可以通过一个超平面线性分割两类样本了:

具体做法是用 Φ(x)代表 x 映射之后的特征向量,对偶问题就变为:

在计算 Φ(xi)的转置与 Φ(xj)的矩阵乘积时,在高维会变的十分困难,所以就引入了:

Φ(xi)与 Φ(xj)内积等于它们在原始样本空间通过 k 函数计算的结果,这样就不用去高维计算内积。这个 k 函数就被称为核函数。

常用的核函数如下:

并不是所有的情况通过核函数映射之后都是线性可分的,我们会根据实际的情况去选取合适的核函数,使其映射到高维之后可以分割,然后高维分割的超平面在原始平面上的投影就是在原始平面上的分割曲线。

0x04 硬间隔和软间隔

即使使用了核函数,实际中,我们仍然存在一种不可分的情况,即两类样本互相有一部分出现在对方的区域,如图:

那么这种情况,我们的处理方式就是允许支持向量机在一些样本上出错,也就是“软间隔”。

对应的所有样本都被正确分类就被称为“硬间隔”。

在之前机器学习的经验中我们都明白,出错就会有损失,那么我们需要一个损失函数来计算惩罚,最终的优化目标是在最大化间隔的同时使不满足约束的样本尽可能少,可写为:

这里面使用的损失函数是 0/1 损失函数:

我们也有其他几种替代损失函数可供选择:

在软间隔情况中,只使满足最终优化目标的值优化到最小即可。

0x05 支持向量机的优缺点

支持向量机的优势在于:

  • 在高维空间中非常高效
  • 即使在数据维度比样本数量大的情况下仍然有效
  • 在决策函数(称为支持向量)中使用训练集的子集,因此它也是高效利用内存的
  • 通用性: 不同的核函数 核函数与特定的决策函数一一对应,常见的 kernel 已

经提供,也可以指定定制的内核

支持向量机的缺点包括:

  • 如果特征数量比样本数量大得多,在选择核函数 核函数 时要避免过拟合,

而且正则化项是非常重要的

  • 支持向量机不直接提供概率估计
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    77 引用 • 37 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Access
    1 引用 • 3 回帖 • 6 关注
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    10 引用 • 77 回帖
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 47 关注
  • 尊园地产

    昆明尊园房地产经纪有限公司,即:Kunming Zunyuan Property Agency Company Limited(简称“尊园地产”)于 2007 年 6 月开始筹备,2007 年 8 月 18 日正式成立,注册资本 200 万元,公司性质为股份经纪有限公司,主营业务为:代租、代售、代办产权过户、办理银行按揭、担保、抵押、评估等。

    1 引用 • 22 回帖 • 811 关注
  • 反馈

    Communication channel for makers and users.

    120 引用 • 906 回帖 • 281 关注
  • Gzip

    gzip (GNU zip)是 GNU 自由软件的文件压缩程序。我们在 Linux 中经常会用到后缀为 .gz 的文件,它们就是 Gzip 格式的。现今已经成为互联网上使用非常普遍的一种数据压缩格式,或者说一种文件格式。

    9 引用 • 12 回帖 • 185 关注
  • 创业

    你比 99% 的人都优秀么?

    81 引用 • 1395 回帖
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 662 关注
  • Kubernetes

    Kubernetes 是 Google 开源的一个容器编排引擎,它支持自动化部署、大规模可伸缩、应用容器化管理。

    118 引用 • 54 回帖 • 10 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 616 关注
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 25 关注
  • Vue.js

    Vue.js(读音 /vju ː/,类似于 view)是一个构建数据驱动的 Web 界面库。Vue.js 的目标是通过尽可能简单的 API 实现响应的数据绑定和组合的视图组件。

    268 引用 • 666 回帖
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖 • 1 关注
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 613 关注
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 396 关注
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖 • 5 关注
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 3 关注
  • 京东

    京东是中国最大的自营式电商企业,2015 年第一季度在中国自营式 B2C 电商市场的占有率为 56.3%。2014 年 5 月,京东在美国纳斯达克证券交易所正式挂牌上市(股票代码:JD),是中国第一个成功赴美上市的大型综合型电商平台,与腾讯、百度等中国互联网巨头共同跻身全球前十大互联网公司排行榜。

    14 引用 • 102 回帖 • 306 关注
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    17 引用 • 7 回帖 • 3 关注
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖 • 8 关注
  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 118 关注
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    694 引用 • 537 回帖 • 1 关注
  • Caddy

    Caddy 是一款默认自动启用 HTTPS 的 HTTP/2 Web 服务器。

    10 引用 • 54 回帖 • 185 关注
  • BND

    BND(Baidu Netdisk Downloader)是一款图形界面的百度网盘不限速下载器,支持 Windows、Linux 和 Mac,详细介绍请看这里

    107 引用 • 1281 回帖 • 44 关注
  • Spring

    Spring 是一个开源框架,是于 2003 年兴起的一个轻量级的 Java 开发框架,由 Rod Johnson 在其著作《Expert One-On-One J2EE Development and Design》中阐述的部分理念和原型衍生而来。它是为了解决企业应用开发的复杂性而创建的。框架的主要优势之一就是其分层架构,分层架构允许使用者选择使用哪一个组件,同时为 JavaEE 应用程序开发提供集成的框架。

    948 引用 • 1460 回帖 • 1 关注
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    15 引用 • 7 回帖 • 3 关注
  • 一些有用的避坑指南。

    69 引用 • 93 回帖