卷积核

本贴最后更新于 227 天前,其中的信息可能已经时移俗易

为什么需要卷积操作

1、特征提取

使用特定的卷积核,能够提取出图片数据特定方向的信息

卷积操作即是对图像的像素点进行乘运算 并将结果矩阵的所有值求和得出一个数的结果

image

此处 input 即是一个 55 像素大小的图片 使用一个 33 矩阵对图片最左上角 9 个像素点进行卷积运算(乘)矩阵算法1

依次从坐标 0,0 ,3,3 --> 1,0,4,3 计算 9 次

image

最终得出 9 个结果 并按顺序排列即可得 33 矩阵
此处暴力推导出结果 3
3 矩阵特征之一 33 矩阵与任何图像计算后 原图像大小变为 长宽少 2 像素的新图像(特征)
新图像的所有像素点(大小 3
3)与原图像(大小 5*5)拥有抽象的映射关系 对于减少计算量 简单化复杂特征是非常必要的

相当于使用卷积操作压缩了图像大小 提取了某种符合卷积核的抽象信息 所以某些时候这些卷积核也叫滤波器 用于提取某种类型的图片信息

在某些时候我们不想特征缩小 即引入填充和步长的概念 填充 步长2

image

此处以提取边缘信息的卷积核为例 示例图image

解释下这个核 提取向右的特征数据

image

相反的还有提取向左的特征数据

image

向下趋度

image

像上趋度

image

四个方向的趋度合并即可获取物体轮廓特征

下载 4

强化边缘信息 1

image

强化边缘信息 2

image

其实已经可以看出 从矩阵的数字规律就可大致得出卷积核的作用

数值大的一方得到强化 数值小的一方被减弱 数值为负的的特征数值越大则抑制越重

附上一个可以在线测试卷积效果的网址

Image Kernels explained visually

代码部分

import cv2 import numpy as np import matplotlib.pyplot as plt if __name__ == '__main__': # 读取图像 image = cv2.imread('C:/Users/jm/Pictures/0eRWZ7.jpg', cv2.IMREAD_GRAYSCALE) kernel = np.array([[-1, 0, 1], [-1, 0, 1], [-1, 0, 1]]) # 对图像提取向右特征 right_image = cv2.filter2D(image, -1, kernel) kernel = np.array([[1, 0, -1], [1, 0, -1], [1, 0, -1]]) # 对图像提取向左特征 left_image = cv2.filter2D(image, -1, kernel) kernel = np.array([[1, 1, 1], [0, 0, 0], [-1, -1, -1]]) # 对图像提取向上特征 top_image = cv2.filter2D(image, -1, kernel) kernel = np.array([[-1, -1, -1], [0, 0, 0], [1, 1, 1]]) # 对图像提取向下特征 bottom_image = cv2.filter2D(image, -1, kernel) # 合并所有方向特征 获取轮廓信息 combined_image = cv2.addWeighted(cv2.addWeighted(left_image, 0.5, right_image, 0.5, 0), 0.5, cv2.addWeighted(top_image, 0.5, bottom_image, 0.5, 0), 0.5, 0) # 显示原始图像和卷积后的图像 plt.figure(figsize=(8, 5)) plt.subplot(3, 4, 5) plt.title('Original Image') plt.imshow(image, cmap='gray') plt.axis('off') plt.subplot(3, 4, 6) plt.title('left_image Image') plt.imshow(left_image, cmap='gray') plt.axis('off') plt.subplot(3, 4, 8) plt.title('Right Image') plt.imshow(right_image, cmap='gray') plt.axis('off') plt.subplot(3, 4, 3) plt.title('top_image Image') plt.imshow(top_image, cmap='gray') plt.axis('off') plt.subplot(3, 4, 11) plt.title('bottom_image Image') plt.imshow(bottom_image, cmap='gray') plt.axis('off') plt.subplot(3, 4, 7) plt.title('Combined Image') plt.imshow(combined_image, cmap='gray') plt.axis('off') plt.tight_layout() plt.show()

image


  1. 矩阵算法

    简单数相乘 等于乘数乘以每个矩阵制

    $\left\vert a,b,c\right\vert$ $\left\vert3\times a,3\times b,3\times c\right\vert$ 3 $\times$ $\left\vert d,e,f\right\vert$ = $\left\vert3\times d,3\times e,3\times f\right\vert$ $\left\vert g,h,i\right\vert$ $\left\vert3\times g,3\times h,3\times i\right\vert$

    矩阵与矩阵乘法 对应位置相乘即可

    =

    加法减法等相同

    矩阵与矩阵点乘 等于第 n 行乘第 n 列 依次计算

    $\left\vert a,b,c\right\vert$ $\left\vert a,b,c\right\vert$ $\left\vert a,b,c\right\vert$ $A\times\left\vert d,e,f\right\vert$ $B\times\left\vert d,e,f\right\vert$ C $\times$ $\left\vert d,e,f\right\vert$ $\left\vert g,h,i\right\vert$ $\left\vert g,h,i\right\vert$ $\left\vert g,h,i\right\vert$

    =

    $\left\vert a,b,c\right\vert$ $\left\vert a,b,c\right\vert$ $\left\vert a,b,c\right\vert$ $G\times\left\vert d,e,f\right\vert$ $H\times\left\vert d,e,f\right\vert$ $I\times\left\vert d,e,f\right\vert$ $\left\vert g,h,i\right\vert$ $\left\vert g,h,i\right\vert$ $\left\vert g,h,i\right\vert$
  2. 填充 步长

  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    43 引用 • 44 回帖 • 1 关注

相关帖子

回帖

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Tomcat

    Tomcat 最早是由 Sun Microsystems 开发的一个 Servlet 容器,在 1999 年被捐献给 ASF(Apache Software Foundation),隶属于 Jakarta 项目,现在已经独立为一个顶级项目。Tomcat 主要实现了 JavaEE 中的 Servlet、JSP 规范,同时也提供 HTTP 服务,是市场上非常流行的 Java Web 容器。

    162 引用 • 529 回帖 • 7 关注
  • Typecho

    Typecho 是一款博客程序,它在 GPLv2 许可证下发行,基于 PHP 构建,可以运行在各种平台上,支持多种数据库(MySQL、PostgreSQL、SQLite)。

    12 引用 • 67 回帖 • 444 关注
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 395 关注
  • Maven

    Maven 是基于项目对象模型(POM)、通过一小段描述信息来管理项目的构建、报告和文档的软件项目管理工具。

    188 引用 • 319 回帖 • 242 关注
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    167 引用 • 597 回帖
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    53 引用 • 190 回帖
  • RYMCU

    RYMCU 致力于打造一个即严谨又活泼、专业又不失有趣,为数百万人服务的开源嵌入式知识学习交流平台。

    4 引用 • 6 回帖 • 60 关注
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖
  • 持续集成

    持续集成(Continuous Integration)是一种软件开发实践,即团队开发成员经常集成他们的工作,通过每个成员每天至少集成一次,也就意味着每天可能会发生多次集成。每次集成都通过自动化的构建(包括编译,发布,自动化测试)来验证,从而尽早地发现集成错误。

    15 引用 • 7 回帖
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    36 引用 • 200 回帖 • 31 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 15 关注
  • 黑曜石

    黑曜石是一款强大的知识库工具,支持本地 Markdown 文件编辑,支持双向链接和关系图。

    A second brain, for you, forever.

    24 引用 • 242 回帖
  • 微软

    微软是一家美国跨国科技公司,也是世界 PC 软件开发的先导,由比尔·盖茨与保罗·艾伦创办于 1975 年,公司总部设立在华盛顿州的雷德蒙德(Redmond,邻近西雅图)。以研发、制造、授权和提供广泛的电脑软件服务业务为主。

    8 引用 • 44 回帖
  • 微服务

    微服务架构是一种架构模式,它提倡将单一应用划分成一组小的服务。服务之间互相协调,互相配合,为用户提供最终价值。每个服务运行在独立的进程中。服务于服务之间才用轻量级的通信机制互相沟通。每个服务都围绕着具体业务构建,能够被独立的部署。

    96 引用 • 155 回帖
  • 博客

    记录并分享人生的经历。

    273 引用 • 2388 回帖
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 85 关注
  • 七牛云

    七牛云是国内领先的企业级公有云服务商,致力于打造以数据为核心的场景化 PaaS 服务。围绕富媒体场景,七牛先后推出了对象存储,融合 CDN 加速,数据通用处理,内容反垃圾服务,以及直播云服务等。

    29 引用 • 230 回帖 • 124 关注
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 93 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    209 引用 • 2040 回帖
  • gRpc
    11 引用 • 9 回帖 • 98 关注
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 675 关注
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖 • 1 关注
  • MongoDB

    MongoDB(来自于英文单词“Humongous”,中文含义为“庞大”)是一个基于分布式文件存储的数据库,由 C++ 语言编写。旨在为应用提供可扩展的高性能数据存储解决方案。MongoDB 是一个介于关系数据库和非关系数据库之间的产品,是非关系数据库当中功能最丰富,最像关系数据库的。它支持的数据结构非常松散,是类似 JSON 的 BSON 格式,因此可以存储比较复杂的数据类型。

    91 引用 • 59 回帖 • 4 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 349 关注
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖 • 1 关注
  • danl
    173 关注
  • Excel
    31 引用 • 28 回帖 • 1 关注