OpenCV在自动化测试中的一些应用

本贴最后更新于 3455 天前,其中的信息可能已经时移俗易

OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库。OpenCV是用C/C++语言编写而成,可以运行在Unix/Windows/Mac等操作系统上。与此同时,OpenCV还提供了Python、Ruby、MATLAB等语言接口,OpenCV可以提供简单易用的计算机视觉框架,帮助开发人员更快捷地设计复杂的计算机视觉相关的应用程序。

在GUI自动化测试中,测试方经常会遇到一些问题导致测试中断,不同的测试工具遇到的情况也不一样。对于需要绑定UI源代码来进行模拟操作的测试工具来说,如果UI源代码被修改,即使是小的修改也可能导致虽然界面看起来没有什么变化,但是测试已经无法继续进行的情况,而且这种测试工具脚本的编写需要对该应用的UI源代码有一定的了解,脚本的复杂度也比较高。还有一种方法是录入用户对屏幕的操作来进行模拟测试,这样测试脚本会比较简单,但是应用的界面布局变换会直接导致基于坐标的位置抓取失败,一些窗口大小位置微调或者系统弹出对话框等都会导致测试的中断。对于手机应用测试来说,一个好的手机应用通常会跨越好几个平台,不同平台上的编程方式和UI都不一样,类似的问题会更加突出,很多时候需要依靠手工测试,通过识别截图来判断问题出在了哪里,同样的可以用机器进行对截图的识别,来代替人工进行测试。

目前的计算机视觉软件大概有以下三种:

1.研究代码(慢,不稳定,独立并与其他库不兼容)

2.耗费很高的商业化工具(比如Halcon, MATLAB+Simulink)

3.依赖硬件的一些特别的解决方案(比如视频监控,制造控制系统,医疗设备)

OpenCV可以提供API简化计算机视觉程序和解决方案的开发同时通过优化的C代码的编写对执行速度带来了可观的提升。

 

 

图片1 OpenCV与其它视觉函数库性能对比

 

OpenCV提供的视觉处理算法非常丰富,并且它部分以C语言编写,加上其开源的特性,处理得当,不需要添加新的外部支持也可以完整的编译链接生成执行程序,通过使用OpenCV,对手机UI进行识别和定位可以比较容易的解决上述出现的问题,这种利用UI截图进行测试脚本的编写使得测试人员只需要具有基本的程序设计知识即可快速学会创建自动化脚本进行GUI测试。

OpenCV中,一种识别图片的方法是模板匹配,模板匹配可以实现在一幅图像中寻找与另一幅模板图像最匹配(相似)部分,通过模版匹配的方法可以定位需要测试的UI控件在界面上的坐标,通过模板匹配得出的坐标不是固定的,而是通过识别最相似的部分计算得出的。模板匹配的主要步骤一般是先通过截图界面,得到需要进行匹配的目标图片,然后以需要测试的UI界面为模板图片,在截取图片上覆盖同样大小的区域进行计算,得出模板和覆盖区域的匹配值,然后滑动模板图片进行下一个区域的计算,所有计算结果中的最大值就是最佳匹配值,OpenCV向用户提供了多种匹配算法。得到最佳匹配同时也会得到测试UI在当前截图的最佳匹配坐标,通过该坐标,可以进行对手机进行各种操作测试。模板匹配是比较基础的一种匹配方法,对模板的要求比较高,但是容许一定的失真。

对于GUI变化的复杂情况,使用基于样本的学习的方法将测试GUI可能的变化情况作为样本存储,然后确定相近特征的样本并获得相应的匹配值。用OpenCV来做特征提取匹配相当简便,只要检测每张图像的关键点,然后在目标图像中找到相应的图像即可,过程如下:

1、读取图像的 mat 数据

2、使用 detector 获取关键点

3、通过关键点,得到图像的描述信息

4、比较图像的描述信息,在目标图像中找到相应的图像

5、通过匹配后的数据,实现相应的功能(对应用进行操作)

在OpenCV中,实现了很多种特征,如SIFT,FAST等,这些特征的实现各不相同,但是都是从一个公共抽象基类派生出来的,因此可以用多态方便地切换特征提取算法。

在实际测试过程中,不同应用和应用的不同UI的情况变化很多,所以需要根据不同的需求和情况选择和优化不同的方法,但是核心都是对测试UI的图片识别。

这种利用目标GUI元素的截图来获取需要进行操作的对象,并执行相应操作的测试方法简单高效。使得GUI测试摆测试脱了对应用的内部程序实现的依赖,无需获取手机 API和了解 GUI 的内部代码实现,也不需要关注标准控件和非标准控件在操作和获取上的差异性,普遍适用于所有运行在有图形用户界面的操作系统之上的应用,有 GUI 显示的地方即可被获取和操作。可以最大限度的缩小与截图手工测试的差距。

在实际应用中,这种基于图片的测试方法也有一定的局限性,测试的结果需要依赖屏幕截图,而在不同的手机操作系统上,根据需求可能需会要独立维护一套图形源文件,对识别算法的要求也很高,对于其跨平台的能力造成障碍。

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
请输入回帖内容 ...

推荐标签 标签

  • Openfire

    Openfire 是开源的、基于可拓展通讯和表示协议 (XMPP)、采用 Java 编程语言开发的实时协作服务器。Openfire 的效率很高,单台服务器可支持上万并发用户。

    6 引用 • 7 回帖 • 133 关注
  • CodeMirror
    2 引用 • 17 回帖 • 197 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 55 关注
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖
  • SMTP

    SMTP(Simple Mail Transfer Protocol)即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则,由它来控制信件的中转方式。SMTP 协议属于 TCP/IP 协议簇,它帮助每台计算机在发送或中转信件时找到下一个目的地。

    4 引用 • 18 回帖 • 662 关注
  • Folo

    Folo 是一个 RSS 阅读和信息聚合应用,整合多种内容源到统一时间线。

    项目地址:https://github.com/RSSNext/Folo

    1 引用 • 3 回帖 • 2 关注
  • Hprose

    Hprose 是一款先进的轻量级、跨语言、跨平台、无侵入式、高性能动态远程对象调用引擎库。它不仅简单易用,而且功能强大。你无需专门学习,只需看上几眼,就能用它轻松构建分布式应用系统。

    9 引用 • 17 回帖 • 650 关注
  • 千千插件

    千千块(自定义块 css 和 js)
    可以用 ai 提示词来无限创作思源笔记

    32 引用 • 69 回帖
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    5 引用 • 16 回帖 • 3 关注
  • 代码片段

    代码片段分为 CSS 与 JS 两种代码,添加在 [设置 - 外观 - 代码片段] 中,这些代码会在思源笔记加载时自动执行,用于改善笔记的样式或功能。

    用户在该标签下分享代码片段时需在帖子标题前添加 [css] [js] 用于区分代码片段类型。

    285 引用 • 1988 回帖
  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    43 引用 • 130 回帖 • 259 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 17 关注
  • Mac

    Mac 是苹果公司自 1984 年起以“Macintosh”开始开发的个人消费型计算机,如:iMac、Mac mini、Macbook Air、Macbook Pro、Macbook、Mac Pro 等计算机。

    168 引用 • 598 回帖
  • 30Seconds

    📙 前端知识精选集,包含 HTML、CSS、JavaScript、React、Node、安全等方面,每天仅需 30 秒。

    • 精选常见面试题,帮助您准备下一次面试
    • 精选常见交互,帮助您拥有简洁酷炫的站点
    • 精选有用的 React 片段,帮助你获取最佳实践
    • 精选常见代码集,帮助您提高打码效率
    • 整理前端界的最新资讯,邀您一同探索新世界
    488 引用 • 384 回帖
  • ReactiveX

    ReactiveX 是一个专注于异步编程与控制可观察数据(或者事件)流的 API。它组合了观察者模式,迭代器模式和函数式编程的优秀思想。

    1 引用 • 2 回帖 • 193 关注
  • GitHub

    GitHub 于 2008 年上线,目前,除了 Git 代码仓库托管及基本的 Web 管理界面以外,还提供了订阅、讨论组、文本渲染、在线文件编辑器、协作图谱(报表)、代码片段分享(Gist)等功能。正因为这些功能所提供的便利,又经过长期的积累,GitHub 的用户活跃度很高,在开源世界里享有深远的声望,并形成了社交化编程文化(Social Coding)。

    213 引用 • 2044 回帖
  • Webswing

    Webswing 是一个能将任何 Swing 应用通过纯 HTML5 运行在浏览器中的 Web 服务器,详细介绍请看 将 Java Swing 应用变成 Web 应用

    1 引用 • 15 回帖 • 669 关注
  • Sillot

    Insights(注意当前设置 master 为默认分支)

    汐洛彖夲肜矩阵(Sillot T☳Converbenk Matrix),致力于服务智慧新彖乄,具有彖乄驱动、极致优雅、开发者友好的特点。其中汐洛绞架(Sillot-Gibbet)基于自思源笔记(siyuan-note),前身是思源笔记汐洛版(更早是思源笔记汐洛分支),是智慧新录乄终端(多端融合,移动端优先)。

    主仓库地址:Hi-Windom/Sillot

    文档地址:sillot.db.sc.cn

    注意事项:

    1. ⚠️ 汐洛仍在早期开发阶段,尚不稳定
    2. ⚠️ 汐洛并非面向普通用户设计,使用前请了解风险
    3. ⚠️ 汐洛绞架基于思源笔记,开发者尽最大努力与思源笔记保持兼容,但无法实现 100% 兼容
    29 引用 • 25 回帖 • 152 关注
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    176 引用 • 544 回帖
  • RIP

    愿逝者安息!

    8 引用 • 92 回帖 • 429 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    56 引用 • 85 回帖 • 1 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 548 关注
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    25 引用 • 373 回帖 • 4 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    79 引用 • 431 回帖
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 443 关注
  • DNSPod

    DNSPod 建立于 2006 年 3 月份,是一款免费智能 DNS 产品。 DNSPod 可以为同时有电信、网通、教育网服务器的网站提供智能的解析,让电信用户访问电信的服务器,网通的用户访问网通的服务器,教育网的用户访问教育网的服务器,达到互联互通的效果。

    6 引用 • 26 回帖 • 548 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    28446 引用 • 119790 回帖