OpenCV在自动化测试中的一些应用

本贴最后更新于 3090 天前,其中的信息可能已经时移俗易

OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉库。OpenCV是用C/C++语言编写而成,可以运行在Unix/Windows/Mac等操作系统上。与此同时,OpenCV还提供了Python、Ruby、MATLAB等语言接口,OpenCV可以提供简单易用的计算机视觉框架,帮助开发人员更快捷地设计复杂的计算机视觉相关的应用程序。

在GUI自动化测试中,测试方经常会遇到一些问题导致测试中断,不同的测试工具遇到的情况也不一样。对于需要绑定UI源代码来进行模拟操作的测试工具来说,如果UI源代码被修改,即使是小的修改也可能导致虽然界面看起来没有什么变化,但是测试已经无法继续进行的情况,而且这种测试工具脚本的编写需要对该应用的UI源代码有一定的了解,脚本的复杂度也比较高。还有一种方法是录入用户对屏幕的操作来进行模拟测试,这样测试脚本会比较简单,但是应用的界面布局变换会直接导致基于坐标的位置抓取失败,一些窗口大小位置微调或者系统弹出对话框等都会导致测试的中断。对于手机应用测试来说,一个好的手机应用通常会跨越好几个平台,不同平台上的编程方式和UI都不一样,类似的问题会更加突出,很多时候需要依靠手工测试,通过识别截图来判断问题出在了哪里,同样的可以用机器进行对截图的识别,来代替人工进行测试。

目前的计算机视觉软件大概有以下三种:

1.研究代码(慢,不稳定,独立并与其他库不兼容)

2.耗费很高的商业化工具(比如Halcon, MATLAB+Simulink)

3.依赖硬件的一些特别的解决方案(比如视频监控,制造控制系统,医疗设备)

OpenCV可以提供API简化计算机视觉程序和解决方案的开发同时通过优化的C代码的编写对执行速度带来了可观的提升。

 

 

图片1 OpenCV与其它视觉函数库性能对比

 

OpenCV提供的视觉处理算法非常丰富,并且它部分以C语言编写,加上其开源的特性,处理得当,不需要添加新的外部支持也可以完整的编译链接生成执行程序,通过使用OpenCV,对手机UI进行识别和定位可以比较容易的解决上述出现的问题,这种利用UI截图进行测试脚本的编写使得测试人员只需要具有基本的程序设计知识即可快速学会创建自动化脚本进行GUI测试。

OpenCV中,一种识别图片的方法是模板匹配,模板匹配可以实现在一幅图像中寻找与另一幅模板图像最匹配(相似)部分,通过模版匹配的方法可以定位需要测试的UI控件在界面上的坐标,通过模板匹配得出的坐标不是固定的,而是通过识别最相似的部分计算得出的。模板匹配的主要步骤一般是先通过截图界面,得到需要进行匹配的目标图片,然后以需要测试的UI界面为模板图片,在截取图片上覆盖同样大小的区域进行计算,得出模板和覆盖区域的匹配值,然后滑动模板图片进行下一个区域的计算,所有计算结果中的最大值就是最佳匹配值,OpenCV向用户提供了多种匹配算法。得到最佳匹配同时也会得到测试UI在当前截图的最佳匹配坐标,通过该坐标,可以进行对手机进行各种操作测试。模板匹配是比较基础的一种匹配方法,对模板的要求比较高,但是容许一定的失真。

对于GUI变化的复杂情况,使用基于样本的学习的方法将测试GUI可能的变化情况作为样本存储,然后确定相近特征的样本并获得相应的匹配值。用OpenCV来做特征提取匹配相当简便,只要检测每张图像的关键点,然后在目标图像中找到相应的图像即可,过程如下:

1、读取图像的 mat 数据

2、使用 detector 获取关键点

3、通过关键点,得到图像的描述信息

4、比较图像的描述信息,在目标图像中找到相应的图像

5、通过匹配后的数据,实现相应的功能(对应用进行操作)

在OpenCV中,实现了很多种特征,如SIFT,FAST等,这些特征的实现各不相同,但是都是从一个公共抽象基类派生出来的,因此可以用多态方便地切换特征提取算法。

在实际测试过程中,不同应用和应用的不同UI的情况变化很多,所以需要根据不同的需求和情况选择和优化不同的方法,但是核心都是对测试UI的图片识别。

这种利用目标GUI元素的截图来获取需要进行操作的对象,并执行相应操作的测试方法简单高效。使得GUI测试摆测试脱了对应用的内部程序实现的依赖,无需获取手机 API和了解 GUI 的内部代码实现,也不需要关注标准控件和非标准控件在操作和获取上的差异性,普遍适用于所有运行在有图形用户界面的操作系统之上的应用,有 GUI 显示的地方即可被获取和操作。可以最大限度的缩小与截图手工测试的差距。

在实际应用中,这种基于图片的测试方法也有一定的局限性,测试的结果需要依赖屏幕截图,而在不同的手机操作系统上,根据需求可能需会要独立维护一套图形源文件,对识别算法的要求也很高,对于其跨平台的能力造成障碍。

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
请输入回帖内容 ...

推荐标签 标签

  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 667 关注
  • sts
    2 引用 • 2 回帖 • 197 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1435 引用 • 10056 回帖 • 489 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1737 回帖 • 1 关注
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 632 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    107 引用 • 153 回帖
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    7 引用 • 40 回帖
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 15 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 4 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 483 关注
  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 483 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 27 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 416 关注
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖 • 6 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 626 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    66 引用 • 114 回帖 • 223 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 635 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23020 引用 • 92599 回帖
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    171 引用 • 512 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    343 引用 • 723 回帖
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 60 关注
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    28 引用 • 108 回帖
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 75 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 668 关注