检测 Lua 脚本中的死循环

本贴最后更新于 2308 天前,其中的信息可能已经天翻地覆

论坛上有人问,所以把以前做的东西拿出来秀一下。

Lua 是一门小巧精致的语言,特别适用于嵌入其它的程序为它们提供脚本支持。不过脚本通常是用户编写的,很有可能出现死循环,虽说这是用户的问题,但却会造成我们的宿主程序死掉。所以检测用户脚本中的死循环并中止这段脚本的运行就显得非常重要了。

可是,一个现实的问题是死循环并不好检测,一些隐藏较深的死循环连人都很难找出来,更不用说让机器去找了。所以实际采用的方案多是检测脚本的执行时间,如果超过一定的限度,就认为里面有死循环,我下面的例子也是用的这种方法。

以下是几个相关的全局变量(我是喜欢把 C++ 当 C 用的程序员,C++ 的忠实粉丝请忍耐一下😄)的定义。

lua_State* g_lua = NULL;            // lua脚本引擎
volatile unsigned g_begin = 0;        // 脚本开始执行的时间
volatile long g_counter = 0;        // 脚本执行计数, 用于判断执行超时
volatile long g_check = 0;           // 进行超时检查时的执行计数

run_user_script 用来执行用户脚本,它首先通过 GetTickCount 把当前的时间记录到 g_begin 中去。然后将 g_counter 加一,在执行完用户脚本后再将其加一,这样就可以保证执行用户脚本时它是个奇数,而不执行时是偶数,检测脚本超时的代码可以籍此来判断当前是否在执行用户脚本。还要注意调用用户脚本要使用 lua_pcall 而不是 lua_call,因为我们中止脚本的执行会产生一个 Lua 中的“错误”,在 C/C++ 中它是一个异常,只有用 lua_pcall 才能保证这个错误被 Lua 脚本引擎正确处理。

int run_user_script( int nargs, int nresults, int errfunc )
{
    g_begin = GetTickCount();
    _InterlockedIncrement( &g_counter );
    int err = lua_pcall( g_lua, nargs, nresults, errfunc );
    _InterlockedIncrement( &g_counter );
    return err;
}

下面的 check_script_timeout 用来检测脚本超时,需要在另外一个线程中周期性的调用,原因我想就不用解释了吧。它首先检查是否在执行用户脚本,或者是否已经让当前执行的用户脚本中止过。然后看这段脚本执行了多长时间,超过限度就把当前脚本计数记录到 g_check 中去,并通过 lua_sethook 设置一个钩子函数 timeout_break,这个钩子函数会在用户脚本执行时被调用。

void check_script_timeout()
{
    long counter = g_counter;
 
    // 没有执行用户脚本, 不检查超时
    if( (counter & 0x00000001) == 0 )
        return;
 
    // 已经让当前执行的用户脚本中止了
    if( g_check == counter )
        return;
 
    // 如果执行时间超过了设置的超时时间(这里是1秒), 终止它
    if( GetTickCount() - g_begin > 1000 )
    {
        g_check = counter;
        int mask = LUA_MASKCALL | LUA_MASKRET | LUA_MASKLINE | LUA_MASKCOUNT;
        lua_sethook( g_lua, timeout_break, mask, 1);
    }
}

最后就是那个钩子函数了,它首先把钩子去掉,因为这个钩子只要执行一次就行了。由于设置钩子和执行钩子是在不同的线程中,并且钩子从设置到执行需要一定的时间,所以它要通过对比 g_checkg_counter 来判断是否还在运行判断超时所执行的那段脚本,不是就什么也不做,是就通过 luaL_error 产生一个错误,并中止脚本的执行,而这个错误最终会被 run_user_script 中的 lua_pcall 捕获。

void timeout_break( lua_State* L, lua_Debug* ar )
{
    lua_sethook( L, NULL, 0, 0 );
    // 钩子从设置到执行, 需要一段时间, 所以要检测是否仍在执行那个超时的脚本
    if( g_check == g_counter )
        luaL_error( L, "script timeout." );
}

上面的检测使用了两个线程,其实在一个线程中也可以做到,并且更简单。但那样会导致钩子函数频繁执行,影响效率,如果对性能没什么要求的话,也可以采用。

  • Lua
    17 引用 • 17 回帖 • 1 关注
  • 算法
    394 引用 • 254 回帖 • 22 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • lpy
    该回帖仅作者和楼主可见

推荐标签 标签

  • 外包

    有空闲时间是接外包好呢还是学习好呢?

    26 引用 • 232 回帖
  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 16 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    5 引用 • 26 回帖 • 499 关注
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 22 关注
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 400 关注
  • Laravel

    Laravel 是一套简洁、优雅的 PHP Web 开发框架。它采用 MVC 设计,是一款崇尚开发效率的全栈框架。

    19 引用 • 23 回帖 • 702 关注
  • QQ

    1999 年 2 月腾讯正式推出“腾讯 QQ”,在线用户由 1999 年的 2 人(马化腾和张志东)到现在已经发展到上亿用户了,在线人数超过一亿,是目前使用最广泛的聊天软件之一。

    45 引用 • 557 回帖 • 162 关注
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 680 关注
  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    89 引用 • 113 回帖
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖 • 3 关注
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    41 引用 • 40 回帖
  • 博客

    记录并分享人生的经历。

    272 引用 • 2386 回帖
  • Jenkins

    Jenkins 是一套开源的持续集成工具。它提供了非常丰富的插件,让构建、部署、自动化集成项目变得简单易用。

    51 引用 • 37 回帖 • 3 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    35 引用 • 35 回帖
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 641 关注
  • Spark

    Spark 是 UC Berkeley AMP lab 所开源的类 Hadoop MapReduce 的通用并行框架。Spark 拥有 Hadoop MapReduce 所具有的优点;但不同于 MapReduce 的是 Job 中间输出结果可以保存在内存中,从而不再需要读写 HDFS,因此 Spark 能更好地适用于数据挖掘与机器学习等需要迭代的 MapReduce 的算法。

    74 引用 • 46 回帖 • 556 关注
  • 倾城之链
    23 引用 • 66 回帖 • 121 关注
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 395 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 52 关注
  • WebSocket

    WebSocket 是 HTML5 中定义的一种新协议,它实现了浏览器与服务器之间的全双工通信(full-duplex)。

    48 引用 • 206 回帖 • 378 关注
  • sts
    2 引用 • 2 回帖 • 167 关注
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    536 引用 • 672 回帖
  • SendCloud

    SendCloud 由搜狐武汉研发中心孵化的项目,是致力于为开发者提供高质量的触发邮件服务的云端邮件发送平台,为开发者提供便利的 API 接口来调用服务,让邮件准确迅速到达用户收件箱并获得强大的追踪数据。

    2 引用 • 8 回帖 • 446 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    51 引用 • 226 回帖
  • 创业

    你比 99% 的人都优秀么?

    83 引用 • 1398 回帖