Python 3.5的async和await特性(PEP492翻译)(转)

本贴最后更新于 3209 天前,其中的信息可能已经斗转星移

 

原因:

 1,coroutine容易与正常的generators弄混

 2,一个function是否为coroutine由函数体内是否有yield 或者yield from 决定,这不科学。

 3,如果在语法上允许yield的地方才能进行异步调用,那诸如with和for语句中都不能执行异步了。

咋解决呢,把coroutine当成一个native的Python语言特性,与generator完全独立。

Native coroutines及其新的语法使得在异步条件下定义context manager(上下文管理器)和iteration protocols(迭代器协议)成为可能(也就是with和for了)。

通过 async with语句可以使得Python程序在进入和退出runtime context(运行时上下文)时,执行异步调用;

通过 async for 语句使得可以在迭代器中执行异步调用。(老外真是的,老是 make it possible).

 

语法定义

假定你已经知道:

 * Python中coroutines的实现。 implementation of coroutines in Python ( PEP 342 and PEP 380 ). 

 * 一些要被改变的语法来自asyncio框架和"Cofunctions"提议(已经悲剧了)。Motivation for the syntax changes proposed here comes from the asyncio framework ( PEP 3156 ) and the "Cofunctions" proposal ( PEP 3152 , now rejected in favor of this specification).

新定义的coroutine

async def read_data(db):
    pass

native couroutines的关键特性:

* 使用async def定义的函数总是native coroutine,无论其中是否有await表达式。

* async函数中不允许有yield和yield from,将抛出SyntaxErro异常。

* 在内部呢,引入了两个新的code object flags. 

     -- CO_COROUTINE用于标记native corroutine(也就是通过async def 定义的)

     -- CO_ITERABLE_COROUTINE 用于的基于 生成器的coroutine与native coroutines兼容。

   所有的coroutine对象都有CO_GENERATOR标准。

* generator返回generator object, coroutines 返回 coroutine object

* 没有被await on的coroutine在gc时会抛出RuntimeWarning 。

Await表达式

await表达式用于获取一个coroutine的执行结果。

async def read_data(db):
    data = await db.fetch('SELECT ...')
    ...

await,与yield from类似(译注;其实知道的真是不多),将阻塞read_data的执行,直到db.fetch这一awaitable的完成并返回数据。

awaitable(注:主要这个awaitable是名词,不是形容词)可以是: 

1, 从一个native coroutine函数返回的native coroutine object.

2, 以types.coroutine 装饰的(decorated) 生成器函数返回的generator-based coroutine object。

3,一个对象,该对象的__await__方法返回一个迭代器。

    如果__await__返回的不是iterator,则抛出TypeError。

4,CPython的C API定义 tp_as_async->am_await函数。

    如果await出现在async def函数以外,则抛出Syntax Error;

 将awaitable对象以外的任何东西传递给await表达式都会抛出TypeError。

。。。。。。。。。

...忽略严格的语法定义部分...

。。。。。。。。

await表达式的优先级高于**,低于切片[]、函数调用()和attribute reference(属性引用,如x.attribute),

 

Asynchronous Context Managers and "async with"

asynchronous context manager(异步上下文管理器)是能够在enter和exit方法中阻塞(当前coroutine)执行的上下文管理器。又增加了两个魔力函数:__aenter__ 和__aexit__ ,两个函数都必须返回一个awaitable对象。

举个例子:

class AsyncContextManager:
    async def __aenter__(self):
        await log('entering context')
async def __aexit__(self, exc_type, exc, tb):
    await log('exiting context')</pre>

 新的语法:

提出针对异步上下文管理器的新语法定义:

async with EXPR as VAR:
    BLOCK

在语法上等价于:

mgr = (EXPR)
aexit = type(mgr).__aexit__
aenter = type(mgr).__aenter__(mgr)
exc = True

VAR = await aenter
try:
BLOCK
except:
if not await aexit(mgr, *sys.exc_info()):
raise
else:
await aexit(mgr, None, None, None)

和通常的with语句一样,可以在一个await with语句中指定多个上下文管理器。

Example

使用异步上下文管理器可以很容易的实现用于数据库事务管理器的coroutine. 

With asynchronous context managers it is easy to implement proper database transaction managers for coroutines:

async def commit(session, data):
    ...
async with session.transaction():
    ...
    await session.update(data)
    ...</pre>

需要加锁的代码变得更加清晰:Code that needs locking also looks lighter:

async with lock:
    ...

instead of:

 with (yield from lock):
    ...

异步迭代器和"async for"

asynchronous iterable能够在其iter实现中调用异步代码,并且能够在其next方法中调用异步代码。

* 必须实现__aiter__方法,该方法返回一个awaitable,并且该awaitable的结果必须 是一个asynchronous iterator object。An object must implement an __aiter__ method returning an awaitable resulting in an asynchronous iterator object .

* asynchronous iterator object必须实现 __anext__ 成员函数,该成员函数返回 awaitable对象 ;

 * 为停止迭代,__anext__必须抛出StopAsyncIteration 异常。

举个例子:

class AsyncIterable:
    async def __aiter__(self):
        return self
async def __anext__(self):
    data = await self.fetch_data()
    if data:
        return data
    else:
        raise StopAsyncIteration

async def fetch_data(self):</pre>

新语法

A new statement for iterating through asynchronous iterators is proposed:

async for TARGET in ITER:
    BLOCK
else:
    BLOCK2
等价于
iter = (ITER)
iter = await type(iter).__aiter__(iter)
running = True
while running:
    try:
        TARGET = await type(iter).__anext__(iter)
    except StopAsyncIteration:
        running = False
    else:
        BLOCK
else:
    BLOCK2

 

如果用于async for的迭代器没有__aiter__ 成员函数,将抛出TypeError; 

如果在async def函数以外使用async for将抛出SyntaxError错误。

如同通常的 for语句,async for也有可选的else子句。

  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    545 引用 • 672 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • imlonghao

    挺好的,asyncawait 之前在 tornado 的文档看到过,3.5 之后用了的话可以更好看.........

推荐标签 标签

  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    77 引用 • 430 回帖
  • Android

    Android 是一种以 Linux 为基础的开放源码操作系统,主要使用于便携设备。2005 年由 Google 收购注资,并拉拢多家制造商组成开放手机联盟开发改良,逐渐扩展到到平板电脑及其他领域上。

    334 引用 • 323 回帖 • 4 关注
  • PHP

    PHP(Hypertext Preprocessor)是一种开源脚本语言。语法吸收了 C 语言、 Java 和 Perl 的特点,主要适用于 Web 开发领域,据说是世界上最好的编程语言。

    179 引用 • 407 回帖 • 490 关注
  • FreeMarker

    FreeMarker 是一款好用且功能强大的 Java 模版引擎。

    23 引用 • 20 回帖 • 465 关注
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    17 引用 • 53 回帖 • 139 关注
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 637 关注
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖 • 3 关注
  • etcd

    etcd 是一个分布式、高可用的 key-value 数据存储,专门用于在分布式系统中保存关键数据。

    5 引用 • 26 回帖 • 528 关注
  • 导航

    各种网址链接、内容导航。

    42 引用 • 175 回帖
  • 爬虫

    网络爬虫(Spider、Crawler),是一种按照一定的规则,自动地抓取万维网信息的程序。

    106 引用 • 275 回帖 • 1 关注
  • ZeroNet

    ZeroNet 是一个基于比特币加密技术和 BT 网络技术的去中心化的、开放开源的网络和交流系统。

    1 引用 • 21 回帖 • 632 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 2 关注
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    313 引用 • 547 回帖
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 63 关注
  • 国际化

    i18n(其来源是英文单词 internationalization 的首末字符 i 和 n,18 为中间的字符数)是“国际化”的简称。对程序来说,国际化是指在不修改代码的情况下,能根据不同语言及地区显示相应的界面。

    8 引用 • 26 回帖 • 1 关注
  • 知乎

    知乎是网络问答社区,连接各行各业的用户。用户分享着彼此的知识、经验和见解,为中文互联网源源不断地提供多种多样的信息。

    10 引用 • 66 回帖 • 1 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖
  • 职场

    找到自己的位置,萌新烦恼少。

    127 引用 • 1706 回帖
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 316 关注
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 387 关注
  • ngrok

    ngrok 是一个反向代理,通过在公共的端点和本地运行的 Web 服务器之间建立一个安全的通道。

    7 引用 • 63 回帖 • 626 关注
  • RESTful

    一种软件架构设计风格而不是标准,提供了一组设计原则和约束条件,主要用于客户端和服务器交互类的软件。基于这个风格设计的软件可以更简洁,更有层次,更易于实现缓存等机制。

    30 引用 • 114 回帖 • 3 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 60 关注
  • Sublime

    Sublime Text 是一款可以用来写代码、写文章的文本编辑器。支持代码高亮、自动完成,还支持通过插件进行扩展。

    10 引用 • 5 回帖 • 1 关注
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用
  • 深度学习

    深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。

    53 引用 • 40 回帖 • 1 关注
  • 反馈

    Communication channel for makers and users.

    123 引用 • 913 回帖 • 250 关注