Python 关键字 yield 详解以及 Iterable 和 Iterator 区别

本贴最后更新于 2460 天前,其中的信息可能已经事过境迁

迭代器(Iterator)

为了理解 yield 是什么,首先要明白生成器(generator)是什么,在讲生成器之前先说说迭代器(iterator),当创建一个列表(list)时,你可以逐个的读取每一项,这就叫做迭代(iteration)。

  1. mylist = [ 1 , 2 , 3 ]
  2. for i in mylist :
  3. print (i)
  4. 1
  5. 2
  6. 3

Mylist 就是一个迭代器,不管是使用复杂的表达式列表,还是直接创建一个列表,都是可迭代的对象。

  1. mylist = [x*x for x in range( 3 )]
  2. for i in mylist :
  3. print (i)
  4. 0
  5. 1
  6. 4

你可以使用“for··· in ···”来操作可迭代对象,如:list,string,files,这些迭代对象非常方便我们使用,因为你可以按照你的意愿进行重复的读取。但是你不得不预先存储所有的元素在内存中,那些对象里有很多元素时,并不是每一项都对你有用。

生成器(Generators)

生成器同样是可迭代对象,但是你只能读取一次,因为它并没有把所有值存放内存中,它动态的生成值:

  1. mygenerator = (x*x for x in range( 3 ))
  2. for i in mygenerator :
  3. print (i)
  4. 0
  5. 1
  6. 4

使用()和[]结果是一样的,但是,第二次执行“ for in mygenerator”不会有任何结果返回,因为它只能使用一次。首先计算 0,然后计算 1,之后计算 4,依次类推。

Yield

**Yield 是关键字, 用起来像 return,yield 在告诉程序,要求函数返回一个生成 **器。

  1. def createGenerator() :

  2. mylist = range( 3 )

  3. for i in mylist :

  4. yield i*i

  5. mygenerator = createGenerator() # create a generator

  6. print (mygenerator) # mygenerator is an object!

  7. < **generator object **createGenerator at 0xb7555c34 >

  8. for i in mygenerator:

  9. print (i)

  10. 0

  11. 1

  12. 4

这个示例本身没什么意义,但是它很清晰地说明函数将返回一组仅能读一次的值,要想掌握 yield,首先必须理解的是:当你调用生成器函数的时候,如上例中的 createGenerator(),程序并不会执行函数体内的代码,它仅仅只是返回生成器对象,这种方式颇为微妙。函数体内的代码只有直到每次循环迭代(for)生成器的时候才会运行。

函数第一次运行时,它会从函数开始处直到碰到 yield 时,就返回循环的第一个值,然后,交互的运行、返回,直到没有值返回为止。如果函数在运行但是并没有遇到 yield,就认为该生成器是空,原因可能是循环终止,或者没有满足任何”if/else”。

接下来读一小段代码来理解生成器的优点:

控制生成器穷举

  1. class Bank(): # 创建银行,构造 ATM 机

  2. ... crisis = False
  3. ... def create_atm( self ) :
  4. ... while not self .crisis :
  5. ... yield "$100"
  6. hsbc = Bank() # 没有危机时,你想要多少,ATM 就可以吐多少

  7. corner_street_atm = hsbc.create_atm()

  8. print (corner_street_atm.next())

  9. $ 100
  10. print (corner_street_atm.next())

  11. $ 100
  12. print ([corner_street_atm.next() for cash in range( 5 )])

  13. [ '$100' , '$100' , '$100' , '$100' , '$100' ]
  14. hsbc.crisis = True # 危机来临,银行没钱了

  15. print (corner_street_atm.next())

  16. wall_street_atm = hsbc.ceate_atm() # 新建 ATM,银行仍然没钱

  17. print (wall_street_atm.next())

  18. hsbc.crisis = False # 麻烦就是,即使危机过后银行还是空的

  19. print (corner_street_atm.next())

  20. brand_new_atm = hsbc.create_atm() # 构造新的 ATM,恢复业务

  21. for cash in brand_new_atm :

  22. ... print cash
  23. $ 100
  24. $ 100
  25. $ 100
  26. $ 100
  27. $ 100
  28. $ 100
  29. $ 100
  30. $ 100
  31. $ 100

对于访问控制资源,生成器显得非常有用。

迭代工具,你最好的朋友

**迭代工具模块包含了操做指定的函数用于操作迭代器。 **想复制一个迭代器出来?链接两个迭代器?以 one liner(这里的 one-liner 只需一行代码能搞定的任务)用内嵌的列表组合一组值?不使用 list 创建 Map/Zip?···,你要做的就是 import itertools,举个例子吧:

四匹马赛跑到达终点排名的所有可能性:

  1. horses = [ 1 , 2 , 3 , 4 ]

  2. races = itertools.permutations(horses)

  3. print (races)

  4. print (list(itertools.permutations(horses)))

  5. [( 1 , 2 , 3 , 4 ),
  6. ( 1 , 2 , 4 , 3 ),
  7. ( 1 , 3 , 2 , 4 ),
  8. ( 1 , 3 , 4 , 2 ),
  9. ( 1 , 4 , 2 , 3 ),
  10. ( 1 , 4 , 3 , 2 ),
  11. ( 2 , 1 , 3 , 4 ),
  12. ( 2 , 1 , 4 , 3 ),
  13. ( 2 , 3 , 1 , 4 ),
  14. ( 2 , 3 , 4 , 1 ),
  15. ( 2 , 4 , 1 , 3 ),
  16. ( 2 , 4 , 3 , 1 ),
  17. ( 3 , 1 , 2 , 4 ),
  18. ( 3 , 1 , 4 , 2 ),
  19. ( 3 , 2 , 1 , 4 ),
  20. ( 3 , 2 , 4 , 1 ),
  21. ( 3 , 4 , 1 , 2 ),
  22. ( 3 , 4 , 2 , 1 ),
  23. ( 4 , 1 , 2 , 3 ),
  24. ( 4 , 1 , 3 , 2 ),
  25. ( 4 , 2 , 1 , 3 ),
  26. ( 4 , 2 , 3 , 1 ),
  27. ( 4 , 3 , 1 , 2 ),
  28. ( 4 , 3 , 2 , 1 )]

理解迭代的内部机制:

迭代(iteration)就是对可迭代对象(iterables,实现了__iter__()方法)和迭代器(iterators,实现了__next__()方法)的一个操作过程。可迭代对象是任何可返回一个迭代器的对象,迭代器是应用在迭代对象中迭代的对象,换一种方式说的话就是:iterable 对象的__iter__()方法可以返回 iterator 对象,iterator 通过调用 next()方法获取其中的每一个值(译者注),读者可以结合 Java API 中的 Iterable 接口和 Iterator 接口进行类比。

java Iterable 接口:

public interface Iterable

Implementing this interface allows an object to be the target of the "foreach" statement.

方法:

Iterator<T> iterator()

Returns an iterator over a set of elements of type T.

Returns:

an Iterator.

Iterator 接口:

public interface Iterator

An iterator over a collection. Iterator takes the place of Enumeration in the Java collections framework. Iterators differ from enumerations in two ways:

  • Iterators allow the caller to remove elements from the underlying collection during the iteration with well-defined semantics.
  • Method names have been improved.

This interface is a member of the Java Collections Framework .

boolean hasNext()
Returns true if the iteration has more elements.
E next()
Returns the next element in the iteration.
void remove()
Removes from the underlying collection the last element returned by the iterator (optional operation).

为什么一定要去实现 Iterable 这个接口呢? 为什么不直接实现 Iterator 接口呢?

看一下 JDK 中的集合类,比如 List 一族或者 Set 一族,
都是实现了 Iterable 接口,但并不直接实现 Iterator 接口。
仔细想一下这么做是有道理的。 **因为 Iterator 接口的核心方法 next()或者 hasNext()
是依赖于迭代器的当前迭代位置的。 **
如果 Collection 直接实现 Iterator 接口,势必导致集合对象中包含当前迭代位置的数据(指针)。
当集合在不同方法间被传递时,由于当前迭代位置不可预置,那么 next()方法的结果会变成不可预知。
除非再为 Iterator 接口添加一个 reset()方法,用来重置当前迭代位置。
但即时这样,Collection 也只能同时存在一个当前迭代位置。
而 Iterable 则不然,每次调用都会返回一个从头开始计数的迭代器。
多个迭代器是互不干扰的
来源 :http://blog.csdn.net/fish0058/article/details/23199249

  • 笔记

    好记性不如烂笔头。

    306 引用 • 782 回帖
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    536 引用 • 672 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • BAE

    百度应用引擎(Baidu App Engine)提供了 PHP、Java、Python 的执行环境,以及云存储、消息服务、云数据库等全面的云服务。它可以让开发者实现自动地部署和管理应用,并且提供动态扩容和负载均衡的运行环境,让开发者不用考虑高成本的运维工作,只需专注于业务逻辑,大大降低了开发者学习和迁移的成本。

    19 引用 • 75 回帖 • 616 关注
  • frp

    frp 是一个可用于内网穿透的高性能的反向代理应用,支持 TCP、UDP、 HTTP 和 HTTPS 协议。

    16 引用 • 7 回帖 • 2 关注
  • 服务器

    服务器,也称伺服器,是提供计算服务的设备。由于服务器需要响应服务请求,并进行处理,因此一般来说服务器应具备承担服务并且保障服务的能力。

    124 引用 • 580 回帖
  • Flume

    Flume 是一套分布式的、可靠的,可用于有效地收集、聚合和搬运大量日志数据的服务架构。

    9 引用 • 6 回帖 • 613 关注
  • Kotlin

    Kotlin 是一种在 Java 虚拟机上运行的静态类型编程语言,由 JetBrains 设计开发并开源。Kotlin 可以编译成 Java 字节码,也可以编译成 JavaScript,方便在没有 JVM 的设备上运行。在 Google I/O 2017 中,Google 宣布 Kotlin 成为 Android 官方开发语言。

    19 引用 • 33 回帖 • 51 关注
  • 程序员

    程序员是从事程序开发、程序维护的专业人员。

    544 引用 • 3531 回帖
  • 区块链

    区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。所谓共识机制是区块链系统中实现不同节点之间建立信任、获取权益的数学算法 。

    91 引用 • 751 回帖
  • SQLServer

    SQL Server 是由 [微软] 开发和推广的关系数据库管理系统(DBMS),它最初是由 微软、Sybase 和 Ashton-Tate 三家公司共同开发的,并于 1988 年推出了第一个 OS/2 版本。

    19 引用 • 31 回帖 • 2 关注
  • 面试

    面试造航母,上班拧螺丝。多面试,少加班。

    324 引用 • 1395 回帖 • 1 关注
  • Swagger

    Swagger 是一款非常流行的 API 开发工具,它遵循 OpenAPI Specification(这是一种通用的、和编程语言无关的 API 描述规范)。Swagger 贯穿整个 API 生命周期,如 API 的设计、编写文档、测试和部署。

    26 引用 • 35 回帖
  • Ruby

    Ruby 是一种开源的面向对象程序设计的服务器端脚本语言,在 20 世纪 90 年代中期由日本的松本行弘(まつもとゆきひろ/Yukihiro Matsumoto)设计并开发。在 Ruby 社区,松本也被称为马茨(Matz)。

    7 引用 • 31 回帖 • 196 关注
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    311 引用 • 546 回帖
  • 快应用

    快应用 是基于手机硬件平台的新型应用形态;标准是由主流手机厂商组成的快应用联盟联合制定;快应用标准的诞生将在研发接口、能力接入、开发者服务等层面建设标准平台;以平台化的生态模式对个人开发者和企业开发者全品类开放。

    15 引用 • 127 回帖 • 1 关注
  • 分享

    有什么新发现就分享给大家吧!

    245 引用 • 1776 回帖 • 1 关注
  • Ubuntu

    Ubuntu(友帮拓、优般图、乌班图)是一个以桌面应用为主的 Linux 操作系统,其名称来自非洲南部祖鲁语或豪萨语的“ubuntu”一词,意思是“人性”、“我的存在是因为大家的存在”,是非洲传统的一种价值观,类似华人社会的“仁爱”思想。Ubuntu 的目标在于为一般用户提供一个最新的、同时又相当稳定的主要由自由软件构建而成的操作系统。

    123 引用 • 168 回帖
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 473 关注
  • 负能量

    上帝为你关上了一扇门,然后就去睡觉了....努力不一定能成功,但不努力一定很轻松 (° ー °〃)

    88 引用 • 1234 回帖 • 441 关注
  • abitmean

    有点意思就行了

    39 关注
  • 资讯

    资讯是用户因为及时地获得它并利用它而能够在相对短的时间内给自己带来价值的信息,资讯有时效性和地域性。

    54 引用 • 85 回帖
  • gRpc
    11 引用 • 9 回帖 • 49 关注
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 1 关注
  • 运维

    互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

    148 引用 • 257 回帖
  • 锤子科技

    锤子科技(Smartisan)成立于 2012 年 5 月,是一家制造移动互联网终端设备的公司,公司的使命是用完美主义的工匠精神,打造用户体验一流的数码消费类产品(智能手机为主),改善人们的生活质量。

    4 引用 • 31 回帖 • 8 关注
  • ngrok

    ngrok 是一个反向代理,通过在公共的端点和本地运行的 Web 服务器之间建立一个安全的通道。

    7 引用 • 63 回帖 • 613 关注
  • CAP

    CAP 指的是在一个分布式系统中, Consistency(一致性)、 Availability(可用性)、Partition tolerance(分区容错性),三者不可兼得。

    11 引用 • 5 回帖 • 580 关注
  • 游戏

    沉迷游戏伤身,强撸灰飞烟灭。

    171 引用 • 814 回帖
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 641 关注