Python 关键字 yield 详解以及 Iterable 和 Iterator 区别

本贴最后更新于 2613 天前,其中的信息可能已经事过境迁

迭代器(Iterator)

为了理解 yield 是什么,首先要明白生成器(generator)是什么,在讲生成器之前先说说迭代器(iterator),当创建一个列表(list)时,你可以逐个的读取每一项,这就叫做迭代(iteration)。

  1. mylist = [ 1 , 2 , 3 ]
  2. for i in mylist :
  3. print (i)
  4. 1
  5. 2
  6. 3

Mylist 就是一个迭代器,不管是使用复杂的表达式列表,还是直接创建一个列表,都是可迭代的对象。

  1. mylist = [x*x for x in range( 3 )]
  2. for i in mylist :
  3. print (i)
  4. 0
  5. 1
  6. 4

你可以使用“for··· in ···”来操作可迭代对象,如:list,string,files,这些迭代对象非常方便我们使用,因为你可以按照你的意愿进行重复的读取。但是你不得不预先存储所有的元素在内存中,那些对象里有很多元素时,并不是每一项都对你有用。

生成器(Generators)

生成器同样是可迭代对象,但是你只能读取一次,因为它并没有把所有值存放内存中,它动态的生成值:

  1. mygenerator = (x*x for x in range( 3 ))
  2. for i in mygenerator :
  3. print (i)
  4. 0
  5. 1
  6. 4

使用()和[]结果是一样的,但是,第二次执行“ for in mygenerator”不会有任何结果返回,因为它只能使用一次。首先计算 0,然后计算 1,之后计算 4,依次类推。

Yield

**Yield 是关键字, 用起来像 return,yield 在告诉程序,要求函数返回一个生成 **器。

  1. def createGenerator() :

  2. mylist = range( 3 )

  3. for i in mylist :

  4. yield i*i

  5. mygenerator = createGenerator() # create a generator

  6. print (mygenerator) # mygenerator is an object!

  7. < **generator object **createGenerator at 0xb7555c34 >

  8. for i in mygenerator:

  9. print (i)

  10. 0

  11. 1

  12. 4

这个示例本身没什么意义,但是它很清晰地说明函数将返回一组仅能读一次的值,要想掌握 yield,首先必须理解的是:当你调用生成器函数的时候,如上例中的 createGenerator(),程序并不会执行函数体内的代码,它仅仅只是返回生成器对象,这种方式颇为微妙。函数体内的代码只有直到每次循环迭代(for)生成器的时候才会运行。

函数第一次运行时,它会从函数开始处直到碰到 yield 时,就返回循环的第一个值,然后,交互的运行、返回,直到没有值返回为止。如果函数在运行但是并没有遇到 yield,就认为该生成器是空,原因可能是循环终止,或者没有满足任何”if/else”。

接下来读一小段代码来理解生成器的优点:

控制生成器穷举

  1. class Bank(): # 创建银行,构造 ATM 机

  2. ... crisis = False
  3. ... def create_atm( self ) :
  4. ... while not self .crisis :
  5. ... yield "$100"
  6. hsbc = Bank() # 没有危机时,你想要多少,ATM 就可以吐多少

  7. corner_street_atm = hsbc.create_atm()

  8. print (corner_street_atm.next())

  9. $ 100
  10. print (corner_street_atm.next())

  11. $ 100
  12. print ([corner_street_atm.next() for cash in range( 5 )])

  13. [ '$100' , '$100' , '$100' , '$100' , '$100' ]
  14. hsbc.crisis = True # 危机来临,银行没钱了

  15. print (corner_street_atm.next())

  16. wall_street_atm = hsbc.ceate_atm() # 新建 ATM,银行仍然没钱

  17. print (wall_street_atm.next())

  18. hsbc.crisis = False # 麻烦就是,即使危机过后银行还是空的

  19. print (corner_street_atm.next())

  20. brand_new_atm = hsbc.create_atm() # 构造新的 ATM,恢复业务

  21. for cash in brand_new_atm :

  22. ... print cash
  23. $ 100
  24. $ 100
  25. $ 100
  26. $ 100
  27. $ 100
  28. $ 100
  29. $ 100
  30. $ 100
  31. $ 100

对于访问控制资源,生成器显得非常有用。

迭代工具,你最好的朋友

**迭代工具模块包含了操做指定的函数用于操作迭代器。 **想复制一个迭代器出来?链接两个迭代器?以 one liner(这里的 one-liner 只需一行代码能搞定的任务)用内嵌的列表组合一组值?不使用 list 创建 Map/Zip?···,你要做的就是 import itertools,举个例子吧:

四匹马赛跑到达终点排名的所有可能性:

  1. horses = [ 1 , 2 , 3 , 4 ]

  2. races = itertools.permutations(horses)

  3. print (races)

  4. print (list(itertools.permutations(horses)))

  5. [( 1 , 2 , 3 , 4 ),
  6. ( 1 , 2 , 4 , 3 ),
  7. ( 1 , 3 , 2 , 4 ),
  8. ( 1 , 3 , 4 , 2 ),
  9. ( 1 , 4 , 2 , 3 ),
  10. ( 1 , 4 , 3 , 2 ),
  11. ( 2 , 1 , 3 , 4 ),
  12. ( 2 , 1 , 4 , 3 ),
  13. ( 2 , 3 , 1 , 4 ),
  14. ( 2 , 3 , 4 , 1 ),
  15. ( 2 , 4 , 1 , 3 ),
  16. ( 2 , 4 , 3 , 1 ),
  17. ( 3 , 1 , 2 , 4 ),
  18. ( 3 , 1 , 4 , 2 ),
  19. ( 3 , 2 , 1 , 4 ),
  20. ( 3 , 2 , 4 , 1 ),
  21. ( 3 , 4 , 1 , 2 ),
  22. ( 3 , 4 , 2 , 1 ),
  23. ( 4 , 1 , 2 , 3 ),
  24. ( 4 , 1 , 3 , 2 ),
  25. ( 4 , 2 , 1 , 3 ),
  26. ( 4 , 2 , 3 , 1 ),
  27. ( 4 , 3 , 1 , 2 ),
  28. ( 4 , 3 , 2 , 1 )]

理解迭代的内部机制:

迭代(iteration)就是对可迭代对象(iterables,实现了__iter__()方法)和迭代器(iterators,实现了__next__()方法)的一个操作过程。可迭代对象是任何可返回一个迭代器的对象,迭代器是应用在迭代对象中迭代的对象,换一种方式说的话就是:iterable 对象的__iter__()方法可以返回 iterator 对象,iterator 通过调用 next()方法获取其中的每一个值(译者注),读者可以结合 Java API 中的 Iterable 接口和 Iterator 接口进行类比。

java Iterable 接口:

public interface Iterable

Implementing this interface allows an object to be the target of the "foreach" statement.

方法:

Iterator<T> iterator()

Returns an iterator over a set of elements of type T.

Returns:

an Iterator.

Iterator 接口:

public interface Iterator

An iterator over a collection. Iterator takes the place of Enumeration in the Java collections framework. Iterators differ from enumerations in two ways:

  • Iterators allow the caller to remove elements from the underlying collection during the iteration with well-defined semantics.
  • Method names have been improved.

This interface is a member of the Java Collections Framework .

boolean hasNext()
Returns true if the iteration has more elements.
E next()
Returns the next element in the iteration.
void remove()
Removes from the underlying collection the last element returned by the iterator (optional operation).

为什么一定要去实现 Iterable 这个接口呢? 为什么不直接实现 Iterator 接口呢?

看一下 JDK 中的集合类,比如 List 一族或者 Set 一族,
都是实现了 Iterable 接口,但并不直接实现 Iterator 接口。
仔细想一下这么做是有道理的。 **因为 Iterator 接口的核心方法 next()或者 hasNext()
是依赖于迭代器的当前迭代位置的。 **
如果 Collection 直接实现 Iterator 接口,势必导致集合对象中包含当前迭代位置的数据(指针)。
当集合在不同方法间被传递时,由于当前迭代位置不可预置,那么 next()方法的结果会变成不可预知。
除非再为 Iterator 接口添加一个 reset()方法,用来重置当前迭代位置。
但即时这样,Collection 也只能同时存在一个当前迭代位置。
而 Iterable 则不然,每次调用都会返回一个从头开始计数的迭代器。
多个迭代器是互不干扰的
来源 :http://blog.csdn.net/fish0058/article/details/23199249

  • 笔记

    好记性不如烂笔头。

    308 引用 • 793 回帖
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    545 引用 • 672 回帖

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Bootstrap

    Bootstrap 是 Twitter 推出的一个用于前端开发的开源工具包。它由 Twitter 的设计师 Mark Otto 和 Jacob Thornton 合作开发,是一个 CSS / HTML 框架。

    18 引用 • 33 回帖 • 667 关注
  • sts
    2 引用 • 2 回帖 • 197 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1435 引用 • 10056 回帖 • 489 关注
  • Bug

    Bug 本意是指臭虫、缺陷、损坏、犯贫、窃听器、小虫等。现在人们把在程序中一些缺陷或问题统称为 bug(漏洞)。

    76 引用 • 1737 回帖 • 1 关注
  • OpenShift

    红帽提供的 PaaS 云,支持多种编程语言,为开发人员提供了更为灵活的框架、存储选择。

    14 引用 • 20 回帖 • 632 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    107 引用 • 153 回帖
  • Notion

    Notion - The all-in-one workspace for your notes, tasks, wikis, and databases.

    7 引用 • 40 回帖
  • 友情链接

    确认过眼神后的灵魂连接,站在链在!

    24 引用 • 373 回帖 • 1 关注
  • CongSec

    本标签主要用于分享网络空间安全专业的学习笔记

    1 引用 • 1 回帖 • 15 关注
  • WebComponents

    Web Components 是 W3C 定义的标准,它给了前端开发者扩展浏览器标签的能力,可以方便地定制可复用组件,更好的进行模块化开发,解放了前端开发者的生产力。

    1 引用 • 4 关注
  • jsoup

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS 以及类似于 jQuery 的操作方法来取出和操作数据。

    6 引用 • 1 回帖 • 483 关注
  • AngularJS

    AngularJS 诞生于 2009 年,由 Misko Hevery 等人创建,后为 Google 所收购。是一款优秀的前端 JS 框架,已经被用于 Google 的多款产品当中。AngularJS 有着诸多特性,最为核心的是:MVC、模块化、自动化双向数据绑定、语义化标签、依赖注入等。2.0 版本后已经改名为 Angular。

    12 引用 • 50 回帖 • 483 关注
  • SEO

    发布对别人有帮助的原创内容是最好的 SEO 方式。

    35 引用 • 200 回帖 • 27 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 416 关注
  • 星云链

    星云链是一个开源公链,业内简单的将其称为区块链上的谷歌。其实它不仅仅是区块链搜索引擎,一个公链的所有功能,它基本都有,比如你可以用它来开发部署你的去中心化的 APP,你可以在上面编写智能合约,发送交易等等。3 分钟快速接入星云链 (NAS) 测试网

    3 引用 • 16 回帖 • 6 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    86 引用 • 122 回帖 • 626 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    66 引用 • 114 回帖 • 223 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 635 关注
  • 思源笔记

    思源笔记是一款隐私优先的个人知识管理系统,支持完全离线使用,同时也支持端到端加密同步。

    融合块、大纲和双向链接,重构你的思维。

    23020 引用 • 92599 回帖
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    171 引用 • 512 回帖
  • 数据库

    据说 99% 的性能瓶颈都在数据库。

    343 引用 • 723 回帖
  • 服务

    提供一个服务绝不仅仅是简单的把硬件和软件累加在一起,它包括了服务的可靠性、服务的标准化、以及对服务的监控、维护、技术支持等。

    41 引用 • 24 回帖
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 60 关注
  • 小说

    小说是以刻画人物形象为中心,通过完整的故事情节和环境描写来反映社会生活的文学体裁。

    28 引用 • 108 回帖
  • OkHttp

    OkHttp 是一款 HTTP & HTTP/2 客户端库,专为 Android 和 Java 应用打造。

    16 引用 • 6 回帖 • 75 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 668 关注