Python 关键字 yield 详解以及 Iterable 和 Iterator 区别

本贴最后更新于 2383 天前,其中的信息可能已经事过境迁

迭代器(Iterator)

为了理解 yield 是什么,首先要明白生成器(generator)是什么,在讲生成器之前先说说迭代器(iterator),当创建一个列表(list)时,你可以逐个的读取每一项,这就叫做迭代(iteration)。

  1. mylist = [ 1 , 2 , 3 ]
  2. for i in mylist :
  3. print (i)
  4. 1
  5. 2
  6. 3

Mylist 就是一个迭代器,不管是使用复杂的表达式列表,还是直接创建一个列表,都是可迭代的对象。

  1. mylist = [x*x for x in range( 3 )]
  2. for i in mylist :
  3. print (i)
  4. 0
  5. 1
  6. 4

你可以使用“for··· in ···”来操作可迭代对象,如:list,string,files,这些迭代对象非常方便我们使用,因为你可以按照你的意愿进行重复的读取。但是你不得不预先存储所有的元素在内存中,那些对象里有很多元素时,并不是每一项都对你有用。

生成器(Generators)

生成器同样是可迭代对象,但是你只能读取一次,因为它并没有把所有值存放内存中,它动态的生成值:

  1. mygenerator = (x*x for x in range( 3 ))
  2. for i in mygenerator :
  3. print (i)
  4. 0
  5. 1
  6. 4

使用()和[]结果是一样的,但是,第二次执行“ for in mygenerator”不会有任何结果返回,因为它只能使用一次。首先计算 0,然后计算 1,之后计算 4,依次类推。

Yield

**Yield 是关键字, 用起来像 return,yield 在告诉程序,要求函数返回一个生成 **器。

  1. def createGenerator() :

  2. mylist = range( 3 )

  3. for i in mylist :

  4. yield i*i

  5. mygenerator = createGenerator() # create a generator

  6. print (mygenerator) # mygenerator is an object!

  7. < **generator object **createGenerator at 0xb7555c34 >

  8. for i in mygenerator:

  9. print (i)

  10. 0

  11. 1

  12. 4

这个示例本身没什么意义,但是它很清晰地说明函数将返回一组仅能读一次的值,要想掌握 yield,首先必须理解的是:当你调用生成器函数的时候,如上例中的 createGenerator(),程序并不会执行函数体内的代码,它仅仅只是返回生成器对象,这种方式颇为微妙。函数体内的代码只有直到每次循环迭代(for)生成器的时候才会运行。

函数第一次运行时,它会从函数开始处直到碰到 yield 时,就返回循环的第一个值,然后,交互的运行、返回,直到没有值返回为止。如果函数在运行但是并没有遇到 yield,就认为该生成器是空,原因可能是循环终止,或者没有满足任何”if/else”。

接下来读一小段代码来理解生成器的优点:

控制生成器穷举

  1. class Bank(): # 创建银行,构造 ATM 机

  2. ... crisis = False
  3. ... def create_atm( self ) :
  4. ... while not self .crisis :
  5. ... yield "$100"
  6. hsbc = Bank() # 没有危机时,你想要多少,ATM 就可以吐多少

  7. corner_street_atm = hsbc.create_atm()

  8. print (corner_street_atm.next())

  9. $ 100
  10. print (corner_street_atm.next())

  11. $ 100
  12. print ([corner_street_atm.next() for cash in range( 5 )])

  13. [ '$100' , '$100' , '$100' , '$100' , '$100' ]
  14. hsbc.crisis = True # 危机来临,银行没钱了

  15. print (corner_street_atm.next())

  16. wall_street_atm = hsbc.ceate_atm() # 新建 ATM,银行仍然没钱

  17. print (wall_street_atm.next())

  18. hsbc.crisis = False # 麻烦就是,即使危机过后银行还是空的

  19. print (corner_street_atm.next())

  20. brand_new_atm = hsbc.create_atm() # 构造新的 ATM,恢复业务

  21. for cash in brand_new_atm :

  22. ... print cash
  23. $ 100
  24. $ 100
  25. $ 100
  26. $ 100
  27. $ 100
  28. $ 100
  29. $ 100
  30. $ 100
  31. $ 100

对于访问控制资源,生成器显得非常有用。

迭代工具,你最好的朋友

**迭代工具模块包含了操做指定的函数用于操作迭代器。 **想复制一个迭代器出来?链接两个迭代器?以 one liner(这里的 one-liner 只需一行代码能搞定的任务)用内嵌的列表组合一组值?不使用 list 创建 Map/Zip?···,你要做的就是 import itertools,举个例子吧:

四匹马赛跑到达终点排名的所有可能性:

  1. horses = [ 1 , 2 , 3 , 4 ]

  2. races = itertools.permutations(horses)

  3. print (races)

  4. print (list(itertools.permutations(horses)))

  5. [( 1 , 2 , 3 , 4 ),
  6. ( 1 , 2 , 4 , 3 ),
  7. ( 1 , 3 , 2 , 4 ),
  8. ( 1 , 3 , 4 , 2 ),
  9. ( 1 , 4 , 2 , 3 ),
  10. ( 1 , 4 , 3 , 2 ),
  11. ( 2 , 1 , 3 , 4 ),
  12. ( 2 , 1 , 4 , 3 ),
  13. ( 2 , 3 , 1 , 4 ),
  14. ( 2 , 3 , 4 , 1 ),
  15. ( 2 , 4 , 1 , 3 ),
  16. ( 2 , 4 , 3 , 1 ),
  17. ( 3 , 1 , 2 , 4 ),
  18. ( 3 , 1 , 4 , 2 ),
  19. ( 3 , 2 , 1 , 4 ),
  20. ( 3 , 2 , 4 , 1 ),
  21. ( 3 , 4 , 1 , 2 ),
  22. ( 3 , 4 , 2 , 1 ),
  23. ( 4 , 1 , 2 , 3 ),
  24. ( 4 , 1 , 3 , 2 ),
  25. ( 4 , 2 , 1 , 3 ),
  26. ( 4 , 2 , 3 , 1 ),
  27. ( 4 , 3 , 1 , 2 ),
  28. ( 4 , 3 , 2 , 1 )]

理解迭代的内部机制:

迭代(iteration)就是对可迭代对象(iterables,实现了__iter__()方法)和迭代器(iterators,实现了__next__()方法)的一个操作过程。可迭代对象是任何可返回一个迭代器的对象,迭代器是应用在迭代对象中迭代的对象,换一种方式说的话就是:iterable 对象的__iter__()方法可以返回 iterator 对象,iterator 通过调用 next()方法获取其中的每一个值(译者注),读者可以结合 Java API 中的 Iterable 接口和 Iterator 接口进行类比。

java Iterable 接口:

public interface Iterable

Implementing this interface allows an object to be the target of the "foreach" statement.

方法:

Iterator<T> iterator()

Returns an iterator over a set of elements of type T.

Returns:

an Iterator.

Iterator 接口:

public interface Iterator

An iterator over a collection. Iterator takes the place of Enumeration in the Java collections framework. Iterators differ from enumerations in two ways:

  • Iterators allow the caller to remove elements from the underlying collection during the iteration with well-defined semantics.
  • Method names have been improved.

This interface is a member of the Java Collections Framework .

boolean hasNext()
Returns true if the iteration has more elements.
E next()
Returns the next element in the iteration.
void remove()
Removes from the underlying collection the last element returned by the iterator (optional operation).

为什么一定要去实现 Iterable 这个接口呢? 为什么不直接实现 Iterator 接口呢?

看一下 JDK 中的集合类,比如 List 一族或者 Set 一族,
都是实现了 Iterable 接口,但并不直接实现 Iterator 接口。
仔细想一下这么做是有道理的。 **因为 Iterator 接口的核心方法 next()或者 hasNext()
是依赖于迭代器的当前迭代位置的。 **
如果 Collection 直接实现 Iterator 接口,势必导致集合对象中包含当前迭代位置的数据(指针)。
当集合在不同方法间被传递时,由于当前迭代位置不可预置,那么 next()方法的结果会变成不可预知。
除非再为 Iterator 接口添加一个 reset()方法,用来重置当前迭代位置。
但即时这样,Collection 也只能同时存在一个当前迭代位置。
而 Iterable 则不然,每次调用都会返回一个从头开始计数的迭代器。
多个迭代器是互不干扰的
来源 :http://blog.csdn.net/fish0058/article/details/23199249

  • 笔记

    好记性不如烂笔头。

    305 引用 • 780 回帖 • 1 关注
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    536 引用 • 672 回帖 • 1 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 安全

    安全永远都不是一个小问题。

    189 引用 • 813 回帖
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    84 引用 • 139 回帖 • 2 关注
  • RYMCU

    RYMCU 致力于打造一个即严谨又活泼、专业又不失有趣,为数百万人服务的开源嵌入式知识学习交流平台。

    4 引用 • 6 回帖 • 41 关注
  • 招聘

    哪里都缺人,哪里都不缺人。

    189 引用 • 1056 回帖
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 30 关注
  • Redis

    Redis 是一个开源的使用 ANSI C 语言编写、支持网络、可基于内存亦可持久化的日志型、Key-Value 数据库,并提供多种语言的 API。从 2010 年 3 月 15 日起,Redis 的开发工作由 VMware 主持。从 2013 年 5 月开始,Redis 的开发由 Pivotal 赞助。

    284 引用 • 247 回帖 • 169 关注
  • App

    App(应用程序,Application 的缩写)一般指手机软件。

    90 引用 • 383 回帖 • 1 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    103 引用 • 294 回帖 • 1 关注
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖
  • MySQL

    MySQL 是一个关系型数据库管理系统,由瑞典 MySQL AB 公司开发,目前属于 Oracle 公司。MySQL 是最流行的关系型数据库管理系统之一。

    675 引用 • 535 回帖
  • 996
    13 引用 • 200 回帖 • 2 关注
  • B3log

    B3log 是一个开源组织,名字来源于“Bulletin Board Blog”缩写,目标是将独立博客与论坛结合,形成一种新的网络社区体验,详细请看 B3log 构思。目前 B3log 已经开源了多款产品:SymSoloVditor思源笔记

    1083 引用 • 3461 回帖 • 284 关注
  • 博客

    记录并分享人生的经历。

    270 引用 • 2386 回帖
  • danl
    66 关注
  • Pipe

    Pipe 是一款小而美的开源博客平台。Pipe 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    131 引用 • 1114 回帖 • 148 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    711 引用 • 1173 回帖 • 161 关注
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 7 关注
  • Flutter

    Flutter 是谷歌的移动 UI 框架,可以快速在 iOS 和 Android 上构建高质量的原生用户界面。 Flutter 可以与现有的代码一起工作,它正在被越来越多的开发者和组织使用,并且 Flutter 是完全免费、开源的。

    39 引用 • 92 回帖 • 6 关注
  • JVM

    JVM(Java Virtual Machine)Java 虚拟机是一个微型操作系统,有自己的硬件构架体系,还有相应的指令系统。能够识别 Java 独特的 .class 文件(字节码),能够将这些文件中的信息读取出来,使得 Java 程序只需要生成 Java 虚拟机上的字节码后就能在不同操作系统平台上进行运行。

    180 引用 • 120 回帖
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖
  • Node.js

    Node.js 是一个基于 Chrome JavaScript 运行时建立的平台, 用于方便地搭建响应速度快、易于扩展的网络应用。Node.js 使用事件驱动, 非阻塞 I/O 模型而得以轻量和高效。

    138 引用 • 268 回帖 • 191 关注
  • 反馈

    Communication channel for makers and users.

    123 引用 • 906 回帖 • 194 关注
  • ActiveMQ

    ActiveMQ 是 Apache 旗下的一款开源消息总线系统,它完整实现了 JMS 规范,是一个企业级的消息中间件。

    19 引用 • 13 回帖 • 626 关注
  • Typecho

    Typecho 是一款博客程序,它在 GPLv2 许可证下发行,基于 PHP 构建,可以运行在各种平台上,支持多种数据库(MySQL、PostgreSQL、SQLite)。

    12 引用 • 60 回帖 • 461 关注
  • Dubbo

    Dubbo 是一个分布式服务框架,致力于提供高性能和透明化的 RPC 远程服务调用方案,是 [阿里巴巴] SOA 服务化治理方案的核心框架,每天为 2,000+ 个服务提供 3,000,000,000+ 次访问量支持,并被广泛应用于阿里巴巴集团的各成员站点。

    60 引用 • 82 回帖 • 612 关注
  • 新人

    让我们欢迎这对新人。哦,不好意思说错了,让我们欢迎这位新人!
    新手上路,请谨慎驾驶!

    51 引用 • 226 回帖
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖 • 1 关注