Python:itertools模块使用说明

本贴最后更新于 4178 天前,其中的信息可能已经时移世改

itertools模块为python2.6之后引入的,包含创建有效迭代器的函数,可以用各种方式对数据进行循环操作,此模块中的所有函数返回的迭代器都可以与for循环语句以及其他包含迭代器(如生成器和生成器表达式)的函数联合使用。

In [1]: from itertools import *
#用xrange创建长度10000,元素均为0的列表
In [2]: timeit [0 for i in xrange(10000)]
1000 loops, best of 3: 404 us per loop
#用itertools创建长度10000,元素均为0的列表,性能明显提高。原因是迭代器创建列表对象是一次性分配完内存
In [3]: timeit list(repeat(0,10000))
10000 loops, best of 3: 75.8 us per loop
#连接两个列表
In [4]: it=chain(xrange(5),"abc")

In [5]: list(it)
Out[5]: [0, 1, 2, 3, 4, 'a', 'b', 'c']
#对列表进行排序组合,无序
In [6]:list(combinations("abcd",2))
Out[6]: [('a', 'b'), ('a', 'c'), ('a', 'd'), ('b', 'c'), ('b', 'd'), ('c', 'd')]
#对列表进行排序组合,有序
In [7]:list(permutations("abcd",2))
Out[7]: [('a', 'b'), ('a', 'c'), ('a', 'd'), ('b', 'a'), ('b', 'c'), ('b', 'd'), ('c', 'a'), ('c', 'b'), ('c', 'd'), ('d', 'a'), ('d', 'b'), ('d', 'c')]
#对列表进行排序组合,包括同一元素自身的组合
In [8]: it=combinations_with_replacement("abcd",2)
In [9]: list(it)
Out[9]: [('a', 'a'),
('a', 'b'),
('a', 'c'),
('a', 'd'),
('b', 'b'),
('b', 'c'),
('b', 'd'),
('c', 'c'),
('c', 'd'),
('d', 'd')]
#按条件过滤迭代器
In [10]: it=compress("abcde",[True,False,True])
In [11]: list(it)
Out[11]: ['a', 'c']
#ifilter(predicate, iterable) 创建一个迭代器,仅生成 iterable 中 predicate(item)为 True 的项,如果 predicate 为 None,将返回 iterable 中所有计算为 True 的项。
In [18]: list(ifilter(lambda x: x%2, range(10)))
Out[18]: [1, 3, 5, 7, 9]
#ifilterfalse(predicate, iterable):创建一个迭代器,仅生成 iterable 中 predicate(item)为 False 的项,如果 predicate 为 None,则返回 iterable 中所有计算为 False 的项。
In [19]: list(ifilterfalse(lambda x: x%2, range(10)))
Out[19]: [0, 2, 4, 6, 8]
#dropwhile(predicate, iterable):
#创建一个迭代器,只要函数 predicate(item)为 True,就丢弃 iterable 中的项,如果 predicate 返回 False,就会生成 iterable 中的项和所有后续项。
In [20]: list(dropwhile(lambda x: x<5, [1,4,6,4,1]))
Out[20]: [6, 4, 1]
#takewhile(predicate [, iterable]):
#创建一个迭代器,生成 iterable 中 predicate(item)为 True 的项,只要 predicate 计算为 False,迭代就会立即停止。
In [21]: list(takewhile(lambda x: x<5, [1,4,6,4,1]))
Out[21]: [1, 4]
#chain.from_iterable(iterables):
#一个备用链构造函数,其中的 iterables 是一个迭代变量,生成迭代序列,此操作的结果与以下生成器代码片段生成的结果相同:
In [22]: test = chain.from_iterable('ABCDEF')
In [23]: test.next()
Out[23]: 'A'
In [24]: test.next()
Out[24]: 'B'
#count([n]):
#创建一个迭代器,生成从 n 开始的连续整数,如果忽略 n,则从 0 开始计算(注意:此迭代器不支持长整数),如果超出了 sys.maxint,计数器将溢出并继续从-sys.maxint-1 开始计算。
In [30]: test=count(10000)
In [31]: test.next()
Out[31]: 10000
In [32]: test.next()
Out[32]: 10001
In [33]: test.next()
Out[33]: 10002
In [34]: test.next()
Out[34]: 10003
#cycle(iterable):
#创建一个迭代器,对 iterable 中的元素反复执行循环操作,内部会生成 iterable 中的元素的一个副本,此副本用于返回循环中的重复项。
In [49]: test=cycle(range(3))
In [50]: test.next()
Out[50]: 0
In [51]: test.next()
Out[51]: 1
In [52]: test.next()
Out[52]: 2
In [53]: test.next()
Out[53]: 0
In [54]: test.next()
Out[54]: 1
#islice(iterable, [start, ] stop [, step]):
#创建一个迭代器,生成项的方式类似于切片返回值: iterable[start : stop : step],将跳过前 start 个项,迭代在 stop 所指定的位置停止,step 指定用于跳过项的步幅。与切片不同,负值不会用于任何 start,stop 和 step,如果省略了 start,迭代将从 0 开始,如果省略了 step,步幅将采用 1.
In [1]: from itertools import *
In [2]: list(islice('ABCDEFG', 2))
Out[2]: ['A', 'B']
In [3]: list(islice('ABCDEFG', 2, 4))
Out[3]: ['C', 'D']
In [4]: list(islice('ABCDEFG', 2, None))
Out[4]: ['C', 'D', 'E', 'F', 'G']
In [5]: list(islice('ABCDEFG', 2, None,2))
Out[5]: ['C', 'E', 'G']
#izip(iter1, iter2, ... iterN):
#创建一个迭代器,生成元组(i1, i2, ... iN),其中 i1,i2 ... iN 分别来自迭代器 iter1,iter2 ... iterN,只要提供的某个迭代器不再生成值,迭代就会停止,此函数生成的值与内置的 zip()函数相同。
In [7]: list(izip('ABCD', 'xy'))
Out[7]: [('A', 'x'), ('B', 'y')]
#izip_longest(iter1, iter2, ... iterN, [fillvalue=None]):
#与 izip()相同,但是迭代过程会持续到所有输入迭代变量 iter1,iter2 等都耗尽为止,如果没有使用 fillvalue 关键字参数指定不同的值,则使用 None 来填充已经使用的迭代变量的值。
In [8]: list(izip_longest('ABCD', 'xy', fillvalue='-'))
Out[8]: [('A', 'x'), ('B', 'y'), ('C', '-'), ('D', '-')]
#product(iter1, iter2, ... iterN, [repeat=1]):
#创建一个迭代器,生成表示 item1,item2 等中的项目的笛卡尔积的元组,repeat 是一个关键字参数,指定重复生成序列的次数
In [11]: list(product('ABCD', 'xy'))
Out[11]:
[('A', 'x'),
('A', 'y'),
('B', 'x'),
('B', 'y'),
('C', 'x'),
('C', 'y'),
('D', 'x'),
('D', 'y')]
In [13]: list(product(range(2), repeat=3))
Out[13]:
[(0, 0, 0),
(0, 0, 1),
(0, 1, 0),
(0, 1, 1),
(1, 0, 0),
(1, 0, 1),
(1, 1, 0),
(1, 1, 1)]

  

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • 倾城之链
    23 引用 • 66 回帖 • 137 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 3 关注
  • 又拍云

    又拍云是国内领先的 CDN 服务提供商,国家工信部认证通过的“可信云”,乌云众测平台认证的“安全云”,为移动时代的创业者提供新一代的 CDN 加速服务。

    21 引用 • 37 回帖 • 545 关注
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 453 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    77 引用 • 430 回帖 • 2 关注
  • 单点登录

    单点登录(Single Sign On)是目前比较流行的企业业务整合的解决方案之一。SSO 的定义是在多个应用系统中,用户只需要登录一次就可以访问所有相互信任的应用系统。

    9 引用 • 25 回帖
  • WiFiDog

    WiFiDog 是一套开源的无线热点认证管理工具,主要功能包括:位置相关的内容递送;用户认证和授权;集中式网络监控。

    1 引用 • 7 回帖 • 587 关注
  • OAuth

    OAuth 协议为用户资源的授权提供了一个安全的、开放而又简易的标准。与以往的授权方式不同之处是 oAuth 的授权不会使第三方触及到用户的帐号信息(如用户名与密码),即第三方无需使用用户的用户名与密码就可以申请获得该用户资源的授权,因此 oAuth 是安全的。oAuth 是 Open Authorization 的简写。

    36 引用 • 103 回帖 • 9 关注
  • V2Ray
    1 引用 • 15 回帖 • 1 关注
  • golang

    Go 语言是 Google 推出的一种全新的编程语言,可以在不损失应用程序性能的情况下降低代码的复杂性。谷歌首席软件工程师罗布派克(Rob Pike)说:我们之所以开发 Go,是因为过去 10 多年间软件开发的难度令人沮丧。Go 是谷歌 2009 发布的第二款编程语言。

    497 引用 • 1387 回帖 • 283 关注
  • 旅游

    希望你我能在旅途中找到人生的下一站。

    90 引用 • 899 回帖
  • 周末

    星期六到星期天晚,实行五天工作制后,指每周的最后两天。再过几年可能就是三天了。

    14 引用 • 297 回帖
  • 心情

    心是产生任何想法的源泉,心本体会陷入到对自己本体不能理解的状态中,因为心能产生任何想法,不能分出对错,不能分出自己。

    59 引用 • 369 回帖
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 585 关注
  • 链书

    链书(Chainbook)是 B3log 开源社区提供的区块链纸质书交易平台,通过 B3T 实现共享激励与价值链。可将你的闲置书籍上架到链书,我们共同构建这个全新的交易平台,让闲置书籍继续发挥它的价值。

    链书社

    链书目前已经下线,也许以后还有计划重制上线。

    14 引用 • 257 回帖
  • V2EX

    V2EX 是创意工作者们的社区。这里目前汇聚了超过 400,000 名主要来自互联网行业、游戏行业和媒体行业的创意工作者。V2EX 希望能够成为创意工作者们的生活和事业的一部分。

    17 引用 • 236 回帖 • 325 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    70 引用 • 193 回帖 • 432 关注
  • C

    C 语言是一门通用计算机编程语言,应用广泛。C 语言的设计目标是提供一种能以简易的方式编译、处理低级存储器、产生少量的机器码以及不需要任何运行环境支持便能运行的编程语言。

    85 引用 • 165 回帖 • 1 关注
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    71 引用 • 535 回帖 • 786 关注
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    36 引用 • 35 回帖
  • CloudFoundry

    Cloud Foundry 是 VMware 推出的业界第一个开源 PaaS 云平台,它支持多种框架、语言、运行时环境、云平台及应用服务,使开发人员能够在几秒钟内进行应用程序的部署和扩展,无需担心任何基础架构的问题。

    5 引用 • 18 回帖 • 167 关注
  • ngrok

    ngrok 是一个反向代理,通过在公共的端点和本地运行的 Web 服务器之间建立一个安全的通道。

    7 引用 • 63 回帖 • 624 关注
  • 创业

    你比 99% 的人都优秀么?

    84 引用 • 1399 回帖 • 1 关注
  • Java

    Java 是一种可以撰写跨平台应用软件的面向对象的程序设计语言,是由 Sun Microsystems 公司于 1995 年 5 月推出的。Java 技术具有卓越的通用性、高效性、平台移植性和安全性。

    3187 引用 • 8213 回帖
  • Lute

    Lute 是一款结构化的 Markdown 引擎,支持 Go 和 JavaScript。

    25 引用 • 191 回帖 • 16 关注
  • TextBundle

    TextBundle 文件格式旨在应用程序之间交换 Markdown 或 Fountain 之类的纯文本文件时,提供更无缝的用户体验。

    1 引用 • 2 回帖 • 47 关注