Python:itertools模块使用说明

本贴最后更新于 3974 天前,其中的信息可能已经时移世改

itertools模块为python2.6之后引入的,包含创建有效迭代器的函数,可以用各种方式对数据进行循环操作,此模块中的所有函数返回的迭代器都可以与for循环语句以及其他包含迭代器(如生成器和生成器表达式)的函数联合使用。

In [1]: from itertools import *
#用xrange创建长度10000,元素均为0的列表
In [2]: timeit [0 for i in xrange(10000)]
1000 loops, best of 3: 404 us per loop
#用itertools创建长度10000,元素均为0的列表,性能明显提高。原因是迭代器创建列表对象是一次性分配完内存
In [3]: timeit list(repeat(0,10000))
10000 loops, best of 3: 75.8 us per loop
#连接两个列表
In [4]: it=chain(xrange(5),"abc")

In [5]: list(it)
Out[5]: [0, 1, 2, 3, 4, 'a', 'b', 'c']
#对列表进行排序组合,无序
In [6]:list(combinations("abcd",2))
Out[6]: [('a', 'b'), ('a', 'c'), ('a', 'd'), ('b', 'c'), ('b', 'd'), ('c', 'd')]
#对列表进行排序组合,有序
In [7]:list(permutations("abcd",2))
Out[7]: [('a', 'b'), ('a', 'c'), ('a', 'd'), ('b', 'a'), ('b', 'c'), ('b', 'd'), ('c', 'a'), ('c', 'b'), ('c', 'd'), ('d', 'a'), ('d', 'b'), ('d', 'c')]
#对列表进行排序组合,包括同一元素自身的组合
In [8]: it=combinations_with_replacement("abcd",2)
In [9]: list(it)
Out[9]: [('a', 'a'),
('a', 'b'),
('a', 'c'),
('a', 'd'),
('b', 'b'),
('b', 'c'),
('b', 'd'),
('c', 'c'),
('c', 'd'),
('d', 'd')]
#按条件过滤迭代器
In [10]: it=compress("abcde",[True,False,True])
In [11]: list(it)
Out[11]: ['a', 'c']
#ifilter(predicate, iterable) 创建一个迭代器,仅生成 iterable 中 predicate(item)为 True 的项,如果 predicate 为 None,将返回 iterable 中所有计算为 True 的项。
In [18]: list(ifilter(lambda x: x%2, range(10)))
Out[18]: [1, 3, 5, 7, 9]
#ifilterfalse(predicate, iterable):创建一个迭代器,仅生成 iterable 中 predicate(item)为 False 的项,如果 predicate 为 None,则返回 iterable 中所有计算为 False 的项。
In [19]: list(ifilterfalse(lambda x: x%2, range(10)))
Out[19]: [0, 2, 4, 6, 8]
#dropwhile(predicate, iterable):
#创建一个迭代器,只要函数 predicate(item)为 True,就丢弃 iterable 中的项,如果 predicate 返回 False,就会生成 iterable 中的项和所有后续项。
In [20]: list(dropwhile(lambda x: x<5, [1,4,6,4,1]))
Out[20]: [6, 4, 1]
#takewhile(predicate [, iterable]):
#创建一个迭代器,生成 iterable 中 predicate(item)为 True 的项,只要 predicate 计算为 False,迭代就会立即停止。
In [21]: list(takewhile(lambda x: x<5, [1,4,6,4,1]))
Out[21]: [1, 4]
#chain.from_iterable(iterables):
#一个备用链构造函数,其中的 iterables 是一个迭代变量,生成迭代序列,此操作的结果与以下生成器代码片段生成的结果相同:
In [22]: test = chain.from_iterable('ABCDEF')
In [23]: test.next()
Out[23]: 'A'
In [24]: test.next()
Out[24]: 'B'
#count([n]):
#创建一个迭代器,生成从 n 开始的连续整数,如果忽略 n,则从 0 开始计算(注意:此迭代器不支持长整数),如果超出了 sys.maxint,计数器将溢出并继续从-sys.maxint-1 开始计算。
In [30]: test=count(10000)
In [31]: test.next()
Out[31]: 10000
In [32]: test.next()
Out[32]: 10001
In [33]: test.next()
Out[33]: 10002
In [34]: test.next()
Out[34]: 10003
#cycle(iterable):
#创建一个迭代器,对 iterable 中的元素反复执行循环操作,内部会生成 iterable 中的元素的一个副本,此副本用于返回循环中的重复项。
In [49]: test=cycle(range(3))
In [50]: test.next()
Out[50]: 0
In [51]: test.next()
Out[51]: 1
In [52]: test.next()
Out[52]: 2
In [53]: test.next()
Out[53]: 0
In [54]: test.next()
Out[54]: 1
#islice(iterable, [start, ] stop [, step]):
#创建一个迭代器,生成项的方式类似于切片返回值: iterable[start : stop : step],将跳过前 start 个项,迭代在 stop 所指定的位置停止,step 指定用于跳过项的步幅。与切片不同,负值不会用于任何 start,stop 和 step,如果省略了 start,迭代将从 0 开始,如果省略了 step,步幅将采用 1.
In [1]: from itertools import *
In [2]: list(islice('ABCDEFG', 2))
Out[2]: ['A', 'B']
In [3]: list(islice('ABCDEFG', 2, 4))
Out[3]: ['C', 'D']
In [4]: list(islice('ABCDEFG', 2, None))
Out[4]: ['C', 'D', 'E', 'F', 'G']
In [5]: list(islice('ABCDEFG', 2, None,2))
Out[5]: ['C', 'E', 'G']
#izip(iter1, iter2, ... iterN):
#创建一个迭代器,生成元组(i1, i2, ... iN),其中 i1,i2 ... iN 分别来自迭代器 iter1,iter2 ... iterN,只要提供的某个迭代器不再生成值,迭代就会停止,此函数生成的值与内置的 zip()函数相同。
In [7]: list(izip('ABCD', 'xy'))
Out[7]: [('A', 'x'), ('B', 'y')]
#izip_longest(iter1, iter2, ... iterN, [fillvalue=None]):
#与 izip()相同,但是迭代过程会持续到所有输入迭代变量 iter1,iter2 等都耗尽为止,如果没有使用 fillvalue 关键字参数指定不同的值,则使用 None 来填充已经使用的迭代变量的值。
In [8]: list(izip_longest('ABCD', 'xy', fillvalue='-'))
Out[8]: [('A', 'x'), ('B', 'y'), ('C', '-'), ('D', '-')]
#product(iter1, iter2, ... iterN, [repeat=1]):
#创建一个迭代器,生成表示 item1,item2 等中的项目的笛卡尔积的元组,repeat 是一个关键字参数,指定重复生成序列的次数
In [11]: list(product('ABCD', 'xy'))
Out[11]:
[('A', 'x'),
('A', 'y'),
('B', 'x'),
('B', 'y'),
('C', 'x'),
('C', 'y'),
('D', 'x'),
('D', 'y')]
In [13]: list(product(range(2), repeat=3))
Out[13]:
[(0, 0, 0),
(0, 0, 1),
(0, 1, 0),
(0, 1, 1),
(1, 0, 0),
(1, 0, 1),
(1, 1, 0),
(1, 1, 1)]

  

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • webpack

    webpack 是一个用于前端开发的模块加载器和打包工具,它能把各种资源,例如 JS、CSS(less/sass)、图片等都作为模块来使用和处理。

    41 引用 • 130 回帖 • 292 关注
  • BAE

    百度应用引擎(Baidu App Engine)提供了 PHP、Java、Python 的执行环境,以及云存储、消息服务、云数据库等全面的云服务。它可以让开发者实现自动地部署和管理应用,并且提供动态扩容和负载均衡的运行环境,让开发者不用考虑高成本的运维工作,只需专注于业务逻辑,大大降低了开发者学习和迁移的成本。

    19 引用 • 75 回帖 • 619 关注
  • 负能量

    上帝为你关上了一扇门,然后就去睡觉了....努力不一定能成功,但不努力一定很轻松 (° ー °〃)

    85 引用 • 1201 回帖 • 449 关注
  • MyBatis

    MyBatis 本是 Apache 软件基金会 的一个开源项目 iBatis,2010 年这个项目由 Apache 软件基金会迁移到了 google code,并且改名为 MyBatis ,2013 年 11 月再次迁移到了 GitHub。

    170 引用 • 414 回帖 • 426 关注
  • JSON

    JSON (JavaScript Object Notation)是一种轻量级的数据交换格式。易于人类阅读和编写。同时也易于机器解析和生成。

    51 引用 • 190 回帖
  • V2Ray
    1 引用 • 15 回帖 • 1 关注
  • IBM

    IBM(国际商业机器公司)或万国商业机器公司,简称 IBM(International Business Machines Corporation),总公司在纽约州阿蒙克市。1911 年托马斯·沃森创立于美国,是全球最大的信息技术和业务解决方案公司,拥有全球雇员 30 多万人,业务遍及 160 多个国家和地区。

    16 引用 • 53 回帖 • 122 关注
  • InfluxDB

    InfluxDB 是一个开源的没有外部依赖的时间序列数据库。适用于记录度量,事件及实时分析。

    2 引用 • 55 关注
  • API

    应用程序编程接口(Application Programming Interface)是一些预先定义的函数,目的是提供应用程序与开发人员基于某软件或硬件得以访问一组例程的能力,而又无需访问源码,或理解内部工作机制的细节。

    76 引用 • 421 回帖
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    311 引用 • 546 回帖 • 34 关注
  • Hibernate

    Hibernate 是一个开放源代码的对象关系映射框架,它对 JDBC 进行了非常轻量级的对象封装,使得 Java 程序员可以随心所欲的使用对象编程思维来操纵数据库。

    39 引用 • 103 回帖 • 683 关注
  • Python

    Python 是一种面向对象、直译式电脑编程语言,具有近二十年的发展历史,成熟且稳定。它包含了一组完善而且容易理解的标准库,能够轻松完成很多常见的任务。它的语法简捷和清晰,尽量使用无异义的英语单词,与其它大多数程序设计语言使用大括号不一样,它使用缩进来定义语句块。

    536 引用 • 672 回帖
  • VirtualBox

    VirtualBox 是一款开源虚拟机软件,最早由德国 Innotek 公司开发,由 Sun Microsystems 公司出品的软件,使用 Qt 编写,在 Sun 被 Oracle 收购后正式更名成 Oracle VM VirtualBox。

    10 引用 • 2 回帖 • 6 关注
  • Facebook

    Facebook 是一个联系朋友的社交工具。大家可以通过它和朋友、同事、同学以及周围的人保持互动交流,分享无限上传的图片,发布链接和视频,更可以增进对朋友的了解。

    4 引用 • 15 回帖 • 456 关注
  • Hadoop

    Hadoop 是由 Apache 基金会所开发的一个分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。

    82 引用 • 122 回帖 • 619 关注
  • Windows

    Microsoft Windows 是美国微软公司研发的一套操作系统,它问世于 1985 年,起初仅仅是 Microsoft-DOS 模拟环境,后续的系统版本由于微软不断的更新升级,不但易用,也慢慢的成为家家户户人们最喜爱的操作系统。

    215 引用 • 462 回帖 • 1 关注
  • 自由行
    3 关注
  • Ant-Design

    Ant Design 是服务于企业级产品的设计体系,基于确定和自然的设计价值观上的模块化解决方案,让设计者和开发者专注于更好的用户体验。

    17 引用 • 23 回帖 • 4 关注
  • Gitea

    Gitea 是一个开源社区驱动的轻量级代码托管解决方案,后端采用 Go 编写,采用 MIT 许可证。

    4 引用 • 16 回帖 • 2 关注
  • Hexo

    Hexo 是一款快速、简洁且高效的博客框架,使用 Node.js 编写。

    21 引用 • 140 回帖 • 30 关注
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 318 关注
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 623 关注
  • GitBook

    GitBook 使您的团队可以轻松编写和维护高质量的文档。 分享知识,提高团队的工作效率,让用户满意。

    3 引用 • 8 回帖
  • 支付宝

    支付宝是全球领先的独立第三方支付平台,致力于为广大用户提供安全快速的电子支付/网上支付/安全支付/手机支付体验,及转账收款/水电煤缴费/信用卡还款/AA 收款等生活服务应用。

    29 引用 • 347 回帖 • 1 关注
  • JavaScript

    JavaScript 一种动态类型、弱类型、基于原型的直译式脚本语言,内置支持类型。它的解释器被称为 JavaScript 引擎,为浏览器的一部分,广泛用于客户端的脚本语言,最早是在 HTML 网页上使用,用来给 HTML 网页增加动态功能。

    710 引用 • 1173 回帖 • 163 关注
  • H2

    H2 是一个开源的嵌入式数据库引擎,采用 Java 语言编写,不受平台的限制,同时 H2 提供了一个十分方便的 web 控制台用于操作和管理数据库内容。H2 还提供兼容模式,可以兼容一些主流的数据库,因此采用 H2 作为开发期的数据库非常方便。

    11 引用 • 54 回帖 • 640 关注
  • 职场

    找到自己的位置,萌新烦恼少。

    126 引用 • 1699 回帖 • 3 关注