Python:itertools模块使用说明

本贴最后更新于 4209 天前,其中的信息可能已经时移世改

itertools模块为python2.6之后引入的,包含创建有效迭代器的函数,可以用各种方式对数据进行循环操作,此模块中的所有函数返回的迭代器都可以与for循环语句以及其他包含迭代器(如生成器和生成器表达式)的函数联合使用。

In [1]: from itertools import *
#用xrange创建长度10000,元素均为0的列表
In [2]: timeit [0 for i in xrange(10000)]
1000 loops, best of 3: 404 us per loop
#用itertools创建长度10000,元素均为0的列表,性能明显提高。原因是迭代器创建列表对象是一次性分配完内存
In [3]: timeit list(repeat(0,10000))
10000 loops, best of 3: 75.8 us per loop
#连接两个列表
In [4]: it=chain(xrange(5),"abc")

In [5]: list(it)
Out[5]: [0, 1, 2, 3, 4, 'a', 'b', 'c']
#对列表进行排序组合,无序
In [6]:list(combinations("abcd",2))
Out[6]: [('a', 'b'), ('a', 'c'), ('a', 'd'), ('b', 'c'), ('b', 'd'), ('c', 'd')]
#对列表进行排序组合,有序
In [7]:list(permutations("abcd",2))
Out[7]: [('a', 'b'), ('a', 'c'), ('a', 'd'), ('b', 'a'), ('b', 'c'), ('b', 'd'), ('c', 'a'), ('c', 'b'), ('c', 'd'), ('d', 'a'), ('d', 'b'), ('d', 'c')]
#对列表进行排序组合,包括同一元素自身的组合
In [8]: it=combinations_with_replacement("abcd",2)
In [9]: list(it)
Out[9]: [('a', 'a'),
('a', 'b'),
('a', 'c'),
('a', 'd'),
('b', 'b'),
('b', 'c'),
('b', 'd'),
('c', 'c'),
('c', 'd'),
('d', 'd')]
#按条件过滤迭代器
In [10]: it=compress("abcde",[True,False,True])
In [11]: list(it)
Out[11]: ['a', 'c']
#ifilter(predicate, iterable) 创建一个迭代器,仅生成 iterable 中 predicate(item)为 True 的项,如果 predicate 为 None,将返回 iterable 中所有计算为 True 的项。
In [18]: list(ifilter(lambda x: x%2, range(10)))
Out[18]: [1, 3, 5, 7, 9]
#ifilterfalse(predicate, iterable):创建一个迭代器,仅生成 iterable 中 predicate(item)为 False 的项,如果 predicate 为 None,则返回 iterable 中所有计算为 False 的项。
In [19]: list(ifilterfalse(lambda x: x%2, range(10)))
Out[19]: [0, 2, 4, 6, 8]
#dropwhile(predicate, iterable):
#创建一个迭代器,只要函数 predicate(item)为 True,就丢弃 iterable 中的项,如果 predicate 返回 False,就会生成 iterable 中的项和所有后续项。
In [20]: list(dropwhile(lambda x: x<5, [1,4,6,4,1]))
Out[20]: [6, 4, 1]
#takewhile(predicate [, iterable]):
#创建一个迭代器,生成 iterable 中 predicate(item)为 True 的项,只要 predicate 计算为 False,迭代就会立即停止。
In [21]: list(takewhile(lambda x: x<5, [1,4,6,4,1]))
Out[21]: [1, 4]
#chain.from_iterable(iterables):
#一个备用链构造函数,其中的 iterables 是一个迭代变量,生成迭代序列,此操作的结果与以下生成器代码片段生成的结果相同:
In [22]: test = chain.from_iterable('ABCDEF')
In [23]: test.next()
Out[23]: 'A'
In [24]: test.next()
Out[24]: 'B'
#count([n]):
#创建一个迭代器,生成从 n 开始的连续整数,如果忽略 n,则从 0 开始计算(注意:此迭代器不支持长整数),如果超出了 sys.maxint,计数器将溢出并继续从-sys.maxint-1 开始计算。
In [30]: test=count(10000)
In [31]: test.next()
Out[31]: 10000
In [32]: test.next()
Out[32]: 10001
In [33]: test.next()
Out[33]: 10002
In [34]: test.next()
Out[34]: 10003
#cycle(iterable):
#创建一个迭代器,对 iterable 中的元素反复执行循环操作,内部会生成 iterable 中的元素的一个副本,此副本用于返回循环中的重复项。
In [49]: test=cycle(range(3))
In [50]: test.next()
Out[50]: 0
In [51]: test.next()
Out[51]: 1
In [52]: test.next()
Out[52]: 2
In [53]: test.next()
Out[53]: 0
In [54]: test.next()
Out[54]: 1
#islice(iterable, [start, ] stop [, step]):
#创建一个迭代器,生成项的方式类似于切片返回值: iterable[start : stop : step],将跳过前 start 个项,迭代在 stop 所指定的位置停止,step 指定用于跳过项的步幅。与切片不同,负值不会用于任何 start,stop 和 step,如果省略了 start,迭代将从 0 开始,如果省略了 step,步幅将采用 1.
In [1]: from itertools import *
In [2]: list(islice('ABCDEFG', 2))
Out[2]: ['A', 'B']
In [3]: list(islice('ABCDEFG', 2, 4))
Out[3]: ['C', 'D']
In [4]: list(islice('ABCDEFG', 2, None))
Out[4]: ['C', 'D', 'E', 'F', 'G']
In [5]: list(islice('ABCDEFG', 2, None,2))
Out[5]: ['C', 'E', 'G']
#izip(iter1, iter2, ... iterN):
#创建一个迭代器,生成元组(i1, i2, ... iN),其中 i1,i2 ... iN 分别来自迭代器 iter1,iter2 ... iterN,只要提供的某个迭代器不再生成值,迭代就会停止,此函数生成的值与内置的 zip()函数相同。
In [7]: list(izip('ABCD', 'xy'))
Out[7]: [('A', 'x'), ('B', 'y')]
#izip_longest(iter1, iter2, ... iterN, [fillvalue=None]):
#与 izip()相同,但是迭代过程会持续到所有输入迭代变量 iter1,iter2 等都耗尽为止,如果没有使用 fillvalue 关键字参数指定不同的值,则使用 None 来填充已经使用的迭代变量的值。
In [8]: list(izip_longest('ABCD', 'xy', fillvalue='-'))
Out[8]: [('A', 'x'), ('B', 'y'), ('C', '-'), ('D', '-')]
#product(iter1, iter2, ... iterN, [repeat=1]):
#创建一个迭代器,生成表示 item1,item2 等中的项目的笛卡尔积的元组,repeat 是一个关键字参数,指定重复生成序列的次数
In [11]: list(product('ABCD', 'xy'))
Out[11]:
[('A', 'x'),
('A', 'y'),
('B', 'x'),
('B', 'y'),
('C', 'x'),
('C', 'y'),
('D', 'x'),
('D', 'y')]
In [13]: list(product(range(2), repeat=3))
Out[13]:
[(0, 0, 0),
(0, 0, 1),
(0, 1, 0),
(0, 1, 1),
(1, 0, 0),
(1, 0, 1),
(1, 1, 0),
(1, 1, 1)]

  

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...

推荐标签 标签

  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖 • 7 关注
  • ZooKeeper

    ZooKeeper 是一个分布式的,开放源码的分布式应用程序协调服务,是 Google 的 Chubby 一个开源的实现,是 Hadoop 和 HBase 的重要组件。它是一个为分布式应用提供一致性服务的软件,提供的功能包括:配置维护、域名服务、分布式同步、组服务等。

    59 引用 • 29 回帖 • 14 关注
  • 学习

    “梦想从学习开始,事业从实践起步” —— 习近平

    171 引用 • 512 回帖
  • JWT

    JWT(JSON Web Token)是一种用于双方之间传递信息的简洁的、安全的表述性声明规范。JWT 作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以 JSON 的形式安全的传递信息。

    20 引用 • 15 回帖 • 6 关注
  • C++

    C++ 是在 C 语言的基础上开发的一种通用编程语言,应用广泛。C++ 支持多种编程范式,面向对象编程、泛型编程和过程化编程。

    107 引用 • 153 回帖
  • Love2D

    Love2D 是一个开源的, 跨平台的 2D 游戏引擎。使用纯 Lua 脚本来进行游戏开发。目前支持的平台有 Windows, Mac OS X, Linux, Android 和 iOS。

    14 引用 • 53 回帖 • 538 关注
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 59 关注
  • 机器学习

    机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。

    83 引用 • 37 回帖
  • Swagger

    Swagger 是一款非常流行的 API 开发工具,它遵循 OpenAPI Specification(这是一种通用的、和编程语言无关的 API 描述规范)。Swagger 贯穿整个 API 生命周期,如 API 的设计、编写文档、测试和部署。

    26 引用 • 35 回帖 • 5 关注
  • 房星科技

    房星网,我们不和没有钱的程序员谈理想,我们要让程序员又有理想又有钱。我们有雄厚的房地产行业线下资源,遍布昆明全城的 100 家门店、四千地产经纪人是我们坚实的后盾。

    6 引用 • 141 回帖 • 584 关注
  • App

    App(应用程序,Application 的缩写)一般指手机软件。

    91 引用 • 384 回帖 • 2 关注
  • 自由行
    4 关注
  • Sym

    Sym 是一款用 Java 实现的现代化社区(论坛/BBS/社交网络/博客)系统平台。

    下一代的社区系统,为未来而构建

    524 引用 • 4601 回帖 • 700 关注
  • iOS

    iOS 是由苹果公司开发的移动操作系统,最早于 2007 年 1 月 9 日的 Macworld 大会上公布这个系统,最初是设计给 iPhone 使用的,后来陆续套用到 iPod touch、iPad 以及 Apple TV 等产品上。iOS 与苹果的 Mac OS X 操作系统一样,属于类 Unix 的商业操作系统。

    85 引用 • 139 回帖
  • Log4j

    Log4j 是 Apache 开源的一款使用广泛的 Java 日志组件。

    20 引用 • 18 回帖 • 29 关注
  • TensorFlow

    TensorFlow 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。节点(Nodes)在图中表示数学操作,图中的线(edges)则表示在节点间相互联系的多维数据数组,即张量(tensor)。

    20 引用 • 19 回帖 • 1 关注
  • NGINX

    NGINX 是一个高性能的 HTTP 和反向代理服务器,也是一个 IMAP/POP3/SMTP 代理服务器。 NGINX 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的,第一个公开版本 0.1.0 发布于 2004 年 10 月 4 日。

    313 引用 • 547 回帖 • 1 关注
  • Hprose

    Hprose 是一款先进的轻量级、跨语言、跨平台、无侵入式、高性能动态远程对象调用引擎库。它不仅简单易用,而且功能强大。你无需专门学习,只需看上几眼,就能用它轻松构建分布式应用系统。

    9 引用 • 17 回帖 • 612 关注
  • SVN

    SVN 是 Subversion 的简称,是一个开放源代码的版本控制系统,相较于 RCS、CVS,它采用了分支管理系统,它的设计目标就是取代 CVS。

    29 引用 • 98 回帖 • 694 关注
  • Latke

    Latke 是一款以 JSON 为主的 Java Web 框架。

    71 引用 • 535 回帖 • 789 关注
  • WordPress

    WordPress 是一个使用 PHP 语言开发的博客平台,用户可以在支持 PHP 和 MySQL 数据库的服务器上架设自己的博客。也可以把 WordPress 当作一个内容管理系统(CMS)来使用。WordPress 是一个免费的开源项目,在 GNU 通用公共许可证(GPLv2)下授权发布。

    66 引用 • 114 回帖 • 223 关注
  • Solo

    Solo 是一款小而美的开源博客系统,专为程序员设计。Solo 有着非常活跃的社区,可将文章作为帖子推送到社区,来自社区的回帖将作为博客评论进行联动(具体细节请浏览 B3log 构思 - 分布式社区网络)。

    这是一种全新的网络社区体验,让热爱记录和分享的你不再感到孤单!

    1435 引用 • 10056 回帖 • 489 关注
  • CSDN

    CSDN (Chinese Software Developer Network) 创立于 1999 年,是中国的 IT 社区和服务平台,为中国的软件开发者和 IT 从业者提供知识传播、职业发展、软件开发等全生命周期服务,满足他们在职业发展中学习及共享知识和信息、建立职业发展社交圈、通过软件开发实现技术商业化等刚性需求。

    14 引用 • 155 回帖
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    209 引用 • 358 回帖 • 1 关注
  • 分享

    有什么新发现就分享给大家吧!

    248 引用 • 1795 回帖
  • 百度

    百度(Nasdaq:BIDU)是全球最大的中文搜索引擎、最大的中文网站。2000 年 1 月由李彦宏创立于北京中关村,致力于向人们提供“简单,可依赖”的信息获取方式。“百度”二字源于中国宋朝词人辛弃疾的《青玉案·元夕》词句“众里寻他千百度”,象征着百度对中文信息检索技术的执著追求。

    63 引用 • 785 回帖 • 164 关注
  • BookxNote

    BookxNote 是一款全新的电子书学习工具,助力您的学习与思考,让您的大脑更高效的记忆。

    笔记整理交给我,一心只读圣贤书。

    1 引用 • 1 回帖