粗谈Python内置库itertools
admin
2023-07-30 20:43:48
0

官方对itertools的定义是Functions creating iterators for efficient looping,定义了一系列的方法,能帮助我们创建能够进行高效遍历迭代的迭代器,里面包含不少有意思并且有用的方法,比如像chain, izip/izip_longest, combinations, ifilter等等。

在这里简单拿几个方法为例,简单分析一下文档里面给出的等效的实现的方式还有平时我们能够使用的场景。

chain

如同chain的名称还有签名itertools.chain(*iterables)所示,我们能用它将一系列的可迭代对象串联起来,这样就能连续的对多个迭代对象的内容进行迭代:

>>> itertools.chain(\'ABC\', \'DEF\')

>>> for item in itertools.chain(\'ABC\', \'DEF\'):
...     print item,
... 
A B C D E F

从上面的打印日志里面能够看到,调用itertools.chain生成了一个迭代器对象,在python的itertools内置库里面,chain被实现成一个继承自object的一个对象,实现了next, __iter__方法(将自己实现成一个可迭代对象,迭代器),调用时其实是调用它的__init__(self, *iterables)方法初始化了一个对象,然后接下来进行迭代。简化的等效的实现方式类似:

def chain(*iterables):
    for it in iterables:
        for element in it:
            yield element

传递给chain的多个可迭代对象呗保存在元组类型的变量iterables里面,遍历每一个可迭代对象里面的每一个对象,上面等效实现的方式里面是用yield的实现的,当对串联的结果比如说用for进行遍历的时候,yield能够每次返回一条数据,中断,外面我们自己的代码执行(或输出或其它的操作)如此循环反复知道遍历结束(StopIteration error throwed)。

combinations

这个方法能够帮助我们生成一个列表中,按照顺序能够有的所有组合,当然生成依然是迭代器对象。

>>> itertools.combinations(\'ABCDA\', 2)

>>> for item in itertools.combinations(\'ABCDA\', 2):
...     print item
... 
(\'A\', \'B\')
(\'A\', \'C\')
(\'A\', \'D\')
(\'A\', \'A\')
(\'B\', \'C\')
(\'B\', \'D\')
(\'B\', \'A\')
(\'C\', \'D\')
(\'C\', \'A\')
(\'D\', \'A\')

chain的实现方式差不多是一样的,实现了next, __iter__方法(将自己实现成一个可迭代对象,迭代器),调用时其实是调用它的__init__(self, iterable, r)方法初始化了一个combinations对象,然后能够对它进行迭代。等效的实现方式差不多像这样:

def combinations(iterable, r):
    # combinations(\'ABCD\', 2) --> AB AC AD BC BD CD
    # combinations(range(4), 3) --> 012 013 023 123
    pool = tuple(iterable)
    n = len(pool)
    if r > n:
        return
    indices = range(r)
    yield tuple(pool[i] for i in indices)
    while True:
        for i in reversed(range(r)):
            if indices[i] != i + n - r:
                break
        else:
            return
        indices[i] += 1
        for j in range(i+1, r):
            indices[j] = indices[j-1] + 1
        yield tuple(pool[i] for i in indices)

其实这个等效的实现的方式也很有意思,里面充分你的利用了yield的特性,中断返回值后能够将现场的环境保持下来,比如例子中,变量indices的值在每次返回值之后都能继续保存,这样里面记录的索引值才能正确递进,直到迭代结束。

itertools这个内置库里面的提供的一些服用方法能够很大简化平时需要做的一些工作,而且高效。也能方便结合operator里面的一些计算的方法一起使用,代码能精简很多。官方的文档里面详细的介绍了各个方法的实现和使用,希望这篇流水账能够起个引言的作用。

参考资料:itertools — Functions creating iterators for efficient looping

相关内容

热门资讯

Mobi、epub格式电子书如... 在wps里全局设置里有一个文件关联,打开,勾选电子书文件选项就可以了。
小程序支付时提示:appid和... [Q]小程序支付时提示:appid和mch_id不匹配 [A]小程序和微信支付没有进行关联,访问“小...
项目管理和工程管理的区别 项目管理 项目管理,顾名思义就是专注于开发和完成项目的管理,以实现目标并满足成功标准和项目要求。 工...
Apache Doris 2.... 亲爱的社区小伙伴们,我们很高兴地向大家宣布,Apache Doris 2.0.0 版本已于...
微信小程序使用slider实现... 众所周知哈,微信小程序里面的音频播放是没有进度条的,但最近有个项目呢,客户要求音频要有进度条控制,所...
Apache Doris 常见... 什么是 Apache Doris Apache Doris 是一款 MPP 架构的 OLAP 列式存...
Vmware简易安装ubunt... 大晚上的折腾死我了VMware安装ubuntu,用简易安装结果设置的用户名密码死活进不去再重装一次,...
‘WebDriver‘ obj... selenium库报错"‘WebDriver’ object has no attribute ‘f...
WiFi中继器和WiFi扩展器... WiFi中继器以无线方式连接到 WiFi 网络并重新广播信号。它就像一个中继系统,连接到我们的 Wi...
mysql插入数据到数据库时失... 插入数据到数据库时失败:Timeout in IO operation 查看mysql日志 显示是磁...