1

我们都知道for in在代码中出现的次数相当的频繁, 那么你知道for in循环中到底发生了什么吗?

答: 当我们调用一个for x in dataContainer的时候, 实际上是先调用了dataContainer__iter__()方法来获得它的iterator(迭代器), 然后不断的调用next()方法, Python3.x里面是__next__(), 直到迭代器抛出StopIteration的异常, 停止

什么是iterable和iterator

上一篇如何理解yield中已经对interable已经略有介绍, 我们可以简单的认为可以使用for in的都是iterable的, 但是这只是从使用场景来说的, 下面就从它内部来说下

  • iterable: 如果一个数据容器定义了一个__iter__()方法, 那么它就是可迭代的
  • iterator: 如果一个object支持迭代协议, 也就是: 1. 定义一个__iter__返回它自身 2. 定义一个next()方法, 每次被调用的时候返回下一个值

很明显list dictiterable的, 但它不是iterator

>>> a = [1,2,3]
>>> a.__iter__
<method-wrapper '__iter__' of list object at 0x2ad2cf8>
>>> a.next()
Traceback (most recent call last):
  File "<console>", line 1, in <module>
AttributeError: 'list' object has no attribute 'next'

但是通过__iter__获得的就是它们的iterator迭代器

>>> ai = a.__iter__()
>>> ai
<listiterator object at 0x2dfe310>
>>> ai.next()
1
>>> ai.__iter__() is ai
True

如何构建iterable的容器

class MyList(list):
    def __iter__(self):
        return MyListIter(self)

class MyListIter(object):
    """一个实现List的Iterator的 Demo Class"""
    def __init__(self, lst):
        self.lst = lst
        self.i = -1
    def __iter__(self):
        return self
    def next(self):
        if self.i<len(self.lst)-1:
            self.i += 1         
            return self.lst[self.i]
        else:
            raise StopIteration

if __name__ == '__main__':
    a = MyList([1, 2, 3, 4])
    ia = iter(a)
    print 'type(a): %r, type(ia): %r' %(type(a), type(ia))
    for i in a: 
        print i,

上面的一段代码中 MyListIter 就实现了 MyList的迭代器, 运行结果应该是

type(a): <class '__main__.MyList'>, type(ia): <class '__main__.MyListIter'>
1 2 3 4

如何把我们的变量iterable

比如我们有一个需求, 需要返回所有0~4中数字和a~e中字母组合情况, 一般我们可能会这样写

class Combinations:
    def __init__(self):
        self.combs = []
        for x in range(5):
            for y in ['a', 'b', 'c', 'd', 'e']:
                self.combs.append("%s%s" % (x, y))

for c in Combinations().combs: print c

这样的话, 我们每次都要调用Combinations的'combs'才能拿到所有的组合情况, 显然每次暴露combs出来非常的不优雅, 为什么不能for c in Combinations()这样呢?

当然可以, 定义一个__iter__方法返回combs的迭代器就可以了

class Combinations:
    def __init__(self):
        self.combs = []
        for x in range(5):
            for y in ['a', 'b', 'c', 'd', 'e']:
                self.combs.append("%s%s" % (x, y))
    def __iter__(self):
        return iter(self.combs)

for c in Combinations(): print c

参考: Understanding Python Iterables and Iterators


扑克
228 声望19 粉丝

import this