6

前言

首先,明确可迭代对象、迭代器和生成器这三个概念。

可迭代对象(Iterable)

可迭代对象(Iterable Object),简单的来理解就是可以使用 for 来循环遍历的对象。比如常见的 list、set和dict。

可迭代对象具有__iter__ 方法,用于返回一个迭代器,或者定义了 getitem 方法,可以按 index 索引的对象(并且能够在没有值时抛出一个 IndexError 异常),因此,可迭代对象就是能够通过它得到一个迭代器的对象。所以,可迭代对象都可以通过调用内建的 iter() 方法返回一个迭代器。

可迭代器对象具有如下的特性:

  • 可以 for 循环: for i in iterable;

  • 可以按 index 索引的对象,也就是定义了 getitem 方法,比如 list,str;

  • 定义了__iter__ 方法,可以随意返回;

  • 可以调用 iter(obj) 的对象,并且返回一个iterator。

  • 可以通过isinstance(obj, collections.Iterable) 来判断对象是否为可迭代对象。

迭代器对象(Iterator)

传送门之迭代器实现原理

首先明确它是一个带状态的对象。

Python的for循环本质上就是通过不断调用next()函数实现的,举个栗子,下面的代码

 x = [1, 2, 3] for elem in x:
     ...

实际上执行时是

clipboard.png

生成器(generator)

传送门生成器解析
传送门之协程解密

生成器其实是一种特殊的迭代器,不过这种迭代器更加优雅。它不需要再像上面的类一样写__iter__()和__next__()方法了,只需要一个yiled关键字。

Python对协程的支持是通过generator实现的。

生成器表达式(generator expression)

生成器表达式是列表推倒式的生成器版本,看起来像列表推导式,但是它返回的是一个生成器对象而不是列表对象。

>>> a = (x*x for x in range(10))
>>> a
<generator object <genexpr> at 0x401f08>
>>> sum(a)
285

总结

  • 容器是一系列元素的集合,str、list、set、dict、file、sockets对象都可以看作是容器,容器都可以被迭代(用在for,while等语句中),因此他们被称为可迭代对象。

  • 可迭代对象实现了__iter__方法,该方法返回一个迭代器对象。

  • 迭代器持有一个内部状态的字段,用于记录下次迭代返回值,它实现了__next__和__iter__方法,迭代器不会一次性把所有元素加载到内存,而是需要的时候才生成返回结果。

  • 生成器是一种特殊的迭代器,它的返回值不是通过return而是用yield。


Echelon
56 声望5 粉丝