16、Python 教程 - 迭代器与生成器

1 迭代器

迭代

我们知道 Python 中有一些对象可以通过 for 来循环遍历,比如:列表、元组、字符等,以字符串为例,如下所示:

for i in 'Hello':
    print(i)

执行结果:

H
e
l
l
o

这个遍历过程就是迭代。

可迭代对象

可迭代对象需具有 __iter__() 方法,它们均可使用 for 循环遍历,我们可以使用 isinstance() 方法来判断一个对象是否为可迭代对象,看下示例:

from collections import Iterable

print(isinstance('abc', Iterable))
print(isinstance({
   
     1, 2, 3}, Iterable))
print(isinstance(1024, Iterable))

执行结果:

True
True
False

迭代器

迭代器需要具有 __iter__()__next__() 两个方法,这两个方法共同组成了迭代器协议,通俗来讲迭代器就是一个可以记住遍历位置的对象,迭代器一定是可迭代的,反之不成立。

  • iter():返回迭代器对象本身
  • next():返回下一项数据

迭代器对象本质是一个数据流,它通过不断调用 __next__() 方法或被内置的 next() 方法调用返回下一项数据,当没有下一项数据时抛出 StopIteration 异常迭代结束。上面我们说的 for 循环语句的实现便是利用了迭代器。

我们试着自己来实现一个迭代器,如下所示:

class MyIterator:
    def __init__(self):
        self.s = '程序之间'
        self.i = 0

    def __iter__(self):
        return self

    def __next__(self):
        if self.i < 4:
            n = self.s[self.i]
            self.i += 1
            return n
        else:
            raise StopIteration

mi = iter(MyIterator())
for i in mi:
    print(i)

输出结果:

程
序
之
间

2 生成器

生成器是用来创建迭代器的工具,其写法与标准函数类似,不同之处在于返回时使用 yield 语句,关于 yield ,我们在使用 Scrapy 爬取去哪儿网景区信息中已经作了一些介绍,我们再来熟悉一下:

yield 是一个关键字,作用和 return 差不多,差别在于 yield 返回的是一个生成器(在 Python 中,一边循环一边计算的机制,称为生成器),它的作用是:有利于减小服务器资源,在列表中所有数据存入内存,而生成器相当于一种方法而不是具体的信息,用多少取多少,占用内存小。

生成器的创建方式有很多种,比如:使用 yield 语句、生成器表达式(可以简单的理解为是将列表的 [] 换成了 (),特点是更加简洁,但不够灵活)。看下示例:

示例 1

def reverse(data):
    for i in range(len(data)-1, -1, -1):
        yield data[i]
for char in reverse('Hello'):
    print(char)

执行结果:

o
l
l
e
H

示例 2

# 列表
lis = [x*x for x in range(5)]
print(lis)

# 生成器
gen = (x*x for x in range(5))
for g in gen:
    print(g)

执行结果:

[0, 1, 4, 9, 16]
0
1
4
9
16