简述Python中的迭代器和生成器


才疏学浅, 欢迎建议

迭代器

  • 相比于装饰器, 迭代器是一种很抽象的概念,我理解的比较抽象, 感觉都没有太多地方使用过
  • 对于一个对象来说,实现__iter__方法的叫做迭代对象,而实现__iter____next__ 方法的叫迭代器
  • 在进行遍历的时候,循环语句先判断 对象xx是否可以迭代,如果实现__iter__ 就可以使用iter(xx)调用,而__iter__必须要返回一个迭代器才行,也就是一个实现了__iter____next__方法的对象
  • 迭代器包含有next方法的实现,在正确的范围内返回期待的数据以及超出范围后能够抛出StopIteration的错误停止迭代。

至于为什么要返回迭代器呢,因为在遍历的时候,会调用next()不断的找下一个值,而next()方法会调用对象的__next__

  • 有更好的理解或者见解欢迎评论告知,感谢

生成器

  • 生成器是一个特殊的程序,可以被用作控制循环的迭代行为,python中生成器是迭代器的一种,使用yield返回值函数,每次调用yield会暂停,而可以使用next()函数和send()函数恢复生成器
  • 生成器的好处是延迟计算,一次返回一个结果。也就是说,它不会一次生成所有的结果,这对于大数据量处理,将会非常有用
  • 生成器是一种特殊的迭代器
  • 生成器两种使用
    • 生成器函数 : def 定义, 写法跟正常函数一样,区别就是把最后的return 换成yield返回
    • 生成器表达式 : 知道列表生成式吗, 就是把列表生成式两边的中括号换成小括号

下面直接说生成器的使用, 解释再多不如一段代码

生成器函数

1
2
3
4
5
6
7
8
9
10
11
12
13
14
def get_url(url):
for i in range(5):
yield url + str(i)


if __name__ == '__main__':
for url in get_url("www.xxx.com/"):
print(url)
"""
简单介绍一下这个生成器, 如果使用正常的函数,想要达到这种效果,需要在定义一个list
而只要定义list就会有内存的开销, 这就是生成器的优点
这个生成器,就是用来拼接一下路径url, 写爬虫程序的时候很适合用
"""

生成器表达式

1
2
3
4
5
6
7
8
""" 列表生成式"""
lis = [x*x for x in range(10)]
print(lis)

""" 生成器"""
generator = (x*x for x in range(10))
print(generator)