# 可迭代对象 ## 什么叫做迭代 通过之前的学习,我们已经知道对于**list、tuple、str**等类型的数据,我们可以使用`for i in xxx`的语法进行循环取值,我们把这样的过程称之为**遍历**,也叫做**迭代** 如下: ```python li = [1, 2, 3, 'a', 'b', 'c'] for i in li: print(i) str = "hello,world" for j in str: print(j) dic = {'name': 'nls', 'age': 18, 'job': 'teacher'} for k,v in dic.items(): print(k,v) # ...... ``` Q:整数类型可以迭代吗?可以动手试一下.... ## 如何判断一个对象是否可迭代 我们可以用Python中内置的`isinstance()`方法来判断某个对象是**Iterable对象**,也可以称之为**可迭代对象** ```python # 字符串、列表、元组、字典、集合都可以被for循环,说明他们都是可迭代的 from collections.abc import Iterable l = [1, 2, 3, 4] t = (1, 2, 3, 4) d = {1: 2, 3: 4} s = {1, 2, 3, 4} a = 100 print(isinstance(l, Iterable)) print(isinstance(t, Iterable)) print(isinstance(d, Iterable)) print(isinstance(s, Iterable)) print(isinstance(a, Iterable)) # Output: True True True True False ``` # 迭代器 Python 中,**迭代器**是一种用于遍历集合(如列表、元组、字典等)中元素的对象。 可迭代对象通过`__iter__`方法向我们提供一个迭代器,我们在迭代一个可迭代对象的时候,实际上就是先获取该对象提供的一个迭代器,然后通过这个迭代器来依次获取对象中的每一个数据。 上面讲到迭代是访问集合元素的一种方式。而迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。 **那么也就是说,一个具备了`__iter__`方法的对象,就是一个可迭代对象。** ```python l = [1, 2, 3, 4] t = (1, 2, 3, 4) d = {1: 2, 3: 4} s = {1, 2, 3, 4} print(dir(l)) print(dir(t)) print(dir(d)) print(dir(s)) ``` ## 迭代器的本质 我们分析对可迭代对象进行迭代使用的过程,发现每迭代一次(即在for...in...中每循环一次)都会返回对象中的下一条数据,一直向后读取数据直到迭代了所有数据后结束。那么,在这个过程中就应该有一个“人”去记录每次访问到了第几条数据,以便每次迭代都可以返回下一条数据。我们把这个能帮助我们进行数据迭代的“人”称为**迭代器(Iterator)**。 ## 迭代器协议 迭代器遵循迭代协议,内部主要定义了`__iter__()`和`__next__()`两个方法 - `__iter__()`方法用于初始化一个迭代器,返回迭代器本身 - `__next__()`方法用于迭代下一个数据。当没有元素可返回时,抛出 `StopIteration` 异常。 ## 初始化迭代器 ```python list1 = [1,2,3,'a','b','c'] list_iter = list1.__iter__() # list是可迭代对象,这里我们调用iter方法初始化一个迭代器list_iter item = list_iter.__next__() # 这里通过next方法来获取下一个数据 print(item) item = list_iter.__next__() print(item) item = list_iter.__next__() print(item) item = list_iter.__next__() print(item) item = list_iter.__next__() print(item) item = list_iter.__next__() print(item) ``` 如果超出迭代范围,会触发**StopIteration**异常。我们可以加上异常处理,取完值后自动停止 ```python list1 = [1,2,3,'a','b','c'] list_iter = list1.__iter__() while True: try: print(next(list_iter)) # 这里是next方法的另一种写法 except StopIteration: print('迭代完成') break ``` ## 如何判断一个对象是迭代器 我们同样可以用内置的`isinstance()`方法来判断某个对象是否是**Iterator 对象(迭代器)** ```python from collections.abc import Iterator list1 = [1,2,3,'a','b','c'] list_iter = list1.__iter__() print(isinstance(list1, Iterator)) print(isinstance(list_iter, Iterator)) print(isinstance(iter(list1), Iterator)) # 初始化迭代器的另一种方法 # Output: False True True ``` ## for循环的本质 我们常用的for循环其实本质上就是迭代器协议的一种具体实现,为我们提供了一个遍历的迭代元素的方法。 **工作原理:** 当你使用 `for` 循环遍历一个可迭代对象时,实际上发生了以下几个步骤: 1. **调用 `__iter__()`**: - `for` 循环首先调用对象的 `__iter__()` 方法,获取一个迭代器对象。 2. **调用 `__next__()`**: - 然后,`for` 循环在迭代器上反复调用 `__next__()` 方法,以获取下一个元素。 3. **处理 `StopIteration`**: - 一旦 `__next__()` 抛出 `StopIteration` 异常,`for` 循环停止迭代。 # 生成器 生成器是 Python 中一种特殊的迭代器,允许你以一种简单而高效的方式生成序列。 ## 生成器的原理 **状态保持**:生成器通过 `yield` 语句保存函数的状态。在每次调用生成器时,函数会从上一个 `yield` 语句的下一行继续执行,而不仅仅是从函数的开始处执行。 **迭代器接口**:生成器实现了迭代器协议,因此可以使用 `for` 循环进行遍历。 ## 生成器函数 生成器也是一个函数,但与普通函数不同的是,它使用 `yield` 语句来返回值。每次调用生成器函数时,它会从上次 `yield` 的地方继续执行,直到遇到下一个 `yield` 或函数结束。 所以说,如果一个函数中使用yield来返回值,那么可以认为这是一个生成器函数 并且调用生成器函数不会得到返回的具体的值,而是得到一个迭代器。每一次获取这个迭代器值,就能推动函数的执行,获取新的返回值。直到函数执行结束。 ```python def numbers(n): """生成从 1 到 n 的自然数""" for i in range(1,n+1): yield i for i in numbers(10): print(i) ``` ## 惰性求值 生成器在需要时生成值,而不是一次性计算和返回所有值。这可以节省内存,特别是处理大型数据集时。 ### 案例:重生之我在早餐店卖包子 我重生了,重生在了高考的前一天,由于上一世我参加了高考最后只能上个大专,毕业了一事无成。这一生,我要成为商业巨头...... 一抬头,有一个卖包子的店铺正在转让,我决定从这里开始我的梦幻人生... 言归正传,如果卖包子,那么我一下子生成100笼包子,没地方放的同时还容易坏。我们可不可以等到有顾客下单的时候再去生成? ```python def produce(): # 生产包子 for i in range(1,100): yield f'生产了第{i}笼包子' produce_g = produce() print(produce_g.__next__()) print(produce_g.__next__()) print(produce_g.__next__()) # 顾客下单了,需要5笼包子 for i in range(5): print(produce_g.__next__()) # Output: 生产了第1笼包子 生产了第2笼包子 生产了第3笼包子 生产了第4笼包子 生产了第5笼包子 生产了第6笼包子 生产了第7笼包子 生产了第8笼包子 ``` ## send send 获取下一个值的效果和next基本一致 只是在获取下一个值的时候,给上一yield的**位置**传递一个数据 使用send的注意事项 - 第一次使用生成器的时候 是用next获取下一个值 - 最后一个yield不能接受外部的值 ```python def generator(): print(123) content = yield 1 print('欢迎来到',content) print(456) yield 2 g = generator() ret = g.__next__() print('***',ret) ret = g.send('英格科技') print('***',ret) # Output: 123 *** 1 欢迎来到 英格科技 456 *** 2 ```