252 lines
7.5 KiB
Markdown
252 lines
7.5 KiB
Markdown
# 可迭代对象
|
||
|
||
## 什么叫做迭代
|
||
|
||
通过之前的学习,我们已经知道对于**list、tuple、str**等类型的数据,我们可以使用`for i in xxx`的语法进行循环取值,我们把这样的过程称之为**遍历**,也叫做**迭代**
|
||
|
||
如下:
|
||
|
||
```python
|
||
li = [1, 2, 3, 'a', 'b', 'c']
|
||
for i in li:
|
||
print(i)
|
||
|
||
str = "hello,world"
|
||
for j in str:
|
||
print(j)
|
||
|
||
dic = {'name': 'nls', 'age': 18, 'job': 'teacher'}
|
||
for k,v in dic.items():
|
||
print(k,v)
|
||
# ......
|
||
```
|
||
|
||
Q:整数类型可以迭代吗?可以动手试一下....
|
||
|
||
## 如何判断一个对象是否可迭代
|
||
|
||
我们可以用Python中内置的`isinstance()`方法来判断某个对象是**Iterable对象**,也可以称之为**可迭代对象**
|
||
|
||
```python
|
||
# 字符串、列表、元组、字典、集合都可以被for循环,说明他们都是可迭代的
|
||
from collections.abc import Iterable
|
||
|
||
l = [1, 2, 3, 4]
|
||
t = (1, 2, 3, 4)
|
||
d = {1: 2, 3: 4}
|
||
s = {1, 2, 3, 4}
|
||
a = 100
|
||
|
||
print(isinstance(l, Iterable))
|
||
print(isinstance(t, Iterable))
|
||
print(isinstance(d, Iterable))
|
||
print(isinstance(s, Iterable))
|
||
print(isinstance(a, Iterable))
|
||
|
||
# Output:
|
||
True
|
||
True
|
||
True
|
||
True
|
||
False
|
||
```
|
||
|
||
# 迭代器
|
||
|
||
Python 中,**迭代器**是一种用于遍历集合(如列表、元组、字典等)中元素的对象。
|
||
|
||
可迭代对象通过`__iter__`方法向我们提供一个迭代器,我们在迭代一个可迭代对象的时候,实际上就是先获取该对象提供的一个迭代器,然后通过这个迭代器来依次获取对象中的每一个数据。
|
||
|
||
上面讲到迭代是访问集合元素的一种方式。而迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。
|
||
|
||
**那么也就是说,一个具备了`__iter__`方法的对象,就是一个可迭代对象。**
|
||
|
||
```python
|
||
l = [1, 2, 3, 4]
|
||
t = (1, 2, 3, 4)
|
||
d = {1: 2, 3: 4}
|
||
s = {1, 2, 3, 4}
|
||
|
||
print(dir(l))
|
||
print(dir(t))
|
||
print(dir(d))
|
||
print(dir(s))
|
||
```
|
||
|
||
## 迭代器的本质
|
||
|
||
我们分析对可迭代对象进行迭代使用的过程,发现每迭代一次(即在for...in...中每循环一次)都会返回对象中的下一条数据,一直向后读取数据直到迭代了所有数据后结束。那么,在这个过程中就应该有一个“人”去记录每次访问到了第几条数据,以便每次迭代都可以返回下一条数据。我们把这个能帮助我们进行数据迭代的“人”称为**迭代器(Iterator)**。
|
||
|
||
## 迭代器协议
|
||
|
||
迭代器遵循迭代协议,内部主要定义了`__iter__()`和`__next__()`两个方法
|
||
|
||
- `__iter__()`方法用于初始化一个迭代器,返回迭代器本身
|
||
|
||
- `__next__()`方法用于迭代下一个数据。当没有元素可返回时,抛出 `StopIteration` 异常。
|
||
|
||
## 初始化迭代器
|
||
|
||
```python
|
||
list1 = [1,2,3,'a','b','c']
|
||
|
||
list_iter = list1.__iter__() # list是可迭代对象,这里我们调用iter方法初始化一个迭代器list_iter
|
||
item = list_iter.__next__() # 这里通过next方法来获取下一个数据
|
||
print(item)
|
||
item = list_iter.__next__()
|
||
print(item)
|
||
item = list_iter.__next__()
|
||
print(item)
|
||
item = list_iter.__next__()
|
||
print(item)
|
||
item = list_iter.__next__()
|
||
print(item)
|
||
item = list_iter.__next__()
|
||
print(item)
|
||
```
|
||
|
||
如果超出迭代范围,会触发**StopIteration**异常。我们可以加上异常处理,取完值后自动停止
|
||
|
||
```python
|
||
list1 = [1,2,3,'a','b','c']
|
||
|
||
list_iter = list1.__iter__()
|
||
while True:
|
||
try:
|
||
print(next(list_iter)) # 这里是next方法的另一种写法
|
||
except StopIteration:
|
||
print('迭代完成')
|
||
break
|
||
```
|
||
|
||
## 如何判断一个对象是迭代器
|
||
|
||
我们同样可以用内置的`isinstance()`方法来判断某个对象是否是**Iterator 对象(迭代器)**
|
||
|
||
```python
|
||
from collections.abc import Iterator
|
||
list1 = [1,2,3,'a','b','c']
|
||
|
||
list_iter = list1.__iter__()
|
||
|
||
print(isinstance(list1, Iterator))
|
||
print(isinstance(list_iter, Iterator))
|
||
print(isinstance(iter(list1), Iterator)) # 初始化迭代器的另一种方法
|
||
|
||
# Output:
|
||
False
|
||
True
|
||
True
|
||
```
|
||
|
||
## for循环的本质
|
||
|
||
我们常用的for循环其实本质上就是迭代器协议的一种具体实现,为我们提供了一个遍历的迭代元素的方法。
|
||
|
||
**工作原理:**
|
||
|
||
当你使用 `for` 循环遍历一个可迭代对象时,实际上发生了以下几个步骤:
|
||
|
||
1. **调用 `__iter__()`**:
|
||
- `for` 循环首先调用对象的 `__iter__()` 方法,获取一个迭代器对象。
|
||
2. **调用 `__next__()`**:
|
||
- 然后,`for` 循环在迭代器上反复调用 `__next__()` 方法,以获取下一个元素。
|
||
3. **处理 `StopIteration`**:
|
||
- 一旦 `__next__()` 抛出 `StopIteration` 异常,`for` 循环停止迭代。
|
||
|
||
# 生成器
|
||
|
||
生成器是 Python 中一种特殊的迭代器,允许你以一种简单而高效的方式生成序列。
|
||
|
||
## 生成器的原理
|
||
|
||
**状态保持**:生成器通过 `yield` 语句保存函数的状态。在每次调用生成器时,函数会从上一个 `yield` 语句的下一行继续执行,而不仅仅是从函数的开始处执行。
|
||
|
||
**迭代器接口**:生成器实现了迭代器协议,因此可以使用 `for` 循环进行遍历。
|
||
|
||
## 生成器函数
|
||
|
||
生成器也是一个函数,但与普通函数不同的是,它使用 `yield` 语句来返回值。每次调用生成器函数时,它会从上次 `yield` 的地方继续执行,直到遇到下一个 `yield` 或函数结束。
|
||
|
||
所以说,如果一个函数中使用yield来返回值,那么可以认为这是一个生成器函数
|
||
|
||
并且调用生成器函数不会得到返回的具体的值,而是得到一个迭代器。每一次获取这个迭代器值,就能推动函数的执行,获取新的返回值。直到函数执行结束。
|
||
|
||
```python
|
||
def numbers(n):
|
||
"""生成从 1 到 n 的自然数"""
|
||
for i in range(1,n+1):
|
||
yield i
|
||
|
||
for i in numbers(10):
|
||
print(i)
|
||
```
|
||
|
||
## 惰性求值
|
||
|
||
生成器在需要时生成值,而不是一次性计算和返回所有值。这可以节省内存,特别是处理大型数据集时。
|
||
|
||
### 案例:重生之我在早餐店卖包子
|
||
|
||
我重生了,重生在了高考的前一天,由于上一世我参加了高考最后只能上个大专,毕业了一事无成。这一生,我要成为商业巨头......
|
||
|
||
一抬头,有一个卖包子的店铺正在转让,我决定从这里开始我的梦幻人生...
|
||
|
||
言归正传,如果卖包子,那么我一下子生成100笼包子,没地方放的同时还容易坏。我们可不可以等到有顾客下单的时候再去生成?
|
||
|
||
```python
|
||
def produce():
|
||
# 生产包子
|
||
for i in range(1,100):
|
||
yield f'生产了第{i}笼包子'
|
||
|
||
produce_g = produce()
|
||
print(produce_g.__next__())
|
||
print(produce_g.__next__())
|
||
print(produce_g.__next__())
|
||
|
||
# 顾客下单了,需要5笼包子
|
||
for i in range(5):
|
||
print(produce_g.__next__())
|
||
|
||
# Output:
|
||
生产了第1笼包子
|
||
生产了第2笼包子
|
||
生产了第3笼包子
|
||
生产了第4笼包子
|
||
生产了第5笼包子
|
||
生产了第6笼包子
|
||
生产了第7笼包子
|
||
生产了第8笼包子
|
||
```
|
||
|
||
## send
|
||
|
||
send 获取下一个值的效果和next基本一致
|
||
只是在获取下一个值的时候,给上一yield的**位置**传递一个数据
|
||
使用send的注意事项
|
||
|
||
- 第一次使用生成器的时候 是用next获取下一个值
|
||
- 最后一个yield不能接受外部的值
|
||
|
||
```python
|
||
def generator():
|
||
print(123)
|
||
content = yield 1
|
||
print('欢迎来到',content)
|
||
print(456)
|
||
yield 2
|
||
|
||
g = generator()
|
||
ret = g.__next__()
|
||
print('***',ret)
|
||
ret = g.send('英格科技')
|
||
print('***',ret)
|
||
|
||
# Output:
|
||
123
|
||
*** 1
|
||
欢迎来到 英格科技
|
||
456
|
||
*** 2
|
||
``` |