一文读懂Python的yield:初学者也能轻松掌握的生成器神器
文章目录
- 一文读懂Python的yield:初学者也能轻松掌握的生成器神器
- 生成器函数 VS 普通函数
- 核心区别
- yield的核心优势:惰性求值
- yield的进阶小技巧
- send():给生成器“传值”(双向通信)
- yield from:简化嵌套生成器
- yield常见应用场景
如果你刚学Python,可能对yield这个关键字有点陌生——它看起来像return,却又和return不一样。其实yield一点都不难,它的核心作用就一个:帮我们创建“生成器”,实现“用的时候再生成数据”,既省内存又灵活。不管是处理大文件,还是生成无限序列,yield都能派上大用场。今天我们就用最直白的话讲清yield,再配上简单代码练习,新手也能快速上手!
要搞懂yield,先对比我们最熟悉的return——毕竟它们都是“返回值”的工具,但用法和效果完全不同。下面我们先从基础例子入手,看看yield到底特殊在哪。
配合练习效果更佳哦!!
生成器函数 VS 普通函数
1、普通函数(用return):执行到return就结束,状态全销毁
# 普通函数,使用returndefnormal_func():print('执行第1步')return1print('执行第2步')# 调用执行result=normal_func()print(f'普通函数:{result}')这段代码运行的结果会是什么呢?
结果如下
执行第1步 普通函数:12、生成器函数(用yield):遇到yield就暂停,保留状态
只要函数里有yield,它就不是普通函数了,而是“生成器函数”。调用它不会执行代码,只会得到一个“生成器对象”;只有用next()或for循环迭代时,才会执行代码
# 生成器函数,使用yielddefgen_func():print("执行第一步")yield1# 暂停执行,返回1,保留当前状态print("执行第二步")yield2# 再次暂停,返回2print("执行第三步")yield3# 最后一次暂停,返回3# 调用生成器函数,不会执行代码,只得到生成器对象gen=gen_func()print("直接调用的结果:",gen)# 用next()触发执行(每次next(),执行到下一个yield就停)print("\n第一次调用next(gen):")print(next(gen))print("\n第二次调用next(gen):")print(next(gen))print("\n第三次调用next(gen):")print(next(gen))# print(next(gen)) # 会抛出StopIteration异常!对应结果如下:
如果第四次调用next(gen):生成器耗尽,会抛StopIteration异常
直接调用的结果:<generator object gen_func at 0x00000238C50BA3B0>第一次调用next(gen): 执行第一步1第二次调用next(gen): 执行第二步2第三次调用next(gen): 执行第三步33、用for循环迭代生成器
手动写next()太麻烦,for循环会自动处理StopIteration异常,迭代起来更简单,这也是实际开发中最常用的方式
defgen_func():print("执行第一步")yield1# 暂停执行,返回1,保留当前状态print("执行第二步")yield2# 再次暂停,返回2print("执行第三步")yield3# 最后一次暂停,返回3print("for循环迭代生成器:")fornumingen_func():print("获取到的值:",num)可以得到结果如下:
for循环迭代生成器: 执行第一步 获取到的值:1执行第二步 获取到的值:2执行第三步 获取到的值:3通过以上代码的练习,我们可以发现:
return是“一次性返回,直接结束”,yield是“分次返回,暂停保留状态”——这就是yield最核心的特点。
核心区别
| 特性 | return(普通函数) | yield(生成器函数) |
|---|---|---|
| 执行逻辑 | 执行到 return 立即终止函数,销毁状态 | 执行到 yield 暂停函数,保留当前状态 |
| 返回值 | 直接返回最终值,函数调用即执行 | 返回生成器对象,迭代时才逐步返回值 |
| 内存占用 | 一次性生成所有数据,占用内存大 | 按需生成数据,仅占用当前迭代的内存 |
| 可迭代性 | 无(返回单个 / 多个值,需手动封装迭代) | 生成器对象本身是可迭代对象,支持 for/next |
yield的核心优势:惰性求值
这个时候,问题很多的小明就要问了:“既然return也能返回值,我为啥还要用yield呀?”
答曰:yield能省内存!这种“用的时候再生成数据”的方式,叫“惰性求值”
为啥用yield就可以省内存呀?
假如说,现在我们需要100w条数据,用list存储,return返回,他会一次性把100w的数据全部放到内存中,这个时候,就有可能会导致电脑卡顿;但是如果使用yield,yield每次只会返回1个数据,用完就扔,可以说是几乎不占内存。
现在我们写一段代码来实验一下:
importtimeimportsysdefcreate_big_list():print("开始创建列表...")result=[iforiinrange(1000000)]print("列表创建完成")returnresultdefcreate_big_gen():print("创建生成器对象...")foriinrange(1000000):yieldiprint("生成器完成所有值的生成")# 对比创建时间print("=== 创建阶段 ===")start=time.time()list_big=create_big_list()print(f"创建列表耗时:{time.time()-start:.6f}秒")start=time.time()gen_big=create_big_gen()print(f"创建生成器耗时:{time.time()-start:.6f}秒")# 对比内存使用print(f"\n=== 内存使用 ===")print(f"列表大小:{sys.getsizeof(list_big):,}字节")print(f"生成器大小:{sys.getsizeof(gen_big):,}字节")# 验证惰性取值print("\n=== 惰性求值验证 ===")print("从生成器获取前5个值:")foriinrange(5):print(f" 第{i+1}个值:{next(gen_big)}")结果如下:
===创建阶段===开始创建列表... 列表创建完成 创建列表耗时:0.043654秒 创建生成器耗时:0.000000秒===内存使用===列表大小:8,448,728 字节 生成器大小:104字节===惰性求值验证===从生成器获取前5个值: 创建生成器对象... 第1个值:0第2个值:1第3个值:2第4个值:3第5个值:4可以看出yield消耗的内存可以说是远小于直接使用return返回的消耗的
另一个实用场景:逐行读取大文件。如果直接用read()读取几十GB的日志文件,会瞬间占满内存;用yield逐行读,就不会有这个问题
defread_big_file(file_path):# 打开文件(with语句会自动关闭文件,新手放心用)withopen(file_path,"r",encoding="utf-8")asf:forlineinf:yieldline.strip()这里可以把内存看作家里的冰箱,而return与yield的区别就在于:
return会一次性买一周的量,可能会有冰箱装不下的风险,
而yield则是每次只买做一顿饭的量,吃多少买多少,所以冰箱不会有爆满的风险。
普通函数执行流程:
调用函数 → 执行代码 → 遇到return → 返回值 → 函数结束
生成器函数执行流程:
调用函数 → 返回生成器对象 → next()触发 → 执行到yield暂停 →
返回值 → 保留状态 → 下次next() → 从暂停处继续 → …
yield的进阶小技巧
send():给生成器“传值”(双向通信)
yield不仅能返回值,还能接收外部传进来的值,用send()方法就行。注意:第一次传值前,要先用next()触发生成器到暂停状态。
defchat_gen():print("生成器:你好!请给我发一条消息~")msg1=yield"等待你的消息..."# 暂停,返回提示语,同时接收外部传值print(f"生成器:收到你的消息啦:{msg1}")msg2=yieldf"已确认消息:{msg1}"# 再次暂停,接收第二条消息print(f"生成器:又收到一条消息:{msg2}")yieldf"结束对话,共收到两条消息"# 测试send()用法gen_chat=chat_gen()# 第一步:用next()触发生成器到第一个yieldfirst_reply=next(gen_chat)print("我收到的回复:",first_reply)# 第二步:用send()传值,同时触发生成器继续执行second_reply=gen_chat.send("Hello! yield真有趣~")print("我收到的回复:",second_reply)# 第三步:再传一条消息third_reply=gen_chat.send("我学会啦!")print("我收到的回复:",third_reply)结果如下:
生成器:你好!请给我发一条消息~ 我收到的回复: 等待你的消息... 生成器:收到你的消息啦:Hello!yield真有趣~ 我收到的回复: 已确认消息:Hello!yield真有趣~ 生成器:又收到一条消息:我学会啦! 我收到的回复: 结束对话,共收到两条消息yield from:简化嵌套生成器
如果有嵌套的生成器(生成器里套生成器),用yield from能直接迭代内部生成器的值,不用写复杂循环。
# 子生成器(内部的小生成器)defsub_gen():yield"苹果"yield"香蕉"# 主生成器(外部的生成器)defmain_gen():yield"开始输出水果:"yieldfromsub_gen()# 直接迭代sub_gen()的所有值,等价于for val in sub_gen(): yield valyield"结束输出水果"# 迭代主生成器forvalinmain_gen():print(val)可以得到如下结果:
开始输出水果: 苹果 香蕉 结束输出水果yield常见应用场景
常见的应用场景如下:
- 处理大文件/大数据:比如逐行读日志、生成百万级数据(省内存);
- 生成无限序列:比如生成自然数、斐波那契数列(列表存不下,生成器能一直给值);
- 分步执行任务:比如爬虫的“请求网页→解析数据→保存数据”,每一步用yield暂停,方便调试;
- 简单协程/异步:入门级的异步操作(比如简单的任务调度),yield是基础。
最后再实现一个用yield生成无限斐波那契数列的代码:
斐波那契数列:在一组数据中,每个数都等于前两个数之和
deffib_gen():a,b=0,1whileTrue:# 无限循环,生成器不会一次性执行完yielda# 每次返回一个斐波那契数a,b=b,a+b# 更新值# 取前10个斐波那契数(避免无限迭代)fib=fib_gen()print("前10个斐波那契数:")for_inrange(10):print(next(fib),end=" ")总结:新手掌握yield的核心要点
其实yield一点都不复杂,新手记住3个核心点就行:
- 有yield的函数是生成器函数,调用不执行,返回生成器对象;
- 用next()或for循环触发执行,遇到yield就暂停、返回值、保留状态;
- 核心优势是惰性求值,省内存,适合大数据/大文件场景。