news 2026/6/23 4:03:12

使用 Gemini(又称 Nano Banana 和 Nano Banana Pro)生成图片

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
使用 Gemini(又称 Nano Banana 和 Nano Banana Pro)生成图片

图片生成(文本转图片)

from google import genai from google.genai import types from PIL import Image client = genai.Client() prompt = ( "Create a picture of a nano banana dish in a fancy restaurant with a Gemini theme" ) response = client.models.generate_content( model="gemini-2.5-flash-image", contents=[prompt], ) for part in response.parts: if part.text is not None: print(part.text) elif part.inline_data is not None: image = part.as_image() image.save("generated_image.png")

注意:python要提前安装Pillow

pip install Pillow

图片编辑(文字和图片转图片)

from google import genai from google.genai import types from PIL import Image client = genai.Client() prompt = ( "Create a picture of my cat eating a nano-banana in a " "fancy restaurant under the Gemini constellation", ) image = Image.open("/path/to/cat_image.png") response = client.models.generate_content( model="gemini-2.5-flash-image", contents=[prompt, image], ) for part in response.parts: if part.text is not None: print(part.text) elif part.inline_data is not None: image = part.as_image() image.save("generated_image.png")

Gemini 3 Pro Image (gemini-3-pro-image-preview) 是一款先进的图片生成和编辑模型,针对专业资源制作进行了优化。Gemini 1.5 Pro 旨在通过高级推理来应对最具挑战性的工作流程,擅长处理复杂的多轮创建和修改任务。

  • 高分辨率输出:内置 1K、2K 和 4K 视觉效果生成功能。
  • 高级文字渲染:能够为信息图表、菜单、图表和营销素材资源生成清晰易读的风格化文字。
  • 使用 Google 搜索进行接地:模型可以使用 Google 搜索作为工具来验证事实,并根据实时数据(例如当前天气地图、股票图表、近期活动)生成图像。
  • 思考模式:模型会利用“思考”过程来推理复杂的提示。它会生成临时“思维图像”(在后端可见,但不收费),以在生成最终的高质量输出之前优化构图。
  • 最多 14 张参考图片:您现在最多可以混合使用 14 张参考图片来生成最终图片。

最多可使用 14 张参考图片

借助 Gemini 3 Pro 预览版,您最多可以混合 14 张参考图片。这 14 张图片可以包含以下内容:

  • 最多 6 张高保真对象图片,用于包含在最终图片中
  • 最多 5 张人像照片,以保持角色一致性

from google import genai from google.genai import types from PIL import Image prompt = "An office group photo of these people, they are making funny faces." aspect_ratio = "5:4" # "1:1","2:3","3:2","3:4","4:3","4:5","5:4","9:16","16:9","21:9" resolution = "2K" # "1K", "2K", "4K" client = genai.Client() response = client.models.generate_content( model="gemini-3-pro-image-preview", contents=[ prompt, Image.open('person1.png'), Image.open('person2.png'), Image.open('person3.png'), Image.open('person4.png'), Image.open('person5.png'), ], config=types.GenerateContentConfig( response_modalities=['TEXT', 'IMAGE'], image_config=types.ImageConfig( aspect_ratio=aspect_ratio, image_size=resolution ), ) ) for part in response.parts: if part.text is not None: print(part.text) elif image:= part.as_image(): image.save("office.png")
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 19:51:06

Ivy统一AI框架:5步实现多框架代码无缝转换

在AI开发领域,你是否曾因不同框架间的代码迁移而头疼?Ivy统一AI框架正是为解决这一痛点而生。这个创新的开源项目让机器学习代码可以在PyTorch、TensorFlow、JAX、NumPy等主流框架间自由转换,真正实现了"一次编写,到处运行&q…

作者头像 李华
网站建设 2026/6/23 7:22:35

Socket.IO-Client-Swift完整开发指南:从零构建实时iOS应用

Socket.IO-Client-Swift完整开发指南:从零构建实时iOS应用 【免费下载链接】socket.io-client-swift 项目地址: https://gitcode.com/gh_mirrors/so/socket.io-client-swift 想要快速掌握iOS实时通信开发的核心技术吗?Socket.IO-Client-Swift为S…

作者头像 李华
网站建设 2026/6/23 10:48:43

LangFlow工作流导出为API接口的完整流程

LangFlow工作流导出为API接口的完整流程 在AI应用开发日益普及的今天,一个核心挑战浮出水面:如何让非程序员也能参与构建智能系统?数据科学家、产品经理甚至业务专家常常能清晰描述他们想要的逻辑——比如“先检索知识库,再用大模…

作者头像 李华
网站建设 2026/6/23 19:47:01

25、Linux 系统通信指南:网络连接、传真与调制解调器使用

Linux 系统通信指南:网络连接、传真与调制解调器使用 在当今数字化时代,计算机之间的通信变得至关重要。无论是连接互联网、收发传真还是使用调制解调器进行串行连接,都是常见的需求。本文将详细介绍在 Linux 系统中实现这些通信功能的方法。 1. 连接到互联网 连接 Linux…

作者头像 李华
网站建设 2026/6/23 20:59:04

22、Linux系统中的提醒工具使用指南

Linux系统中的提醒工具使用指南 在Linux系统中,当我们花费大量时间在工作上时,提醒功能就显得尤为重要。它能帮助我们合理安排时间,确保不会错过重要的事情。下面将介绍一些常见的提醒工具及其使用方法。 日期和时间显示 在Linux中, date 命令可以用来输出当前系统的日…

作者头像 李华
网站建设 2026/6/23 5:13:12

加密已死?不,它正在重生:为什么加密仍然是数据安全的终极堡垒

当数据成为数字时代的血液,加密就是保护生命线的最坚固血管。深夜,某互联网公司的服务器监控中心,警报声刺破了平静。安全团队迅速发现,攻击者已突破层层防线:防火墙规则被篡改、零日漏洞被利用、管理员账户被接管。但…

作者头像 李华