news 2026/1/10 3:42:56

AMD Nitro-E:304M轻量AI绘图,39.3样本/秒极速生成

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
AMD Nitro-E:304M轻量AI绘图,39.3样本/秒极速生成

AMD Nitro-E:304M轻量AI绘图,39.3样本/秒极速生成

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

AMD近日推出全新轻量级文本到图像扩散模型Nitro-E,以304M参数实现高效AI绘图,其蒸馏版本在单张AMD Instinct MI300X GPU上可达到39.3样本/秒的极速生成能力,为AI图像生成领域带来性能与效率的双重突破。

当前AI图像生成领域正面临模型规模与推理速度的双重挑战。随着Stable Diffusion、Midjourney等主流模型不断迭代,参数规模已从数亿级向千亿级迈进,但这也导致普通硬件难以承载,且商业部署成本居高不下。行业调研显示,企业级AI绘图应用中,超过60%的算力消耗集中在图像生成环节,如何在保证图像质量的前提下实现轻量化部署,成为制约技术落地的关键瓶颈。

Nitro-E模型家族通过创新架构设计实现了效率突破。其核心是AMD提出的Efficient Multimodal Diffusion Transformer(E-MMDiT)架构,采用" token reduction "设计理念,通过高度压缩的视觉tokenizer生成紧凑表示,并引入多路径压缩模块进一步减少token数量。同时,模型创新性地应用Position Reinforcement技术增强空间连贯性,以及Alternating Subregion Attention(ASA)机制在子区域内执行注意力计算,有效降低计算成本。

该模型系列包含三个版本:基础版Nitro-E-512px(20步生成)、蒸馏版Nitro-E-512px-dist(4步生成)以及采用Group Relative Policy Optimization(GRPO)策略优化的Nitro-E-512px-GRPO。其中蒸馏版本在保持图像质量的同时,将推理步数从20步压缩至4步,配合16位浮点运算(bfloat16)支持,在单张MI300X GPU上实现39.3样本/秒的吞吐量,较同参数规模模型提升近3倍。

训练效率同样令人瞩目。基础模型从 scratch 训练仅需1.5天,在配备8张AMD Instinct MI300X GPU的单节点上即可完成,训练成本较同类模型降低60%以上。训练数据来自约2500万张图像的混合数据集,包括Segment-Anything-1B、JourneyDB、DiffusionDB等公开数据源,确保模型具备丰富的视觉理解能力。

Nitro-E的推出将加速AI图像生成技术的工业化应用。对于内容创作平台,39.3样本/秒的生成速度意味着可同时服务数百名并发用户,且响应延迟控制在毫秒级;在电商领域,该模型可实时生成商品展示图,将传统美工流程从小时级压缩至分钟级;边缘计算场景中,304M的轻量化参数使AI绘图能力可部署在消费级硬件上,为移动设备端AI创作开辟新可能。

值得注意的是,AMD同步开放了Nitro-E的源代码与技术博客,采用MIT许可协议,这将加速学术界对高效扩散模型的研究。行业专家预测,Nitro-E提出的" token压缩 + 子区域注意力 "架构可能成为轻量化扩散模型的标准设计范式,推动AI图像生成从"重算力依赖"向"高效能部署"转型。随着硬件优化与算法迭代的持续结合,未来12个月内,企业级AI绘图的单位算力成本有望降低70%,进一步释放创意产业的数字化潜力。

【免费下载链接】Nitro-E项目地址: https://ai.gitcode.com/hf_mirrors/amd/Nitro-E

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/7 0:29:27

SMAPI模组开发实战指南:5步构建你的第一个星露谷物语模组

SMAPI模组开发实战指南:5步构建你的第一个星露谷物语模组 【免费下载链接】SMAPI The modding API for Stardew Valley. 项目地址: https://gitcode.com/gh_mirrors/smap/SMAPI SMAPI作为星露谷物语官方推荐的模组API,为开发者提供了完整的扩展框…

作者头像 李华
网站建设 2026/1/9 8:16:52

AI一秒生成萌猫!Consistency模型极速绘图体验

AI图像生成领域再添新成员!一款名为diffusers-ct_cat256的模型近日引起关注,它基于Consistency模型架构,能够在一秒钟内快速生成256x256分辨率的猫咪图像,为AI绘图的效率与体验带来新突破。 【免费下载链接】diffusers-ct_cat256 …

作者头像 李华
网站建设 2026/1/5 7:34:27

WarcraftHelper:魔兽争霸III完全优化指南

还在为经典魔兽争霸III在新系统上的兼容性问题困扰吗?WarcraftHelper插件专为1.20e至1.27b多个经典版本精心打造,通过一系列实用功能让老游戏在现代硬件上焕发全新活力。无论你是竞技对战爱好者还是RPG地图玩家,这款插件都能显著提升你的游戏…

作者头像 李华
网站建设 2026/1/10 0:31:47

AVIF格式Photoshop插件终极指南:轻松实现高质量图像压缩

AVIF格式Photoshop插件终极指南:轻松实现高质量图像压缩 【免费下载链接】avif-format An AV1 Image (AVIF) file format plug-in for Adobe Photoshop 项目地址: https://gitcode.com/gh_mirrors/avi/avif-format 还在为图像文件占用过多存储空间而烦恼吗&a…

作者头像 李华
网站建设 2026/1/8 12:33:52

Magistral 1.2本地部署:24B多模态AI轻松跑

大语言模型本地化部署迎来重要突破——Magistral-Small-2509-GGUF版本实现了240亿参数多模态模型在消费级硬件上的流畅运行,标志着高性能AI向个人设备普及迈出关键一步。 【免费下载链接】Magistral-Small-2509-GGUF 项目地址: https://ai.gitcode.com/hf_mirror…

作者头像 李华
网站建设 2026/1/10 1:16:09

Gemma 3 270M:小模型大能力,QAT技术释放AI潜力

Gemma 3 270M:小模型大能力,QAT技术释放AI潜力 【免费下载链接】gemma-3-270m-it-qat-unsloth-bnb-4bit 项目地址: https://ai.gitcode.com/hf_mirrors/unsloth/gemma-3-270m-it-qat-unsloth-bnb-4bit 导语 Google最新发布的Gemma 3 270M指令微…

作者头像 李华