news 2026/6/23 22:26:26

刚刚!GPT-5.2 正式发布!这是把 Claude 4.5 和 Gemini 3 Pro 按在地上摩擦!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
刚刚!GPT-5.2 正式发布!这是把 Claude 4.5 和 Gemini 3 Pro 按在地上摩擦!

刚刚,OpenAI 正式发布了 GPT-5.2。

Claude Opus 4.5、Gemini 3 Pro,这些原本都是世界顶级的模型,在 GPT-5.2 面前,数据差距肉眼可见。都要被按地上摩擦了!特别是 AIME 2025 这种数学竞赛,直接干到了 100%。


但我看完官方的所有信息,我的感觉是:OpenAI 这次不想和你聊“谁更聪明”。它想解决的是“能不能把活干完”。

如果不讲虚的,GPT-5.2 这次的变化,主要都在这 5 点。

1. 以后没有“一个模型”,只有“三种模式”

现在,OpenAI 把 GPT-5.2 拆成了三种角色:

  • GPT-5.2 Instant(即时版):它很快,成本低。适合写邮件、翻译、改文案这种“短平快”的活。

  • GPT-5.2 Thinking(思考版):它很稳。它会思考,适合做复杂的逻辑推理、写长文档、做数学题。

  • GPT-5.2 Pro(专业版):它最强,也最贵。当你需要最高质量的结果,或者解决那种“掉头发”的难题时,就用它。


这其实是在帮你省钱。简单的活,不用杀鸡用牛刀;难的活,必须用重武器。

2. 不只是聊天,它是真的在“干活”

这次发布里,有个数据很吓人。在 SWE-Bench Pro(一个很难的代码测试标准)上,GPT-5.2 拿到了55.6%的分数,这是目前的最高分。


Notion、Zoom 这些大公司已经试用了。他们发现,GPT-5.2 特别擅长处理“长任务”。

  • • 你给它一堆乱七八糟的文档,让它整理成项目表。

  • • 你让它改一个复杂的代码库,它能记住上下文。

  • • 你让它按步骤执行一个流程,它不会做着做着就跑偏。

它能自己找资料、自己检查错误、自己补全中间的步骤。它给你的,不再是一个“大概的思路”,而是一个“能用的结果”。

3. 前端能力史诗级加强

早期测试者发现,GPT-5.2 Thinking 在前端开发和复杂的 UI 工作方面表现得格外强悍——尤其是涉及到 3D 元素的时候。

欣赏两个示例,都是一个提示词做出来的

比如这个海洋波浪模拟,光影、物理效果,都是一次成型。

Prompt: Create a single-page app in a single HTML file with the following requirements: - Name: Ocean Wave Simulation - Goal: Display realistic animated waves. - Features: Change wind speed, wave height, lighting. - The UI should be calming and realistic.

还有这个节日贺卡


Prompt: Create a single-page app, in a single HTML file, that demonstrates a warm and fun holiday card! The card should be interactive and enjoyable for kids! - Have variety of items kids can drop in the UI; a few should be already placed by default - Also have fun sound interactions - Place many cute and fun stuff as much as possible - Animation like snowdrop should be used nicely

4. 长记性,不靠死记硬背

以前我们说 AI “记性好”,通常是指它的窗口大,能塞进去几十万字。

但字塞进去了,它能不能记住重点?很难说。

GPT-5.2 Thinking 配合了一个新功能(API 里的/compact)。简单说,就是让模型在处理超长内容时,更能抓住重点线索。

它不会读了后面忘前面,对于写长篇报告、分析整个项目的代码非常有惊人的帮助。

5. 价格更精明:该省的省,该花的要花

大家最关心的价格,OpenAI 也给了明确的数字(每百万 tokens):

  • 输入:$1.75

  • 输出:$14


看着不便宜?但它有个大招:缓存输入打一折(90% 折扣)

如果你是写代码,或者处理重复的文档,很多背景信息是不用反复算的。这一折下来,实际成本可能会大幅下降。

而且,因为它变聪明了,一次能把事情做对,不用反复重试。算总账,反而可能更省钱。

6. 安全不再是虚设

这次 OpenAI 居然把安全变成了产品能力。

它对敏感话题的处理更成熟了。特别是对于 18 岁以下的用户,它会自动识别并增加保护。这说明 GPT-5.2 已经准备好大规模进入教育和家庭场景了。


Claude Opus 4.5 很强,Gemini 3 Pro 也很猛。

但 OpenAI 这一手 GPT-5.2,打法变了。它不光是在卷“智商”,它在卷“靠谱”,要真的能干活和解决问题的能力。

往期推荐

Claude Code 算是被我玩明白了

Ant Design 6.0 来了!这一次它终于想通了什么?

15 个 Node.js 新功能替代流行 NPM 包


最后

  • 欢迎加我微信,拉你进技术群,长期交流学习...

  • 欢迎关注「前端Q」,认真学前端,做个专业的技术人...

点个在看
支持我吧

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 20:14:14

Docker Swarm集群部署LLama-Factory生产环境最佳实践

Docker Swarm集群部署LLama-Factory生产环境最佳实践 在大模型技术加速落地的今天,越来越多企业希望基于开源LLM构建自有知识体系驱动的智能服务。然而,从模型微调到稳定部署这一链条中,往往面临开发门槛高、资源调度复杂、服务可用性差等现实…

作者头像 李华
网站建设 2026/6/23 20:39:38

AutoGPT与Neo4j图数据库整合:构建智能关系网络的知识图谱

AutoGPT与Neo4j图数据库整合:构建智能关系网络的知识图谱 在企业知识管理日益复杂的今天,一个典型的问题是:AI助手花了三天时间调研“生成式AI在制药研发中的应用”,最终交出一份详尽报告——可当一周后被问到“哪些公司正在用扩…

作者头像 李华
网站建设 2026/6/23 11:10:17

【2025最新】基于SpringBoot+Vue的福泰轴承股份有限公司进销存系统管理系统源码+MyBatis+MySQL

摘要 随着信息技术的快速发展,企业信息化管理已成为提升运营效率的重要手段。福泰轴承股份有限公司作为一家专注于轴承生产与销售的企业,传统的手工记录和Excel表格管理方式已无法满足其日益增长的订单、库存和财务数据分析需求。尤其在供应链管理环节&a…

作者头像 李华
网站建设 2026/6/23 20:42:16

LSTM模型在LobeChat上下文理解中的潜在应用

LSTM模型在LobeChat上下文理解中的潜在应用 在构建现代对话系统时,一个常被忽视却至关重要的问题浮出水面:如何让AI真正“记住”用户?不是简单地拼接历史消息,而是像人类一样捕捉语气的变化、意图的演变,甚至情绪的起伏…

作者头像 李华
网站建设 2026/6/23 21:46:03

ComfyUI条件控制门限设置Qwen-Image-Edit-2509触发逻辑

ComfyUI条件控制门限设置触发Qwen-Image-Edit-2509的工程实践 在当前AIGC内容生产加速渗透电商、广告与社交媒体的背景下,如何让图像编辑既精准又高效,成为系统设计的核心挑战。一个常见的矛盾是:高精度模型(如Qwen-Image-Edit-25…

作者头像 李华
网站建设 2026/6/23 22:01:25

Kotaemon框架支持SSCOM串口通信扩展?工业场景新玩法设想

Kotaemon框架支持SSCOM串口通信扩展?工业场景新玩法设想 在智能制造加速推进的今天,越来越多工厂面临一个尴尬局面:一方面部署了先进的AI对话系统用于运维辅助,另一方面大量关键设备仍通过RS-485串口进行控制。当操作员对着语音助…

作者头像 李华