news 2026/1/20 20:25:08

用一条主线串起全文: 2023–2024 年:AI 主要做 代码补全 / 问答,更多像“高级自动完成”。 2025 年:AI 开始做 需求理解、任务规划、代码实现、测试、重构 的闭环1

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
用一条主线串起全文: 2023–2024 年:AI 主要做 代码补全 / 问答,更多像“高级自动完成”。 2025 年:AI 开始做 需求理解、任务规划、代码实现、测试、重构 的闭环1

用一条主线串起全文:

  • 2023–2024 年:AI 主要做代码补全 / 问答,更多像“高级自动完成”。
  • 2025 年:AI 开始做需求理解、任务规划、代码实现、测试、重构的闭环,变成真正的“虚拟软件工程师”。
  • 下半年开始:行业从“聊着写”(Vibe Coding)走向“写完再干”(Spec & Skills 编程)。

全文围绕四条脉络展开:

  1. 推理模型平民化:o3 / DeepSeek V3 系列。
  2. IDE 代理人革命:Cursor / Windsurf / Copilot Workspace。
  3. Spec 驱动开发崛起:Kiro / OpenSpec。
  4. Skill 驱动 Agent:Claude Skills / Agent Skills。

二、按时间线梳理 2025 关键节点

Q1:推理模型的平民化

关键词:o3-mini、DeepSeek V3、算力普惠

1. 1 月 31 日 – OpenAI o3-mini 发布

o3-mini 被定位为高效推理模型,在编程竞赛(如 Codeforces Elo)上达到强竞争水平,被视作“日常开发可用的深度思考模型”。 相比早期高延迟的深度推理模型,o3-mini 把“深度思考”拉进了秒级响应,减少了中断心流的等待时间,对 Vibe Coding 体验影响巨大。

2. DeepSeek V3 / R1 带来的价格冲击

DeepSeek V3 在 2024 年底开源并在 2025 年持续演进,提供了在代码任务上极具竞争力的性能,同时保持极低推理成本。 对个人开发者和小团队来说,这意味着可以在代码审查、长文档理解、整仓级重构上“放手用”,不再过度担心 Token 花费。

3. Claude 系列的持续迭代

Claude 3.x / 3.5 在 2025 年初仍是代码理解和安全约束方面的标杆,给后来的 Claude 4 系列打下基础。


Q2:IDE 的代理人革命

关键词:Windsurf、Copilot Workspace、o3 / o3-pro

1. 4 月中旬 – OpenAI o3 & o4-mini 正式登场

o3 被描述为“新一代深度推理模型”,在软件工程基准 SWE-bench 等任务上表现突出;o4-mini 覆盖了大量日常开发需求。 这代模型开始原生支持更复杂的函数调用和结构化输出,为 Agent 在 IDE 内做多步计划和执行提供了基础能力。

2. 5 月 – Windsurf:Agentic IDE 成型

Windsurf(前 Codeium)在 2025 年推出了侧重多步自动化的Cascade / Turbo 模式,允许 AI 主动读取代码库、规划变更、执行修改,而不仅仅是在单个文件里补代码。 这一设计让“让 AI 修复整个项目的 TypeScript 报错”这类需求变成现实,被称为“Agentic IDE”的重要里程碑。

3. 5 月 30 日前后 – GitHub Copilot Workspace 面向更多用户开放

Copilot Workspace 把“写代码”抽象成“提出问题 / Issue → 生成计划 → 自动实现 / 提交 PR”的流水线,让开发者更多处于产品与设计决策层,而非底层实现细节层。 对很多团队来说,这是第一次在官方产品中体验“只写需求,不打开编辑器也能出代码”的模式。

4. 6 月 10 日 – OpenAI o3-pro 发布

o3-pro 作为高端版本,提供更稳定的推理结果和更大的上下文窗口,被 Cursor、Windsurf 等高阶 IDE 集成为“后端大脑”。


Q3:巨头巅峰与 Vibe 平台混战

关键词:Claude 4.1、DeepSeek V3.1、Bolt.new、v0.app

1. 8 月初 – Claude 4.1 & Claude Code 工作空间

Claude 4.1(及其高端变体)在代码生成、重构和长上下文理解方面表现极强,被不少工程师视为“复杂后端和系统设计首选模型”。 与之配套的Claude Code工作空间强调“项目级协作”,可对整仓库进行重构、文档生成和测试分析,推动了“在浏览器里完成整套开发闭环”的趋势。

2. 8 月 19 日 – DeepSeek V3.1 发布

V3.1 在推理质量和代码能力上明显提升,同时保持极具优势的价格,使得其在个人和中小团队中的采用率迅速上升。 大参数量与高效推理结合,使其在很多评测中对闭源商用模型形成有力冲击,也带动了本地和私有部署方案的兴起。

3. Bolt.new vs v0.app:Vibe Coding 平台战火升温
  • Bolt.new主打“全栈生成 + 一键部署”,适合从零到一快速搭建可运行产品;
  • v0.app则在高保真 UI 生成和交互设计上更具优势。

很多工程师形成了“缝合流”工作流:用 v0 生成界面,再交给 Bolt 或本地 IDE / Agent 填充业务逻辑。


Q4:完全体智能体与本地生态

关键词:Cursor 2.0、DeepSeek V3.2、Trae IDE

1. Cursor 2.0:Vibe Coding 的终极形态

Cursor 在 2025 年下半年发布了 2.0 版本,引入更强的内置模型(Composer 2.0)以及多智能体并行能力,可以让多个 Agent 在不同分支 / 子任务上同时工作。 借助更好长上下文支持和 Git Worktree 隔离等机制,AI 可以在后台大幅度重构代码而不干扰开发者当前的编辑状态。

2. 11 月 30 日 – DeepSeek V3.2 发布

V3.2 在工具调用和“显式思考”结合上做了增强,让模型在执行终端命令、API 调用前会进行更清晰的推理和安全检查,降低高风险操作误用概率。 这类设计对“让 AI 真正执行命令”的场景格外重要,是向“可托管 Agent”迈进的一大步。

3. Trae IDE:本地化 Agent IDE 的崛起

Trae 在 2025 年多次更新,强化了与多家模型(如国际大模型与中文生态模型)的集成,并提供项目级协作和代码审查自动化能力。 其在中文语境、国内云平台集成等方面的优化,使其成为国产智能 IDE 阵营中颇具代表性的一个。

1. 从 Syntax 到 Semantics

模型已经足够理解语法和框架细节,开发者越来越多把精力放在业务语义、领域知识和产品体验上。

2. Prompt Engineering 已死,Context & Spec 永生

与其纠结一句 Prompt 该怎么写,不如把需求、约束和流程写成可复用的 Spec / Skill,让 AI 在清晰的边界里工作。

3. Vibe Coding 成为日常,Spec & Skills 成为"上线级工程"标配

  • Vibe Coding依旧是探索和原型阶段最爽的方式
  • 一旦进入多人协作和生产级项目,Spec 驱动与 Skill 驱动开始成为"让 AI 真正进团队"的基础设施

结语

2025 年,我们见证了 AI 编程从"辅助工具"到"协作伙伴"的历史性跨越。从年初 o3-mini 的发布,到年中 Windsurf、Copilot Workspace 的革新,再到下半年 Kiro、OpenSpec、Claude Skills 的崛起——这一年的每个节点,都在重新定义"编程"这件事的边界。

展望 2026:如果你的团队还在纠结要不要用 AI,那已经晚了一步。真正的问题是:你要不要为团队建立一套 Spec / Skills 能力栈,让 AI 不只是个聊天机器人,而是一个真正能接管项目、遵守规范的虚拟团队成员?

这不是技术的选择,而是生产力革命的入场券。

1

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/14 1:28:07

Windows跨平台字体优化:让苹方字体完美呈现

Windows跨平台字体优化:让苹方字体完美呈现 【免费下载链接】PingFangSC PingFangSC字体包文件、苹果平方字体文件,包含ttf和woff2格式 项目地址: https://gitcode.com/gh_mirrors/pi/PingFangSC 还在为Windows系统无法显示苹果原生苹方字体而烦恼…

作者头像 李华
网站建设 2026/1/14 1:28:05

10分钟精通pot-desktop:跨平台翻译神器完全使用指南

10分钟精通pot-desktop:跨平台翻译神器完全使用指南 【免费下载链接】pot-desktop 🌈一个跨平台的划词翻译和OCR软件 | A cross-platform software for text translation and recognize. 项目地址: https://gitcode.com/pot-app/pot-desktop pot-…

作者头像 李华
网站建设 2026/1/16 13:13:23

热销榜单:2025年机房动力环境监控系统推荐,提升管理效率与安全性

在2025年的机房动力环境监控系统市场里,各大品牌展示了其独特的功能与优势,致力于提升机房管理的效率与安全性。这些系统普遍具备实时监测、数据分析和报警预警功能,为用户提供全方位的保障。随着技术的发展,许多品牌开始采用智能…

作者头像 李华
网站建设 2026/1/17 19:25:55

硬件在环(HIL)测试十年演进(2015–2025)

硬件在环(HIL)测试十年演进(2015–2025) 一句话总论: 2015年HIL还是“dSPACE/NI主导低实时性单ECU验证”的传统汽车电子测试工具,2025年已进化成“实时x-in-the-Loop亿级场景注入大模型故障自生成量子级容错…

作者头像 李华
网站建设 2026/1/16 10:32:59

Gyroflow视频稳定大师课:7步实现电影级防抖效果

想要让你的运动相机视频告别晃动,拥有专业级的平滑画面吗?Gyroflow这款开源神器将彻底改变你的视频制作体验!通过精准的陀螺仪数据分析,它能够实现真正的光学级稳定效果,让你的每一帧画面都充满电影感。 【免费下载链接…

作者头像 李华
网站建设 2026/1/18 21:24:03

人体姿势识别与智能搜索完整教程:用AI技术重新定义图像检索

人体姿势识别与智能搜索完整教程:用AI技术重新定义图像检索 【免费下载链接】pose-search x6ud.github.io/pose-search 项目地址: https://gitcode.com/gh_mirrors/po/pose-search 还在为找不到特定动作的图片而烦恼吗?🤔 Pose-Search…

作者头像 李华