news 2026/2/7 0:49:04

【AndrejKarpathy】2025年AI大模型深度复盘:年度最深刻的行业分析!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【AndrejKarpathy】2025年AI大模型深度复盘:年度最深刻的行业分析!

AndrejKarpathy前几天发了一篇2025年LLM年度回顾。他是OpenAI联合创始人、前特斯拉AI总监,也是全球最有影响力的AI研究者之一。这篇文章里有6个观点,每一个都理解得非常深刻。强烈推荐大家看看。

第一: 训练方法彻底变了

2025年之前,训练一个好用的大模型基本是三步走。预训练、监督微调、人类反馈强化学习。这个配方从 2020年用到现在,稳定了5年。

2025年多了关键的第四步: RLVR。全称是Reinforcementfrom VerifiableLearningRewards,翻译过来就是可验证奖励的强化学习。

什么意思?简单说,就是让模型在有标准答案的环境里反复练习。比如数学题,答案对就是对错就是错,不需要人来打分。代码也一样,能跑通就是能跑通。

这和之前的训练有什么本质区别?以前的监督微调和人类反馈,本质上是照葫芦画瓢,人给什么样本,模型学什么样本。但RLVR不一样,它让模型自己摸索出解题策略。就像学游泳,之前是看教学视频模仿动作,现在是直接扔水里,只要你能游到对岸,怎么划水我不管。

结果呢?模型自己悟出了看起来像推理的东西它学会了把大问题拆成小步骤,学会了走错路时回头重来。这些策略如果靠人类标注示范,根本标不出来,因为人自己也说不清正确的思考过程长什么样。

这个变化带来一个连锁反应,算力的分配方式变了。以前大部分算力砸在预训练阶段,现在越来越多算力用于RL阶段。模型的参数规模没怎么涨,但推理能力飙升。

OpenAl的o1是这条路的起点,o3 是真正让人感觉到不一样的拐点。

还有个新玩法,推理时也能花更多算力。让模型想久一点,生成更长的推理链条,效果就更好。这相当于多了一个调节能力的旋钮。

第二: 我们终于搞懂了 AI 是什么形状的

聪明Karpathy 用了一个很妙的比喻,我们不是在养动物,而是在召唤幽灵。

人类的智能是进化出来的,优化目标是在从林里让部落活下去。大模型的智能是训练出来的,优化目标是模仿人类文本、在数学题里拿分、在评测榜单上刷分。优化目标完全不同,出来的东西当然也完全不同。

所以 AI的智能是参差不齐的,英文叫jaggedintelligence。它可以在某些领域表现得像全知全能的学者,同时在另一些领域犯小学生都不会犯的错。上一秒帮你推导复杂公式,下一秒被一个简单的越狱提示骗走你的数据。

为什么会这样?因为哪个领域有可验证的奖励模型在那个领域就会长出尖刺。数学有标准答案代码能跑测试,所以这些领域进步飞快。但常识社交、创意这些领域,什么是对很难定义,模型就没法高效学习。

这也让Karpathy 对基准测试失去了信任。道理很简单,测试题本身就是可验证环境,模型完全可以针对测试环境做优化。刷榜变成了一门艺术。

所有基准都刷满了,但离真正的通用智能还差得远,这是完全可能发生的事。

第三: LLM 应用层浮出水面

今年火得一塌糊涂。但 Karpathy 认为Cursor它最大的意义不是产品本身,而是证明了LLM应用这个新物种的存在。

大家开始讨论X领域的Cursor,这说明一种新的软件范式成立了。

这类应用做什么?第一,做上下文工程,把相关信息整理好,喂给模型。第二,编排多个模型调用,后台可能串了一堆 API 调用,平衡效果和成本。第三,提供专业场景的界面,让人类能在关键节点介入。第四,给用户一个自主程度滑杆你可以让它多干点,也可以让它少干点。

有个问题被讨论了一整年,这个应用层有多厚?

模型厂商会不会把所有应用都吃掉?

Karpathy的判断是,模型厂商培养的是有通用能力的大学毕业生,但LLM应用负责把这些毕业生组织起来、培训上岗,变成能在具体行业干活的专业团队。数据、传感器、执行器、反馈循环,这些都是应用层的活。

第四: AI 搬进了你的电脑

Claude Code 是今年最让Karpathy 印象深刻的产品之一。它展示了 AI 智能体应该长什么样,能调用工具、能做推理、能循环执行、能解决复杂问题。

但更关键的是,它跑在你的电脑上。用你的环境你的数据、你的上下文。

Karpathy认为OpenAI 在这里判断失误了。他们把Codex和智能体的重心放在云端容器里从 ChatGPT 去调度。这像是在瞄准AGI 终局,但我们还没到那一步。

现实是,AI的能力还是参差不齐的,还需要人类在旁边看着、配合着干活。把智能体放在本地和开发者并肩工作,才是当下更合理的选择。

Claude Code 用一个极简的命令行界面做到了这一点。AI不再只是你访问的一个网站,而是住在你电脑里的一个小精灵。这是一种全新的人机交互范式。

第五: Vibe Coding 起飞了

2025 年,AI 的能力跨过了一个门槛。你可以纯用英语描述需求,让它帮你写程序,完全不用管代码长什么样。

Karpathy 随手发了条推特,给这种编程方式起了个名字叫 vibe coding,结果这个词火遍全网。

这意味着什么?编程不再是专业程序员的专利,普通人也能做。这和过去所有技术的扩散模式都不一样。以前新技术总是先被大公司、政府、专业人士掌握,然后才慢慢下沉。但大模型反过来普通人从中受益的比例远超专业人士。

不只是让不会编程的人能编程。对会编程的人来说,很多以前不值得写的小程序现在都值得写了。

Karpathy 自己就用 vibe coding 做了一堆项目。用Rust 写了个定制的分词器、做了好几个工具类 App、甚至写了一次性的程序只为找一个 bug。

代码突然变得廉价、即用即弃、像草稿纸一样随便写。这会彻底改变软件的形态和程序员的工作内容。

第六: 大模型的图形界面时代要来了

Google的Gemini Nano Banana 是今年最被低估的产品之一。它能根据对话内容实时生成图片: 信息图、动画,把回复画出来而不是写出来。

Karpathy把这件事放到更大的历史脉络里看大模型是下一个重大计算范式,就像70年代、80年代的计算机一样。所以我们会看到类似的演进路径。

现在和大模型聊天,有点像80年代在终端敲命令。文字是机器喜欢的格式,但不是人喜欢的格式。人其实不爱读文字,读文字又慢又累。人喜欢看图、看视频、看空间布局。这就是传统计算机为什么要发明图形界面。

大模型也需要自己的GUI。它应该用我们喜欢的方式跟我们说话,图片、幻灯片、白板、动画、小应用。现在的Emoji和Markdown 只是初级形态,帮文字化个妆。

真正的 LLM GUI 会是什么样?Nano Banana 是一个早期暗示。最有意思的是,这不只是图像生成的事。它需要把文本生成、图像生成、世界知识全部绞在一起,在模型权重里融为一体。

Karpathy 的总结是这样的。2025 年的大模型比他预期的聪明,也比他预期的蠢。两者同时成立。

但有一点很确定,即使以现在的能力,我们连10%的潜力都没挖掘出来。还有太多想法可以试整个领域感觉是敞开的。他相信进步会继续飞速推进,同时也相信还有大量的工作要做。两件事并不矛盾。

2026年,系好安全带继续加速吧。

​最后

我在一线科技企业深耕十二载,见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事,早已在效率与薪资上形成代际优势,我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。

我整理出这套 AI 大模型突围资料包:

  • ✅AI大模型学习路线图
  • ✅Agent行业报告
  • ✅100集大模型视频教程
  • ✅大模型书籍PDF
  • ✅DeepSeek教程
  • ✅AI产品经理入门资料

完整的大模型学习和面试资料已经上传带到CSDN的官方了,有需要的朋友可以扫描下方二维码免费领取【保证100%免费】👇👇
​​

为什么说现在普通人就业/升职加薪的首选是AI大模型?

人工智能技术的爆发式增长,正以不可逆转之势重塑就业市场版图。从DeepSeek等国产大模型引发的科技圈热议,到全国两会关于AI产业发展的政策聚焦,再到招聘会上排起的长队,AI的热度已从技术领域渗透到就业市场的每一个角落。


智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200%,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。

AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。

​​

资料包有什么?

①从入门到精通的全套视频教程⑤⑥

包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(还有视频解说)

全过程AI大模型学习路线

③学习电子书籍和技术文档

市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤ 这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理,鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位,在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利,同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

所有的视频教程由智泊AI老师录制,且资料与智泊AI共享,相互补充。这份学习大礼包应该算是现在最全面的大模型学习资料了。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。


智泊AI始终秉持着“让每个人平等享受到优质教育资源”的育人理念‌,通过动态追踪大模型开发、数据标注伦理等前沿技术趋势‌,构建起"前沿课程+智能实训+精准就业"的高效培养体系。

课堂上不光教理论,还带着学员做了十多个真实项目。学员要亲自上手搞数据清洗、模型调优这些硬核操作,把课本知识变成真本事‌!

​​​​

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!

应届毕业生‌:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。

零基础转型‌:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界‌。

业务赋能 ‌突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型‌。

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓**

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/5 23:05:06

基于SpringBoot的中山社区医疗综合服务平台

系统简介 传统信息的管理大部分依赖于管理人员的手工登记与管理,然而,随着近些年信息技术的迅猛发展,让许多比较老套的信息管理模式进行了更新迭代,居民信息因为其管理内容繁杂,管理数量繁多导致手工进行处理不能满足广…

作者头像 李华
网站建设 2026/2/5 7:54:28

GESP认证C++编程真题解析 | P10112 [GESP202312 八级] 奖品分配

​欢迎大家订阅我的专栏:算法题解:C与Python实现! 本专栏旨在帮助大家从基础到进阶 ,逐步提升编程能力,助力信息学竞赛备战! 专栏特色 1.经典算法练习:根据信息学竞赛大纲,精心挑选…

作者头像 李华
网站建设 2026/2/5 19:27:19

【翻译】【SOMEIP-SD】Page79 - Page84

文章目录5.1.4.5 SOME/IP-SD 机制和错误处理5.1.4.6 错误处理5.1.4.5 SOME/IP-SD 机制和错误处理 本节介绍SOME/IP-SD的机制设计原因和错误处理 Soft State Protocol:SOME/IP-SD被设计软件状态协议,因此设计了TTL机制。软件状态需要按时刷新以保持其有效…

作者头像 李华
网站建设 2026/2/6 7:22:39

Open-AutoGLM 2.0究竟强在哪:3大技术突破彻底改写AI推理规则

第一章:Open-AutoGLM 2.0原理Open-AutoGLM 2.0 是新一代开源自动语言生成模型框架,专注于提升多轮对话理解与任务自动化执行能力。其核心架构融合了语义解析、意图识别与动态上下文记忆机制,支持在复杂业务场景中实现精准指令转化与自主决策。…

作者头像 李华
网站建设 2026/2/6 23:12:23

抖音火开源我的进化之路网页文字游戏源码带搭建教程

开源我的进化之路网页文字游戏源码带搭建教程,游戏名字我的进化之路在线战斗,回合制,从五大种族中选择你的种族,并随机获得一个角色,踏上进化之路! 网页H5在线小游戏,快速搭建、易上手&#xf…

作者头像 李华