news 2026/2/7 7:10:01

终极指南!私有AI知识库搭建(DeepSeek+Ollama+MaxKB),看这篇彻底告别付费API!

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
终极指南!私有AI知识库搭建(DeepSeek+Ollama+MaxKB),看这篇彻底告别付费API!

近日,由国家高新区人工智能产业协同创新网络、中央广播电视总台《赢在AI+》节目组、清华大学可持续社会价值研究院、中国人民大学交叉科学研究院、赛迪研究院人工智能研究中心、中关村发展集团等联合主办的2025人工智能+大会在北京中关村国际创新中心&中关村国家自主创新示范区会议中心举行。

图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长、清华大学人工智能学院院长姚期智发表演讲。

姚期智演讲的核心观点有:

1.AI未来核心发展方向是达成具备类人认知推理能力的AGI,其在科学、战略、经济层面意义重大。

2.中国近5年在大模型、具身智能领域进步迅猛,已跻身国际第一方阵甚至领先,另外两大方向也有发展。

3.具身智能需硬件身体与“小脑”“大脑”结合,能完成灵巧任务,可弥补传统机器人不足,替代部分人类不愿做的工作。

4.科学智能将颠覆科研方式,未来科学家需与AI协同,AI还能助力量子计算机研发,尤其在量子纠错上成效显著。

5.谷歌借助AI神经网络实现量子比特纠错,为大规模量子计算机发展奠定基础,中国相关团队具备竞争力。

6.AI存在算法不鲁棒、冲击社会伦理、导致失业及失控等风险,需重视安全性与治理问题。

7.应对AI风险需研发安全对齐算法,借助多学科理论构建可证明安全的AI系统,同时建立国际治理共识。

8.中美欧科学家已发起定期对话,推动AI治理的国际合作与交流。

9.大模型革新各行业,中长期AI将向AGI迈进,赋能科学且需保障安全可靠,发展前景广阔。

10.中国不缺AI应用人才与场景,关键是培养尖端创新人才,助力AI持续突破。

以下是姚期智演讲正文:

非常高兴有机会能够和大家在这儿见面。

我今天想和大家谈谈人工智能的未来发展。无论怎么样看,人工智能未来发展最重要的下一步就是怎么样能够达到大家都满意的AGI,就是通用人工智能。AGI的定义,它能够让机器具有认知推理、复杂场景种种的相似人的能力。如今的人工智能既能够实现部分功能,离AGI的理想还有一些距离。

因为AGI一旦完成了以后,它的效用非常强大,所以它不但是科学上,而且是战略上、经济上,各国经济的科技高地。

未来我们走向通用人工智能,到底会在哪几个方向发展呢?当然会有很多不同的可能性,将来会陆续涌现。但是从现在看来,下面四个方面是不可避免的。中国非常可喜的就是在过去5年里面,在“十四五”规划里面做出了非常令人惊讶,而且钦佩的工作。特别是大模型技术演化方面,还有具身智能,就是智能机器人方面,在过去5年,中国基本上从一个和国际上有相当距离的程度,到达了能够在第一方阵,甚至领先的地步。另外两项,中国也有不少的发展。

大模型的演进不多讲了,基本上智能越高,可以做的事儿越大。关于人工智能大模型怎么样做得更好,甚至有一些不同的方式来做,这都是一个非常重要的方向。因为今天讲AI+,所以不谈大模型演化部分了。

第一,关于具身智能,顾名思义,它需要有一个硬件的身体,需要有一个小脑,像人一样,能够让它的行动更加稳定、更加敏捷,同时还需要进一步有一个大脑,能够有各种认知,各种决策,各种计划的能力。

人工智能机器人,一方面是科学研究的高地,原因就是我们怎么样从大语言模型变成具有物理知识,能够了解世界的智能,这在科学上非常重要;另一方面在经济上、产业上非常重要,因为它基本上能够补足以前机器人产业比较呆板的不足,使得机器人加上小脑、大脑,基本上就有这个可能性,能够替人取代很多我们不想做的工作。

国内和世界的机器人的成就,大家耳熟能详,今天王兴兴王总等下也会和大家谈,我现在跟大家谈一下,大学里面对于具身智能也做得非常出色。今天清华大学有两个教授设立了展示厅。

这是星动纪元,这是用强化学习做的,跳得非常高,达到世界纪录,它能够使用大模型做各种灵巧的事情,像这种都是不太容易的,每秒4米,是相当厉害了。

第二,关于科学智能,在科学上,AI+顾名思义就是AI能够赋能各种行业,特别令人惊奇的,它不仅能够赋能普通的产业,甚至在人类觉得最高智能的领域,就是科学研究,现在AI也能够使得科学里面每个领域在以后的5年、10年会对科学研究者做科学的方式起翻天覆地的变化,基本上我们过去这几十年,做科学的方法在5年、10年以后会很不一样。以前我们具有的一些科学家的特性,适合做科学家的,将来5年、10年以后不见得一定就能够成为最好的科学家。将来任何一个科学家的工作都必须是科学家加上大模型之类的人工智能。这两个人怎么样能够最好地配合,这个团队才是将来最有竞争力的单位。

举例,这里面有很多的进步。AI能够赋能另外一个战略高地、战略方向就是做量子计算机,AI有这个能力,甚至能够帮助量子物理学家构造下一个真正的量子计算机。量子是相当深奥的科学,它最重要的观念就是有一个量子比特,它的量子比特和普通经典的0和1不一样,有更大的自由度。量子比特做计算的基本单位,有一个很大的缺点,就是很容易受到环境的干扰。一旦受到环境的干扰,它的值就和你想要的不一样了。怎么样能够纠错,这个事情一直困扰着物理学家。甚至早年物理学家觉得量子计算机原则上不能做,因为纠错是物理上不能解决的问题。1996年有一个计算机科学家发现如果我们能够把最基本的纠错做好,就可以在一个有规模、大的量子计算机上就可以继续稳定,怎么样在一个最简单的解码上能够做好。量子纠错一直是做量子计算机的人的心病,如果这个做不好,做了很多的量子比特也没有用。

怎么样纠错的事情,在经典的计算机里面也是一个重要的问题,Fonomen(音)想到了一个简单的方法做纠错。比如说一个0,如果用100个0表示,即使中间有一两个比特发生变化,整体上还可以知道它是一个0,因为98个都是0。但是在量子上,这个事情就很困难。

差不多一年以前,谷歌发表了一篇文章,里面做好了量子芯片。这个芯片有105个量子比特,但是它长处不是有105个量子比特,有很多人也会做,主要就是利用了这100个比特,它能够做一个量子比特的纠错。它能够使得一个量子比特在原则上让它无限期的生存,能够保持它本来的状态,无限期的延长,这个事情最重要的是能够低于一个1%,就是小于了刚才提到最重要的条件。这就让量子计算机的群体非常高兴,觉得有非常大的鼓舞。

这是一个重大的成就,它实现了大规模量子计算机的可能性。它和人工智能有什么关系呢?主要就是量子纠错用人工智能来达到的。它的核心技术就是用一个AlphaQubit的手段,它是为量子纠错而设计的解码器。这个解码器是一个神经网络,它采集了很多用量子模拟得到的样本,用机器学习的方法训练出来,所以这个重要的方向将来在各种方面提升,在比特准确率和速度方面也有大幅提升,中国也有几个团队在这方面非常有竞争性。

第三,关于人工智能的安全性,我们有一个这么有能力的科学手段,它也产生了一定的危险性。所以怎么样治理它也是大家很关心的方向。

AI的风险有哪些?一是因为AI算法有它天生的性质,就是不鲁棒,不确定,不可解释,不善于抵抗恶意。在AI的应用上也会产生一些对于社会运行的冲击,它可能冲击社会价值或者伦理,比如说隐私保护,同时即使我们把它用到好的方面,它能够替代很多人的工作,它也带来了可能大量失业的问题。现在我们已经看到,在亚马逊、谷歌,在微软,这些做AI特别好的公司里面有很多解雇的浪潮。

二是生存性的风险,它和以前盒子的科技、生物科技都有一点不一样的地方。因为盒子科技、生物科技最危险就是有恐怖分子运用它做一些不好的事情。但是AI的风险除了刚刚所提到的这些非常大的风险以外,还有一个风险就是AI非常像人,我们和AI的关系可能会升级到AI失去控制,违背了人类想让它做的事情。我们要把这个事情做好,就产生了一个新的交叉领域,特别是关于失控的处理方面,牵涉到AI、密码学、博弈学和各种科学。研发AI算法的确定,鲁棒性、可解释性和社会价值对齐,我们要做这些对齐的算法。尤其是对于生存性风险,我们应该最有效彻底解决问题的方法就是怎么研发出可以证明安全的AI系统。

借助密码学、博弈学等理论,同时在科学发展的基础上,要能够取得设置AI治理的协议,在区域和全球减少风险,需要建立国际共识。现在这方面中国做得不错,比如说中美欧科学家发起了定期对话,这个对话有Bengio、Russell、张亚勤和我们,第一次是在2023年在英国,第二次在北京,第三次在威尼斯,差不多每半年开展一次。今年7月的时候在上海举行了这个大会。

总结,多年的科技进步与积累,让人工智能发展得到新动力,大模型的出现带来了人工智能的新潮流,有无限发展机会。近期AI大模型正在革新各个行业,中长期要走向AGI,赋能科学,同时能够建设安全可靠的,它的前景辽阔,影响深远,我们必须不断地创新突破,中国不缺应用人才和场景,最重要的是多培养尖端创新人才。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/5 17:34:11

KAT-V1-40B:重新定义大模型推理效率的AutoThink技术革命

KAT-V1-40B:重新定义大模型推理效率的AutoThink技术革命 【免费下载链接】KAT-V1-40B 项目地址: https://ai.gitcode.com/hf_mirrors/Kwaipilot/KAT-V1-40B 在当今AI技术快速发展的浪潮中,快手开源的KAT-V1-40B大模型以其创新的AutoThink双模式推…

作者头像 李华
网站建设 2026/2/6 7:57:06

计算机毕业设计springboot灾区物资管理系统 基于SpringBoot的灾后救援物资调配平台 SpringBoot驱动的应急物资供应链管理系统

计算机毕业设计springboot灾区物资管理系统sm768kx9 (配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。当自然灾害突袭,道路中断、通讯失联、物资短缺,每一秒…

作者头像 李华
网站建设 2026/2/6 8:43:53

关于人工智能和就业的一线希望

最新的就业数据描绘了劳动力市场的严峻图景,人工智能对其造成了明显的破坏。继今年早些时候对应届毕业生失业的警告之后,最新报告表明人工智能的影响正在影响更广泛的工人群体。十月裁员超过15万人,是二十多年来最严重的十月,其中…

作者头像 李华
网站建设 2026/2/6 7:47:48

揭秘智能Agent在Docker中的编排难题:5大核心策略助你提升系统弹性

第一章:揭秘智能Agent在Docker编排中的核心挑战在现代云原生架构中,智能Agent被广泛用于自动化管理Docker容器的生命周期与服务编排。然而,其在复杂动态环境下的稳定性、可观测性与协同能力面临严峻挑战。动态服务发现的不确定性 当多个智能A…

作者头像 李华