可能是最简单的本地化 DeepSeek+个人知识库实现方案-育师

“本地化大模型+知识库”介绍

其实是一套本地化的 RAG 的方案，整体技术架构如下图所示：

[图片来源见文末]图中重要的三个组件：

1-LLM我们使用 Ollama 下载到本地；

2-文本切片及Embedding后放入向量数据库的过程与组件，使用 AnythingLLM 来提供；

3-Embedding 模型可以使用 AnythingLLM 自带的，也可以使用本地部署的。

使用 Ollama 下载 LLM

在 Ollama 的官网（https://ollama.com）下载并安装 Ollama 。

安装后，根据你本地硬件的配置，选择合适的模型下载。

对于 DeepSeek-R1 模型，可以参考下图中对显存的需求，选择不同模型。我选择的是一个7B 的模型。

选择好模型后，复制这里的命令行，粘贴至终端。Ollama 开始下载：

为提高后续的检索精度，我使用 Ollama 又下载了一个 Embedding 模型，Bge-m3。

AnythingLLM 自带了一个嵌入模型，所以这里你也可以不下载，用这个自带的嵌入模型。

到这里，我们使用 Ollama 成功下载了需要的两个模型：

安装并配置 AnythingLLM

从 AnythingLLM 的官网（https://anythingllm.com/）下载适合你系统的 AnythingLLM：

安装过程比较缓慢，耐心等待即可。

安装后进入欢迎界面，点击“开始”按钮：

之后的配置可以先不管，一直向右滑动：

进入到工作区界面，点击配置按钮：

Step1：LLM 配置

找到 “LLM 首选项”，选择LLM 提供商为 Ollama，会自动找到我们已经拉取的DeepSeek-R1: 7B模型：

配置后之后点“ Save Change ”。

向量数据库选择默认的即可。

Step2： Embedding 配置

嵌入引擎提供商选择 Ollama，配置 Embedding 模型为 bge-m3。

如果你没有拉取 bge-m3，保持默认的AnythingLLM Embedder就可以。

Step3：工作区配置

回到工作区界面，新建一个工作区，然后点击上传按钮：

点击这里，选择你需要放到知识库的本地文档。

之后，选中知识库中的文档，点击“ Move to Workspace”，将文档移入工作区：

工作区这时已经看得到放进去的文档了。保存并进行 Embed：

这个过程中，看得到 GPU 已经开始疯狂工作了

嵌入完成后，回到工作区，就可以针对我们的文档进行提问与分析了。

测试，及使用云端模型

根据我们的文档提问。推理速度很快，但结果并不太好：

因为我们本地算力有限，模型太小，性能上差很多。

使用云端模型试试。

回到设置，我们配置 LLM 首选项为 DeepSeek，填入一个可用的 API，选择推理模型：

同样的问题再测试一下，结果（仅截取部分）要比我们的本地模型好得多，而且初步来看，答案相关性和上下文相关性都更高：

总结

以上就是使用 Ollama + Anything 构建本地化大模型+知识库的极简方案，希望能帮到大家。

需要注意的是，并非所有的业务场景都需要完全本地化部署。

在本地没有足够算力，又需要文档不出域的情况下，只要保证文档存储和检索过程在本地，即使大模型在云端，也可通过技术手段（如仅向云端发送查询向量或脱敏后的文本）实现合规；这也是一种很常见的技术方案。

读者福利：如果大家对大模型感兴趣，这套大模型学习资料一定对你有用

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。
一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

作为一名老互联网人，看着AI越来越火，也总想为大家做点啥。干脆把我这几年整理的AI大模型干货全拿出来了。
包括入门指南、学习路径图、精选书籍、视频课，还有我录的一些实战讲解。全部免费，不搞虚的。
学习从来都是自己的事，我能做的就是帮你把路铺平一点。资料都放在下面了，有需要的直接拿，能用到多少就看你自己了。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以点击文章最下方的VX名片免费领取【保真100%】

SCI论文查AI率，可以用免费系统查吗？

先说结论：SCI论文查AI率真的不建议用免费系统查，主要从以下几点考虑： 1，SCI论文比较重要，免费系统有被泄露风险。免费系统之所以免费，检测免费了，总要从其他地方赚钱，不然开发免费…

李华

收藏！程序员从零转行大模型：4大核心难点+实操路径全解析

随着大模型技术的爆发式发展，“All in AI”成为行业热词，不少传统程序员纷纷将转型大模型视为职业新方向。毕竟相较于传统开发岗位，大模型相关岗位不仅薪资水涨船高，更有着广阔的发展前景。但理想很丰满，现实很骨感&a…

李华

STM32HAL库中断教程以及分装中断工具函数（附下载地址）

文章内容使用HAL库实现引脚外部中断封装中断工具函数快速入门访问git仓库: Guardian-Elf/Guardian-Elf-Embedded找到并下载中断工具文件（2个文件：Interrupt.h/.c）由于我的项目中使用了串口来调试中断函数，所以如果报错就把无关…

李华

PaperXie文献综述智能生成：3步把“文献堆砌”变“学术脉络”，导师直呼“这才是综述”！

paperxie-免费查重复率aigc检测/开题报告/毕业论文/智能排版/文献综述/aippt https://www.paperxie.cn/ai/journalsReviewedhttps://www.paperxie.cn/ai/journalsReviewed 你是不是也经历过这样的“文献综述困境”？ 打开知网、万方、Web of Science，关…

李华

基于STM32的水质PH值电导率TDS超声波水位液位检测系统设计

一、设计背景与核心需求在水资源监测、水产养殖、污水处理等场景中，水质PH值、电导率、TDS（总溶解固体）与水位液位是评估水质状态与水体安全的关键参数。传统检测方式需多设备分别测量，存在操作繁琐、数据不同步的问题。基于STM3…

李华

基于STM32的智能家居控制系统设计与应用

一、系统设计背景与核心目标在物联网技术普及的当下，传统家居控制多依赖单一设备手动操作，存在功能割裂、能源浪费、便捷性不足等问题，难以满足用户对“全屋智能联动”的需求。STM32单片机凭借Cortex-M系列内核的高性能运算能力、丰富的外设…

李华