用 Codex、Zotero 和 Obsidian 打造论文精读与科研知识库：从文献管理到 AI 辅助写作的完整工作流-育师

用 Codex、Zotero 和 Obsidian 打造论文精读与科研知识库：从文献管理到 AI 辅助写作的完整工作流

在科研写作中，最耗时间的往往不是“写”本身，而是文献的收集、阅读、标注、整理、复盘和调用。我们经常会遇到这样的情况：Zotero 里存了几百篇论文，PDF 里画了很多高亮；Obsidian 里写了不少笔记，但真正写论文时却找不到合适的内容；AI 工具可以帮忙总结和改写，却又容易出现引用不准确、内容脱离原文的问题。

因此，一个理想的科研工作流应该同时满足三个要求：

第一，文献来源要可靠；
第二，阅读笔记要可沉淀；
第三，AI 辅助写作要建立在自己的知识库之上，而不是让 AI 凭空生成内容。

基于这个思路，我们可以把Zotero、Obsidian 和 Codex联动起来，构建一个适合论文精读、文献综述、论文写作和长期科研积累的知识库系统。

这里的 Codex 指 OpenAI 的 Codex 编程助手，尤其是可以在本地终端运行的 Codex CLI。OpenAI 官方说明中提到，Codex CLI 可以在用户选定的本地目录中读取、修改并运行代码，这使它非常适合处理 Obsidian 这类基于本地 Markdown 文件的知识库。

一、为什么要把 Zotero、Obsidian 和 Codex 联动起来？

科研工作中，单独使用一个工具往往很难覆盖完整流程。

Zotero擅长文献管理。它可以帮助我们收集、组织、标注、引用和共享研究文献，是非常成熟的文献管理工具。但是，Zotero 更适合管理“文献对象”，并不适合长期构建概念网络、研究框架和个人知识体系。

Obsidian擅长知识管理。它适合用来做个人笔记、知识库和项目管理，并且支持在笔记之间建立链接，从而形成类似“个人维基”的知识网络。但是，Obsidian 本身并不是专业的文献管理器，如果完全依靠手动维护引用，很容易出现文献信息混乱、citekey 不一致等问题。

Codex擅长自动化整理和批量处理。它可以读取 Obsidian Vault 中的 Markdown 文件，帮助我们批量整理文献笔记、生成综述草稿、检查引用键、提取研究问题、构建对比表，甚至编写脚本完成重复性任务。Codex 还可以通过AGENTS.md读取项目级说明，从而遵守我们给知识库设定的写作和整理规则。

所以，三者的关系可以这样理解：

Zotero：负责“文献来源” Obsidian：负责“知识沉淀” Codex：负责“智能整理与辅助写作”

最重要的是：不要让 AI 直接替代文献管理工具，而是让 AI 在你已经整理好的文献知识库之上工作。

近年来，关于 AI 生成引用错误的问题已有研究关注。例如，有研究指出，即使带有搜索能力的前沿模型在生成 BibTeX 条目时仍可能出现字段错误，尤其是在较新或低引用文献中更容易出错。这也提醒我们，在科研写作中，Zotero 应该作为参考文献的“事实来源”，而 Codex 更适合做整理、归纳和写作辅助。

二、三者联动的基本架构

一个稳定的联动系统可以设计为：

Zotero ├─ 收集论文 ├─ 管理 PDF ├─ 阅读、标注、高亮 └─ 生成稳定的 citekey ↓ Obsidian ├─ 一篇文献 = 一篇 Markdown 笔记 ├─ 一个概念 = 一张知识卡片 ├─ 一个研究方向 = 一个项目文件夹 └─ 所有内容沉淀为本地知识库 ↓ Codex ├─ 读取 Obsidian Vault ├─ 批量整理文献笔记 ├─ 生成研究现状和综述草稿 ├─ 检查引用是否真实存在 └─ 辅助论文写作和知识库维护

这套系统的核心不是“工具越多越好”，而是让每个工具只做自己最擅长的事情。

Zotero 保存文献元数据和 PDF；Obsidian 保存可长期积累的阅读笔记、概念卡片和研究框架；Codex 则在这些结构化材料之上进行批量分析和写作辅助。

三、第一步：用 Zotero 管理文献和 PDF 标注

Zotero 是整个系统的文献源头。建议将所有论文、书籍、报告、网页资料都先进入 Zotero，而不是直接散落在电脑文件夹里。

在 Zotero 中，可以按照研究方向建立不同的 Collection，例如：

Zotero Library ├─ Oil Monitoring ├─ Deep Learning ├─ ... └─ Others

阅读论文时，建议在 Zotero PDF 阅读器中完成三类标注：

黄色高亮：重要结论 蓝色高亮：方法与实验 红色高亮：问题、局限与争议 文字批注：自己的理解和可用于论文的位置

这样做的好处是，文献的原始信息、PDF 文件、高亮和批注都集中在 Zotero 中。后续导入 Obsidian 时，这些内容可以成为文献笔记的基础材料。

四、第二步：用 Better BibTeX 生成稳定引用键

如果你希望 Zotero、Obsidian、LaTeX、Markdown 和论文写作系统之间保持统一引用，那么 Better BibTeX 几乎是必备插件。

Better BibTeX 是 Zotero 的扩展，主要面向使用 LaTeX、Markdown 等文本化写作工具的用户，能够更方便地管理书目信息。它还支持将文献库或文献集合自动导出，并保持更新。

推荐设置一个稳定的 citekey 格式，例如：

auth.lower + year + shorttitle

生成效果类似：

smith2023wear liu2024ferrography zhang2025microscopy

在科研写作中，citekey 非常重要。它相当于每篇文献的“身份证”。后续在 Obsidian、LaTeX 或 Markdown 论文中都可以这样引用：

已有研究表明，深度学习方法能够提升磨粒图像识别的准确率 [@liu2024ferrography]。

同时，可以将 Zotero 中的文献自动导出为一个 BibTeX 文件，放入 Obsidian Vault：

ResearchVault/ └─ references/ └─ library.bib

这样，Obsidian 和 Codex 都可以读取同一个参考文献数据库。Better BibTeX 的自动导出功能支持“Keep updated”模式，设置后可以在 Zotero 文献库变化时持续更新导出的.bib文件。

五、第三步：用 Obsidian 建立科研知识库

Obsidian 的优势在于，它不是一个封闭数据库，而是一个本地 Markdown 知识库。也就是说，你的每一篇笔记本质上都是一个.md文件，可以长期保存、迁移、版本管理，也可以被 Codex 读取和处理。

建议建立如下目录结构：

ResearchVault/ ├─ 00_Inbox/ ├─ 01_LiteratureNotes/ ├─ 02_Concepts/ ├─ 03_Projects/ ├─ 04_Manuscripts/ ├─ 05_Templates/ ├─ references/ │ └─ library.bib └─ AGENTS.md

每个文件夹的作用如下：

00_Inbox：临时想法、未整理笔记 01_LiteratureNotes：文献精读笔记 02_Concepts：概念卡片，例如“微流铁谱”“注意力机制”“超分辨率” 03_Projects：具体论文或课题章节 04_Manuscripts：论文草稿、综述草稿、投稿材料 05_Templates：文献笔记模板、概念模板、项目模板 references：BibTeX 参考文献数据库 AGENTS.md：给 Codex 的知识库规则说明

这套结构的核心思想是：

文献笔记负责“读过什么” 概念卡片负责“理解了什么” 项目文件夹负责“正在写什么” 论文草稿负责“最终输出什么”

六、第四步：用 Zotero Integration 将文献导入 Obsidian

Obsidian 与 Zotero 的联动通常依靠社区插件Zotero Integration。该插件可以从 Zotero 向 Obsidian 插入或导入引用、参考文献、笔记和 PDF 标注，并且要求配合 Better BibTeX 使用。

基本流程如下：

1. Zotero 安装 Better BibTeX 2. Obsidian 安装 Zotero Integration 3. 在 Zotero 中阅读 PDF 并做标注 4. 在 Obsidian 中调用 Zotero Integration 5. 将文献元数据、摘要、标注和批注导入为 Markdown 笔记

推荐为 Zotero Integration 设置一个文献笔记模板。模板可以放在：

05_Templates/Literature Note Template.md

模板示例：

--- title: "{{title}}" authors: "{{authors}}" year: "{{date | format('YYYY')}}" citekey: "{{citekey}}" journal: "{{publicationTitle}}" doi: "{{DOI}}" tags: - literature status: unread --- # {{title}} ## 1. 基本信息 - 作者：{{authors}} - 年份：{{date | format('YYYY')}} - 期刊/会议：{{publicationTitle}} - DOI：{{DOI}} - 引用键：[@{{citekey}}] ## 2. 研究问题 这篇文章主要解决什么问题？ ## 3. 研究方法 作者使用了什么理论、模型、实验或数据？ ## 4. 主要结论 - ## 5. 创新点 - ## 6. 局限性 - ## 7. 可用于我论文的位置 - 可用于引言： - 可用于相关工作： - 可用于方法对比： - 可用于实验讨论： - 可用于未来展望： ## 8. PDF 标注与摘录 {{notes}} ## 9. 我的思考 -

这样，每导入一篇新论文，就可以在Obsidian 中生成一篇结构化文献笔记。

一篇文献不再只是 Zotero 里的一个条目，而是变成了可以被链接、检索、重组和写作调用的知识单元。

七、第五步：用 Codex 读取和整理 Obsidian Vault

Codex 与 Obsidian 的联动不一定需要复杂插件。最简单、最稳妥的方式是：

把 Obsidian Vault 当成本地项目文件夹 让 Codex 在这个文件夹中工作

例如你的 Obsidian Vault 路径是：

E:\Obsidian\ResearchVault

可以在终端中进入该目录：

cdE:\Obsidian\ResearchVault codex

然后你就可以让 Codex 读取整个知识库，例如：

请阅读 01_Literature 文件夹中与 wear particle classification 相关的文献笔记， 按照“传统图像处理方法、机器学习方法、深度学习方法、轻量化网络方法” 四个方面生成一份中文研究现状综述。 要求： 1. 不要虚构文献； 2. 所有引用必须使用已有 citekey； 3. 输出到 03_Projects/xx论文/研究现状.md。

因为 Obsidian 笔记是 Markdown 文件，Codex 可以直接读取、分析和修改。相比让 AI 随机回答，基于 Obsidian Vault 的方式更接近“在自己的科研资料库中进行检索和写作”。

八、给 Codex 准备 AGENTS.md

为了让 Codex 更理解你的知识库结构，建议在 Obsidian Vault 根目录新建一个AGENTS.md文件。

OpenAI 官方文档说明，Codex 会在开始工作前读取AGENTS.md文件，从而获得项目相关的指令和规范。对科研知识库来说，这个文件非常关键，因为它可以告诉 Codex：哪些文件可以修改，哪些文件不能修改，写作时如何引用，遇到信息不足时如何处理。

示例：

# AGENTS.md ## 项目说明 这是我的 Obsidian 科研知识库，主要用于论文精读、文献综述、论文写作和科研项目管理。 ## 文件夹说明 - `01_LiteratureNotes/`：单篇文献笔记，每篇文献一个 Markdown 文件。 - `02_Concepts/`：概念卡片，用于沉淀研究主题、方法和术语。 - `03_Projects/`：具体论文或课题章节。 - `04_Manuscripts/`：论文草稿、综述草稿和投稿材料。 - `references/library.bib`：由 Zotero + Better BibTeX 导出的参考文献数据库。 ## 写作规则 1. 不要虚构参考文献。 2. 所有引用必须使用已有 citekey，格式为 `[@citekey]`。 3. 生成综述时，优先读取 `01_LiteratureNotes/` 中的文献笔记。 4. 不要直接修改 `references/library.bib`，除非我明确要求。 5. 不要删除原始笔记，只能新增、整理或重构。 6. 中文学术写作应保持严谨、连贯、自然，适合学位论文或期刊论文。 7. 输出研究现状时，按照“研究背景—主要方法—代表性工作—不足—发展趋势”的逻辑组织。 8. 如果某篇文献笔记信息不足，应标注“信息不足”，不要自行补全不存在的细节。 ## 常用任务 - 根据文献笔记生成研究现状。 - 整理某一主题下的文献对比表。 - 检查 Markdown 文件中的 citekey 是否存在于 `references/library.bib`。 - 将零散笔记改写为论文段落。 - 为某个研究方向生成概念图、论文框架或技术路线。

这个文件相当于给 Codex 的“科研助理工作手册”。

没有AGENTS.md时，Codex 只知道这是一个文件夹；有了AGENTS.md后，Codex 就知道这是一个学术知识库，并且会按照你设定的规则处理文件。

九、论文精读的推荐流程

真正高效的论文精读，不是读完一篇论文后随手写几句感想，而是把每篇论文转化为可复用的知识模块。

推荐流程如下：

1. Zotero 收集论文 2. Zotero 阅读 PDF，完成高亮和批注 3. Zotero Integration 导入到 Obsidian 4. 在 Obsidian 中补充结构化精读笔记 5. 将重要概念拆成独立知识卡片 6. 用双链连接文献、概念和项目 7. 用 Codex 批量整理文献和生成综述 8. 人工校对并回到原文核查 9. 将成熟内容迁移到论文草稿

例如，读一篇关于磨粒图像分类的论文后，可以在 Obsidian 中形成三类笔记：

01_LiteratureNotes/liu2024-wear-particle-classification.md 02_Concepts/磨粒分类.md 03_Projects/xx论文/相关工作.md

三者之间可以互相链接：

这篇论文主要讨论了 [[磨粒分类]] 中的深度学习方法， 可用于 [[xx论文]] 的相关工作部分。

这样，随着阅读量增加，你的知识库不再是一堆孤立笔记，而是逐渐形成一个围绕研究方向展开的知识网络。

十、Codex 可以做什么？

1. 自动生成文献综述初稿

你可以让 Codex 读取某一主题下的文献笔记：

请读取 01_LiteratureNotes 中与 ferrography、wear debris、oil monitoring 相关的文献笔记， 生成一段中文研究现状，要求适合博士论文“研究背景与意义”部分。

Codex 的输出不应该直接作为最终论文，而应该作为“可编辑初稿”。你需要检查逻辑、补充原文细节，并核对引用。

2. 生成文献对比表

请根据 01_LiteratureNotes 中关于 wear particle classification 的文献笔记， 生成一个 Markdown 表格，字段包括： 年份、作者、研究对象、方法、数据集、优点、局限性、citekey。

这种表格非常适合写综述、开题报告和论文 Introduction。

3. 检查引用是否存在

请检查 04_Manuscripts/introduction.md 中所有 [@xxx] 引用， 确认它们是否都存在于 references/library.bib。 如果不存在，请列出缺失 citekey，不要自动替换。

这一步可以减少论文写作后期常见的引用错误。

4. 把零散笔记改写为论文语言

请根据 03_Projects/xx论文/notes.md 中的要点， 改写为博士论文风格的“国内外研究现状”段落， 要求逻辑严谨、语言自然，并保留已有 citekey。

5. 批量整理新导入的文献笔记

请整理 01_LiteratureNotes 中最近导入但 status 为 unread 的文献笔记， 按照“研究问题、方法、实验、结论、局限性、可用于我论文的位置”重新归类。

这类任务特别适合 Codex，因为它可以批量处理多个 Markdown 文件，减少重复劳动。

十一、一个完整的科研写作案例

假设你正在写一篇关于“基于深度学习的磨粒图像识别”的论文，可以这样使用三者联动。

首先，在 Zotero 中建立一个文献集合：

Wear Particle Classification

然后，将相关论文全部加入该集合，并在 Zotero 中完成 PDF 阅读和高亮。

接着，通过 Zotero Integration 将这些论文导入 Obsidian：

01_LiteratureNotes/ ├─ liu2022-wear-debris-classification.md ├─ zhang2023-ferrography-image-analysis.md ├─ wang2024-lightweight-cnn.md └─ chen2025-attention-mechanism.md

然后，在 Obsidian 中建立项目文件夹：

03_Projects/xx论文/ ├─ 研究背景.md ├─ 国内外研究现状.md ├─ 方法对比.md ├─ 实验设计.md └─ 投稿修改意见.md

最后，让 Codex 辅助生成综述框架：

请基于 01_LiteratureNotes 中与 wear particle classification 相关的文献笔记， 为 03_Projects/xx论文/国内外研究现状.md 生成一个综述框架。 要求按照以下逻辑组织： 1. 油液监测与磨粒分析的研究意义； 2. 传统图像处理和机器学习方法； 3. 深度学习在磨粒识别中的应用； 4. 轻量化网络和注意力机制的发展； 5. 当前研究不足； 6. 本文工作的切入点。

这个过程的价值在于：Codex 并不是从零开始“编”综述，而是在你的文献笔记和 Zotero 引用体系之上进行整理。

这也是 AI 参与科研写作时最安全、最高效的方式。

十二、使用这套工作流时需要注意什么？

1. Zotero 是文献事实来源

不要让 Codex 随便生成参考文献。所有正式引用都应该来自 Zotero 和library.bib。

2. Obsidian 是知识库，不是垃圾箱

不要把所有 PDF 标注不加整理地导入 Obsidian。导入只是第一步，真正有价值的是后续的重组、概括和链接。

3. Codex 是助理，不是作者

Codex 可以帮你整理、归纳、改写和检查，但最终判断仍然要由研究者完成。尤其是论文中的关键结论、数据、实验结果和引用，必须回到原文核查。

4. 文献笔记模板要统一

如果每篇文献笔记结构不同，Codex 后续处理就会变得困难。统一模板是后续自动化的基础。

5. citekey 要保持稳定

不要频繁修改 citekey。否则 Obsidian 笔记、LaTeX 文档和 BibTeX 文件之间可能出现引用断裂。

十三、推荐的最小可行配置

如果你刚开始搭建，不必一步到位。建议先完成以下五件事：

1. Zotero 安装 Better BibTeX 2. Obsidian 安装 Zotero Integration 3. Zotero 自动导出 library.bib 到 Obsidian 的 references 文件夹 4. Obsidian 建立 01_LiteratureNotes、02_Concepts、03_Projects 三个核心文件夹 5. 在 Vault 根目录建立 AGENTS.md

完成这五步后，你就已经拥有了一个基本可用的科研知识库系统。

十四、总结：让 AI 站在你的知识库之上

Codex、Zotero 和 Obsidian 的联动，本质上不是简单地把几个工具装在一起，而是重新设计科研知识的流动方式。

过去的文献阅读流程往往是：

下载论文 → 阅读 PDF → 做一些高亮 → 过几天忘记 → 写论文时重新找

而新的流程应该是：

收集文献 → 精读标注 → 结构化笔记 → 概念链接 → 项目沉淀 → AI 辅助整理 → 人工校对写作

这套系统真正解决的问题，不只是“如何管理文献”，而是“如何让读过的论文持续为未来的研究服务”。

Zotero 负责保证文献可靠，Obsidian 负责沉淀知识结构，Codex 负责提升整理和写作效率。三者结合之后，科研知识不再散落在 PDF、文件夹和临时笔记中，而是逐渐变成一个可以检索、复用、扩展和写作调用的个人科研知识库。

对于正在写论文、做博士研究、准备文献综述或长期积累研究方向的人来说，这套工作流值得尽早建立。因为真正高质量的科研写作，并不是临近投稿时才开始拼凑材料，而是在每一次精读、每一条批注、每一张概念卡片中慢慢积累出来的。

用 Codex、Zotero 和 Obsidian 打造论文精读与科研知识库：从文献管理到 AI 辅助写作的完整工作流