Clawdbot保姆级教学：Qwen3-32B代理网关的自定义Hook开发与事件监听-育师

Clawdbot保姆级教学：Qwen3-32B代理网关的自定义Hook开发与事件监听

1. 为什么需要自定义Hook与事件监听

Clawdbot 不只是一个聊天界面，它本质上是一个可编程的 AI 代理运行时环境。当你把 Qwen3-32B 这样的大模型接入后，真正决定业务价值的，不是“能不能对话”，而是“在什么时机、以什么方式、对哪些关键环节做干预”。

比如：

用户刚输入一句模糊需求时，你想自动补全上下文再转发给模型；
模型返回结果前，你想过滤掉敏感词或插入品牌话术；
对话流中检测到用户表达不满，立刻触发客服转接逻辑；
每次推理完成后，把 prompt、response、耗时、token 数自动写入自己的数据库。

这些都不是默认功能，但通过 Clawdbot 提供的 Hook 机制，你不需要改源码、不依赖重启服务，就能在请求生命周期的关键节点插入自己的逻辑——就像给网关装上可插拔的“神经末梢”。

这正是本教程要带你亲手完成的事：从零写出第一个可用的 Hook，监听 Qwen3-32B 的完整调用链，并实现一个真实可用的响应增强功能。

2. 环境准备与基础验证

2.1 确认 Clawdbot 已正确启动并连通 Qwen3-32B

在开始编码前，请确保你已成功运行 Clawdbot 并能调用本地qwen3:32b模型。

执行以下命令启动网关：

clawdbot onboard

启动后，访问带 token 的控制台地址（注意替换为你实际的域名）：

https://gpu-pod6978c4fda2b3b8688426bd76-18789.web.gpu.csdn.net/?token=csdn

验证成功标志：进入控制台后，在「Models」页面能看到qwen3:32b显示为Online，且状态灯为绿色。

如果你看到模型显示Offline或报错Connection refused，请检查：

Ollama 是否正在运行：ollama list应显示qwen3:32b；
Clawdbot 配置中baseUrl是否指向http://127.0.0.1:11434/v1（不是localhost，某些容器网络下localhost不可达）；
防火墙或 SELinux 是否拦截了 11434 端口。

2.2 理解 Clawdbot 的 Hook 执行时机

Clawdbot 的 Hook 不是“中间件”，而是一组明确命名的生命周期钩子函数，按请求流向顺序执行。针对 OpenAI 兼容 API（如 Ollama），最关键的四个 Hook 是：

Hook 名称	触发时机	典型用途
`beforeRequest`	请求发往模型前	修改 prompt、注入系统指令、添加上下文、日志记录
`afterResponse`	模型返回原始 response 后	解析 JSON、提取结构化字段、打标、缓存预处理
`beforeSend`	响应返回给前端前	添加水印、替换敏感词、插入免责声明、格式美化
`onError`	请求失败时	错误降级、重试策略、告警通知

注意：所有 Hook 函数都必须是同步函数，不能使用async/await；如需异步操作（如调用外部 API），请用child_process.execSync或fs.writeFileSync等同步方式，避免阻塞主线程。

3. 第一个自定义 Hook：为 Qwen3-32B 响应自动添加来源标识

3.1 创建 Hook 文件

Clawdbot 的 Hook 存放在项目根目录下的hooks/文件夹中。请按以下路径创建文件：

hooks/ └── add-source-tag.js

内容如下（逐行解释见注释）：

// hooks/add-source-tag.js /** * 在每次 Qwen3-32B 返回的 response 中，自动在末尾添加一行标识 * 格式：【由 Qwen3-32B 生成｜2025-04-05 14:22:31】 */ module.exports = { // 仅对 qwen3:32b 模型生效，避免影响其他模型 modelFilter: ['qwen3:32b'], // 在响应返回给前端前执行 beforeSend: (ctx) => { // ctx.response 是完整的 OpenAI-style 响应对象 const { choices } = ctx.response; if (!choices || choices.length === 0) return; // 只处理 text completion 类型（非 streaming） if (ctx.request.stream !== false) return; const now = new Date().toLocaleString('zh-CN', { year: 'numeric', month: '2-digit', day: '2-digit', hour: '2-digit', minute: '2-digit', second: '2-digit', hour12: false }); const tag = `\n【由 Qwen3-32B 生成｜${now}】`; // 遍历每个 choice，修改 message.content choices.forEach(choice => { if (choice.message && choice.message.content) { choice.message.content += tag; } }); } };

3.2 启用 Hook 并测试效果

保存文件后，无需重启 Clawdbot —— 它会自动热加载hooks/下的 JS 文件；
打开控制台 → 「Chat」页面，选择模型为Local Qwen3 32B；
输入任意问题，例如：“今天北京天气怎么样？”；
查看返回结果末尾，应出现类似：

……（模型正常回答） 【由 Qwen3-32B 生成｜2025-04-05 14:22:31】

成功！你已完成了第一个可运行的 Hook。

小技巧：如果没看到效果，打开浏览器开发者工具 → Console 标签页，查看是否有Hook error报错；也可在 Hook 函数开头加console.log('add-source-tag triggered')辅助调试。

4. 进阶实践：构建带上下文感知的 beforeRequest Hook

4.1 场景需求：自动补全用户提问中的模糊指代

用户常会说：“它支持多语言吗？”、“这个功能怎么收费？”，但未说明“它”或“这个”具体指什么。我们希望在请求发给 Qwen3-32B 前，自动将最近一次系统回复中的产品名称注入 prompt。

假设上一轮对话是：

用户：你们的 AI 网关叫什么？
系统：Clawdbot 是一个统一的 AI 代理网关与管理平台。

那么当用户接着问：“它支持多语言吗？”，我们想让 Hook 自动改写为：

“Clawdbot 支持多语言吗？”

4.2 实现代码：利用 ctx.session 持久化上下文

新建文件hooks/enhance-pronouns.js：

// hooks/enhance-pronouns.js /** * 自动识别并补全用户提问中的代词（它/这个/那个/他们） * 依赖：上一轮系统回复中包含明确名词（如 Clawdbot、Qwen3-32B） */ const PRONOUNS = ['它', '这个', '那个', '它们', '这些', '那些', '他', '她', '他们', '她们']; module.exports = { modelFilter: ['qwen3:32b'], beforeRequest: (ctx) => { const { messages } = ctx.request; if (!messages || messages.length < 2) return; // 获取最后一条用户消息（即当前提问） const lastUserMsg = messages[messages.length - 1]; if (!lastUserMsg || lastUserMsg.role !== 'user' || !lastUserMsg.content) return; // 获取倒数第二条消息（应为上一轮系统回复） const prevSystemMsg = messages[messages.length - 2]; if (!prevSystemMsg || prevSystemMsg.role !== 'assistant' || !prevSystemMsg.content) return; const userContent = lastUserMsg.content.trim(); const systemContent = prevSystemMsg.content.trim(); // 检查用户提问是否含代词且无明确主语 if (!PRONOUNS.some(p => userContent.includes(p))) return; if (/^[A-Za-z\u4e00-\u9fa5]+/.test(userContent)) return; // 开头已是名词，跳过 // 从系统回复中提取最可能的主语（取前15字内首个中文名词或英文单词） let subject = ''; const chineseNounMatch = systemContent.match(/[\u4e00-\u9fa5]{2,8}/); const englishWordMatch = systemContent.match(/[A-Za-z]{3,12}/); if (chineseNounMatch) { subject = chineseNounMatch[0]; } else if (englishWordMatch) { subject = englishWordMatch[0]; } if (subject) { // 替换代词为具体名词（简单版：只替换第一个出现的） const enhanced = userContent.replace(PRONOUNS[0], subject); lastUserMsg.content = enhanced; // 记录日志便于追踪 console.log(`[Hook] Pronoun enhanced: "${userContent}" → "${enhanced}"`); } } };

4.3 测试流程

在 Chat 页面连续发送两条消息：
- 第一条（用户）：你们的 AI 网关叫什么？
- 第二条（系统）：Clawdbot 是一个统一的 AI 代理网关与管理平台。
紧接着发送第三条（用户）：它支持多语言吗？

打开浏览器 Console，应看到日志：

[Hook] Pronoun enhanced: "它支持多语言吗？" → "Clawdbot支持多语言吗？"

查看 Qwen3-32B 实际收到的 prompt（可在控制台「Debug」面板开启「Show raw request」），确认 content 已被改写。

你已实现一个具备上下文理解能力的前置 Hook —— 这正是真实业务中提升对话连贯性的关键一环。

5. 事件监听实战：捕获并持久化每次推理元数据

5.1 为什么需要监听事件而非仅用 Hook？

Hook 是同步、短生命周期的；而事件（Event）是异步、可跨模块广播的。当你需要：

将日志写入远程数据库（如 PostgreSQL）；
触发 Slack / 钉钉告警；
启动后台任务（如异步摘要、向量入库）；
与外部监控系统（Prometheus）集成；

这时，事件监听（Event Listener）比 Hook 更合适。

Clawdbot 内置了标准事件总线，支持以下核心事件：

事件名	触发条件	payload 示例字段
`request.start`	请求开始处理	`model`,`promptTokens`,`userId`
`request.success`	请求成功返回	`responseTokens`,`latencyMs`,`finishReason`
`request.error`	请求失败	`errorType`,`errorMessage`,`statusCode`

5.2 编写事件监听器：将每次成功请求写入本地 JSON 日志

创建文件events/log-to-file.js：

// events/log-to-file.js const fs = require('fs'); const path = require('path'); // 日志文件路径（相对 clawdbot 根目录） const LOG_FILE = path.join(__dirname, '../logs', 'qwen3_requests.jsonl'); // 确保 logs 目录存在 if (!fs.existsSync(path.dirname(LOG_FILE))) { fs.mkdirSync(path.dirname(LOG_FILE), { recursive: true }); } module.exports = { // 监听所有模型的成功请求，但后续可加 filter events: ['request.success'], handler: (event) => { // 只记录 qwen3:32b 的请求 if (event.model !== 'qwen3:32b') return; // 构建日志行：JSON Lines 格式，每行一个 JSON 对象 const logEntry = { timestamp: new Date().toISOString(), model: event.model, promptTokens: event.promptTokens, responseTokens: event.responseTokens, latencyMs: event.latencyMs, finishReason: event.finishReason, // 截取 prompt 前 100 字用于快速检索（避免日志过大） promptPreview: event.prompt?.substring(0, 100) + (event.prompt?.length > 100 ? '...' : ''), // 保留完整 response 长度，但不存全文 responseLength: event.response?.length || 0 }; try { fs.appendFileSync(LOG_FILE, JSON.stringify(logEntry) + '\n'); } catch (err) { console.error('[Event Log] Failed to write:', err.message); } } };

5.3 启用事件监听器

Clawdbot 要求事件监听器放在events/目录下，且文件名需以.js结尾。保存后，它会自动注册。

验证方式：

发送一次 Qwen3-32B 请求；
检查logs/qwen3_requests.jsonl文件是否生成；

使用命令行查看最新几条：

tail -n 3 logs/qwen3_requests.jsonl | jq '.'

你将看到类似输出：

{ "timestamp": "2025-04-05T06:22:31.452Z", "model": "qwen3:32b", "promptTokens": 42, "responseTokens": 187, "latencyMs": 2341, "finishReason": "stop", "promptPreview": "Clawdbot 支持多语言吗？", "responseLength": 328 }

日志已就绪，你可以用任何 ELK、Grafana 或自研 BI 工具对接此 JSONL 文件。