Clawdbot整合Qwen3:32B实操手册：代理直连配置、Web网关调试与日志排查-育师

Clawdbot整合Qwen3:32B实操手册：代理直连配置、Web网关调试与日志排查

1. 为什么需要这套组合方案

你是不是也遇到过这样的情况：想用大模型做内部智能对话，但发现直接调用公网API响应慢、不稳定，还担心数据出域？或者部署了本地大模型，却卡在怎么让前端Chat界面和后端模型真正“说上话”这一步？

Clawdbot + Qwen3:32B 这套组合，就是为解决这类实际问题而生的。它不依赖云服务，所有推理都在你自己的服务器上完成；它不走公网中转，通过代理直连方式把Web前端请求精准路由到本地大模型；它也不黑盒运行，每一步都有可查的日志、可调的网关、可验证的链路。

这不是一个“装完就完”的玩具方案，而是一套能真正在企业内网或开发环境中跑起来、调得动、查得清的落地实践。接下来，我会带你从零开始，把代理怎么配、网关怎么调、日志怎么看，全部拆开讲清楚——不讲虚的，只讲你打开终端就能敲的命令、改就能生效的配置、看就能懂的输出。

2. 环境准备与基础服务启动

2.1 确认前置依赖已就位

在动手前，请先确认你的服务器上已安装并运行以下三项基础服务：

Ollama（v0.4.0+）：负责加载和运行 Qwen3:32B 模型
Clawdbot（v1.8.2+）：轻量级Bot框架，提供HTTP接口和Web UI
Nginx 或 Caddy（任选其一）：作为反向代理，处理端口转发与路径路由

你可以用下面这条命令快速检查 Ollama 是否正常工作：

ollama list

如果看到类似qwen3:32b的模型名，并且状态为loaded，说明模型已就绪。如果没有，执行：

ollama pull qwen3:32b

注意：Qwen3:32B 是一个对显存要求较高的模型，建议至少配备 24GB 显存的 GPU（如 RTX 4090 / A10）。若显存不足，可考虑使用--num-gpu 1参数限制显存占用，或启用--load-in-4bit量化加载。

2.2 启动 Qwen3:32B 模型服务

Ollama 默认以http://localhost:11434提供 API。我们不需要改端口，但要确保它监听的是0.0.0.0而非仅127.0.0.1，否则外部服务无法访问。

编辑 Ollama 配置（Linux/macOS 路径通常为~/.ollama/config.json），添加或修改如下字段：

{ "host": "0.0.0.0:11434" }

然后重启 Ollama：

systemctl --user restart ollama # 或者直接 kill 后重起 pkill ollama && ollama serve &

验证是否生效：

curl -s http://localhost:11434/api/tags | jq '.models[] | select(.name == "qwen3:32b")'

只要返回模型信息，就说明服务已对外可访问。

2.3 启动 Clawdbot 并确认 Web 界面可用

Clawdbot 默认监听http://localhost:8080。启动时需指定后端模型地址，命令如下：

clawdbot \ --model-url http://localhost:11434/api/chat \ --model-name qwen3:32b \ --port 8080

稍等几秒，打开浏览器访问http://your-server-ip:8080，你应该能看到一个简洁的聊天界面——这就是你后续所有调试工作的操作入口。

小提示：如果你看到空白页或报错Failed to fetch，大概率是浏览器同源策略拦截了跨域请求。别急，这正是我们要用代理解决的问题，下一节就来打通它。

3. 代理直连配置：绕过跨域，实现前后端无缝通信

3.1 为什么必须用代理？直连为什么不行？

Clawdbot 前端页面运行在浏览器里，而浏览器出于安全限制，不允许 JavaScript 直接向http://localhost:11434发起请求（即使两者在同一台机器上），除非目标服务明确允许跨域（CORS）。而 Ollama 默认不开启 CORS 头，这是它的设计选择，也是我们采用代理的根本原因。

代理的作用，就是让浏览器以为它一直在跟同一个域名（比如http://chat.your-company.com）打交道，而背后由 Nginx 把/api/chat这类请求悄悄转发给 Ollama，完全避开跨域检查。

3.2 Nginx 代理配置详解（推荐方案）

创建/etc/nginx/conf.d/clawdbot.conf，内容如下：

upstream ollama_backend { server 127.0.0.1:11434; } server { listen 80; server_name chat.your-company.com; # 替换为你自己的域名或IP location / { proxy_pass http://127.0.0.1:8080; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; } location /api/chat { proxy_pass http://ollama_backend; proxy_set_header Host $host; proxy_set_header X-Real-IP $remote_addr; proxy_set_header X-Forwarded-For $proxy_add_x_forwarded_for; proxy_set_header X-Forwarded-Proto $scheme; proxy_set_header Content-Type "application/json"; # 关键：透传原始请求体，避免 Ollama 解析失败 proxy_http_version 1.1; proxy_set_header Upgrade $http_upgrade; proxy_set_header Connection "upgrade"; } }

保存后测试配置并重载：

nginx -t && systemctl reload nginx

现在，你只需访问http://chat.your-company.com（或直接用服务器 IP），就能在浏览器里和 Qwen3:32B 正常对话了——所有请求都经由 Nginx 统一调度，前端无感知，后端无跨域。

验证成功标志：打开浏览器开发者工具 → Network 标签页 → 发送一条消息 → 查看api/chat请求的 Status 应为200 OK，Response 中应有"model":"qwen3:32b"和完整回复内容。

3.3 替代方案：Caddy（更轻量，适合开发环境）

如果你不想折腾 Nginx，Caddy 是个极简替代。新建Caddyfile：

:80 reverse_proxy /api/chat localhost:11434 reverse_proxy localhost:8080

然后执行：

caddy run

Caddy 会自动处理 HTTPS、压缩、缓存等，开发阶段非常省心。

4. Web网关调试：8080 → 18789 端口转发实战

4.1 网关作用再澄清：不是多此一举，而是分层解耦

文档中提到“内部代理将 8080 端口转发到 18789 网关”，这里容易误解为又加了一层转发。实际上，这个 18789 端口是 Clawdbot 内置的管理网关，专门用于：

接收来自代理（Nginx/Caddy）的标准化请求
做统一鉴权、限流、日志打标
将清洗后的请求再发给 Ollama
收集模型调用耗时、token 使用量等运营指标

它不是必须暴露给前端的，而是 Clawdbot 自身的“中枢神经”。8080 是面向用户的 Web 服务端口，18789 是面向内部组件的控制端口。

4.2 如何确认网关已激活并监听？

Clawdbot 启动时默认不开启管理网关。你需要显式启用它：

clawdbot \ --model-url http://localhost:11434/api/chat \ --model-name qwen3:32b \ --port 8080 \ --admin-port 18789 \ --admin-password "your-secure-pass"

启动后，执行：

ss -tuln | grep ':18789'

若看到LISTEN状态，说明网关已就绪。

4.3 用 curl 直接调用网关，跳过前端验证链路

这是最高效的调试方式。构造一个标准请求，模拟前端发送的消息：

curl -X POST http://localhost:18789/v1/chat/completions \ -H "Content-Type: application/json" \ -H "Authorization: Bearer your-secure-pass" \ -d '{ "model": "qwen3:32b", "messages": [{"role": "user", "content": "你好，请用一句话介绍你自己"}], "stream": false }'

成功响应应包含"choices":[{...}]和完整的回复文本。如果返回401 Unauthorized，说明密码错误；如果返回502 Bad Gateway，说明网关没连上 Ollama；如果卡住无响应，大概率是 Ollama 模型加载未完成或显存不足。

这个命令是你排查“前端能进、发不出消息”问题的第一把钥匙。

5. 日志排查三板斧：从现象定位根因

5.1 第一板斧：看 Clawdbot 主日志（定位请求是否抵达）

Clawdbot 默认将日志输出到终端。若后台运行，可通过 journalctl 查看：

journalctl -u clawdbot -f --since "2 minutes ago"

重点关注三类行：

Received request for /api/chat→ 表示 Nginx 已成功把请求转给 Clawdbot
Forwarding to model backend→ 表示 Clawdbot 已准备调用 Ollama
Model response received或Model call failed→ 明确告诉你模型侧是否成功

如果只看到第一行，后面两行缺失，说明问题出在 Clawdbot 到 Ollama 这一段。

5.2 第二板斧：看 Ollama 日志（确认模型是否真在干活）

Ollama 日志默认不输出到系统日志，需手动查看：

journalctl --user-unit ollama -f --since "2 minutes ago"

典型健康日志：

time=2026-01-28T10:25:35+08:00 level=info msg="chat request" model=qwen3:32b duration=2.345s tokens=128

如果看到CUDA out of memory或context length exceeded，说明显存或上下文长度超限，需调整--num-gpu或--num_ctx参数。

5.3 第三板斧：看 Nginx 访问与错误日志（确认网络链路是否通畅）

Nginx 错误日志是排查代理问题的黄金线索：

tail -f /var/log/nginx/error.log

常见报错及含义：

connect() failed (111: Connection refused)→ Ollama 服务没起来，或端口不对
upstream timed out (110: Connection timed out)→ Ollama 响应太慢（模型加载中/显存不足）
client intended to send too large body→ 前端发的消息过长，需在 Nginx 配置中加client_max_body_size 10M;

配合访问日志（/var/log/nginx/access.log），你能清晰还原每一次请求的完整路径、耗时、状态码。

6. 常见问题速查表与修复建议

现象	可能原因	快速验证命令	修复建议
前端页面空白，Network 显示`net::ERR_CONNECTION_REFUSED`	Nginx 未运行或监听端口错误	`systemctl is-active nginx`	`systemctl start nginx`，检查`listen`配置
能打开页面，但发送消息后无响应，Network 中`api/chat`显示`pending`	Ollama 未加载模型或显存不足	`ollama ps`，`nvidia-smi`	`ollama run qwen3:32b`预热，或加`--num-gpu 1`
发送消息后返回`502 Bad Gateway`	Nginx 无法连接 Ollama 后端	`curl -v http://localhost:11434/api/tags`	检查 Ollama`host`配置是否为`0.0.0.0`
返回`400 Bad Request`，提示`invalid character`	前端发送的 JSON 格式错误	查看 Network → Payload	更新 Clawdbot 到 v1.8.3+，已修复部分 JSON 兼容问题
日志中频繁出现`rate limited`	网关启用了限流但未配置白名单	`curl http://localhost:18789/v1/health`	在启动参数中加`--rate-limit 0`临时关闭