Git Commit提交规范太复杂？让本地大模型自动帮你生成Commit信息-育师

Git Commit提交规范太复杂？让本地大模型自动帮你生成Commit信息

在每天的开发流程中，你是否也曾面对git commit时卡壳——明明改了几百行代码，却不知道该怎么写一条既准确又合规的提交信息？“feat”还是“fix”？要不要加 scope？描述是该简洁还是详细？这些问题看似微小，实则日积月累，成了团队协作中的隐性成本。

更麻烦的是，很多公司推行 Conventional Commits 或 Angular 提交规范，初衷是为了自动化生成 changelog、支持语义化版本控制，但落地时往往变成“形式主义”，开发者要么随意应付，要么干脆复制粘贴。结果就是：提交历史看起来整齐，实际内容却模糊不清。

而与此同时，大语言模型已经能读懂代码、解释逻辑、甚至写出单元测试。那为什么不能让它来帮我们写 commit message？

答案是可以，而且完全可以在本地运行，不上传任何代码到云端。借助像ms-swift这样的开源框架，我们不仅能一键部署一个懂代码的大模型，还能把它无缝集成进 Git 工作流，实现“敲完代码 →git add .→git commit→ 自动生成标准提交信息”的全自动体验。

从“人工总结”到“AI概括”：一次小小的提交，背后是工程效率的跃迁

设想这样一个场景：

你刚刚完成了一个用户登录模块的重构，修改了三个文件：
-auth.service.ts：重写了 token 刷新逻辑；
-login.component.html：调整了错误提示样式；
-api-client.interceptor.ts：新增了 401 状态码的统一处理。

如果让你手动写 commit，可能会是这样：

update login and token refresh

或者稍微认真一点：

refactor(auth): improve token handling and error UI

但有没有可能更精准？比如明确指出“移除了过时的 refreshTimer”，“增加了拦截器自动登出”？这些细节很容易被忽略，但在几个月后的代码审查或故障排查中，恰恰是最关键的信息。

而一个训练有素的代码理解模型，看到 diff 后可以输出：

refactor(auth): replace manual token refresh timer with interceptor-based auto-logout on 401

这不只是格式上的提升，更是信息密度和可追溯性的飞跃。

为什么选择本地部署？隐私、延迟与可控性缺一不可

当然，你可以直接用 Copilot 或调用 OpenAI API 来生成 commit 信息。但这意味着你的代码变更要发往第三方服务器——对于涉及业务逻辑、内部接口结构的内容来说，风险显然过高。

更重要的是，理想中的 commit 生成应该是“零感知”的：你按下回车执行git commit，2 秒内就完成提交，不需要等待网络响应，也不需要跳出编辑器去确认内容。

这就引出了我们的核心技术栈：ms-swift—— 魔搭社区推出的面向大模型的一站式本地化推理与部署框架。

它不是一个简单的模型加载工具，而是一整套覆盖“下载 → 微调 → 推理加速 → API 封装”的完整链路系统。最吸引人的一点是：它支持超过 600 个主流大模型（包括 Qwen、LLaMA、ChatGLM 等），并且内置了对vLLM、LmDeploy、SGLang等高性能推理引擎的支持，使得在一台配备消费级 GPU 的开发机上也能跑得动 7B 级别的模型。

更重要的是，它提供了类 OpenAI 的 RESTful 接口，这意味着我们可以用最轻量的方式将其接入现有脚本，无需关心底层是 PyTorch 还是 DeepSpeed。

如何实现？四步构建你的“AI 提交助手”

整个系统的运作并不复杂，核心流程如下：

捕获暂存区的代码差异（git diff --cached）；
构造一段结构化 prompt，引导模型按规范输出；
调用本地运行的 LLM 服务获取自然语言描述；
自动执行git commit -m "..."完成提交。

下面是一个完整的 Python 实现示例：

import subprocess import requests import json def get_git_diff(): result = subprocess.run( ['git', 'diff', '--cached'], stdout=subprocess.PIPE, text=True ) return result.stdout.strip() def generate_commit_message(diff_content): if not diff_content: return "" prompt = f""" 你是一名资深前端工程师，请根据以下代码变更生成一条符合 Conventional Commits 规范的提交信息。 要求： 1. 使用中文简要说明变更目的； 2. 类型必须为 feat|fix|docs|style|refactor|perf|test|build|ci|chore 之一； 3. 格式严格遵循 type(scope): description； 4. 描述部分不超过 50 个汉字。 代码变更如下： {diff_content} """.strip() headers = {"Content-Type": "application/json"} data = { "model": "qwen-coder-7b", "prompt": prompt, "max_tokens": 100, "temperature": 0.3, "top_p": 0.9 } try: response = requests.post( "http://localhost:8080/v1/completions", headers=headers, json=data, timeout=10 ) if response.status_code == 200: msg = response.json()["choices"][0]["text"].strip() # 简单校验格式 if any(msg.startswith(t + ":") for t in ["feat", "fix", "refactor"]): return msg else: # 若不符合，返回 fallback return "chore(commit): auto-generated by local LLM" else: print(f"LLM request failed: {response.text}") return "chore(commit): generation failed, please input manually" except Exception as e: print(f"Request error: {e}") return "chore(commit): connection error" def auto_commit(): diff = get_git_diff() if not diff: print("❌ No staged changes found.") return print("🔍 Analyzing changes...") commit_msg = generate_commit_message(diff) print(f"📝 Generated commit message:\n {commit_msg}") # 执行提交 result = subprocess.run( ['git', 'commit', '-m', commit_msg], input=commit_msg, text=True, capture_output=True ) if result.returncode == 0: print("✅ Commit successful!") else: print("⚠️ Commit failed:", result.stderr) if __name__ == "__main__": auto_commit()

这个脚本可以保存为auto-commit.py，并通过 Git hook 或别名命令触发。

方式一：作为 Git alias 使用

在.gitconfig中添加：

[alias] ac = "!python3 /path/to/auto-commit.py"

然后只需执行：

git add . git ac

即可完成智能提交。

方式二：通过 pre-commit hook 自动拦截

创建.git/hooks/prepare-commit-msg文件：

#!/bin/sh # 如果是空提交，则跳过 if [ -z "$(git diff --cached --exit-code)" ]; then exit 0 fi # 调用 AI 生成并写入 COMMIT_EDITMSG python3 /path/to/auto-commit.py > "$1"

记得给脚本加上可执行权限：

chmod +x .git/hooks/prepare-commit-msg

这样每次运行git commit，都会先由 AI 生成默认提交信息，你仍可在编辑器中修改后再确认提交，兼顾自动化与灵活性。

怎么启动本地模型？ms-swift 让一切变得简单

前面提到的http://localhost:8080/v1/completions接口，正是由 ms-swift 启动的本地推理服务提供。它的部署过程非常直观：

# 克隆项目 git clone https://github.com/modelscope/ms-swift.git cd ms-swift # 启动一键脚本（会引导选择模型） ./yichuidingyin.sh

脚本会交互式地让你选择：
- 模型类型（推荐Qwen-Coder-7B或CodeLlama-7b-Instruct）；
- 是否启用量化（如 AWQ/GPTQ，适合显存小于 16GB 的设备）；
- 推理后端（建议选 vLLM，支持连续批处理，响应更快）；
- 是否开启 OpenAI 兼容接口。

完成后，模型将以 REST API 形式运行在本地端口，等待请求。

你甚至可以通过 Web UI 直接测试效果：

# 启动图形界面 swift web-ui

进入http://localhost:7860即可进行交互式调试，验证 prompt 效果。

模型怎么选？不是越大越好，关键是“懂代码”

虽然理论上任何通用大模型都能尝试理解代码，但真正适合这项任务的，是那些专门在代码语料上预训练过的模型。以下是几个推荐选项：

模型名称	特点	显存需求（FP16）	推荐场景
Qwen-Coder-7B	阿里通义实验室出品，强于中文注释理解和 JS/TS 生态	~14GB	国内团队首选
CodeLlama-7b-Instruct	Meta 发布，指令微调完善，英文表达清晰	~14GB	国际化项目
StarCoder2-7b	BigCode 项目成果，训练数据丰富，支持多种语言	~14GB	多语言混合项目
DeepSeek-Coder-1.3b	小尺寸高精度，适合低配机器	~4GB	边缘开发环境

如果你的显卡只有 8GB，还可以使用 QLoRA + GPTQ 量化方案加载 7B 模型，例如：

swift infer --model_type qwen_coder --quantization_bit 4 --device_map auto

虽然性能略有下降，但对于生成 commit 这类短文本任务而言，依然足够准确。

实际效果对比：AI vs 开发者

我们做了一个小实验，在一个真实的 React + Node.js 项目中随机抽取 10 次提交，分别记录原始提交信息与 AI 生成结果：

原始提交	AI 生成
`fix bug`	`fix(user-api): handle null user object in profile endpoint`
`update style`	`style(login-page): align button margin and font size to design spec`
`add feature`	`feat(notification): implement email reminder for overdue tasks`
`chore: update deps`	`build(deps): bump axios from 0.21.4 to 1.6.2 via npm audit`