AI 辅助开发实战：高效生成毕业设计中期检查报告的技术方案与避坑指南-育师

背景痛点：写报告写到“Ctrl C/V 手抽筋”

每年四月，实验室的打印机就开始集体冒烟——大家排队彩印中期检查报告。把师兄三年前的那份 Word 改个名字交上去？导师一眼能认出页眉的像素偏移。自己从零写？至少要凑齐以下“八股”：

课题背景与意义（200 字）
已完成工作（配图 3-5 张）
进度量化（百分比精确到小数点后一位）
存在问题与改进措施（既要深刻又不能写“时间不够用”）
参考文献（格式 GB/T 7714-2015）

手动维护的痛点集中体现在三点：

结构混乱：不同章节由不同版本 Word 拼接，标题层级全靠手感。
内容重复：背景、意义、相关工作三段往往只有主语不同。
进度失真：拍脑袋写“完成 60%”，导师追问“60% 怎么算的”时当场宕机。

于是大家把 80% 时间花在“排版+找图+凑字数”，真正反思工作的时间反而被挤占。能不能让机器做脏活累活，人类只负责思考与创新？这就是 AI 辅助开发介入的起点。

技术选型对比：模板、规则还是大模型？

先给出三条主流路线在“高校笔记本可离线运行”前提下的 5 维对比（满分 5★）：

方案	实现成本	可解释性	扩展性	离线可行	合规风险
纯模板填充	★★★★★	★★★★★	★	★★★★★	★★★★★
规则引擎	★★★	★★★★	★★★	★★★★	★★★
LLM 微调	★	★★	★★★★★	★	★

结论：

纯模板最快，但遇到“一句话总结实验结果”就抓瞎。
规则引擎（Drools、Easy Rules）能把学院量化指标硬编码，可维护性随规则膨胀而指数级下降。
LLM 微调生成最自然，可 3090 单卡跑 7B 模型对很多学生仍过重。

折中思路：
“轻量级提示工程 + 本地 4-bit 量化开源模型 + Jinja2 模板”——让 LLM 只负责生成段落级文本，结构、样式、数据仍由模板与代码掌控，解释性与扩展性兼得，还能 100% 离线。

核心实现：一条 80 行 Python 流水线

1. 系统架构

┌------------┐ JSON ┌-----------┐ Markdown ┌----------┐ │ 数据源(Git)│----------->│ 预处理脚本 │------------->│Jinja2模板│ └------------┘ └-----------┘ └----------┘ ▲ │ │ 填充/渲染 │ └------------------┼---------------------------┘ ▼ ┌---------------┐ │ LLM 润色器 │<--- prompt.txt └---------------┘ ▼ ┌---------------┐ │ PDF 生成器 │ └---------------┘

2. 依赖最小化

Python ≥ 3.9
Jinja2 ≥ 3.1
transformers ≥ 4.35 + optimum + auto-gptq（用于 4-bit 量化）
pandoc + xelatex（一键 PDF）

全部可用pip安装，离线包可提前pip download -d pkgs。

3. 关键代码片段

以下代码遵循 Clean Code 原则：单一职责、显式优于隐式、函数长度 < 40 行。

# midterm_builder.py from pathlib import Path import json, datetime, subprocess from jinja2 import Environment, FileSystemLoader, select_autoescape from transformers import AutoTokenizer, AutoModelForCausalLM import torch MODEL_ID = "Qwen/Qwen-7B-Chat-Int4" # 4-bit 量化，6G 显存可跑 TEMPLATE_DIR = Path("templates") DATA_JSON = Path("data.json") OUTPUT_MD = Path("build/report.md") OUTPUT_PDF = Path("build/report.pdf") device = "cuda" if torch.cuda.is_available() else "cpu" tokenizer = AutoTokenizer.from_pretrained(MODEL_ID, trust_remote_code=True) model = AutoModelForCausalLM.from_pretrained( MODEL_ID, device_map="auto", trust_remote_code=True ) def load_data(path: Path) -> dict: """读取 JSON 并做最小校验""" with path.open(encoding="utf-8") as f: data = json.load(f) assert "progress_pct" in data, "缺少进度字段" assert 0 <= data["progress_pct"] <= 100, "进度百分比越界" return data def render_template(data: dict) -> str: """Jinja2 渲染，生成 Markdown 初稿""" env = Environment( loader=FileSystemLoader(TEMPLATE_DIR), autoescape=select_autoescape(["md"]), ) tpl = env.get_template("report.md.j2") return tpl.render(**data, date=datetime.date.today()) def llm_polish(section: str, prompt_path: Path) -> str: """调用本地 LLM 对单段文本润色，返回 Markdown""" prompt_template = prompt_path.read_text(encoding="utf-8") prompt = prompt_template.format(section=section) inputs = tokenizer(prompt, return_tensors="pt").to(device) with torch.no_grad(): out = model.generate( **inputs, max_new_tokens=512, temperature=0.7, do_sample=True, top_p=0.95, repetition_penalty=1.1, ) polished = tokenizer.decode(out[0], skip_special_tokens=True) # 只取生成部分，防止 prompt 被重复输出 return polished.split("###输出:")[-1].strip() def build(): data = load_data(DATA_JSON) draft = render_template(data) # 按二级标题分段润色 parts = [] for chunk in draft.split("\n## "): header, body = chunk.split("\n", 1) polished = llm_polish(body, Path("prompt_polish.txt")) parts.append(f"## {header}\n{polished}") final_md = "\n".join(parts) OUTPUT_MD.parent.mkdir(exist_ok=True) OUTPUT_MD.write_text(final_md, encoding="utf-8") # Markdown -> PDF subprocess.run([ "pandoc", OUTPUT_MD, "-o", OUTPUT_PDF, "--pdf-engine=xelatex", "-V", "CJKmainfont=SimSun" ], check=True) if __name__ == "__main__": build()

4. 提示词设计（prompt_polish.txt）

你是一名严谨的工程硕士导师助理。请对下列技术段落进行语言润色，要求： 1. 保持原意不变，不添加新数据； 2. 使用学术书面语，避免口语； 3. 每句尽量不超过 25 字； 4. 输出 Markdown 格式，不要添加标题。 ###输入: {section} ###输出:

该提示词短小却满足“幂等性”——多次运行不会引入额外 hallucination。

5. 模板片段（templates/report.md.j2）

# 毕业设计中期检查报告 **学生**：{{ name }} **学号**：{{ id }} **日期**：{{ date }} ## 课题背景与意义 {{ background }} ## 已完成工作 {% for item in finished %} - {{ item.title }}：{{ item.desc }} {% endfor %} ## 进度量化 整体进度：{{ progress_pct }}% ## 存在问题与改进措施 {{ problems }} ## 参考文献 {% for ref in references %} [{{ ref.id }}] {{ ref.text }} {% endfor %}

通过 JSON 与模板解耦，学院格式一旦变动，只需改模板不动代码。

性能与安全：让笔记本也能“冷静”运行

冷启动延迟：4-bit 量化后模型首次加载约 18s，后续每段润色 3-5s。可把model做成单例常驻进程，通过 FastAPI 提供/polish接口，避免重复加载。
显存占用：Qwen-7B-Int4 峰值 6.1 GB，GTX 3060 12G 足够；CPU 推理需 8G 内存，但生成 500 字要 40s，体验差。
提示词幂等性：固定temperature=0.7并加repetition_penalty，经 50 次蒙特卡洛测试，输出编辑距离 < 3%，满足论文严谨要求。
敏感信息过滤：在load_data()中增加正则，把手机号、邮箱、内部项目代号替换为占位符；同时关闭trust_remote_code=False会报错，因此需自行审计模型源码。
随机种子：对外服务时固定torch.manual_seed(42)，保证同输入同输出，方便 diff 审核。

避坑指南：从“导师红叉”到“一键过审”

过度生成：LLM 会把“基于 Python 的 Web 框架”扩写成“基于跨平台高级编程语言 Python 的面向万维网的信息系统快速开发框架”，字数爆炸。解决：在提示词加“每句不超过 25 字”硬限制。
图表缺失：AI 目前无法帮你把实验结果自动画图。解决：在data.json约定figures字段，仅保存路径列表；模板里用![]({{ fig.path }})显式引用，确保图片随 repo 统一版本管理。
学校格式变动：去年要求“章节 1.5 倍行距”，今年变“固定 20 磅”。解决：把版式参数写进meta.yaml，模板只负责内容；换版时改meta即可。
参考文献对不上：AI 润色可能把“[3]”改成“[8]”。解决：关闭 LLM 对参考文献段落的润色，交由模板静态渲染。
量化模型输出乱码：中文指令跟随弱。解决：优先选 ChatGLM3-6B-Int4 或 Qwen-7B-Chat，两者在 C-Eval 中文榜单领先；若用 Llama 系列需加中文词表再训练。

交付前请逐条打钩的 Checklist：