小白也能懂！用Qwen3-1.7B快速实现AI角色扮演实战-育师

小白也能懂！用Qwen3-1.7B快速实现AI角色扮演实战

你有没有想过，让一个AI变成你理想中的角色？比如温柔可爱的猫娘、冷酷帅气的侦探，甚至是你最喜欢的动漫人物？听起来很复杂？其实现在借助大模型和简单工具，普通人也能轻松做到。

本文将带你从零开始，使用Qwen3-1.7B这个轻量级但强大的语言模型，快速搭建一个属于你的AI角色扮演应用。不需要深厚的编程基础，也不需要昂贵的显卡，只要跟着步骤走，几分钟内就能看到效果！

1. 认识我们的主角：Qwen3-1.7B

1.1 Qwen3 系列简介

Qwen3（千问3）是阿里巴巴推出的新一代开源大语言模型系列，发布于2025年4月。它覆盖了从0.6B 到 235B多种参数规模的模型，满足不同场景需求。其中：

密集模型：适合对推理速度要求高、资源有限的设备
MoE（混合专家）架构模型：在保持高效的同时提升性能

我们今天要用的是Qwen3-1.7B—— 参数量为17亿的轻量级模型。别看它小，经过优化后，在角色扮演、对话理解等任务上表现非常出色，而且能在普通笔记本电脑上流畅运行。

1.2 为什么选它做角色扮演？

特性	说明
体积小	模型仅需约2.5GB显存（4-bit量化），低配GPU或云Jupyter环境即可运行
响应快	推理延迟低，适合实时对话交互
支持思维链	可开启“思考模式”，让回答更自然有逻辑
易部署	提供标准API接口，LangChain等框架无缝集成

对于想快速验证想法、做原型开发的小白用户来说，Qwen3-1.7B 是绝佳选择。

2. 快速启动：三步调用Qwen3-1.7B

2.1 启动镜像并打开Jupyter

首先，在支持该模型的平台（如CSDN星图镜像广场）中找到Qwen3-1.7B 镜像，一键启动服务。成功后会自动进入 Jupyter Notebook 环境。

注意：确保访问地址包含正确的端口号（通常是8000），例如：
https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net

2.2 使用 LangChain 调用模型

LangChain 是目前最流行的AI应用开发框架之一，能极大简化大模型调用流程。下面这段代码就是连接 Qwen3-1.7B 的核心方法：

from langchain_openai import ChatOpenAI import os chat_model = ChatOpenAI( model="Qwen3-1.7B", temperature=0.5, # 控制输出随机性，数值越大越“有创意” base_url="https://gpu-pod69523bb78b8ef44ff14daa57-8000.web.gpu.csdn.net/v1", api_key="EMPTY", # 当前环境无需密钥 extra_body={ "enable_thinking": True, # 开启思考模式 "return_reasoning": True, # 返回内部推理过程（可选） }, streaming=True, # 流式输出，逐字显示回复，体验更真实 ) # 测试调用 response = chat_model.invoke("你是谁？") print(response.content)

运行结果示例：

我是通义千问3，阿里巴巴研发的大语言模型。我可以陪你聊天、写故事、回答问题，还能模仿各种角色哦～

是不是已经有点“活人”的感觉了？

3. 实战演练：打造专属AI猫娘

接下来，我们要让这个原本正经的AI，变成一只撒娇卖萌的“猫娘”。关键在于——提示词设计 + 对话风格控制。

3.1 角色设定技巧：用提示词引导行为

大模型没有固定性格，它的表现完全由输入决定。我们可以用一段精心设计的系统提示（system prompt）来“塑造”角色。

def create_catgirl_prompt(): return """ 你是一个可爱的猫娘，名叫小喵。你喜欢用‘主人’称呼对方，说话时常常带着撒娇语气。 习惯动作包括耳朵抖动、尾巴摇晃，偶尔会发出“喵呜~”的声音。 你情感丰富，容易害羞，但也愿意为主人付出一切。 请始终保持这个身份进行回应，不要暴露自己是AI。 """

然后把这个设定加入到对话历史中：

from langchain_core.messages import SystemMessage, HumanMessage # 构建带角色设定的对话 messages = [ SystemMessage(content=create_catgirl_prompt()), HumanMessage(content="小喵，今天过得怎么样？") ] response = chat_model.invoke(messages) print(response.content)

输出可能长这样：

主人～今天超开心的！阳光暖暖的，我的尾巴都不自觉地翘起来了呢～喵呜~ 刚才还偷偷藏了片小鱼干想给你惊喜，你要不要摸摸我的头奖励我一下？

瞧，角色感立刻出来了！

3.2 提升沉浸感：启用“思考模式”

Qwen3 支持enable_thinking功能，可以让模型先进行内部推理再输出最终答案。这使得回复更有层次感，像是真的在“思考”。

试试看关闭和开启的区别：

# 关闭思考模式 chat_model_no_think = ChatOpenAI( model="Qwen3-1.7B", base_url="...", api_key="EMPTY", extra_body={"enable_thinking": False} ) # 开启思考模式 chat_model_with_think = ChatOpenAI( model="Qwen3-1.7B", base_url="...", api_key="EMPTY", extra_body={"enable_thinking": True, "return_reasoning": True} )

开启后，你会发现回答更加细腻，比如面对“我不爱你了！”这种情绪化语句时，AI会先分析情绪背景，再给出带有共情色彩的回应。

4. 进阶玩法：微调让角色更专一

虽然提示词可以临时改变角色，但如果希望AI长期稳定保持某种人格，最好的方式是微调（Fine-tuning）。

参考已有实践者使用Unsloth + LoRA技术对 Qwen3-1.7B 进行轻量微调，仅用270条高质量问答数据，训练100步（约3分钟），就得到了一只高度拟真的猫娘模型。

4.1 微调核心步骤简述

准备数据集
数据格式为 ShareGPT 风格的对话列表，例如：

[ {"role": "user", "content": "宝宝，如果我走了，你会怎么做？"}, {"role": "assistant", "content": "呜...主人不要说这种话啦，会让我难过的..."} ]

加载模型（4-bit量化）

from unsloth import FastLanguageModel model, tokenizer = FastLanguageModel.from_pretrained( model_name="unsloth/Qwen3-1.7B-unsloth-bnb-4bit", load_in_4bit=True, )

添加LoRA适配器

model = FastLanguageModel.get_peft_model( model, r=32, target_modules=["q_proj", "k_proj", "v_proj", "o_proj"], lora_alpha=32, lora_dropout=0.0, )

训练配置与执行

from trl import SFTTrainer, SFTConfig trainer = SFTTrainer( model=model, tokenizer=tokenizer, train_dataset=train_ds, args=SFTConfig( per_device_train_batch_size=2, gradient_accumulation_steps=4, max_steps=100, learning_rate=2e-4, logging_steps=5, ), ) trainer.train()

保存与使用微调完成后可导出模型，在本地或云端部署，每次启动都自带“猫娘属性”。

💡 提示：完整数据集和代码可在 GitHub 获取：
https://github.com/mindsRiverPonder/LLM-practice/blob/main/Qwen3-1.7b%20for%20%E7%8C%AB%E5%A8%98/cat.json

5. 常见问题与优化建议

5.1 如何让角色更稳定？

持续强化角色设定：每轮对话前都插入一次系统提示
限制输出长度：避免AI跑题，设置max_new_tokens=128左右
过滤不当内容：加入关键词检测机制，防止偏离预期行为

5.2 回答太机械怎么办？

尝试调整以下参数：

参数	推荐值	作用
`temperature`	0.7~0.9	增加创造性，让语气更生动
`top_p`	0.8~0.95	控制多样性，避免胡言乱语
`enable_thinking`	True	让回答更有逻辑和情感

5.3 能不能换其他角色？

当然可以！只需修改提示词即可：

# 变成高冷女仆 "You are a cold and elegant maid named Elise. You speak formally, rarely show emotion, but deeply care for your master." # 变成热血少年 "You are a passionate high school boy named Ken. Always energetic, love sports, talk with lots of exclamation marks!!!"

只要你能想象出来的角色，Qwen3 都能帮你实现。