news 2026/7/5 14:35:18

Qwen Code新特性来袭:终端支持语音对话

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Qwen Code新特性来袭:终端支持语音对话

如果说AI编程助手是开发者的“第二双手”,那么语音交互的加入,则意味着这双手开始拥有“耳朵”和“嘴巴”。近期Qwen Code的相关动态,尤其是围绕Qwen3.5-Omni全能模型的技术整合,正将这种交互范式从键盘驱动推向声控协同的新阶段。

语音如何“走进”终端

长期以来,编程助手的功能对比表上,“语音模式(Voice Mode)”一栏对Qwen Code而言始终标注着“不支持”。这一局面的改变,并非单纯在终端里塞入一个语音转文字模块,而是源于其后端模型的代际跃迁。Qwen3.5-Omni模型的原生多模态能力,让语音不再是一个外挂的输入法,而是与文本、图像、视频同等的一等公民模态

该模型在超过1亿小时的多模态音视频数据上训练而成,其混合专家(MoE)架构中设有专门处理音频和视频的专家模块。这种架构设计意味着,模型对语音的理解是在特征提取和推理层面完成的,而非将语音识别结果作为文本“喂”给大模型。由此产生的**“音频-视觉Vibe编码”能力**允许开发者通过语音描述需求,辅以视觉参考(如UI草图),直接生成可运行的前端代码或Python脚本。

qwen code这次支持如下几种方式进行语音对话
/voice hold​ — 按住空格键说话,松开即停止转录
/voice tap​ — 单击开始录音,说完一句话或检测到静音后自动停止
/model --voice qwen3-asr-flash-realtime​ — 选择实时流式转录模型
/voice status​ — 查看当前语音配置状态
Web Shell:点击麦克风按钮进行语音输入(浏览器端录音,后台守护进程转录)


voice命令

这背后的技术突破在于语义中断(Semantic Interruption)自适应速率交错对齐(ARIA)。前者让模型能像人一样区分“真正想插话”与“环境杂音”,使对话更自然;后者则同步协调文本生成与语音输出的节奏,避免了机器人朗读般的机械感。

我认为,Qwen Code引入深度语音能力,绝不仅仅是补上了一块功能短板,它代表了AI编程助手从**“被动的指令执行者”“主动的协作伙伴”**的质变。

传统的“Vibe Coding”被定义为用自然语言写代码,但键盘依然是物理上的隔阂。真正的“Vibe”应包含口述构思、即时反馈、视觉验证的闭环。当我口述“生成一个带渐变背景的登录页,按钮加个微交互动画”时,这种沉浸感远超手打prompt。语音通道的加入解放了双手和注意力,让开发者能在浏览设计稿、架构图时同步“编码”,使得**“说”代码与“看”代码可以并行**。

此外,语音输出的加入(模型能直接生成语音回复)让终端有了“听觉”。在调试或代码审查场景下,模型能口语化地解释复杂逻辑,降低认知负荷。虽然开发者可能更习惯阅读文本,但在原型设计、头脑风暴或教育演示场景中,双向语音交互会极大降低使用门槛。

未来的声音

当然,终端环境的高噪音干扰、团队协作中的声音隐私以及代码片段语音输入的精度问题,仍是待解的工程挑战。但不可否认,Qwen Code这一步将语音从“可选”变为“核心”,预告了**“多模态交互式开发”**时代的加速到来。当模型能同时听懂、看见并说出代码,我们与软件的关系将进入一个更自然、更高效的新维度。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/5 14:34:46

TVA推动物理AI的具身智能革命(9)

前沿技术介绍:AI智能体视觉(TVA,Transformer-based Vision Agent)是依托Transformer架构与“因式智能体”理论所构建的颠覆性工业视觉技术,属于“物理AI” 领域的一种全新技术形态,完成了从“虚拟世界”到“…

作者头像 李华
网站建设 2026/7/5 14:34:22

Kubernetes 系列【4】基础概念

文章目录1. Cluster(集群)2. Control Plane(控制平面)3. Node(节点)4. Pod(容器组)5. Deployment(部署控制器)6. Service(服务)7. Lab…

作者头像 李华
网站建设 2026/7/5 14:31:33

AI智能体开发指南:从核心概念到实践应用

1. AI智能体(Agent)入门指南:从零开始理解核心概念AI智能体(Agent)正在成为2024年最热门的技术趋势之一。作为一个能够自主执行任务的智能系统,它正在改变我们与计算机交互的方式。想象一下,你有一个不知疲倦的数字助手,不仅能理解…

作者头像 李华
网站建设 2026/7/5 14:28:13

开源B站视频下载器:轻松获取高清内容的Python解决方案

开源B站视频下载器:轻松获取高清内容的Python解决方案 【免费下载链接】bilibili-downloader B站视频下载,支持下载大会员清晰度4K,持续更新中 项目地址: https://gitcode.com/gh_mirrors/bil/bilibili-downloader 想要将B站上的精彩视…

作者头像 李华
网站建设 2026/7/5 14:24:55

告别手动对齐!用UvSquares插件3分钟搞定Blender UV网格重塑

告别手动对齐!用UvSquares插件3分钟搞定Blender UV网格重塑 【免费下载链接】UvSquares Blender addon for reshaping UV quad selection into a grid. 项目地址: https://gitcode.com/gh_mirrors/uv/UvSquares 你是否曾经在Blender的UV编辑器中花费数小时手…

作者头像 李华