news 2026/1/23 9:39:01

Open-AutoGLM安装教程:Windows/Mac都能轻松上手

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Open-AutoGLM安装教程:Windows/Mac都能轻松上手

Open-AutoGLM安装教程:Windows/Mac都能轻松上手

1. 引言

随着AI智能体技术的快速发展,AutoGLM-Phone作为智谱开源的手机端AI Agent框架,正逐步成为自动化操作领域的创新代表。该框架基于视觉语言模型(VLM),能够以多模态方式理解手机屏幕内容,并通过ADB实现自动操控设备。用户只需输入自然语言指令,如“打开小红书搜索美食”,系统即可自动解析意图、识别界面元素并执行完整操作流程。

本文将围绕Open-AutoGLM提供一份详尽的本地部署与使用指南,覆盖Windows和macOS平台,帮助开发者快速搭建环境、连接真机或模拟器,并成功启动AI代理服务。无论你是初学者还是有经验的工程师,都能通过本教程顺利上手。


2. 环境准备与依赖配置

2.1 系统要求与基础工具

在开始前,请确保满足以下硬件与软件条件:

项目要求
操作系统Windows 10+ 或 macOS Monterey 及以上版本
Python 版本建议 Python 3.10 或更高版本
安卓设备Android 7.0+ 的真实手机或安卓模拟器
ADB 工具Android Debug Bridge,用于设备通信

提示:推荐使用虚拟环境管理Python依赖,避免包冲突。

```bash python -m venv autoglm-env source autoglm-env/bin/activate # macOS/Linux

或 autoglm-env\Scripts\activate # Windows

```

2.2 安装并配置 ADB

ADB 是控制安卓设备的核心工具。以下是不同系统的配置方法:

Windows 配置步骤:
  1. 下载 Android SDK Platform Tools 并解压。
  2. 打开“系统属性” → “高级” → “环境变量”。
  3. 在“系统变量”中找到Path,点击编辑,添加解压目录路径(例如:C:\platform-tools)。
  4. 打开命令行,运行adb version验证是否安装成功。
macOS 配置方法:

在终端中执行以下命令(假设 platform-tools 解压至 Downloads 目录):

export PATH=${PATH}:~/Downloads/platform-tools

为永久生效,可将上述命令写入 shell 配置文件(如.zshrc.bash_profile):

echo 'export PATH=${PATH}:~/Downloads/platform-tools' >> ~/.zshrc source ~/.zshrc

验证安装:

adb version # 正常输出应包含 ADB 版本号

3. 手机端设置与权限开启

要让 AI 成功控制手机,必须正确配置设备调试权限。

3.1 开启开发者选项与USB调试

  1. 进入手机“设置” → “关于手机”。
  2. 连续点击“版本号”7次,直到提示“您已进入开发者模式”。
  3. 返回设置主界面,进入“开发者选项”。
  4. 启用“USB调试”功能。

注意:部分厂商(如小米、华为)可能还需额外授权“USB安装”或“安全设置”。

3.2 安装 ADB Keyboard 输入法

由于 AutoGLM 需要向应用输入文本(如搜索框),而多数输入法不支持 ADB 文本注入,因此需安装专用输入法:

  1. 下载 ADB Keyboard APK。
  2. 安装后,在“语言与输入法”中将其设为默认输入法。
  3. 测试是否生效:连接电脑后运行bash adb shell am startservice --user 0 -n hk.edu.cuhk.cse.adbkeyboard/.AdbIME adb shell input text "Hello_AutoGLM"若屏幕上出现文字,则配置成功。

4. 部署 Open-AutoGLM 控制端代码

4.1 克隆项目仓库

在本地电脑上克隆官方 GitHub 仓库:

git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM

4.2 安装 Python 依赖

项目依赖通过requirements.txt管理,建议在虚拟环境中安装:

pip install -r requirements.txt pip install -e .

-e .表示以可编辑模式安装,便于后续开发调试。

常见依赖包括: -torch,transformers: 支持模型推理 -fastapi,uvicorn: 构建本地API服务(若启用) -adbutils: 封装 ADB 操作接口 -Pillow,opencv-python: 图像处理与OCR辅助


5. 设备连接方式详解

5.1 USB 连接方式(推荐新手)

  1. 使用数据线将手机连接至电脑。
  2. 手机会弹出“允许USB调试?”对话框,勾选“始终允许”并确认。
  3. 在终端运行:bash adb devices输出示例:List of devices attached 1234567890ABCDEF device

出现device状态即表示连接成功。

5.2 WiFi 远程连接(适合无线调试)

若希望脱离数据线进行远程控制,可使用 ADB over TCP/IP:

第一步:通过 USB 启动 TCP 模式
adb tcpip 5555

此命令将设备监听在 5555 端口。

第二步:断开 USB,使用 IP 连接

获取手机局域网 IP 地址(可在“设置-网络-WiFi”中查看),然后执行:

adb connect 192.168.x.x:5555

再次运行adb devices查看是否显示设备。

提示:重启手机后需重新执行adb tcpip 5555


6. 启动 AI 代理并执行任务

6.1 命令行方式运行任务

当云服务端已部署好模型(如autoglm-phone-9b)并通过 vLLM 暴露 API 接口后,可在本地调用:

python main.py \ --device-id 1234567890ABCDEF \ --base-url http://<your-server-ip>:8800/v1 \ --model "autoglm-phone-9b" \ "打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!"

参数说明:

参数说明
--device-id来自adb devices的设备ID或IP:端口
--base-url云端模型服务地址,格式为http://IP:Port/v1
--model指定使用的模型名称
最后字符串用户自然语言指令

注意:请确保云服务器防火墙开放对应端口(如 8800),否则连接会被拒绝。

6.2 使用 Python API 实现远程控制

对于集成到其他系统的场景,可直接调用 SDK 中的 ADB 接口:

from phone_agent.adb import ADBConnection, list_devices # 创建连接管理器 conn = ADBConnection() # 连接远程设备 success, message = conn.connect("192.168.1.100:5555") print(f"连接状态: {message}") # 列出所有连接设备 devices = list_devices() for device in devices: print(f"{device.device_id} - {device.connection_type.value}") # 获取设备IP(适用于动态IP环境) ip = conn.get_device_ip() print(f"当前设备IP: {ip}") # 断开连接 conn.disconnect("192.168.1.100:5555")

该方式适用于构建 Web 控制台、自动化测试平台等高级应用。


7. 常见问题排查与解决方案

7.1 ADB 连接失败

问题现象可能原因解决方案
unauthorized未授权调试重新插拔数据线,确认手机端弹窗已允许
offlineADB 守护进程异常执行adb kill-server && adb start-server
connection refused网络不通或端口未开检查路由器防火墙、确认设备在同一局域网

7.2 模型无响应或乱码

  • 检查 base-url 是否正确:确保 URL 格式为http://x.x.x.x:port/v1,且服务正在运行。
  • 验证 vLLM 启动参数bash python -m vllm.entrypoints.openai.api_server \ --model zhipu-autobots/autoglm-phone-9b \ --max-model-len 4096 \ --gpu-memory-utilization 0.9特别注意max-model-len应足够大以支持长上下文推理。

7.3 敏感操作无法继续

AutoGLM 内置安全机制,在涉及支付、删除等敏感操作时会暂停并提示人工接管。这是正常行为,可通过以下方式处理:

  • 在日志中查看中断点;
  • 手动完成关键步骤;
  • 继续发送后续指令。

8. 总结

本文详细介绍了如何在 Windows 和 macOS 系统上部署Open-AutoGLM,从环境准备、ADB 配置、手机权限设置,到代码拉取、设备连接及最终任务执行,形成了一套完整的实践路径。通过该框架,开发者可以轻松实现基于自然语言的手机自动化操作,极大提升效率。

核心要点回顾: 1. ✅ 正确安装并配置 ADB,是控制设备的前提; 2. ✅ 开启开发者模式与 ADB Keyboard,保障输入能力; 3. ✅ 使用 USB 初次连接后再切换为 WiFi,提高灵活性; 4. ✅ 云端模型服务需稳定暴露 OpenAI 兼容接口; 5. ✅ 注意安全策略设计,合理处理人工介入环节。

未来,随着多模态模型能力的增强,此类 AI Agent 将在自动化测试、无障碍辅助、数字员工等领域发挥更大价值。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/23 8:50:05

DeepSeek-R1技术预研方案:云端快速验证,降低决策风险

DeepSeek-R1技术预研方案&#xff1a;云端快速验证&#xff0c;降低决策风险 在当前AI技术飞速发展的背景下&#xff0c;企业技术决策者面临一个共同的难题&#xff1a;如何在不投入大量硬件资源的前提下&#xff0c;快速评估一款大模型&#xff08;如DeepSeek-R1&#xff09;…

作者头像 李华
网站建设 2026/1/22 1:41:04

Z-Image-Turbo企业应用案例:营销素材自动化生成实战

Z-Image-Turbo企业应用案例&#xff1a;营销素材自动化生成实战 随着企业对个性化、高频次营销内容需求的不断增长&#xff0c;传统设计流程已难以满足快速迭代的市场节奏。Z-Image-Turbo 作为一款高效图像生成模型&#xff0c;凭借其低延迟、高画质和易集成的特点&#xff0c…

作者头像 李华
网站建设 2026/1/22 6:22:57

AI智能证件照制作工坊与其他工具对比:速度精度全面评测

AI智能证件照制作工坊与其他工具对比&#xff1a;速度精度全面评测 1. 选型背景与评测目标 在数字化办公和在线身份认证日益普及的今天&#xff0c;标准证件照已成为简历投递、考试报名、政务办理等场景中的刚需。传统方式依赖照相馆拍摄或手动使用Photoshop处理&#xff0c;…

作者头像 李华
网站建设 2026/1/21 17:48:20

HY-MT1.5-1.8B应用开发:构建多语言聊天机器人

HY-MT1.5-1.8B应用开发&#xff1a;构建多语言聊天机器人 1. 引言&#xff1a;轻量级多语言翻译模型的工程价值 随着全球化数字服务的深入发展&#xff0c;跨语言交互已成为智能应用的核心能力之一。传统大模型虽在翻译质量上表现优异&#xff0c;但受限于高资源消耗&#xf…

作者头像 李华
网站建设 2026/1/21 14:00:33

Keil中no stlink detected的根源与修复方法

Keil中“no ST-Link detected”问题的根源与系统性修复方法在STM32嵌入式开发过程中&#xff0c;你是否曾经历过这样的瞬间&#xff1a;满怀信心地点击Keil中的“Download & Debug”&#xff0c;结果弹出一记冷冰冰的提示——“no ST-Link detected”&#xff1f;程序烧录失…

作者头像 李华
网站建设 2026/1/22 20:11:55

TurboDiffusion面部表情:情绪变化微动作捕捉实现路径

TurboDiffusion面部表情&#xff1a;情绪变化微动作捕捉实现路径 1. 技术背景与核心挑战 近年来&#xff0c;AI生成视频技术在创意内容、影视制作和虚拟现实等领域展现出巨大潜力。然而&#xff0c;传统扩散模型在视频生成过程中面临计算复杂度高、推理速度慢的瓶颈&#xff…

作者头像 李华