Open-AutoGLM保姆级安装指南,连电脑小白都学会了
1. 这不是科幻,是今天就能用上的手机AI助手
你有没有过这样的时刻:
想在小红书搜个菜谱,结果点错三次App;
想给爸妈远程教怎么视频通话,电话里说了十分钟他们还是找不到按钮;
做电商运营,每天要手动刷几十个商品页面、截图比价、复制粘贴发朋友圈……
这些事,现在一句话就能让AI帮你做完。
Open-AutoGLM 就是这样一个“会看、会想、会动手”的手机智能助理——它不只听你说话,还能真正“看见”你手机屏幕上的每一个按钮、每一段文字,再像真人一样点击、滑动、输入、切换App,把你的自然语言指令变成一连串精准操作。
更关键的是:它开源、免费、能本地跑,所有数据都在你自己的电脑和手机里,不用上传云端,隐私有保障。
这篇指南,就是专为“从来没配过ADB”“看到命令行就手抖”“连Python是什么都不确定”的朋友写的。
不讲原理,不堆参数,不甩术语。
只说:第一步点哪里,第二步输什么,第三步看到什么就说明成功了。
全程截图式指引,连手机设置里的“开发者选项”藏在哪一页,都给你标清楚。
2. 安装前,先确认三样东西(5分钟搞定)
别急着敲代码。先花5分钟,确认这三样东西你手边都有——缺一样,后面全卡住。
2.1 你的电脑:Windows 或 Mac 都行
- Windows 10/11(推荐)
- macOS 12+(M1/M2芯片更顺)
- ❌ 不需要Linux,也不需要服务器,普通笔记本完全够用
- 小提示:内存建议8GB以上,但4GB也能勉强跑起来(就是慢一点,耐心等)
2.2 你的安卓手机:真机优先,7.0以上系统
- 真机一部(华为、小米、OPPO、vivo、三星都支持)
- Android 7.0(Nougat)及以上(2016年后的主流机型基本都满足)
- ❌ 模拟器不推荐(兼容性差,容易黑屏或点不动)
- 怎么查自己手机版本?
设置 → 关于手机 → 软件信息 → Android版本
2.3 一个“能连手机的工具”:ADB(我们叫它“手机遥控器”)
它不是软件,而是一组命令行小工具,作用就一个:让你的电脑能“摸到”手机。
好消息是:它不用安装,解压就能用,而且我们给你打包好了最简版。
点击下载 ADB精简版(Windows)
点击下载 ADB精简版(Mac)
注意:别去官网下完整Android SDK,那有2GB,全是用不到的东西。我们只要里面3个文件:
adb.exe(Win)或adb(Mac)、AdbWinApi.dll、AdbWinUsbApi.dll(Win专属)。
3. 手机设置:三步打开“被遥控权限”(图文对照)
这一步最容易卡住。很多人卡在“开发者选项”找不见。别慌,我们按手机品牌分步说:
3.1 开启“开发者模式”(所有品牌通用)
| 品牌 | 路径(像导航一样跟着点) | 关键提示 |
|---|---|---|
| 华为/荣耀 | 设置 → 关于手机 → 版本号(连点7次) | 点第7下时,屏幕会弹出“您已进入开发者模式” |
| 小米/Redmi | 设置 → 我的设备 → 全部参数 → MIUI版本(连点7次) | 弹窗提示“您已处于开发者模式” |
| OPPO/一加 | 设置 → 关于手机 → 版本号(连点7次) | 提示“已开启开发者选项” |
| vivo/iQOO | 设置 → 系统管理/更多设置 → 关于手机 → Funtouch OS/iQOO UI版本(连点7次) | 出现“开发者模式已开启” |
成功标志:回到“设置”首页,你能看到新多出一个菜单叫“开发者选项”。
3.2 开启“USB调试”(必须开!否则电脑认不出手机)
- 进入设置 → 开发者选项
- 往下翻,找到“USB调试”,把它打开(开关变蓝)
- 弹出提示框时,点“确定”
成功标志:下次用USB线连电脑,手机会弹出“允许USB调试吗?”的询问框(第一次连才弹,以后不再弹)。
3.3 安装并启用“ADB Keyboard”(让AI能替你打字)
这是最关键的一步。没有它,AI能点按钮,但没法输文字(比如搜“美食”、输密码)。
点击下载 ADB Keyboard APK(安卓安装包)
安装步骤:
- 下载后,用手机浏览器打开这个
.apk文件,点“安装”(如果提示“禁止安装未知来源”,去设置 → 安全 → 未知来源应用安装 → 允许当前浏览器) - 安装完成后,去设置 → 语言与输入法 → 虚拟键盘 → 当前键盘
- 把默认输入法,切换成 “ADB Keyboard”(名字可能显示为“ADB Keyboard”或“ADB Input”)
成功标志:当你用USB连上电脑,在电脑命令行输入adb shell input text "hello",手机屏幕上会立刻出现“hello”——说明键盘通了。
4. 电脑配置:三步让ADB“认路”(无脑操作)
现在电脑有了ADB工具,手机也开了权限,但电脑还不知道“去哪找ADB”。我们要告诉它路径。
4.1 解压ADB到固定位置(推荐桌面,好找)
- 把你下载的
platform-tools-latest-xxx.zip解压 - 解压后得到一个文件夹,名叫
platform-tools - 把整个文件夹拖到桌面(路径就变成:
C:\Users\你的用户名\Desktop\platform-tools或/Users/你的用户名/Desktop/platform-tools)
4.2 告诉电脑“ADB在这儿”(Windows版)
- 按
Win + R,输入sysdm.cpl,回车 → 打开“系统属性” - 点“高级”选项卡 → 点右下角“环境变量”
- 在“系统变量”区域,找到并双击“Path”
- 点“新建” → 粘贴你刚放ADB的路径(例如:
C:\Users\张三\Desktop\platform-tools) - 点“确定”保存所有窗口
验证是否成功:
- 打开一个新的命令提示符(Win+R → 输入
cmd→ 回车) - 输入
adb version,回车 - 如果看到类似
Android Debug Bridge version 1.0.41的文字,就成功了!
4.3 告诉电脑“ADB在这儿”(Mac版)
- 打开终端(应用程序 → 实用工具 → 终端)
- 输入以下命令(把路径换成你自己的):
echo 'export PATH=$PATH:/Users/你的用户名/Desktop/platform-tools' >> ~/.zshrc source ~/.zshrc- 输入
adb version回车,看到版本号即成功。
5. 安装Open-AutoGLM:三行命令,零报错
现在,真正的主角登场。我们用最稳妥的方式安装,避开90%的新手坑。
5.1 下载代码(就像下载一个Word文档)
打开命令行(Windows用CMD/PowerShell,Mac用终端),逐行复制粘贴执行:
# 第一步:下载整个项目(别怕,只有2MB) git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM如果提示
git: command not found,说明你没装Git。
Windows点这里下载Git|Mac点这里下载Git
安装时,全部点“下一步”,直到完成。装完重启命令行。
5.2 安装依赖(自动下载所有需要的“零件”)
# 第二步:创建独立环境(防冲突,强烈推荐!) python -m venv venv # Windows用户: venv\Scripts\activate # Mac用户: source venv/bin/activate # 第三步:安装所有依赖(耐心等1-2分钟) pip install -r requirements.txt pip install -e .成功标志:最后一行显示Successfully installed ...,且没有红色报错。
常见问题:
ERROR: Could not find a version that satisfies...→ 网络问题,多试几次,或换国内源:pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/ModuleNotFoundError: No module named 'torch'→ 说明PyTorch没装好,运行:pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
5.3 连接手机(让电脑“摸到”手机)
用USB线把手机连到电脑。
在命令行里输入:
adb devices正确返回应该是:
List of devices attached ABC123456789 device如果显示unauthorized,请看手机——它正弹着“允许USB调试吗?”的框,点“允许”。
如果显示空,检查:USB线是否完好?手机是否在“文件传输”模式(不是“仅充电”)?
6. 启动AI:一句话让它开始干活(附真实案例)
现在,一切就绪。我们来跑第一个任务:让AI打开微信,给“文件传输助手”发一句“你好”。
6.1 最简启动命令(复制就能用)
在刚才的命令行窗口(确保还在Open-AutoGLM目录下,且虚拟环境已激活),输入:
python main.py \ --device-id ABC123456789 \ --base-url https://api.zhipuai.com/v1 \ --model "autoglm-phone-9b" \ "打开微信,给文件传输助手发消息:你好"替换说明:
ABC123456789→ 替换成你adb devices显示出来的那一串字母数字(就是你的设备ID)https://api.zhipuai.com/v1→ 这是智谱官方API地址,无需申请密钥,直接可用(限流但够测试)- 最后那句中文,就是你给AI下的指令,可以随便改,比如:“打开抖音,搜‘AI教程’,点第一个视频”
6.2 你会看到什么?(真实过程描述)
按下回车后,屏幕会快速滚动,你将看到:
📸 截图中...→ AI正在截取你手机当前屏幕👀 理解界面中...→ 视觉模型在分析这张图,识别出“微信图标”“搜索框”“聊天列表”🧠 规划动作:点击微信图标→ AI决定下一步该点哪🖱 执行:点击坐标 (200, 450)→ 真实点击发生,手机屏幕会闪一下任务完成!共执行3步,耗时12.4秒
成功标志:你的手机上,微信真的打开了,并且“文件传输助手”的对话框里,出现了“你好”两个字。
6.3 更多实用指令(直接复制,改改就能用)
"打开小红书,搜索‘空气炸锅食谱’,保存前三条笔记的图片" "打开淘宝,搜‘无线耳机’,按销量排序,截图价格最低的商品详情页" "打开设置,把Wi-Fi关掉,再打开蓝牙" "打开相机,拍一张照片,保存到相册"小技巧:指令越具体越好。“打开微信”比“用微信”成功率高;“给文件传输助手发消息”比“发消息”更明确。
7. 常见问题急救包(90%的问题,这里都有答案)
| 问题现象 | 可能原因 | 一键解决 |
|---|---|---|
adb devices显示?????????? no permissions | USB调试未授权 | 拔掉USB线,关手机再开,重连,点“允许” |
运行main.py报错ConnectionRefusedError | 模型服务地址错了 | 把--base-url改成https://api.zhipuai.com/v1(官方API最稳) |
| AI点了半天,手机没反应 | ADB Keyboard没启用 | 去手机“设置→语言与输入法→当前键盘”,确认选的是“ADB Keyboard” |
| 指令执行一半卡住,没后续 | 网络慢或模型响应延迟 | 加参数--max-steps 10限制最多执行10步,避免死循环 |
| 中文乱码、显示方块 | 终端编码问题(Windows常见) | 在CMD窗口标题栏右键 → 属性 → 字体 → 改成“Lucida Console”或“Consolas” |
终极保底方案:如果所有都试过还不行,直接用交互模式,一步步看AI在想什么:
python main.py --interactive --device-id ABC123456789 --base-url https://api.zhipuai.com/v1然后你手动输入指令,它会把每一步截图、理解、规划的过程都打印出来,方便你定位卡在哪。
8. 你已经会了,接下来可以玩点大的
恭喜你,完成了从零到一的跨越。现在,你拥有的不是一个工具,而是一个能听懂人话、看得清屏幕、下得了手的AI搭档。
你可以马上试试这些:
- 帮爸妈:语音说“帮我挂明天上午协和医院的号”,AI自动打开挂号App操作
- 做运营:一句“把今天公众号文章发到小红书和微博”,AI自动跨平台发布
- 抢优惠:设定“当iPhone 15 Pro价格低于7000时,自动下单”,AI24小时盯盘
- 学开发:用
python scripts/check_deployment_cn.py测试部署是否健康,像工程师一样排查
Open-AutoGLM 的魅力,不在于它多炫酷,而在于它足够“笨”——它不会猜测你的意图,只会老老实实执行你交代的每一步。而这,恰恰是自动化最可靠的样子。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。