Open-AutoGLM + 定时任务,打造24小时待命AI助理
1. 让AI替你操作手机:从一句话开始
你有没有想过,只要说一句“帮我打开小红书搜美食”,手机就能自动完成所有点击、输入和滑动?这不是科幻电影,而是Open-AutoGLM已经实现的现实。
这个由智谱AI开源的手机端AI Agent框架,正在重新定义人与设备的交互方式。它不仅能“听懂”你的指令,还能“看懂”屏幕内容,通过ADB自动执行操作,真正实现“动口不动手”的智能体验。
更进一步——结合定时任务,你可以让这位AI助理7×24小时在线值守,在指定时间自动执行任务。无论是每天早上的健康打卡、抢购限量商品,还是定期备份数据、发送提醒消息,它都能准时完成,像一个永不疲倦的数字助手。
本文将带你一步步部署Open-AutoGLM,并教你如何用定时任务让它变成全天候AI助理,彻底解放双手。
2. Open-AutoGLM 是什么?
2.1 核心能力:多模态理解 + 自动化执行
Open-AutoGLM 的核心是AutoGLM-Phone框架,它基于视觉语言模型(VLM),具备以下关键能力:
- 多模态感知:通过截图理解当前手机界面,识别按钮、输入框、图标等元素。
- 自然语言解析:将用户的一句话指令拆解为可执行的操作序列。
- 自动化控制:通过 ADB(Android Debug Bridge)模拟点击、滑动、输入等操作。
- 智能规划:根据当前界面状态动态调整下一步动作,具备“思考”能力。
比如你说:“打开抖音,搜索‘科技测评’,点赞第一个视频。”
AI会:
- 打开抖音App
- 找到搜索框并点击
- 输入“科技测评”
- 进入结果页
- 找到第一个视频并双击点赞
整个过程无需人工干预,完全自动化。
2.2 安全设计:敏感操作人工确认
为了防止误操作,系统内置了敏感操作拦截机制。当检测到支付、删除、转账等高风险行为时,AI会暂停执行,等待你手动确认。所有操作都在本地完成,数据不上传云端,保障隐私安全。
2.3 部署灵活:支持本地与远程
你可以选择多种部署方式:
- 本地运行:在自己的电脑上部署vLLM服务,完全离线使用。
- 云端调用:连接已部署好的云服务器,通过WiFi远程控制手机。
- API接入:支持接入智谱BigModel、Hugging Face等平台的API。
3. 快速部署:三步让AI接管手机
3.1 环境准备
你需要准备以下环境:
| 组件 | 要求 |
|---|---|
| 电脑 | Windows / macOS / Linux,Python 3.10+ |
| 手机 | Android 7.0+,开启开发者模式和USB调试 |
| 工具 | ADB工具、ADB Keyboard输入法 |
安装ADB(以Windows为例)
- 下载 Android SDK Platform Tools
- 解压后将路径添加到系统环境变量
Path - 命令行输入
adb version验证是否安装成功
手机设置
- 进入“设置 → 关于手机”,连续点击“版本号”7次开启开发者模式。
- 返回“设置 → 开发者选项”,启用“USB调试”。
- 下载并安装 ADB Keyboard APK,设置为默认输入法。
为什么需要ADB Keyboard?
因为AI无法直接调用手机软键盘输入文字。ADB Keyboard允许通过ADB命令发送文本,实现自动输入。
3.2 部署控制端代码
在本地电脑执行以下命令:
git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM pip install -r requirements.txt pip install -e .3.3 连接设备
确保手机通过USB连接电脑,然后运行:
adb devices如果看到设备ID后跟device状态,说明连接成功。
使用WiFi远程连接(推荐)
如果你希望摆脱USB线束缚,可以启用WiFi ADB:
# 先用USB连接,开启TCP模式 adb tcpip 5555 # 断开USB,通过IP连接 adb connect 192.168.1.100:5555之后即可无线控制手机。
4. 启动AI代理:让AI开始工作
4.1 命令行运行示例
假设你已经在云服务器上部署了vLLM模型服务,地址为http://123.45.67.89:8800,则运行:
python main.py \ --device-id 192.168.1.100:5555 \ --base-url http://123.45.67.89:8800/v1 \ --model "autoglm-phone-9b" \ "打开微信,给文件传输助手发一条消息:今天天气真好"AI会自动:
- 启动微信
- 找到“文件传输助手”聊天窗口
- 点击输入框
- 输入文字并发送
4.2 Python API调用(适合集成)
你也可以在自己的脚本中调用:
from phone_agent.adb import ADBConnection from phone_agent.agent import PhoneAgent # 连接设备 conn = ADBConnection() conn.connect("192.168.1.100:5555") # 创建AI代理 agent = PhoneAgent( device_id="192.168.1.100:5555", base_url="http://123.45.67.89:8800/v1", model="autoglm-phone-9b" ) # 执行任务 result = agent.run("打开美团,搜索附近的咖啡店") print(result)这种方式便于与其他系统集成,比如Web后台、企业OA等。
5. 打造24小时AI助理:定时任务实战
真正的价值在于自动化+定时执行。我们可以结合操作系统的定时任务功能,让AI每天自动完成固定流程。
5.1 场景一:每日健康打卡
很多公司要求员工每天上午9点前完成健康打卡。手动操作容易忘记,AI可以帮你准时完成。
编写脚本daily_checkin.py:
from phone_agent.agent import PhoneAgent def do_daily_checkin(): agent = PhoneAgent( device_id="192.168.1.100:5555", base_url="http://123.45.67.89:8800/v1", model="autoglm-phone-9b" ) agent.run("打开企业微信,进入工作台,点击健康打卡,提交今日信息") if __name__ == "__main__": do_daily_checkin()添加定时任务(Linux/macOS)
使用crontab设置每天9:00执行:
crontab -e添加一行:
0 9 * * * cd /path/to/Open-AutoGLM && python daily_checkin.pyWindows任务计划程序
- 打开“任务计划程序”
- 创建基本任务,设置触发时间为“每天”
- 操作选择“启动程序”,填写:
- 程序:
python - 参数:
daily_checkin.py - 起始目录:项目路径
- 程序:
保存后,每天早上9点AI会自动打卡。
5.2 场景二:电商抢购助手
双十一、618期间,很多商品限时抢购。AI可以提前监控页面,在开售瞬间自动下单。
agent.run("打开淘宝,进入iPhone 15 Pro商品页,等待开售,一旦可购买立即点击下单并跳转支付")注意:支付环节需手动确认,避免误购。
5.3 场景三:社交媒体运营
自媒体创作者可以设置:
- 每天中午12点发布一条微博
- 每晚8点回复粉丝评论
- 每周日自动生成周报并发送邮件
只需一句指令,AI自动完成App切换、内容编辑、发布全流程。
6. 常见问题与优化建议
6.1 常见问题排查
| 问题 | 可能原因 | 解决方案 |
|---|---|---|
| ADB连接失败 | 防火墙阻止、USB调试未开启 | 检查手机设置,关闭防火墙 |
| AI乱点屏幕 | 模型响应异常或延迟高 | 检查vLLM服务是否正常,调整max-model-len参数 |
| 输入中文失败 | ADB Keyboard未启用 | 检查输入法设置,确保ADB Keyboard为默认 |
| WiFi断连 | 网络不稳定 | 改用USB连接,或优化路由器信号 |
6.2 性能优化建议
- 使用GPU加速:推荐NVIDIA显卡(RTX 3090及以上),显著提升推理速度。
- 降低截图频率:在
config.yaml中调整screen_update_interval,减少不必要的截图请求。 - 预加载常用App:在任务开始前先启动目标App,减少等待时间。
- 设置最大步数:使用
--max-steps 20防止AI陷入死循环。
7. 应用前景与未来可能
Open-AutoGLM 不只是一个玩具项目,它打开了AI原生操作系统的大门。未来我们可能会看到:
- 老年人数字助手:子女远程配置任务,AI帮父母挂号、购物、视频通话。
- 企业流程自动化:财务报销、数据录入、审批流转全部由AI完成。
- 无障碍辅助:视障人士通过语音指令操控手机,提升生活质量。
- 自动化测试:测试人员用自然语言描述用例,AI自动执行回归测试。
更重要的是,它是开源的。任何人都可以下载、修改、部署,构建属于自己的AI助理生态。
8. 总结
Open-AutoGLM 正在将“AI助手”的概念从“回答问题”升级为“执行任务”。它不再只是聊天机器人,而是一个能真正帮你做事的数字员工。
通过本文的部署指南和定时任务实践,你已经掌握了如何:
- 搭建Open-AutoGLM运行环境
- 连接手机并启动AI代理
- 编写自动化脚本
- 设置定时任务,打造24小时待命AI助理
下一步,你可以尝试:
- 将多个任务组合成复杂流程
- 接入企业内部系统,实现办公自动化
- 为家人配置专属AI助手,解决实际生活难题
技术的价值在于改变生活。现在,轮到你来定义它的边界了。
获取更多AI镜像
想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。