news 2026/2/5 8:29:48

Open-AutoGLM + 定时任务,打造24小时待命AI助理

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Open-AutoGLM + 定时任务,打造24小时待命AI助理

Open-AutoGLM + 定时任务,打造24小时待命AI助理

1. 让AI替你操作手机:从一句话开始

你有没有想过,只要说一句“帮我打开小红书搜美食”,手机就能自动完成所有点击、输入和滑动?这不是科幻电影,而是Open-AutoGLM已经实现的现实。

这个由智谱AI开源的手机端AI Agent框架,正在重新定义人与设备的交互方式。它不仅能“听懂”你的指令,还能“看懂”屏幕内容,通过ADB自动执行操作,真正实现“动口不动手”的智能体验。

更进一步——结合定时任务,你可以让这位AI助理7×24小时在线值守,在指定时间自动执行任务。无论是每天早上的健康打卡、抢购限量商品,还是定期备份数据、发送提醒消息,它都能准时完成,像一个永不疲倦的数字助手。

本文将带你一步步部署Open-AutoGLM,并教你如何用定时任务让它变成全天候AI助理,彻底解放双手。


2. Open-AutoGLM 是什么?

2.1 核心能力:多模态理解 + 自动化执行

Open-AutoGLM 的核心是AutoGLM-Phone框架,它基于视觉语言模型(VLM),具备以下关键能力:

  • 多模态感知:通过截图理解当前手机界面,识别按钮、输入框、图标等元素。
  • 自然语言解析:将用户的一句话指令拆解为可执行的操作序列。
  • 自动化控制:通过 ADB(Android Debug Bridge)模拟点击、滑动、输入等操作。
  • 智能规划:根据当前界面状态动态调整下一步动作,具备“思考”能力。

比如你说:“打开抖音,搜索‘科技测评’,点赞第一个视频。”
AI会:

  1. 打开抖音App
  2. 找到搜索框并点击
  3. 输入“科技测评”
  4. 进入结果页
  5. 找到第一个视频并双击点赞

整个过程无需人工干预,完全自动化。

2.2 安全设计:敏感操作人工确认

为了防止误操作,系统内置了敏感操作拦截机制。当检测到支付、删除、转账等高风险行为时,AI会暂停执行,等待你手动确认。所有操作都在本地完成,数据不上传云端,保障隐私安全。

2.3 部署灵活:支持本地与远程

你可以选择多种部署方式:

  • 本地运行:在自己的电脑上部署vLLM服务,完全离线使用。
  • 云端调用:连接已部署好的云服务器,通过WiFi远程控制手机。
  • API接入:支持接入智谱BigModel、Hugging Face等平台的API。

3. 快速部署:三步让AI接管手机

3.1 环境准备

你需要准备以下环境:

组件要求
电脑Windows / macOS / Linux,Python 3.10+
手机Android 7.0+,开启开发者模式和USB调试
工具ADB工具、ADB Keyboard输入法
安装ADB(以Windows为例)
  1. 下载 Android SDK Platform Tools
  2. 解压后将路径添加到系统环境变量Path
  3. 命令行输入adb version验证是否安装成功
手机设置
  1. 进入“设置 → 关于手机”,连续点击“版本号”7次开启开发者模式。
  2. 返回“设置 → 开发者选项”,启用“USB调试”。
  3. 下载并安装 ADB Keyboard APK,设置为默认输入法。

为什么需要ADB Keyboard?
因为AI无法直接调用手机软键盘输入文字。ADB Keyboard允许通过ADB命令发送文本,实现自动输入。

3.2 部署控制端代码

在本地电脑执行以下命令:

git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM pip install -r requirements.txt pip install -e .

3.3 连接设备

确保手机通过USB连接电脑,然后运行:

adb devices

如果看到设备ID后跟device状态,说明连接成功。

使用WiFi远程连接(推荐)

如果你希望摆脱USB线束缚,可以启用WiFi ADB:

# 先用USB连接,开启TCP模式 adb tcpip 5555 # 断开USB,通过IP连接 adb connect 192.168.1.100:5555

之后即可无线控制手机。


4. 启动AI代理:让AI开始工作

4.1 命令行运行示例

假设你已经在云服务器上部署了vLLM模型服务,地址为http://123.45.67.89:8800,则运行:

python main.py \ --device-id 192.168.1.100:5555 \ --base-url http://123.45.67.89:8800/v1 \ --model "autoglm-phone-9b" \ "打开微信,给文件传输助手发一条消息:今天天气真好"

AI会自动:

  • 启动微信
  • 找到“文件传输助手”聊天窗口
  • 点击输入框
  • 输入文字并发送

4.2 Python API调用(适合集成)

你也可以在自己的脚本中调用:

from phone_agent.adb import ADBConnection from phone_agent.agent import PhoneAgent # 连接设备 conn = ADBConnection() conn.connect("192.168.1.100:5555") # 创建AI代理 agent = PhoneAgent( device_id="192.168.1.100:5555", base_url="http://123.45.67.89:8800/v1", model="autoglm-phone-9b" ) # 执行任务 result = agent.run("打开美团,搜索附近的咖啡店") print(result)

这种方式便于与其他系统集成,比如Web后台、企业OA等。


5. 打造24小时AI助理:定时任务实战

真正的价值在于自动化+定时执行。我们可以结合操作系统的定时任务功能,让AI每天自动完成固定流程。

5.1 场景一:每日健康打卡

很多公司要求员工每天上午9点前完成健康打卡。手动操作容易忘记,AI可以帮你准时完成。

编写脚本daily_checkin.py

from phone_agent.agent import PhoneAgent def do_daily_checkin(): agent = PhoneAgent( device_id="192.168.1.100:5555", base_url="http://123.45.67.89:8800/v1", model="autoglm-phone-9b" ) agent.run("打开企业微信,进入工作台,点击健康打卡,提交今日信息") if __name__ == "__main__": do_daily_checkin()
添加定时任务(Linux/macOS)

使用crontab设置每天9:00执行:

crontab -e

添加一行:

0 9 * * * cd /path/to/Open-AutoGLM && python daily_checkin.py
Windows任务计划程序
  1. 打开“任务计划程序”
  2. 创建基本任务,设置触发时间为“每天”
  3. 操作选择“启动程序”,填写:
    • 程序:python
    • 参数:daily_checkin.py
    • 起始目录:项目路径

保存后,每天早上9点AI会自动打卡。

5.2 场景二:电商抢购助手

双十一、618期间,很多商品限时抢购。AI可以提前监控页面,在开售瞬间自动下单。

agent.run("打开淘宝,进入iPhone 15 Pro商品页,等待开售,一旦可购买立即点击下单并跳转支付")

注意:支付环节需手动确认,避免误购。

5.3 场景三:社交媒体运营

自媒体创作者可以设置:

  • 每天中午12点发布一条微博
  • 每晚8点回复粉丝评论
  • 每周日自动生成周报并发送邮件

只需一句指令,AI自动完成App切换、内容编辑、发布全流程。


6. 常见问题与优化建议

6.1 常见问题排查

问题可能原因解决方案
ADB连接失败防火墙阻止、USB调试未开启检查手机设置,关闭防火墙
AI乱点屏幕模型响应异常或延迟高检查vLLM服务是否正常,调整max-model-len参数
输入中文失败ADB Keyboard未启用检查输入法设置,确保ADB Keyboard为默认
WiFi断连网络不稳定改用USB连接,或优化路由器信号

6.2 性能优化建议

  • 使用GPU加速:推荐NVIDIA显卡(RTX 3090及以上),显著提升推理速度。
  • 降低截图频率:在config.yaml中调整screen_update_interval,减少不必要的截图请求。
  • 预加载常用App:在任务开始前先启动目标App,减少等待时间。
  • 设置最大步数:使用--max-steps 20防止AI陷入死循环。

7. 应用前景与未来可能

Open-AutoGLM 不只是一个玩具项目,它打开了AI原生操作系统的大门。未来我们可能会看到:

  • 老年人数字助手:子女远程配置任务,AI帮父母挂号、购物、视频通话。
  • 企业流程自动化:财务报销、数据录入、审批流转全部由AI完成。
  • 无障碍辅助:视障人士通过语音指令操控手机,提升生活质量。
  • 自动化测试:测试人员用自然语言描述用例,AI自动执行回归测试。

更重要的是,它是开源的。任何人都可以下载、修改、部署,构建属于自己的AI助理生态。


8. 总结

Open-AutoGLM 正在将“AI助手”的概念从“回答问题”升级为“执行任务”。它不再只是聊天机器人,而是一个能真正帮你做事的数字员工。

通过本文的部署指南和定时任务实践,你已经掌握了如何:

  • 搭建Open-AutoGLM运行环境
  • 连接手机并启动AI代理
  • 编写自动化脚本
  • 设置定时任务,打造24小时待命AI助理

下一步,你可以尝试:

  • 将多个任务组合成复杂流程
  • 接入企业内部系统,实现办公自动化
  • 为家人配置专属AI助手,解决实际生活难题

技术的价值在于改变生活。现在,轮到你来定义它的边界了。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/5 7:32:37

Obsidian个性化定制完全指南:打造专属知识管理神器

Obsidian个性化定制完全指南:打造专属知识管理神器 【免费下载链接】awesome-obsidian 🕶️ Awesome stuff for Obsidian 项目地址: https://gitcode.com/gh_mirrors/aw/awesome-obsidian 还在为Obsidian的默认界面感到单调乏味吗?想要…

作者头像 李华
网站建设 2026/2/5 7:36:54

zotero-style插件终极指南:打造智能文献管理新体验

zotero-style插件终极指南:打造智能文献管理新体验 【免费下载链接】zotero-style zotero-style - 一个 Zotero 插件,提供了一系列功能来增强 Zotero 的用户体验,如阅读进度可视化和标签管理,适合研究人员和学者。 项目地址: ht…

作者头像 李华
网站建设 2026/2/5 2:19:38

OpCore-Simplify:终极智能配置工具让系统部署变得如此简单

OpCore-Simplify:终极智能配置工具让系统部署变得如此简单 【免费下载链接】OpCore-Simplify A tool designed to simplify the creation of OpenCore EFI 项目地址: https://gitcode.com/GitHub_Trending/op/OpCore-Simplify OpCore-Simplify是一款革命性的…

作者头像 李华
网站建设 2026/2/5 9:40:59

TurboDiffusion未来演进方向:长视频生成技术预研分析

TurboDiffusion未来演进方向:长视频生成技术预研分析 1. TurboDiffusion核心能力与现状回顾 1.1 高效视频生成的技术突破 TurboDiffusion是由清华大学、生数科技与加州大学伯克利分校联合研发的视频生成加速框架,其最大亮点在于将传统扩散模型的推理速…

作者头像 李华