news 2026/3/10 23:13:03

用Open-AutoGLM实现抖音自动关注,全过程分享

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
用Open-AutoGLM实现抖音自动关注,全过程分享

用Open-AutoGLM实现抖音自动关注,全过程分享

1. 这不是脚本,是真正能“看懂屏幕”的手机AI助手

你有没有试过在深夜刷抖音时,突然看到一个特别合胃口的博主,想点关注却懒得抬手?或者运营多个账号时,每天重复点击“关注”按钮上百次,手指发酸、效率低下?又或者,你正为一款新App做自动化测试,却卡在“如何让程序理解UI界面并精准点击”这一步?

别再写一堆脆弱的坐标点击脚本了。Open-AutoGLM不是传统意义上的自动化工具——它不靠硬编码坐标,不靠固定ID识别,而是像人一样“看”屏幕、“听”指令、“想”步骤、“动”手指。

它基于智谱开源的AutoGLM-Phone模型,是一个真正的多模态手机智能体框架。你只需要说一句:“打开抖音搜索抖音号为:dycwo11nt61d 的博主并关注他!”,它就能自动完成:启动App → 点击搜索框 → 输入ID → 点击搜索结果 → 滑动找到目标账号 → 点击关注按钮 → 确认操作。整个过程无需你干预,也不依赖App内部结构是否变化。

这不是概念演示,而是已在真实安卓设备上稳定运行的工程方案。本文将带你从零开始,不跳过任何一个关键细节,亲手部署、连接、验证,并最终跑通这个“抖音自动关注”全流程。所有操作均基于官方镜像和开源代码,不涉及任何黑盒服务或付费API。

2. 为什么这次能真正落地?三个关键突破点

2.1 它真的“看得见”,而不是“猜得着”

传统ADB自动化(比如Appium)依赖UI层级树或XPath定位元素,一旦App更新、按钮ID变更、布局微调,整套脚本就失效。而Open-AutoGLM的核心能力在于视觉语言理解

每次执行前,它会通过ADB自动截取当前手机屏幕,将这张图连同你的自然语言指令一起送入视觉语言模型。模型不仅识别出“这是抖音首页”,还能精准定位“搜索图标在右上角第3个图标”、“关注按钮在头像右侧,文字为‘关注’且背景为红色”。这种基于像素的理解,让它对UI变动天然免疫。

就像你朋友帮你操作手机:你告诉他“点右上角那个放大镜”,他不会去查代码里叫什么ID,而是直接看位置、看图标、看文字——Open-AutoGLM正是这样工作的。

2.2 指令是中文的,不是代码的

你不需要学Python、不用写if-else判断、更不用记ADB命令。所有交互都用最直白的中文:

  • “打开小红书,搜‘空气炸锅食谱’,点第一个笔记,保存图片”
  • “进微信,找到‘老板’,发消息‘方案已发邮箱,请查收’”
  • “打开设置,进Wi-Fi,关掉‘自动连接’开关”

这些句子就是完整指令。系统会自动拆解意图:先确定目标App → 再分析当前界面状态 → 推理下一步该点哪里 → 生成并执行ADB动作(tap/click/swipe/type)。你只负责“说需求”,它负责“想路径、走流程”。

2.3 安全机制到位,不怕误操作

自动点手机最怕什么?点错应用、误删数据、乱输密码。Open-AutoGLM内置了三层防护:

  1. 敏感操作确认:当检测到“删除”“卸载”“清除数据”“输入密码”等高危动作时,会主动暂停,等待你手动确认;
  2. 人工接管通道:遇到验证码、登录页、弹窗广告等模型无法可靠处理的场景,它会停止并提示“请人工处理”,你操作完后它继续执行;
  3. 远程调试支持:所有ADB操作都通过标准协议进行,你可以随时用adb logcat查看每一步执行日志,全程可审计、可追溯。

这意味着,你可以放心把它用在主力机上做日常辅助,而不仅是实验室里的玩具。

3. 准备工作:三步搞定硬件与环境

3.1 你的设备必须满足这些硬性条件

项目要求为什么重要验证方式
安卓手机Android 7.0(Nougat)及以上低版本系统缺少必要的ADB接口和权限管理能力设置 → 关于手机 → 查看“Android版本”
USB数据线支持数据传输(非仅充电线)很多百元内充电线无法传输数据,会导致adb devices无响应用线连接手机和电脑,若电脑未识别设备或手机不弹“允许调试”提示,大概率是充电线
电脑系统Windows 10/11、macOS 10.15+ 或 Ubuntu 20.04+旧系统可能缺少ADB兼容驱动或Python依赖命令行输入python --versionadb version测试
Python版本3.10 或 3.11(强烈推荐)项目依赖的vLLM和PyTorch在3.12上存在兼容问题python -c "import sys; print(sys.version)"

特别提醒:如果你用的是华为、小米、OPPO等国产机型,请务必在“开发者选项”中开启“USB调试(安全设置)”——很多用户卡在这一步,只开了“USB调试”但没开这个二级选项,导致ADB始终显示“unauthorized”。

3.2 ADB安装:一行命令解决(macOS/Linux)或三步配置(Windows)

macOS用户(推荐Homebrew):

# 若未安装Homebrew,先执行: /bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)" # 安装ADB brew install android-platform-tools # 验证 adb version # 应输出类似:Android Debug Bridge version 1.0.41

Ubuntu/Debian用户:

sudo apt update && sudo apt install -y android-tools-adb android-tools-fastboot adb version

Windows用户(免配置版):

  1. 访问 Google官方平台工具页面,下载platform-tools-latest-windows.zip
  2. 解压到一个简单路径,例如C:\adb不要放在中文路径或桌面
  3. 右键“此电脑”→属性→高级系统设置→环境变量→在“系统变量”中找到Path→编辑→新建→粘贴C:\adb
  4. 重启命令提示符,输入adb version验证

3.3 手机端设置:四步开启“被操控”权限

按顺序操作,缺一不可:

  1. 开启开发者模式:设置 → 关于手机 → 连续点击“版本号”7次 → 弹出“您现在是开发者”
  2. 开启USB调试:返回设置主菜单 → 找到“开发者选项” → 开启“USB调试”
  3. 开启USB调试(安全设置):在同一页面向下找,开启“USB调试(安全设置)”
  4. 安装ADB Keyboard(关键!)
    • 下载APK:curl -O https://github.com/senzhk/ADBKeyBoard/raw/master/ADBKeyboard.apk
    • 安装到手机:adb install ADBKeyboard.apk
    • 启用并设为默认:
      adb shell ime enable com.android.adbkeyboard/.AdbIME adb shell ime set com.android.adbkeyboard/.AdbIME

完成后,执行adb shell settings get secure default_input_method,输出应为com.android.adbkeyboard/.AdbIME。如果不是,请重做第4步。

4. 部署与连接:本地运行抖音关注全流程

4.1 克隆代码、安装依赖(5分钟搞定)

打开终端(macOS/Linux)或PowerShell(Windows),依次执行:

# 1. 克隆仓库 git clone https://github.com/zai-org/Open-AutoGLM cd Open-AutoGLM # 2. 创建并激活虚拟环境(强烈建议,避免污染全局Python) python3 -m venv venv source venv/bin/activate # macOS/Linux # Windows用户请执行:venv\Scripts\activate # 3. 升级pip并安装依赖 pip install --upgrade pip pip install -r requirements.txt pip install vllm # 用于本地运行模型(如使用云服务可跳过) pip install -e . # 4. 验证安装 python -c "from phone_agent import PhoneAgent; print(' 安装成功')"

如果最后输出 安装成功,说明基础环境已就绪。

4.2 连接手机:USB直连是最稳的选择

用数据线连接手机与电脑,手机屏幕弹出“允许USB调试吗?”→ 勾选“始终允许”→ 点击确定。

在终端中执行:

adb devices

正确输出应为:

List of devices attached 8A9X021234567890 device

如果显示unauthorized,请回到手机“开发者选项”→“撤销USB调试授权”→ 重新插拔USB线→ 再次授权。
如果显示空列表,请检查:USB线是否支持数据传输、是否开启了“USB调试(安全设置)”、是否在电脑上安装了对应手机品牌的USB驱动(华为/小米官网可下载)。

4.3 启动模型服务(两种方式任选)

方式一:使用云服务(推荐新手,免GPU,5分钟启动)

我们推荐使用Compshare算力平台提供的预置AutoGLM镜像。注册即送20元算力金,足够跑完本文全部流程。

  • 登录后,在镜像市场搜索autoglm-phone-9b,选择已预装vLLM的镜像启动
  • 启动后获取公网IP和映射端口(如http://118.193.200.100:8800/v1
  • 记下这个地址,后续--base-url参数就填它
方式二:本地运行(需RTX 3090/4090显卡)

如果你有高端显卡,可本地部署以获得更低延迟:

python3 -m vllm.entrypoints.openai.api_server \ --model zai-org/AutoGLM-Phone-9B-Multilingual \ --served-model-name autoglm-phone-9b-multilingual \ --port 8000 \ --max-model-len 25480 \ --mm-processor-cache-type shm \ --mm-processor-kwargs "{\"max_pixels\":5000000}"

等待终端出现Uvicorn running on http://0.0.0.0:8000即表示服务启动成功。
验证:curl http://localhost:8000/v1/models,应返回JSON格式的模型信息。

4.4 执行抖音自动关注:一条命令,全程见证

确保手机已解锁并停留在桌面(非锁屏状态),然后在Open-AutoGLM目录下执行:

python main.py \ --device-id 8A9X021234567890 \ --base-url http://118.193.200.100:8800/v1 \ # 替换为你的云服务地址 --model autoglm-phone-9b-multilingual \ "打开抖音App,搜索抖音号dycwo11nt61d,进入他的主页,点击关注按钮"

注意:--device-id值请替换为你自己手机的序列号(即adb devices输出的第一列)。如果只连一台设备,也可省略此参数。

你会看到终端实时输出:

  • 截图上传 → 模型分析界面 → 识别出“抖音图标在桌面第2行第3列”
  • 执行点击 → 启动抖音 → 等待加载完成 → 截图 → 识别出“搜索框在顶部”
  • 执行点击 → 输入文字 → 截图 → 识别出“搜索结果列表” → 点击第一个
  • 截图 → 识别出“关注按钮在头像右侧” → 执行点击
  • 最终输出:任务完成:已成功关注抖音号 dycwo11nt61d

整个过程约45-90秒,取决于网络和模型响应速度。你可以全程看着手机自动操作,就像有个AI同事在帮你点。

5. 实战优化:让关注动作更稳、更快、更准

5.1 提升成功率的三条实操经验

  1. 指令要具体,避免模糊词
    ❌ 不推荐:“关注那个美食博主”
    推荐:“打开抖音,搜索抖音号dycwo11nt61d,进入主页,点击红色‘关注’按钮”
    原因:模型对ID、颜色、位置等具象信息识别最准,对“美食”“那个”等抽象描述易误判

  2. 首次运行前,手动打开一次抖音并登录
    自动化无法处理首次安装后的引导页、权限申请、登录流程。确保抖音已安装、已登录、已同意所有必要权限,模型才能专注在“搜索→关注”这一核心链路上。

  3. 为关键步骤加等待时间(可选)
    如果发现模型在App启动后立即截图,而界面还没加载完,可在指令中加入明确等待:
    "打开抖音App,等待3秒,搜索抖音号dycwo11nt61d..."
    模型会将“等待3秒”作为有效动作执行,大幅降低因加载延迟导致的识别失败。

5.2 故障排查:遇到问题,先看这三点

现象最可能原因快速解决
adb devices不显示设备USB调试未开启,或USB线仅充电重做3.3节手机设置;换一根数据线
模型返回“找不到搜索框”抖音首页未完全加载,或被开屏广告遮挡手动点掉开屏广告;指令开头加“等待2秒”
输入文字变成乱码或不显示ADB Keyboard未设为默认输入法执行adb shell ime set com.android.adbkeyboard/.AdbIME

如遇其他问题,启用详细日志模式重试:

python main.py --verbose --device-id YOUR_ID --base-url YOUR_URL "你的指令"

日志会清晰展示每一步的截图分析、动作决策和ADB执行结果,是调试的黄金依据。

6. 远不止关注:这个框架还能帮你做什么?

抖音关注只是冰山一角。Open-AutoGLM的本质是“把手机当画布,用语言当画笔”。以下是你今天就能尝试的真实场景:

  • 电商运营“打开淘宝,搜索‘iPhone 15手机壳’,按销量排序,取前5个商品,截图并保存到相册”
  • 内容分发“打开小红书,发布一篇笔记:标题‘周末咖啡馆探店’,正文见文件note.txt,配图用相册里最新一张”
  • 批量管理“打开微信,进入‘客户群’,逐个发送‘您好,这是本月新品目录’,跳过置顶群”
  • 测试工程师“打开我们的App,依次点击‘注册’→‘手机号登录’→输入13800138000→点击获取验证码→截图”

它的能力边界,取决于你指令的清晰度和手机当前所处的状态。没有预设脚本,没有硬编码逻辑,只有你和AI之间最自然的语言协作。

7. 总结:从“写代码控制手机”到“用说话控制手机”的范式转变

回顾整个过程,你其实只做了四件事:

  1. 给手机开个“开发者门禁”(开启USB调试)
  2. 给电脑装个“手机遥控器”(安装ADB)
  3. 找个“AI大脑”(云服务或本地模型)
  4. 说一句中文指令,然后看着它执行

没有复杂的UI自动化框架学习曲线,没有XPath语法折磨,没有坐标偏移的反复调试。Open-AutoGLM把移动自动化这件事,拉回到了最符合人类直觉的层面——用语言表达意图,由机器负责实现

它不承诺100%完美(毕竟真实世界有网络波动、App闪退、弹窗干扰),但在绝大多数标准化操作中,稳定性远超传统方案。更重要的是,它代表了一种新的可能性:未来,我们可能不再需要为每个App写一套自动化脚本,而是训练一个通用的“手机操作AI”,用自然语言驱动所有数字生活。

你现在拥有的,不仅是一个抖音关注工具,而是一把打开手机自动化新世界的钥匙。接下来,你想让它帮你做什么?欢迎在评论区写下你的第一条指令。


获取更多AI镜像

想探索更多AI镜像和应用场景?访问 CSDN星图镜像广场,提供丰富的预置镜像,覆盖大模型推理、图像生成、视频生成、模型微调等多个领域,支持一键部署。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/3/8 20:13:16

一文说清树莓派4b引脚功能图与GPIO对应关系

以下是对您提供的博文内容进行 深度润色与专业重构后的版本 。我以一位深耕嵌入式系统多年、常年带团队做边缘AI硬件集成的工程师视角重写全文,彻底去除模板化表达和AI腔调,强化技术逻辑链条、实战经验沉淀与教学节奏感。全文无“引言/概述/总结”等刻…

作者头像 李华
网站建设 2026/3/8 17:03:56

树莓派4b模拟信号采集入门必看指南

以下是对您提供的博文内容进行 深度润色与结构重构后的技术指南 。整体风格更贴近一位经验丰富的嵌入式工程师在技术社区中自然、真诚、有温度的分享—— 去AI痕迹、强逻辑流、重实战感、轻说教味 ,同时严格遵循您提出的全部优化要求(如:…

作者头像 李华
网站建设 2026/3/10 20:25:17

Doubao系列的详细讨论 / Detailed Discussion of the Doubao Series

Doubao系列的详细讨论 / Detailed Discussion of the Doubao Series引言 / IntroductionDoubao系列是字节跳动(ByteDance)研发的领先大型语言模型(LLM)家族,自2023年问世以来,成为中国人工智能领域迅猛发展…

作者头像 李华
网站建设 2026/3/9 1:45:08

实战分享|基于PyTorch-2.x镜像快速搭建图像分类训练环境

实战分享|基于PyTorch-2.x镜像快速搭建图像分类训练环境 1. 为什么你需要一个“开箱即用”的PyTorch训练环境? 你是否经历过这样的场景: 刚下载好数据集,兴致勃勃打开终端准备跑第一个训练脚本,结果卡在了第一步——…

作者头像 李华
网站建设 2026/3/8 1:25:44

Windows用户看过来,Open-AutoGLM环境变量配置教程

Windows用户看过来,Open-AutoGLM环境变量配置教程 你是不是也试过在Windows电脑上配ADB,结果卡在“adb不是内部或外部命令”这一步?明明下载了Android SDK平台工具,解压完双击adb.exe能运行,可一打开命令行就报错——…

作者头像 李华
网站建设 2026/3/7 9:23:34

用Unsloth做项目:如何将微调模型集成到实际应用中

用Unsloth做项目:如何将微调模型集成到实际应用中 你刚用Unsloth微调完一个Qwen1.5模型,训练日志跑得飞快,显存占用比以前低了一大截——但接下来呢?模型文件躺在output目录里,怎么让它真正“活”起来,变成…

作者头像 李华