| 模型 | ScreenSpot-Pro | Android World |
| gelab-zero-4b | 68 | 75.8 |
| UI-TARS-1.5 | 61.6 | 64.2 |
| UI-TARS-1.5-7b | 49.6 | |
| UI-TARS-2 | 73.3 | |
| AutoGLM-Phone-9B | 在7款常见安卓APP(微信、美团、淘宝、大众点评、高德地图、小红书、12306)的高频任务上,其成功率达到了89.7% | |
| Qwen3-VL-8B-Instruct | 54.6 | 47.6 |
| Qwen3-VL-4B-Instruct | 59.5 | 45.3 |
各模型GUI Agent能力比对
张小明
前端开发工程师
Git删除过去分支(如删除23年及之前的分支)
下面这个shell清理23年及之前的分支,在清理之前将分支显示在"branch_dates.txt"文件中 #!/bin/bashecho "开始获取远程分支的创建时间信息..."# 获取所有远程分支 branches$(git branch -r | grep -v HEAD | sed s/origin\///)# 临时文件存储分支信息 tem…
AB测试:数据驱动决策的科学与艺术
引言:从直觉到数据的决策革命在互联网产品开发中,我们曾经常陷入无休止的争论:”这个按钮应该是红色还是蓝色?”、”注册流程是三步好还是五步好?”、”新算法真的提升用户体验了吗?“。这些曾经依赖主观判…
零基础学会用vue-qrcode制作第一个二维码
快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个适合Vue初学者的二维码生成教程项目,要求:1. 从零开始搭建Vue项目 2. 逐步讲解vue-qrcode的安装和使用 3. 实现一个最简单的二维码生成demo 4. 包含…
foreach vs for循环:大数据量下的性能对比实验
快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 创建一个性能对比测试工具,能够自动生成并执行foreach和传统for循环的对比测试。功能包括:1) 支持多种语言(Java/C#/JavaScript) 2) 可设置测试数据规模(1K-…
3.9 Elasticsearch-跨集群搜索(CCS)与跨集群复制(CCR)
3.9 Elasticsearch-跨集群搜索(CCS)与跨集群复制(CCR) 1. 功能定位 CCS(Cross-Cluster Search):把查询请求同时发往本地与远程集群,结果聚合后统一返回,解决“数据分散、…
用NATS+AI快速构建物联网数据采集原型
快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个物联网数据采集系统原型,使用NATS处理设备上报的传感器数据。要求实现设备注册、数据收集、实时监控和异常报警功能。前端使用Vue.js展示实时数据仪表盘&#x…