news 2026/2/3 2:05:08

Playwright02-CDP

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Playwright02-CDP

Playwright02-CDP

playwright自动化开发记录,学习BrowserUse的时候涉及到playwright和udp-use的知识点


1-核心知识点

  • 1-运行playwright第一个demo

2-参考网址

  • 1-用Playwright实现接口自动化测试:https://www.cnblogs.com/wzzkaifa/p/19113578
  • 2-playwright开源仓库:https://github.com/microsoft/playwright

3-动手实操

1-UV环境搭建

# 1-uv环境搭建uv python pin3.11.4 uv init python_playwright&&cdpython_playwright uv venv&&source.venv/bin/activate uvaddpython-dotenv pydantic playwright# 2-安装playwright-刷新应用uvaddplaywrightsource.venv/bin/activate# 3-playwright安装chromium(当前只安装了chrome浏览器)playwrightinstallchromium

2-CDP接口开发

cdp-use是一个为 Chrome DevTools Protocol(CDP)生成的类型安全 Python 客户端库


方案 A:完全交给 Playwright

不关心真实 WebSocket 地址,只拿到“默认上下文里已有的页面”

importtimefromplaywright.sync_apiimportsync_playwrightwithsync_playwright()asp:# 1. 启动浏览器,并强制开启远程调试端口browser=p.chromium.launch(headless=False,args=["--remote-debugging-port=9222"]# 开启 CDP 端口)# 2. 新建标签页page=browser.new_page()# 3. 打开目标网址web_url="https://www.baidu.com/"try:# 设置更长的超时时间,并添加异常处理page.goto(web_url,timeout=60000)print("浏览器 成功打开浏览器:",web_url)exceptExceptionase:print(f"页面加载失败:{e}")browser.close()exit(1)# 4. 简单等待,方便肉眼观察time.sleep(3)# 5. 直接通过 playwright 自己的连接拿到同一浏览器try:browser2=p.chromium.connect_over_cdp("http://localhost:9222")browser_contexts=browser2.contexts[0]print("=======browser_contexts响应数据结构========")print(browser_contexts)print("=======browser_contexts响应数据结构========\n")default_ctx_page=browser_contexts.pages[0]# 默认上下文里已有的页面print("默认页面标题:",default_ctx_page.title())# 5. 关闭browser2.close()exceptExceptionase:print(f"连接到CDP时出错:{e}")finally:browser.close()

运行结果示例:

已连接到 pydev 调试器(内部版本号 231.9225.15)浏览器 成功打开浏览器: https://www.baidu.com/ =======browser_contexts响应数据结构======== <BrowserContext browser=<Browser type=<BrowserType name=chromium executable_path=/Users/rong/Library/Caches/ms-playwright/chromium-1194/chrome-mac/Chromium.app/Contents/MacOS/Chromium> version=141.0.7390.37>> =======browser_contexts响应数据结构========

方案 B:Playwright 控制+WebSocket 地址

既要 Playwright 控制,也要“真实的 WebSocket 地址”

importjsonimporttimeimportrequestsfromplaywright.sync_apiimportsync_playwrightwithsync_playwright()asp:# 1. 启动浏览器,并强制开启远程调试端口browser=p.chromium.launch(headless=False,args=["--remote-debugging-port=9222"]# 开启 CDP 端口)# 2. 新建标签页page=browser.new_page()# 3. 打开目标网址web_url="https://www.baidu.com/"try:# 设置更长的超时时间,并添加异常处理page.goto(web_url,timeout=60000)print("浏览器 成功打开浏览器:",web_url)exceptExceptionase:print(f"页面加载失败:{e}")browser.close()exit(1)# 4. 简单等待,方便肉眼观察time.sleep(3)# 5. 自己取一次 /json/version 拿到 webSocketDebuggerUrltry:resp=requests.get("http://localhost:9222/json/version",timeout=5)print("=======json_version响应数据结构========")print(json.dumps(resp.json(),indent=2,ensure_ascii=False))print("=======json_version响应数据结构========\n")ws_url=resp.json()["webSocketDebuggerUrl"]print("浏览器 WebSocket 地址:",ws_url)# 如果还想继续用 playwright 操纵同一浏览器browser2=p.chromium.connect_over_cdp("http://localhost:9222")default_page=browser2.contexts[0].pages[0]print("默认页面标题:",default_page.title())browser2.close()exceptrequests.exceptions.RequestExceptionase:print(f"无法连接到调试地址:{e}")exceptExceptionase:print(f"处理调试连接时出错:{e}")finally:browser.close()

运行结果示例:

已连接到 pydev 调试器(内部版本号 231.9225.15)浏览器 成功打开浏览器: https://www.baidu.com/ =======json_version响应数据结构======== { "Browser": "Chrome/141.0.7390.37", "Protocol-Version": "1.3", "User-Agent": "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/141.0.0.0 Safari/537.36", "V8-Version": "14.1.146.11", "WebKit-Version": "537.36 (@9f043f63b0e5b728c8d09f3e3ddfc1681a4bd58e)", "webSocketDebuggerUrl": "ws://localhost:9222/devtools/browser/27e882e5-8999-4a81-8d1f-9092e6698d61" } =======json_version响应数据结构======== 浏览器 WebSocket 地址: ws://localhost:9222/devtools/browser/27e882e5-8999-4a81-8d1f-9092e6698d61 默认页面标题: 百度一下,你就知道

至此,你既拿到了“真实的 CDP WebSocket 地址”,也通过 Playwright 取得了“默认上下文里已有的页面”。


版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/2 6:25:27

军事图像分类检测数据集介绍-351张图片 军事身份识别 安全检查辅助 智能监控系统 军事训练分析 历史军事影像分析

&#x1f4e6;点击查看-已发布目标检测数据集合集&#xff08;持续更新&#xff09; 数据集名称图像数量应用方向博客链接&#x1f50c; 电网巡检检测数据集1600 张电力设备目标检测点击查看&#x1f525; 火焰 / 烟雾 / 人检测数据集10000张安防监控&#xff0c;多目标检测点…

作者头像 李华
网站建设 2026/1/30 3:18:39

人机环境系统智能是新理科与新文科的融点

人机环境系统智能&#xff08;Human-Machine-Environment System Intelligence, HME-SI&#xff09;是新理科与新文科的核心融点&#xff0c;其本质是通过人、机、环境的三元交互&#xff0c;实现科学逻辑性与人文非逻辑性的动态平衡&#xff0c;为新理科&#xff08;强调技术、…

作者头像 李华
网站建设 2026/1/31 2:25:30

UE5 材质-22:

&#xff08;96&#xff09; &#xff08;97&#xff09; 谢谢

作者头像 李华
网站建设 2026/2/2 2:03:34

WebRTC 中的临界锁实现:从 CritScope 到 RAII 机制的深度解析

WebRTC 中的临界锁实现&#xff1a;从 CritScope 到 RAII 机制的深度解析 本文所有源码均基于 WebRTC M85 (branch-heads/4183) 版本进行分析。 一、引言&#xff1a;一行"什么都没做"的代码 在阅读 WebRTC 源码时&#xff0c;你可能经常会看到类似这样的代码&#…

作者头像 李华