news 2026/6/23 23:18:43

Python 3.10.5使用lxml库的xpath用法

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
Python 3.10.5使用lxml库的xpath用法

网上的都太旧了,所以把这个能用的给发出来了

""" 1.导入lxml 2.将获取到的网页内容转换为xml 3.通过Xpath来定位和解析页面中的内容 """ from lxml import html import re # 读取 HTML 文件 with open("douban.html", "r", encoding="utf-8") as f: page = f.read() # 解析 HTML tree = html.fromstring(page) # 先构建解析树(Element对象) titles=tree.xpath("//*[@class='title'][1]/text()") # 解析树调用xpath,正确! print(titles) rating_num=tree.xpath("//*[@class='rating_num'][1]/text()") print(rating_num) year=tree.xpath('//*[@id="content"]/div/div[1]/ol/li[3]/div/div[2]/div[2]/p[1]/text()') for item in year: # print(item.strip().search("")) numbers = re.findall(r'\d+', item.strip()) print(numbers) print("******************************") #定位到包含所有数据内容的元素 data_list=tree.xpath('//ol/li') #对定位到包含所有元素的列表便可遍历,得到包含单条数据的元素 for i in data_list: #提取单条数据中的详细内容 titles=i.xpath(".//span[@class='title'][1]/text()") score=i.xpath(".//span[@class='rating_num'][1]/text()") number=i.xpath(".//div/div[2]/div[2]/div/span[4]/text()") print('电影的名称',titles[0],score[0],'评价人数',number[0])
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 18:56:30

Langchain-Chatchat如何设置问答结果的置信度显示?

Langchain-Chatchat 如何设置问答结果的置信度显示? 在企业级智能问答系统日益普及的今天,一个关键问题逐渐浮现:我们如何判断模型给出的答案是否可信?尤其是在使用大语言模型(LLM)处理私有知识库时&#x…

作者头像 李华
网站建设 2026/6/23 18:55:55

33、Windows 8使用指南:系统升级、数据迁移与常用术语解析

Windows 8使用指南:系统升级、数据迁移与常用术语解析 1. Windows 8安装与升级要点 在安装Windows 8之前,有几个关键要点需要注意: - 确保了解Windows 8的系统要求,并拥有有效的产品密钥。 - 若要创建与其他Windows版本的双启动设置,应最后安装Windows 8。 - 可以从W…

作者头像 李华
网站建设 2026/6/22 19:38:44

Langchain-Chatchat支持多模态输入吗?图像理解进展

Langchain-Chatchat 的图像理解之路:多模态输入支持现状与演进路径 在企业知识管理日益复杂的今天,文档不再只是密密麻麻的文字。一张网络拓扑图可能抵得上千言万语,一份带批注的流程截图往往承载着关键决策逻辑。然而,当我们将这…

作者头像 李华
网站建设 2026/6/23 16:13:09

SenseGlove R1外骨骼手套专为机器人遥操作设计

SenseGlove在远程操控人形机器人的领域带来了全新产品SenseGlove R1 触觉手套。它专为实现人形机器人手的无缝控制精心打造,集主动力反馈、精准力控制、毫米级手指跟踪精度以及振动触觉反馈等众多先进一身,为遥操作带来前所未有的触觉感知体验&#xff0…

作者头像 李华
网站建设 2026/6/23 16:13:02

Langchain-Chatchat如何实现问答结果的语音播报?

Langchain-Chatchat 如何实现问答结果的语音播报 在智能助手日益普及的今天,用户对交互方式的要求早已不再局限于“看”——越来越多的场景需要我们能“听”到答案。尤其是在工厂巡检、车载系统、老年服务等不方便盯着屏幕的环境中,语音播报已经成为提升…

作者头像 李华
网站建设 2026/6/23 16:13:10

67、Windows 7 磁盘管理与维护:压缩、加密与日常保养

Windows 7 磁盘管理与维护:压缩、加密与日常保养 1. 镜像恢复基础操作 在进行镜像恢复操作时,要保证原始镜像集拥有之前分配给完整镜像的驱动器号。若没有,需分配合适的驱动器号。接着,右键点击原始系统卷,选择“添加镜像”来重新创建镜像。最后,检查启动配置,确保在启…

作者头像 李华