news 2026/6/23 16:30:31

【Python新手村】集合(Set):一个强迫症晚期的“去重大师”

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【Python新手村】集合(Set):一个强迫症晚期的“去重大师”

Python 集合(Set):一个强迫症晚期的“去重大师”

哈喽,各位 Python 探险家!

前面我们认识了列表(什么都装的收纳箱)和元组(上了锁的保险箱)。 今天,我们要介绍一位性格非常古怪的朋友——集合 (Set)

如果说列表是排得整整齐齐的队伍,那集合就是一个大麻袋。 往里一倒,顺序全乱,而且它有个严重的“洁癖”:绝对容不下重复的东西!

如果你给他一堆“张三、李四、张三”,他会冷酷地把第二个张三踢出去,只留下一个。 这就是集合,一个莫得感情的去重机器

1. 它是何方神圣?(创建集合)

集合和字典(Dictionary)长得很像,都戴着花括号{}。但字典是“键值对”,集合只有“值”。

# 创建一个集合 # Python: "我不喜欢重复,也不喜欢排队" my_set = {1, 2, 3, 3, 3, 4} print(my_set) # 输出: {1, 2, 3, 4} 看到没?多余的 3 全没了!

新手必踩的大坑:空集合陷阱

如果你想创建一个空集合,你可能会下意识地写:

empty_thing = {} # 错!大错特错! print(type(empty_thing)) # 输出: <class 'dict'> 居然是个字典?

为什么?因为 Python 的字典出道比集合早,{}这个符号早就被字典占用了。正确写法:必须使用set()工厂函数。

real_empty_set = set() # 这才是正宗的空集合

2. 它的脾气:无序且任性

在列表里,你可以说“我要第 0 个元素”。 在集合里?没门!

s = {"香蕉", "苹果", "西瓜"} # print(s[0]) # 报错: TypeError: 'set' object is not subscriptable

翻译成人话:集合里的东西是无序的,就像麻袋里的土豆,谁在前谁在后全看天意(其实是看哈希值,后面细说)。既然没有顺序,自然就没有索引。

3. 核心绝技:一键去重

这是集合在面试和实战中出现率 99% 的场景。 比如你有一个列表,里面有很多重复的用户 ID,你想去重,怎么办?

普通青年:写个 for 循环,一个个判断...(太累了)Python 青年:

id_list = [101, 102, 101, 103, 102] # 一行代码搞定去重:列表 -> 集合 -> 列表 unique_ids = list(set(id_list)) print(unique_ids) # [101, 102, 103]

简单、粗暴、有效。

4. 隐藏技能:数学课代表 (集合运算)

还记得小学数学学的交集、并集、差集吗?(如果不记得了,请假装记得)。 Python 的集合天生就是做这个的,语法简洁到让你想哭。

假设你有两波朋友:

  • A波朋友喜欢吃火锅:hotpot_lovers = {"张三", "李四", "王五"}

  • B波朋友喜欢吃烧烤:bbq_lovers = {"李四", "赵六", "钱七"}

场景 1:既吃火锅又吃烧烤的(交集 &)也就是找共同好友。

# 这里的 & 就像两只手握在一起 print(hotpot_lovers & bbq_lovers) # 输出: {'李四'}

场景 2:吃火锅或者吃烧烤的(并集 |)大家聚在一起开大趴体。

# 这里的 | 就像一根棍子把两边连起来 print(hotpot_lovers | bbq_lovers) # 输出: {'张三', '王五', '李四', '赵六', '钱七'} (自动去重了李四)

场景 3:只吃火锅不吃烧烤的(差集 -)要把那些“叛徒”剔除出去。

# 就像数学减法一样自然 print(hotpot_lovers - bbq_lovers) # 输出: {'张三', '王五'} (李四因为吃烧烤被踢除了)

5. 增删改:小心翼翼的操作

  • 加人add()

  • 踢人remove()vsdiscard()

这里有个很有意思的区别:

s = {1, 2, 3} s.remove(4) # 报错!KeyError。remove 脾气暴躁,删不到就炸毛。 s.discard(4) # 没事。discard 很佛系,有就删,没有就算了。

建议:除非你明确知道元素一定存在,否则用discard()更安全,不容易让程序崩掉。

6. 个人理解:为啥集合查东西特别快?

这是进阶干货! 你可能会问:“既然列表能存东西,集合也能存,除了去重,集合还有啥用?”

答案是:速度。

想象一下你去图书馆找书:

  • 列表(List):就像把书乱堆在地上。你要找一本书,得从头一本本翻,运气不好要翻到最后。(时间复杂度 O(n))

  • 集合(Set):就像有索引系统的书架。每本书都有固定的位置(通过哈希算法计算)。你要找一本书,算一下它的哈希值,直接走到那个位置。有就是有,没有就是没有,不用翻别人。(时间复杂度 O(1))

所以,如果你需要频繁判断if x in data,请务必把data转成集合!速度提升不是一点半点。

总结

Python 的集合 (Set) 是一个特立独行的家伙:

  • 样子是花括号{},但空集合要用set()

  • 性格是容不下重复(去重神器)。

  • 特长是数学运算(交、并、差)。

  • 本质是哈希表(查找速度极快)。

下次遇到“去重”或者“找共同好友”的需求,别犹豫,召唤集合吧!

觉得这篇有意思?点个赞是对“强迫症”作者最好的治愈!(。♥‿♥。)

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/6/23 4:18:21

Excel如何快速求出排名第一、第二、第N的对应数据?必备高频函数

在Excel中求一列数据中的最大值和最小值的操作方法很简单,只需要两个函数轻松搞定。MAX求单元格区域内数值的最大值,MIN求单元格区域内数值的最小值。 具体用法通过一个实例讲解一下。现在要求工作表中工资列C:C中的最高工资和最低工资。 在最高工资对应的单元格中输入函数“…

作者头像 李华
网站建设 2026/6/23 17:57:31

vue和springboot框架开发的群众网上高效办事系统的设计与实现_6e4j9xi1

文章目录具体实现截图主要技术与实现手段关于我本系统开发思路java类核心代码部分展示结论源码lw获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;具体实现截图 同行可拿货,招校园代理 vuespringboot_6e4j9xi1 框架开发的群众网上高效办…

作者头像 李华
网站建设 2026/6/23 17:56:25

飞算JavaAI自然语言直出全流程代码,告别无效加班

深夜加班场景中&#xff0c;屏幕强光常让人眼睛发涩。面对数据库表设计文档和接口规范反复梳理时&#xff0c;常会心生烦躁&#xff1a;明明是基础功能开发&#xff0c;却要配套完成框架搭建、依赖配置等一系列繁琐工作。加班时的咖啡罐堆积&#xff0c;是不少Java开发者的常态…

作者头像 李华
网站建设 2026/6/23 10:17:27

蓝桥杯JAVA--启蒙之路(三)语句

一前言今天依旧更新有关JAVA基础的知识&#xff0c;唉。自从更新JAVA之后浏览量什么的都下降了&#xff0c;可能是大家也不喜欢这么枯燥的基础学习吧&#xff0c;但是基础还是很重要的&#xff0c;明天和后天可能会停更&#xff0c;因为我要回家了。二主要内容if条件判断&#…

作者头像 李华
网站建设 2026/6/21 21:53:37

金融级情绪识别模型训练全攻略(基于千万级对话数据的优化经验)

第一章&#xff1a;金融客服Agent情绪识别的技术背景与业务价值 在金融服务领域&#xff0c;客户与客服代理&#xff08;Agent&#xff09;之间的交互质量直接影响用户满意度与品牌信任度。随着人工智能技术的发展&#xff0c;尤其是自然语言处理与语音情感分析的进步&#xff…

作者头像 李华
网站建设 2026/6/23 17:45:51

计算机系统基础 bufbomb 实验三

听报告无事&#xff0c;顺手写下做过的实验报告,话不多说&#xff0c;开始正文1、实验目的加深对IA-32函数调用规则和栈帧结构的理解。2、实验原理对目标程序实施缓冲区溢出攻击&#xff0c;通过造成缓冲区溢出来破坏目标程序的栈帧结构&#xff0c;继而执行一些原来程序中没有…

作者头像 李华