news 2026/1/10 7:22:50

ceph中的crush map

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
ceph中的crush map

当集群系统变得复杂时,我们往往需要多种策略来存放不同类型的数据;例如,将热数据存放于SSD中,而将冷数据放在HDD中。CRUSH rule就是定义了一种选择策略,Ceph中每个逻辑池都必须对应一条合法的rule才能正常工作。还是以上面链接中的crushmap为例,分析一下rule的具体含义。

1rule replicated_ruleset{2ruleset03typereplicated4min_size15max_size106step take default7step chooseleaf firstn0typehost8step emit9}
  • Line 1-2: rule的名称和编号
  • Line 3: rule类型;replicated代表适用于副本池,erasure代表适用于EC池
  • Line 4-5: rule适用的池size大小;本例表示1副本到10副本的池均可采用此条rule
  • Line 6-9: 具体的选择步骤
    • take: 直接选中一项item,一般用于指定选择算法的起点;本例中名为default的root类型bucket即为起点
    • chooseleaf firstn 0 type host: 选择策略,这个是重点,后面细述
    • emit: 返回结果

<1>: choose/chooseleaf

  • choose表示选择结果类型为故障域(由<4>指定)
  • chooseleaf表示在确定故障域后,还必须选出该域下面的OSD节点(即leaf)

<2>: firstn/indep

  • firstn: 适用于副本池,选择结果中rep(replica,指一份副本或者EC中的一个分块,下同)位置无明显意义
  • indep: 适用于EC池,选择结果中rep位置不可随意变动

举例来说,副本池中每份副本保存的是完全相同的数据,因此选择结果为[0, 1, 2](数字代表OSD编号)与[0, 2, 1]并无大的不同。但是EC池不一样,在2+1的配比下前两份是数据块,最后一份是校验块,后两份rep位置一交换就会导致数据出错。

<3>: num_reps

这个整数值指定需要选择的rep数目,可以是正值负值或0。

  • 正整数值即代表要选择的副本数,非常直观
  • 0表示的是与实际逻辑池的size相等;也就是说,如果2副本池用了这个rule,0就代表了2;如果3副本池用了此rule,0就相当于3
  • 负整数值代表与实际逻辑池size的差值;如果3副本池使用此rule将该值设为了-1,那边该策略只会选择出2个reps

<4>: failure domain

指定故障域类型;CRUSH确保同一故障域最多只会被选中一次。

step take default step choose firstn3typehost step choose firstn1typeosd step emit

新增的一步会在上述基础上,再以每个选中的host为起点,在host下选择1个OSD。另一个更方便的方案是:

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/3 11:18:34

Windows Precision触控板驱动:让Apple触控板在Windows上完美运行

Windows Precision触控板驱动&#xff1a;让Apple触控板在Windows上完美运行 【免费下载链接】mac-precision-touchpad Windows Precision Touchpad Driver Implementation for Apple MacBook / Magic Trackpad 项目地址: https://gitcode.com/gh_mirrors/ma/mac-precision-t…

作者头像 李华
网站建设 2026/1/6 2:13:23

被这6个UI案例美到!兰亭妙微拆解:好设计真能救效率

做B端/C端界面设计16年的兰亭妙微&#xff0c;最近拆解了这些案例——原来“好看又好用”的界面&#xff0c;都藏着“精准匹配用户需求”的小心机&#xff01;&#x1f331; C端植物工具&#xff08;Zolve&#xff09;&#xff1a;叶片动态扫描实时数据可视化&#xff0c;连养花…

作者头像 李华
网站建设 2025/12/31 19:52:24

自动驾驶紧急制动失效案例复盘(罕见故障模式首次公开)

第一章&#xff1a;自动驾驶紧急制动失效案例复盘&#xff08;罕见故障模式首次公开&#xff09;在一次高优先级的安全审计中&#xff0c;某L4级自动驾驶系统暴露了一例罕见的紧急制动失效事件。该故障发生在夜间低光照条件下&#xff0c;车辆在检测到前方突然出现的障碍物后未…

作者头像 李华
网站建设 2025/12/28 21:48:23

为什么你的PL-600 Agent总是失联?答案全藏在日志的这3个关键区域!

第一章&#xff1a;MCP PL-600 Agent 日志分析的核心价值在现代企业IT运维体系中&#xff0c;MCP PL-600 Agent 作为关键的监控与数据采集组件&#xff0c;其生成的日志文件蕴含着系统运行状态、性能瓶颈和异常行为的深层信息。对这些日志进行系统化分析&#xff0c;不仅能实现…

作者头像 李华
网站建设 2026/1/7 2:33:43

MCP量子认证2024更新全记录,IT从业者必看的技术风向标

第一章&#xff1a;MCP量子认证2024更新概览 2024年&#xff0c;微软认证计划&#xff08;Microsoft Certified Program, MCP&#xff09;对量子计算相关认证体系进行了全面升级&#xff0c;旨在适配日益增长的量子软件开发与云平台集成需求。此次更新聚焦于开发者能力模型重构…

作者头像 李华