news 2026/7/4 8:02:01

CANN/ge LLM集群连接API

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
CANN/ge LLM集群连接API

# link_clusters

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

产品支持情况

  • Atlas A3 训练系列产品/Atlas A3 推理系列产品:支持
  • Atlas A2 推理系列产品:支持
  • Atlas A2 训练系列产品:不支持

函数功能

由Client单侧发起建链。由于动态扩缩的部分大部分是Decode侧,因此将P定义为Server端,D定义为Client端,建链过程实现由D向P发起建链的流程。

函数原型

link_clusters(clusters: Union[List[LLMClusterInfo], Tuple[LLMClusterInfo]], timeout=3000)

参数说明

参数名称数据类型取值说明
clustersUnion[List[LLMClusterInfo], Tuple[LLMClusterInfo]]集群列表。
timeoutint超时时间,单位:ms,默认超时时间3000ms。

调用示例

from llm_datadist import LLMDataDist, LLMRole, LLMStatusCode, LLMClusterInfo llm_datadist = LLMDataDist(LLMRole.DECODER, 0) cluster = LLMClusterInfo() cluster.remote_cluster_id = 1 cluster.append_local_ip_info("1.1.1.1", 26000) cluster.append_remote_ip_info("1.1.1.1", 26000) ret, rets = llm_datadist.link_clusters([cluster], 5000) if ret != LLMStatusCode.LLM_SUCCESS: raise Exception("link failed.") for cluster_i in range(len(rets)): link_ret = rets[cluster_i] if link_ret != LLMStatusCode.LLM_SUCCESS: print(f"{cluster_i} link failed.")

返回值

正常情况下返回两个值的元组,第一个值是接口的返回值,类型是LLMStatusCode,第二个是每个集群建链结果的列表,类型是LLMStatusCode。

参数错误可能抛出TypeError或ValueError。

约束说明

  • 建链的要求如下。建链数量过多存在内存OOM及KV Cache传输的性能风险。

    • Server侧(P侧)并发建链的数量=16,允许创建的最大通信数量=512。
    • Client侧(D侧)允许创建的最大通信连接数量=512。
  • 建议超时时间配置200ms以上。

  • 只有Client发起调用

【免费下载链接】geGE(Graph Engine)是面向昇腾的图编译器和执行器,提供了计算图优化、多流并行、内存复用和模型下沉等技术手段,加速模型执行效率,减少模型内存占用。 GE 提供对 PyTorch、TensorFlow 前端的友好接入能力,并同时支持 onnx、pb 等主流模型格式的解析与编译。项目地址: https://gitcode.com/cann/ge

创作声明:本文部分内容由AI辅助生成(AIGC),仅供参考

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/4 7:59:14

为什么选择ampy?探索MicroPython串口工具的5大优势

为什么选择ampy?探索MicroPython串口工具的5大优势 【免费下载链接】ampy MicroPython Tool - Utility to interact with a MicroPython board over a serial connection. 项目地址: https://gitcode.com/gh_mirrors/am/ampy 在嵌入式开发的世界中&#xff0…

作者头像 李华
网站建设 2026/7/4 7:58:34

计算机毕业设计之springboot医院信息管理系统

医生预约,一直以来就是困扰医院提高服务水平的重要环节,特别是医疗水平高、门诊访问量高的综合型医院,门诊拥挤就成了普遍现象。因此,本文提出了医院信息管理系统。在线医生坐诊、医生咨询、咨询回复、预约信息,是借助…

作者头像 李华
网站建设 2026/7/4 7:57:18

终极AgentScope嵌入模型实战指南:3步构建高效语义检索系统

终极AgentScope嵌入模型实战指南:3步构建高效语义检索系统 【免费下载链接】agentscope Build and run agents you can see, understand and trust. 项目地址: https://gitcode.com/GitHub_Trending/ag/agentscope AgentScope嵌入模型(Embedding …

作者头像 李华
网站建设 2026/7/4 7:55:21

Livox-SDK2激光雷达开发完整教程:从安装到实战应用

Livox-SDK2激光雷达开发完整教程:从安装到实战应用 【免费下载链接】Livox-SDK2 Drivers for receiving LiDAR data and controlling lidar, support Lidar HAP and Mid-360. 项目地址: https://gitcode.com/gh_mirrors/li/Livox-SDK2 Livox-SDK2是为Livox激…

作者头像 李华
网站建设 2026/7/4 7:54:13

终极bCNC指南:如何用这款开源GRBL工具彻底改变你的CNC加工流程

终极bCNC指南:如何用这款开源GRBL工具彻底改变你的CNC加工流程 【免费下载链接】bCNC GRBL CNC command sender, autoleveler and g-code editor 项目地址: https://gitcode.com/gh_mirrors/bc/bCNC 你是否厌倦了CNC加工中的重复性错误和复杂操作&#xff1f…

作者头像 李华
网站建设 2026/7/4 7:51:45

FOC矢量控制在电动出行设备中的应用与优化

1. 项目概述电动出行设备正在经历从传统方波控制向FOC矢量控制的全面升级。作为从业12年的电机控制工程师,我亲历了这套大厂量产级FOC方案在电动滑板车、平衡车等设备上的完整落地过程。相比早期方案,这套基于GD32F150的方案将效率提升15%、转矩脉动降低…

作者头像 李华