一、问题现象(附报错日志上下文):
使用单张昇腾300I Duo显卡可以正常运行DeepSeek14B模型,但当使用双卡配置时,出现了错误,报内存溢出和卡之间通讯问题
二、软件版本:
-- MindIE 版本 :1.0.0-300I-Duo-py311-openeuler24.03-lts
--操作系统版本 :openeuler22.03LTS
三、测试步骤:
四、日志信息:
[ERROR] RUNTIME(9925,python3):2025-04-09-11:20:21.760.603 [npu_driver.cc:1274]9925 DevMemAllocManaged:[INIT][DEFAULT][drv api] halMemAlloc failed:size=32(Byte), type=17, moduleId=3, drvFlag=216172782156776451, drvRetCode=