news 2026/1/14 2:08:41

OpenCL Programming Model

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
OpenCL Programming Model


一、概述
OPenCL是用于异构平台编程矿机,包括CPU,GPU,FPGA,DSP,AI加速器等。

OpenCl Host:CPU
OpenCl Devices:GPU,FPGA,DSP,AI accelerator


二、系统层次
1层------application-------------
2层------opencl-------------------
3层------XRT----------------------
4层------os driver----------------
5层------fpga/gpu/dsp driver-------

三、OPENCL Model
1.Platform model

2.memory model

3.Execution Model


三、XRT Xilinx Runtime
Xilinx Runtime (XRT)框架

四、kernelADD

arg这个参数定义为axilite接口;

int*v定义为axi-mm接口,并且使用axilite来指定axi-mm的基地址!!!!

五、KernelB

上述代码中都指定axi-mm接口,并使用axilite来指定base_address基地址!

六、DMA model

dma + pcie,其中pice的吞吐量是至关重要的!


DMA operation : io cmd
cpu program DMA是比较花费时间的,一般30ms~60ms
pcie transfer的时间太小就划不来,所以pcie设置的buffer size不能太小

所以buffer要大一些

也就是要开辟的buffer size大小,让pcie的transfer time大于cpu program dma的time,这样就比较合适。

七、带宽计算

DDR3200
1chanenl 64bit/1channel 32G*8=25GB
4channel = 100GB

PCIE:8Gb*16lane = 16GB

Compute:
DSP有5952个slice,约6k个slice
dsp计算A*B+C为12Byte
6k*300MZ*12B=25TB
所以pcie和DDR3200都满足不了DSP

但是,可以看到SRAM为24TBS,这个就是block ram

启发:
最好你DSP计算需要用的data就从on-chip buffer上拿,然后
reuse这个buffer就能得到好的效率。
所以设计的时候从host ddr中预取数据到on-chip buffer上,然后
让compute计算单元,而已就是DSP模块从one-chip buffer拿数据,
就能达到好的效果。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/13 6:53:16

Java面试必考点:线程池为何是高性能系统的核心秘诀?

文章目录Java面试必考点:线程池为何是高性能系统的核心秘诀?引言一、线程池为何如此重要?1. 线程的“双刃剑”特性2. 线程池的核心优势二、线程池的工作原理1. 线程池的生命周期2. 线程池的常见实现三、ThreadPoolExecutor的配置详解1. 核心参…

作者头像 李华
网站建设 2026/1/3 18:05:59

如何用GPT-SoVITS训练自己的虚拟主播语音?

如何用 GPT-SoVITS 训练自己的虚拟主播语音? 在直播和短视频内容爆发的今天,越来越多的创作者开始尝试打造属于自己的“数字分身”——一个能说会动、声音熟悉的虚拟主播。但要让这个虚拟形象真正“活起来”,最关键的一步就是赋予它真实且富有…

作者头像 李华
网站建设 2026/1/11 7:55:04

STM32CubeMX使用教程:图解说明引脚分配与复用功能

从零开始掌握STM32引脚配置:CubeMX实战全解析你有没有遇到过这样的情况?项目做到一半,突然发现I2C通信死活不通——查了半天代码,最后才发现PB7被误设成了推挽输出,而不是开漏模式。又或者,ADC采样值跳得像…

作者头像 李华
网站建设 2026/1/7 23:58:03

工业控制中STM32CubeMX安装包的完整指南

从零构建工业级STM32开发环境:CubeMX安装包的实战指南你有没有遇到过这样的场景?项目刚启动,团队里有人在查数据手册配时钟,有人手动写GPIO初始化,结果烧进去一运行——串口不通、引脚冲突、系统跑飞。最后发现是某个A…

作者头像 李华
网站建设 2026/1/6 23:44:11

从官网获取Multisim下载资源:安全可靠的安装路径

如何安全获取Multisim?从官方下载到工程实战的完整指南 你是不是也曾在搜索引擎里输入“multisim下载”,结果跳出一堆带广告、捆绑病毒、甚至要求注册送手机号的网站?点进去后发现版本老旧、安装失败、激活不了……最后不仅浪费时间&#xf…

作者头像 李华
网站建设 2026/1/7 1:37:55

智收派享:智能垃圾回收平台 “垃圾发现 + 精准派单 + 分级分成” 新增功能可行性分析文档

智能垃圾回收平台-“垃圾发现精准派单分级分成”新增功能立项书 一、立项基本信息 项目维度具体内容项目名称智能垃圾回收平台“垃圾发现-派单-回收-分级分成”功能迭代升级项目立项单位XX环保科技有限公司立项负责人(垃圾回收行业10年经验 业务&技术架构师&a…

作者头像 李华