news 2026/2/17 15:58:18

FPGA教程系列-Vivado Aurora 8B/10B IP核设置

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
FPGA教程系列-Vivado Aurora 8B/10B IP核设置

FPGA教程系列-Vivado Aurora 8B/10B IP核设置

Aurora 8B/10B 是 Xilinx 开发的一种轻量级、链路层的高速串行通信协议。它比单纯的 GT(Transceiver)收发器更高级(因为它帮你处理了对齐、绑定、甚至流控),但比以太网或 PCIe 更简单、延迟更低。

手册看的脑袋疼,还是实操一下看看如何使用吧,可能很多部分都是官方写好的,不需要自己去弄,而实际使用可能就是修改一些参数就行了。

1. Physical Layer (物理层设置)

这一部分直接决定了底层的硬件连接和电气特性,必须严格按照板卡设计和对端设备来配置

Lane Width (Bytes) [通道宽度]:2 或 4。决定了用户逻辑接口(AXI-Stream)的数据位宽,也直接影响user_clk的频率。

  • 2 Bytes:AXI 接口位宽为 16-bit。user_clk = 线速率 / 20
  • 4 Bytes:AXI 接口位宽为 32-bit。user_clk = 线速率 / 40

如果线速率很高(比如 > 5Gbps),建议选 4 字节,这样可以让 FPGA 内部逻辑时钟(user_clk)跑慢一点,更容易满足时序。如果是 3.125G 这种中低速,选 2 字节即可。

Line Rate (Gbps) [线速率]:光纤或铜线上实际跑的比特率。

取决于 SFP 模块能力、PCB 走线质量以及对端设备的速度。3.125 Gbps,是 Aurora 的一个经典速率(也是 XAUI 的标准速率)。

GT Refclk (MHz) [GT 参考时钟]:FPGA 外部输入的差分参考时钟频率。

必须与你 PCB 板子上连接到 FPGA GT Bank 的那个晶振频率完全一致。如果填错了,PLL 锁不住,整个核都起不来。

INIT clk (MHz) [初始化时钟]:用于驱动复位逻辑和初始化状态机的辅助时钟。在上电初始化阶段,可以使用该时钟来驱动一些逻辑。默认值:50Mhz。

通常给 50MHz 到 100MHz 之间的稳定时钟即可。这个时钟对抖动要求不高,可以用普通的逻辑时钟。

DRP Clk (in MHz) [动态重配置时钟]:用于驱动 DRP(Dynamic Reconfiguration Port)接口的时钟,允许你在运行时修改 GT 的参数。通常和 INIT clk 共用一个时钟源。动态重配置,一般没用,默认值:50Mhz(通常一个内部模块需要进行配置,使用两种方法:端口控制和配置参数控制。一个常见的应用就是线速率切换。这时候就需要利用DRP端口来调整部分参数的值,然后复位GTX,使GTX工作在不同的线速率下。)。

Tip:关于时钟

上面这三个时钟,是IP核工作所需要的时钟,也是我们需要提供给IP核的。此外,还有一个时钟是IP核提供给我们的:user_clk。这个时钟,是IP核根据设置的线速率及Lane的位宽计算出来的用户时钟,用户需要传输的数据必须是该时钟域下的数据,否则会存在亚稳态风险。


2. Link Layer (链路层设置)

这一部分决定了数据如何打包、如何握手。通信双方(TX 和 RX)的配置必须完全一致

Dataflow Mode [数据流模式]:

  • Duplex (双工):最常用,同时收发。
  • TX-only / RX-only (单工):只发或只收。
  • Simplex (单工):类似单工,但有特殊的边带信号处理。

Interface [用户接口类型] —— ⭐️ 非常重要

Framing (帧模式)

  • 有“包”的概念。AXI 接口上有tlast信号,用来指示一个数据包的结束。
  • 发送类似以太网包、命令包等非连续、有边界的数据。Aurora 会自动处理两帧之间的空闲填充。

Streaming (流模式)

  • 特点:像一根水管,没有“包”的概念,也没有tlast信号。数据源源不断。
  • 适用:发送 ADC 采样数据、视频流等连续数据。传输效率最高,因为没有帧头帧尾的开销。

Flow Control [流控]

  • None:不使用流控(最常用,也最简单)。
  • UFC (User Flow Control):用户发命令来插队。
  • NFC (Native Flow Control):核心自动根据接收端缓冲区的满/空状态,给发送端发暂停信号(反压)。

初学者建议选None。如果你需要防止接收端 FIFO 溢出,可以选 NFC。

Back Channel [回传通道]

  • Sidebands:通常用于单工模式,利用额外的 GPIO 线来告诉发送端“我准备好了”。在双工模式下通常不需要太关注这个。

  • Scrambler/Descrambler [加扰/解扰]

    在发送前把数据打散(伪随机化),接收后还原。避免数据中出现长时间的连 0 或连 1,减少电磁干扰 (EMI),有利于时钟恢复。

  • Little Endian Support [小端序支持]

    决定多字节数据的传输顺序。Aurora 默认是大端序(网络字节序)。除非你的处理器是强小端序且你不想在软件里倒腾字节,否则保持默认(不勾选)。小段模式对应[31:0]这种书写习惯,大端模式对应的是[0:31]这种书写习惯


3. Error Detection (错误检测)

CRC [循环冗余校验]:在每一帧数据后面自动加一个校验码。

如果选了Framing模式,建议勾选。这样接收端收到数据时,如果发现 CRC 不对,会报错,保证数据完整性。如果是 Streaming 模式,通常不加 CRC。


4. Debug and Control (调试与控制)

Vivado Lab Tools

在 IP 核里自动插入 ILA(逻辑分析仪)。

调试阶段建议勾选。它会把 Aurora 的状态机、lane_up、channel_up 等关键信号抓出来,如果不通,你能看到卡在哪一步。量产时关掉以节省资源。


配置总结 & 避坑指南:

  1. 时钟计算
    按照图中的配置:3.125 Gbps / 2 Bytes (16 bits) / 10 (8B/10B编码效率) =156.25 MHz
    user_clk是 156.25 MHz。所有 AXI 接口逻辑(读写 FIFO、状态机)都必须在这个时钟频率下工作。
  2. 两端一致性
    FPGA A 和 FPGA B 通信,它们的 Line Rate、Lane Width、Scrambler、Interface (Framing/Streaming)必须一模一样,否则channel_up永远起不来。
  3. Refclk 必须准
    如果板子上的晶振是 156.25MHz,这里就必须填 156.25,不能填 125。
  4. 复位顺序
    Aurora 也是基于 GT 的,对复位非常敏感。通常建议使用 IP 核自带的reset_pb​ (信号) 或者按照官方 Example Design 的复位序列来操作。上电后,先gt_reset​,再reset

第二页

如果说上一页 “Core Options” 决定了“我们要传多快、传什么格式”,那么这一页则是决定“这套协议要在 FPGA 的哪几根物理引脚上跑”

这是一个纯物理层的配置界面,必须结合PCB 原理图FPGA 芯片手册来设置。

1. Lanes (通道数量)

Aurora 链路包含几条物理通道。

如果需要更高的带宽,可以将多条 Lane 绑定在一起(Bonding)。例如选 4,那么带宽就是单条 Lane 的 4 倍,且 Aurora 会自动处理通道间的对齐。

必须与原理图一致:如果你板子上只画了 1 对线连到光模块,这里就只能选 1。

2. Lane Assignment (通道分配表)

这是最容易晕的地方。这个表格代表了 FPGA 内部GT (Gigabit Transceiver)资源的物理位置分布。

  • 结构解析

    • 左侧列 (GTXQ1, GTXQ2…):代表Quad。Xilinx 的高速收发器是每 4 个一组,称为一个 Quad。

      • GTXQ1通常指物理位置最靠下的那个 Quad(或者编号最小的)。
    • 右侧网格:代表每个 Quad 里的 4 个具体收发器通道 (Channel 0 - Channel 3)。

    • 下拉菜单 (X 或 数字)

      • X:表示这个物理通道不被当前的 Aurora 核使用。
      • 1, 2, 3…:表示将 Aurora 的第几条逻辑通道映射到这个物理位置。
  • 如何设置(关键步骤)

    1. 打开原理图:查看你的 SFP 光口或 SMA 接口连接到了 FPGA 的哪个 Bank,哪对引脚(例如MGTHTXP_115)。
    2. 查找映射:去查 Xilinx 的封装文件(Package File)或在 Vivado 的 “I/O Planning” 视图里看,确定那对引脚属于哪个 Quad 以及该 Quad 里的第几个 Channel(例如 X0Y0, X0Y1)。
    3. 在表中勾选:找到对应的位置,选上编号。
    • 注意:这里的图形化界面只是一个生成网表的向导。最稳妥的做法是这里大概选对 Quad,然后在XDC 约束文件中通过set_property LOC GTXE2_CHANNEL_X0Y0 [get_cells ...]来进行精确的物理约束。

3. GT Refclk1 / GT Refclk2 (参考时钟选择)

GT 收发器需要一个非常高质量的差分参考时钟(MGTREFCLK)才能工作。决定 Aurora 核使用板子上的哪一个差分晶振输入作为参考时钟。

如何设置

  1. 看原理图:你的 125MHz(或 156.25MHz)差分晶振连接到了 FPGA 的哪两个引脚?(例如MGTREFCLK0P_115​ /MGTREFCLK0N_115)。
  2. 确认 Quad:确定这两个引脚属于哪个 Quad。
  3. 选择:在下拉菜单中选择对应的 Quad。

重要规则(时钟路由):通常建议参考时钟和你的数据通道在同一个 Quad,或者在相邻的 Quad(North/South)。如果距离太远,时钟抖动会变大,Vivado 可能会报错。

避坑提示
如果你实在搞不清具体的物理坐标(X0Y?, X0Y?),可以在这里先随便选一个(比如都选在 Q1),生成 IP。但是在写.xdc 约束文件时,必须严格加上package_pin​ 约束和LOC约束,Vivado 会以 XDC 文件为准,强行把逻辑“拽”到正确的物理引脚上。如果这里选的和 XDC 冲突太大(比如跨了太多 Bank 导致时钟够不着),Implementation 阶段会报错。

第三页

简单来说,这一页是在问:“在这个 IP 核内部,我要不要自带时钟发生器(PLL)和差分时钟缓冲器(IBUFDS)?”

什么是“Shared Logic”?

在 Xilinx FPGA 的高速收发器(GT)架构中,4 个通道(Channel)组成一个 Quad。这 4 个通道共享一些公共资源,最主要的就是PLL(锁相环)参考时钟输入缓冲(Diff Refclk Buffer)

  • PLL:负责将参考时钟倍频,生成高速串行时钟。
  • Buffer:负责将板子上的差分时钟引入芯片内部。
1. Include Shared Logic in core (包含在核内) ——“我是房东”

这个 IP 核会把 PLL、参考时钟缓冲、复位逻辑全部包含在自己肚子里。它是全功能、自给自足的。生成的 IP 核对外接口比较简单,直接接板级引脚(refclk)即可。

什么时候选

  • 工程里只有一个Aurora 核。
  • 或者,在一个 Quad 里有多个 Aurora 核,这是第一个(主核)。它负责产生时钟,分给别人用。
2. Include Shared Logic in example design (包含在示例工程中/核外) ——“我是租客”

这个 IP 核内部不包含PLL 和时钟缓冲。它是一个“空壳”或“从核”。它必须依赖外部送进来的 PLL 时钟信号才能工作。生成的 IP 核会多出一堆输入端口(如gt_pll_clk​、gt_refclk_out等),你需要把别的核产生的时钟连进去。

为什么叫“在示例工程中”
如果你生成了 Example Design,Vivado 会把那些公共逻辑(PLL等)放在 IP 核外面的顶层文件中。这样方便你修改或者将其去驱动其他的 IP 核。

什么时候选

  • 多核复用:当你在同一个 Quad 里放了第 2、3、4 个 Aurora 核时。因为 PLL 只有一个,已经被第 1 个核(房东)占用了,剩下的核(租客)只能借用第 1 个核输出的时钟。
  • 高级共享:当你有一个以太网核和一个 Aurora 核共用同一个 Quad 的 PLL 时。

Core with Shared Logic
虚线框是 IP 核的边界。可以看到Shared Logic​(PLL 等)是在虚线框里面的。独立,但也独占资源。

Example Design
虚线框是 IP 核的边界。可以看到Core without Shared Logic​ 在里面,而Shared Logic​ 被挪到了外面(Example Design 层级)。

特点

  1. For users who want to edit…:如果你想自己手写 PLL 的复位逻辑,选这个。
  2. Drive multiple cores…这是最常用的场景。外部的 Shared Logic 产生一次时钟,箭头指向Core without Shared Logic(也就是当前这个 IP),同时还可以引出箭头去驱动其他的 IP 核。
场景 A:最简单的情况(新手推荐)
  • 情况:你的设计里只需要1 个Aurora 接口,或者虽然有多个接口但它们分布在完全不同的 Quad 里(比如一个在 Bank 115,一个在 Bank 117)。
  • 设置:选择Include Shared Logic in core
  • 理由:最省事,不需要处理复杂的时钟互连,开箱即用。
场景 B:同一个 Quad 里有多个通道
  • 情况:你的板子上光口是 4 路的(QSFP),你想跑 4 个独立的 Aurora 单工/双工链路,它们都在同一个 Quad 里。

  • 设置

    1. 第 1 个 IP 核:选择Include Shared Logic in core。(它是 Master,负责开启 PLL)。
    2. 第 2、3、4 个 IP 核:选择Include Shared Logic in example design。(它们是 Slave)。
    3. 连线:在顶层 Verilog 中,把第 1 个核输出的gt_pll_out等时钟信号,连到后面 3 个核的对应输入端口上。
场景 C:你想完全掌控时钟
  • 情况:你有非常复杂的时钟需求,或者你想在顶层自己实例化IBUFDS_GTE​ 和GT_COMMON原语。
  • 设置:选择Include Shared Logic in example design。这样 IP 核就是纯净的数据通路,时钟全靠你喂。

版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/2/17 13:08:02

自动化运维工程师之ansible启动rpcbind和nfs服务

通过 systemd 模块分别启动 rpcbind 和 nfs 服务,并设置它们为开机自启,是 NFS 服务部署中启动相关服务的典型配置。下面我会逐部分解析代码的含义、作用以及关键细节。 一、代码整体功能总结 这段代码包含两个独立的 systemd 模块任务,依次完…

作者头像 李华
网站建设 2026/2/16 12:51:44

数字供应链系统哪个好?2025 供应链系统推荐排名来了,八大供应链系统

当数字化转型从“可选项”变为“必选项”,S2B2B供应链系统已成为企业重构供应链竞争力的核心工具。无论是解决传统批发企业“订单传递慢、库存不清”的沉疴,还是支撑新兴跨境商家“多渠道协同、全链路合规”的需求,一款高效的供应链系统都能让…

作者头像 李华
网站建设 2026/2/16 0:56:30

M.I.B.终极指南:解锁汽车娱乐系统的隐藏功能

你是否曾经对车载系统的功能限制感到困扰?为什么高端汽车的原厂娱乐系统总是缺少你想要的功能?如果你的车辆使用的是Harman MHI2或MHIG系列娱乐系统,那么M.I.B.就是你的完美解决方案。这个开源工具就像一个汽车系统的"多功能工具"&…

作者头像 李华
网站建设 2026/2/10 18:21:36

终极PHP兼容性检查工具:轻松应对版本迁移挑战

终极PHP兼容性检查工具:轻松应对版本迁移挑战 【免费下载链接】PHPCompatibility PHPCompatibility/PHPCompatibility: PHPCompatibility是一个针对PHP代码进行兼容性检查的Composer库,主要用于PHP版本迁移时确保现有代码能够适应新版本的PHP语言特性&am…

作者头像 李华
网站建设 2026/2/7 21:18:47

Kamailio usrloc 细节测试

版本 kamailio 5.7.x IP 地址 192.168.43.68 窥视 usrloc 细节 慢慢测试,慢慢写 ul.rm vs ul.rm_contact 这二个不一样,比如 eyebeam 以 1000 注册,同时 microsip 也以 1000 注册 执行 ul.rm location 1000192.168.43.68 就把 eyebea…

作者头像 李华