EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
可配置逻辑块是所有可编程数字电子系统的基本构建块。自从赛灵思公司在 80 年代发明 FPGA 以来,可配置逻辑(以查找表和寄存器的形式)一直是所有市场和应用数字电子系统的重要组成部分。
! S. O- |* @: x, i5 o* o9 v9 _6 o4 O: v+ ~
本白皮书介绍了 28 nm 工艺的Xilinx 7 系列 FPGA 中可配置逻辑块的特性,重点介绍了与以前的 Xilinx FPGA 相比的优势以及这些变化为数字设计工程师带来的好处。 多功能逻辑结构允许在单一资源中实现大量逻辑和存储器功能,从而在性能、功耗和成本方面提供更高的效率。% K; C% l; Z2 l7 T
8 t$ A8 j5 a" q+ ^5 r
这篇文章主要是通过介绍7系列与之前产品的对比,来展示7系列产品的基本逻辑单元的优点。
# o: M" G/ K, }7 _) b
! o H& d6 @4 f+ I" b! E D2 E4 t1 P6 p7 M+ l+ g
可配置逻辑块 (CLB) 是 Xilinx FPGA 逻辑结构的核心。在 CLB 中存在由查找表(LUT)、进位链和寄存器组成的Slice。这些Slice可以通过配置来实现逻辑功能、算术功能、存储器功能和移位寄存器功能。多年来,CLB 内的资源数量不断发展,以适当的成本不断提供最佳效能。最初的 Virtex® 和 Spartan®-II 架构在世纪之交推出,提供了一个由两个 Slice组成的 CLB,其中一个 Slice包含两个四输入 LUT 和两个寄存器。从那以后,Slice发生了显着变化——在 7 系列 FPGA 中,Slice由四个六输入 LUT (LUT6) 和八个寄存器组成,如图 1 所示。8 c" e1 j( b: \% `5 O, _
0 J3 E$ z N! k: | CLB = 2×Slice =2 ×(4×LUT + 8×FF + 3×MUX + 1×CARRY4)。7 J! h* E& n) |
9 w7 W# r2 }. D+ |! K
8 M R1 _6 P8 R9 f8 k
5 s- Y( q% m, b( }; \
7 J' }5 }4 @3 G7 `
7系列 FPGA 中的Slice架构
( J( ~6 y- w |0 j& h3 q) D 所有 7 系列 FPGA 系列(Artix™-7、Kintex™-7 和 Virtex-7 器件)都使用相同的逻辑架构:CLB 由两个 Slice 组成。 7 系列 FPGA 架构中的 Slice 有两种类型:一种能够在 LUT 中实现逻辑、移位寄存器和存储器功能,称为 SLICEM;另一种只能在 LUT 中实现逻辑功能,称为 SLICEL。采用这种全功能 SLICEM 与减少功能SLICEL 相结合的策略可实现最佳功能和性能,同时保持低成本和低功耗。& R1 [ K5 V. g* b+ I
0 D4 N$ z9 C. \3 k 7 系列FPGA Slice架构紧密基于 Virtex-6 和 Spartan-6 系列中引入的Slice架构。 Virtex- 6、Spartan-6 和 7 系列 FPGA Slice架构之间的相似性为现有设计和 IP 迁移到 7 系列 FPGA 提供了一条简单的路径。设计师可以以最小的重新设计工作量,将他们的设计获得到最新的功能和最高的性能。此外,所有 7 系列 FPGA 使用相同的可扩展、优化架构允许最初针对一个 7 系列 FPGA 系列的设计轻松移植到另一个 7 系列 FPGA 系列。- ^; O0 H C/ }, Y' M
5 j4 F3 |* ~4 N3 P
Slice由两个 SLICEL 或一个 SLICEL 与一个 SLICEM 成对组合在 CLB 中。 7 系列FPGA 构建在基于列的 ASMBL™ 架构之上,允许在设计人员需要的地方轻松放置资源。在这种情况下,具有存储器功能的 Slice 在 DSP Slice 的列附近最为普遍,为设计人员提供接近所需位置的系数存储。 Xilinx 设计工具全面了解资源的相对布局,并以最有效的方式智能、自动地将设计映射到资源,同时遵守用户指定的任何约束。# S9 D# X2 u; [, }# q! \0 X
1 k* h9 C# D) o' X8 X3 [
图 2 显示了 LUT 和寄存器是如何相互排列的。图 2 仅包括一个 LUT 及其相关的两个寄存器,并省略了进位链。在一个完整的 Slice 中,有四个 LUT 和八个寄存器。
1 W0 z2 S! _# g% {# M) `) D! B: r. W) S
- |+ w- Z2 a4 |- m
( L' u# t2 o5 k4 i9 o
1 A- ]- Q8 Q E! R& X. Z( t7 e: W6 P) _8 I
6 输入 LUT 能够实现任何布尔逻辑函数,该函数是 6 个输入信号的乘积,但也可以拆分为两个 5 输入 LUT——只要这两个函数共享公共输入。此外,SLICEM 中的 LUT 也可配置为 64 位分布式 RAM 或最多支持32 位的移位寄存器逻辑 (SRL) 功能。有关详细信息, 请参阅UG474。; I% |, ^2 I( S- ~) }. c: Y, T4 E" |
# \; J% c1 `! R; ]7 w) J! j. q 6输入的LUT是由2个LUT5 + MUX2组成的。1 _+ D3 N: s& R
% L: y, I9 s' g; L6 Z% C
: T# F" E* R, P9 Y常见的Slice资源用法1 u# ? k3 q! b1 N* x
5 m6 G( a# ~5 L. j% k: l! B 多功能性是可编程逻辑的基础,设计人员可以根据他们的目标以多种方式使用 FPGA 的Slice资源。0 u# U( P3 z2 }
5 \8 d9 ^- ]7 T5 j$ Y
该架构允许独立于寄存器使用 LUT。 Slice 的 Bypass (AX/BX/CX/DX) 输入允许在不通过 LUT 的情况下访问寄存器的 D 输入,并且组合逻辑信号可以接到 Slice 的输出(图3)。- @0 ?& O( B& f% f1 i# b7 f
/ H8 E+ p* h" X
) k- y9 K! z: x7 p5 g0 g) _
1 g) x2 k" k b( X" R
' [9 a4 M$ r0 ?7 N
5 h7 I9 T" h$ e9 l 除了直接驱动寄存器外,Bypass 输入还可用于驱动进位链。
0 H1 |: j5 w/ I, k8 \: } ]2 u T, q2 h1 ~0 Q2 B
LUT 输出可以使用触发器多路复用器直接接入相关寄存器的 D 输入(图 4)。 O5 LUT 输出可以连接到任一寄存器的输入(图 4),而 O6 LUT 输出只能连接到其中一个寄存器(图 2)。2 r, C; e( v6 b% \! |. S
% I* v7 s- X P3 i0 n; _9 f7 \
- V0 @' y2 k# D; F, K6 Q- Z
! `' R. ~# D3 d# J6 Y* {8 Q
! o2 I* ~) i- e! w5 m# @$ [
6 v% R( E6 o- g 可以在单个 LUT 中创建不共享输入的逻辑函数。 LUT 的 A6 输入连接到高电平以启用双 LUT 模式,而 LUT 的其余五个输入可用于独立的逻辑功能。例如,一个不共享输入的二输入函数和三输入函数可以打包在同一个 LUT 中(图 5)。如果寄存逻辑输出,寄存器必须共享相同的控制信号。
, |0 A% p' i0 b, M8 H. x4 \) j. W8 R0 ^; O; a% A8 D& Q8 |
, b& o8 `; ]! b. E- I' Y9 M
3 S/ {1 l5 @9 W4 C0 L# Y' \+ x- w0 L$ k
: ^: E# s" K" I/ E/ k; |5 p' k$ A
2 y9 d% P0 Z% L- ^$ [% U6 R. |- q
. L; r" y* j0 j: t* z 多路复用器 F7 和 F8 使用bypass输入在两个 LUT6 输出之间切换,提供了一种在单级 CLB 中实现比六个输入更宽的功能的方法。 LUT6+MUX2的组合可以通过分时复用的方式来实现更大位宽的函数发生功能。
" x, B$ y1 W Q( b( t
控制信号 7 系列 FPGA 中的所有触发器都可以使用设置/复位、时钟和时钟使能信号进行控制, 通常称为一组控制信号或控制集。每个 Slice 可以使用不同的控制集,但如果 slice 中的一个触发器使用了某种控制信号,例如同步复位,则该 Slice 中的所有其他触发器必须使用相同的信号作为它们的复位 - 或者不使用复位。如果 LUT 有可用输入,则可以将控制信号折叠到数据路径(即 LUT)中,从而允许在同一片内使用多个复位信号(图7)。
1 v6 y8 W( J9 Y+ j7 S% s# [; x* L
# `- Q- V: E$ ]1 Y1 x) A
Xilinx 建议避免在设计中使用许多低扇出控制信号,以避免因控制集过多而遇到设计限制。综合工具自动避免生成使用大量低扇出时钟使能信号的电路。在赛灵思 XST 综合工具中,选项“-reduce_control_sets”可用于控制此功能。UG429,提供了有关控制集的良好设计实践的进一步指导。
: M2 u# W; V5 W2 }9 Z0 L) ~6 c; Q# n 在设备上电时,可以使用初始化值 INIT 将所有寄存器初始化为已知值。如果设计只需要在上电时进行初始化,使用这种方法可以消除在每个触发器上设置和复位信号的需要。这也允许将移位寄存器折叠到可用的 SRL 逻辑中,而不是使用触发器。
: S* _) |: ^, J4 i+ f 除了实现用户指定的使能外,寄存器上的时钟使能端口也被智能时钟门控优化所使用。有关这如何帮助将设计的动态功耗降低多达 30% 的更多信息,请参阅WP370。
& J: z% _0 H4 r' D9 v 控制集尽量不要搞得太多,因为同一Slice中的控制集只支持一类,如果种类过多,则会造成大量的资源浪费。
3 e6 o, O3 I% T$ t额外资源的好处 ; U8 Y. O9 m5 j
Xilinx CLB 架构的最新变化之一是向 Slice 添加了第二个寄存器。在 Virtex-6 和Spartan-6 FPGA 之前,高端 Xilinx FPGA 中的 CLB 架构由四个六输入 LUT 和四个寄存器组成。添加第二个寄存器,它首先在 Virtex-6 和 Spartan-6 FPGA 中实现, 也出现在 7 系列 FPGA CLB 架构中,增加了显着的好处,但它的成本增长却很小。
8 Y- E" i2 X u& ~1 T 如图 8 所示,当将 LUT 配置为两个五输入 LUT 时,两个 LUT 的输出可以寄存在同一个 slice 中。这提供了一致的逻辑来寄存时序和寄存每个逻辑功能的能力,从而通过流水线提高性能。
0 z% f( p; j, c; Q. b
; O$ A9 L$ `, x; @0 j7 ?6 i/ g此外,当在单个 Slice 中实现分布式 RAM 中的已寄存 32 x 8 RAM 时,所有八个寄存器都驻留在 sSice 内。这消除了在设备其他地方使用四个寄存器的要求,并提供了从RAM到寄存器的快速、一致的路径(图 9)。
: h8 J2 k7 U1 s* [$ y4 i3 Q
2 F* L) O& A0 r
在单个 Slice 中使用所有八个寄存器可显着提高性能,并具有不耗尽其寄存器的相邻slice 的额外好处资源。与每个 LUT 相邻的第二个寄存器的存在意味着可以将共享控制集的更多寄存器打包到单个Slice中,从而释放以前跨越多个Slice的资源。对一组不同大小和复杂性的设计的分析表明,这导致用作寄存器的Slice平均减少 15%,从而为用户腾出资源以在其 7 系列FPGA 设计中构建额外的功能。将每个 LUT 的第二个寄存器保持在同一个控制集上,并取消将该寄存器配置为锁存器的能力,这意味着它已经实现并且可以非常经济高效地在FPGA 架构中使用。虽然设计人员在编写设计代码时可以从了解逻辑架构中受益,但赛灵思工具套件可以了解不同系列的架构布局,并自动利用架构中存在的资源。 ( F+ J) C6 \* a+ d- Y4 p( Q
简而言之,寄存器的增加,是的更大位宽的功能实现不再需要跨越Slice,而是可以在一个Slice内完成,这使得各个信号的走线长度基本一致,有利于布线和时序收敛。 结论 Xilinx 7 系列 FPGA 中的可配置逻辑块是 Virtex-6 FPGA 和 Spartan-6 FPGA 中 CLB 的演进,为设计迁移到 7 系列 FPGA 提供了一条简单的途径。借助四个六输入 LUT 和八个寄存器,灵活的 Slice 逻辑结构可用于执行组合逻辑功能、算术功能、移位寄存器功能和存储器功能等多种不同功能。与以前的架构相比,四个 LUT 与八个寄存器的组合提供了性能优势和资源减少,而第二个寄存器的低成本实现几乎不会影响设备的整体成本。
7 P- `! h, t# ^6 P5 p R1 L |