找回密码
 注册
关于网站域名变更的通知
查看: 255|回复: 3
打印 上一主题 下一主题

现代高端FPGA的重要拼图:HBM

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-10-22 09:30 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
HBM(High Bandwidth Memory,高带宽存储)已成为现代高端FPGA的一个重要标志和组成部分,尤其是在对带宽要求越来越高的现如今,DDR已经完全跟不上节奏。本篇将分享学习一下HBM的基本情况。
( m1 w: t" D& r/ L0 Z
3 h4 y8 V: M: I1 ?2 d3 C9 E什么是HBM
/ }! X" L" y  E- F; o5 u, y+ \( v5 ]' c* A" Q* n) k+ A
   高带宽存储(HBM)是三星、AMD和SK Hynix推出的基于3D堆叠同步动态随机存取存储器(SDRAM)的高速计算机内存接口。它使用在高性能图形加速器、网络设备、高性能数据中心AI ASIC和FPGA以及一些超级计算机中。(如NEC SX-Aurora TSUBASA和富士通A64FX) 第一款HBM芯片是由SK Hynix在2013年生产的,而2015年AMD首次研发了使用这种技术的GPU芯片。
% w* `  ?* x$ v' m1 P# E% H
; G9 h& h; S& i( `. k; \    2013年10月,JEDEC(电子器件工程联合会)采用高带宽内存作为行业标准。第二代HBM2,于2016年1月被JEDEC所承认。1 n2 Y  r- Y, a0 e1 e  S
! m' Z/ m1 P4 U
HBM及其接口
; T, b1 _: j$ d" ]
& I. ?! }6 B3 J' I* D- J: `   HBM以比DDR4或GDDR5功耗更低,带宽更高。这是通过堆叠8个DRAM die(3D集成电路)来实现的,包括可选的基die(通常是硅interposer)和memory控制器,该控制器通过硅通孔(TSV)和微突点(microbump)相互连接。HBM技术与Micron的Hyrid Memory Cube技术在原理上相似,但不是一回事。
0 ~3 R/ S9 w0 t& S" \- W) o0 J& f9 H8 }' h$ H% ^+ j
    与其他DRAM内存(如DDR4或GDDR5)相比,HBM内存总线非常宽。一个HBM stack由4个DRAM die(4-Hi)堆叠而成,并拥有8个128位信道(每个die上2个),总宽度为1024位。因此,具有四个4-Hi HBM stack的GPU将拥有4096位宽度的内存总线。相比之下,GDDR存储器的总线宽度为32位,同样16个信道则只具有512位存储器接口。HBM支持每个package的容量最多为4GB。
( S+ l. M+ D0 L0 M2 Q9 l& x2 V
3 W& N8 d& P) E   HBM DRAM与具有分布式接口的主计算die进行紧密耦合。该接口被分为若干完全独立的信道但信道间不一定完全同步。HBM DRAM使用wide-inteRFace架构来实现高速、低功耗运算。HBM DRAM使用一个500MHz的差分时钟CK_t/CK_c(其中后缀“_t”表示差分对的“真”或“正”分量,“_c”代表“互补”分量)。命令在CK_t,CK_c的上升沿进行寄存。每个信道接口管理一个128位的数据总线,以双倍数据速率(DDR)运行。HBM支持每个pin上1GT/s的传输速率(传输1bit),提供128GB/s的总package带宽。, `& W! b+ t5 u! c1 D4 C  _9 |5 D
1 e2 x2 D) Q; n5 W) w" i
    第二代高带宽存储,HBM2,该标准指定了每个stack多达8个die,将pin传输速率提高一倍来到2GT/s。保留1024位宽的存取,HBM2能够达到每个package 256GB/s存储带宽。HBM2规范允许每个package容量高达8GB。HBM2对性能敏感的消费类应用,如虚拟现实,特别有吸引力。
1 `5 K2 S3 L( p( _, o) F1 `, @0 H4 w, g+ B
    2018年底,JEDEC宣布了对HBM2规范的更新,增加了带宽和容量。官方规范现在支持每堆栈高达307GB/s(2.5Tbit/s有效数据速率),尽管以此速度运行的产品已经问世。此外,该更新还增加了对12-Hi stack(12个die)的支持,使每个堆栈的容量高达24GB。2019年3月20日,三星宣布了他们的Flashbolt HBM2E,每stack 8个die,传输率为3.2GT/s,每stack可提供410GB/s带宽。2019年8月12日,SK Hynix发布了他们的HBM2E,每stack8个die,传输速率为3.6GT/s,每stack可提供460GB/s带宽。6 @6 `/ T+ E6 f/ |, ~, Q
+ R& s7 \, `: A& x2 M7 @
    2020年底,Micron公司发布了下一代标准HBMnext并表示将全程参与JEDEC的标准制定工作,预计2022年面世。这个未来很有可能是HBM3的标准很可能还是服务于数据中心。" |/ ?0 _, X% ^  n' u% y( x2 L7 K
5 o$ u. T" N: Y  U1 n
   近年来,FPGA厂商对HBM的态度甚至比GPU厂商还要积极,随着数据中心上越来越高的性能要求,相信带有HBM3的FPGA也会在不远的未来和大家见面。
2 H! P8 \& X4 E+ J. J

该用户从未签到

推荐
发表于 2021-10-22 11:23 | 只看该作者
FPGA厂商对HBM的态度甚至比GPU厂商还要积极,随着数据中心上越来越高的性能要求,相信带有HBM3的FPGA也会在不远的未来和大家见面4 D  ]( h4 v: _5 a' x

该用户从未签到

2#
发表于 2021-10-22 10:43 | 只看该作者
高带宽存储(HBM)是三星、AMD和SK Hynix推出的基于3D堆叠同步动态随机存取存储器(SDRAM)的高速计算机内存接口
3 a! h, I: N- M0 B6 l2 m  G- r5 b

该用户从未签到

4#
发表于 2021-10-22 11:24 | 只看该作者
HBM DRAM与具有分布式接口的主计算die进行紧密耦合。该接口被分为若干完全独立的信道但信道间不一定完全同步1 Q  E  h  @' k
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-8-3 07:23 , Processed in 0.125000 second(s), 24 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表