找回密码
 注册
关于网站域名变更的通知
查看: 3551|回复: 1
打印 上一主题 下一主题

[仿真讨论] 富士通首次公开下一代超极计算机主板,单位尺寸处理能力高达“京”的22倍

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2014-5-24 11:13 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
本帖最后由 stupid 于 2014-5-24 11:16 编辑
- L) `. I5 M5 l9 v& K
9 ?5 z/ r) O- e# h- Z4 _% E富士通在东京举办的“富士通论坛2014”(5月15~16日)上公开了正在开发的下一代超级计算机主板,以及收纳该主板的2U(约9cm)高度机箱。这个高约9cm的机箱所容纳的处理能力为12TFLOPS左右,与两代前的超级计算机“京”的一台机柜(高约2m)相同。单位高度的处理能力约为“京”的22倍。
- }2 [# _& m' E* l9 S  Q
, C  {, g+ X1 h; I8 s       “京”的MPU为“SPARC64 VIIIfx”,运算能力为128GFLOPS。富士通2011年发布的新一代超级计算机“PRIMEHPC FX10”配备的是新一代MPU“SPARC64 IXfx”。该MPU的运算能力为236.5GFLOPS。目前正在开发的超级计算机的MPU为SPARC64 IXfx的新一代芯片。尽管名称尚未确定,但运算能力可达到约1TFLOPS。1 C) J9 |; P1 M$ C
$ i& N8 T+ ?0 W# d8 z6 a6 T" R& S
左为机箱,右为主板。, K! r4 a  q8 n  Q4 O! x7 R3 q* G

, H5 S5 P6 R) ]3 [1 Y 1 B7 C+ G- l) D- H
与“京”的比较 富士通的介绍展板。, M6 f& i# y7 A; @% R" N& ]8 ^
, a! z; Z2 z# X
       在“京”上用于连接各处理器的“TOFU”互联芯片被内置在该MPU里。正在开发的下一代超级计算机主板上装有3个这种MPU。每个主板的运算能力约为3TFLOPS,一个2U机箱装有4块主板,其运算能力约为12TFLOPS。* V. ?$ v  o9 |" }/ \
* |. ]" ^$ p( i" y6 D
       据富士通介绍,主板上每个MPU都配备8个DRAM模块。DRAM模块为美国美光科技(Micron Technology)公司的“Hybrid Memory Cube(HMC)”。HMC为纵向堆叠多个DRAM裸片、使用TSV(硅通孔)来连接的三维封装DRAM。截止目前,HMC的容量以及堆叠的DRAM裸片个数均未确定。通过将互联芯片内置于MPU以及使用HMC等措施,使主板布局变得十分简洁,水冷管的设置也较现行超级计算机有了大幅改善。
$ p4 q0 T5 i0 X* j
. n) F. ^8 X4 }2 Y2 n
9 ^# [0 |0 {1 c# O$ |" t" A主板的概要 富士通的幻灯片。       
# F! C1 \* H3 [0 x( l
$ ?# S$ o3 i% x5 o$ L. d5 |
" H% w- A, O5 X; b机箱等的概要 富士通的幻灯片。
1 K  Y) D" C$ ]2 D: i# g, i* s$ t       除了三维封装DRAM之外,富士通还在超级计算机上首次采用了光纤连接技术。各个机箱之间采用光纤连接。但主板上的部件与主板之间仍与原来一样为电信号连接。
" T5 J# ~5 t7 e9 w4 e$ y4 n: s1 E& }. U# M
       富士通目前已经接到了此次公开的下一代计算机订单。订购方为日本独立行政法人宇宙航空研究开发机构(JAXA)。从JAXA获得订单的超级计算机的系统总体理论峰值性能将达到3.4PFLOPS。据富士通介绍,该系统将分阶段导入JAXA,计划2014年10月启动部分系统,2016年4月开始全面运行。

本帖被以下淘专辑推荐:

  • · 超算|主题: 1, 订阅: 0

该用户从未签到

2#
 楼主| 发表于 2014-6-30 16:21 | 只看该作者
本帖最后由 stupid 于 2014-6-30 16:33 编辑
# D' K* m9 G$ ]% l: R: R& }+ }6 w4 k3 W+ u4 l0 K5 n' [
富士通2014年6月23日在于德国举行的超级计算机国际会议“ISC'14”上,公布了现有超级计算机“PRIMEHPC FX10”的后续机型“Post-FX10(暂称)”的详情(照片1、2)。新机型目前正在通过实机测评其性能,预定2015年开始供货。# B7 Z" k$ }' e9 t* w& s
, h. h* k7 Z5 J1 p

) u3 t- ~" X9 B照片1:Post-FX10的概要
0 X: T! l/ R5 x- |' F0 c2 L+ M6 C0 |% [, W4 [7 z5 y
0 s+ g2 W8 z3 ~9 J
照片2:富士通公开的产品发展蓝图以及针对EXAFLOPS级超级计算机的研究开发 3 w+ f9 P" B) g, z1 E& i- [) {' {% i
       Post-FX10配备的新处理器“SPARC64 XIfx”有34个SPARC内核,其中32个用于计算,2个用来辅助OS和MPI等(照片3、4)。通过将SIMD运算电路的bit长度扩展至原来2倍的256bit,提高了单线程性能。每个处理器的运算性能约为1TFLOPS,相当于“京”的处理器的约8倍、现行机型的约4倍。
! q8 E- L% Y' [, r
& g. n  ]5 o8 T$ J8 C% k , I( l+ [8 q& M; {
照片3:此次公开的“SPARC64 XIfx”的晶圆
6 o5 G6 ^. k/ Y
% s+ G6 f/ x% X8 N
! h! w9 b5 k4 \- a6 F- m) i  ?照片4:配备34个SPARC内核,32个用于计算,2个用于辅助 8 d' Y- _5 Q; N$ V7 s
       每个处理器配备8个美光科技的大带宽HMC(Hybrid Memory Cube,照片5)。从这一点来看,可以说,与存储容量相比,Post-FX10更重视存储带宽。富士通没有公布存储容量和存储带宽的详情,但透露说“计划使B/F值(存储带宽与运算性能的比例)达到与京相同的水平”。5 m! Q/ F2 u4 {) [$ K3 j

3 G9 A" ?# J$ _ $ R7 j/ Q: C* \2 b5 Z* D
照片5:“SPARC64 XIfx”的主板。每个板卡上配备3个处理器。每个处理器配备8个美光的HMC。 7 p1 u! }- x" e/ Z& ]2 ]( p6 R
       连接各处理器的“Tofu Interconnect 2”整合到了处理器中。每条链路的带宽为12.5GB/秒×2(双向),提高到了5GB/秒的京的2倍以上。  ~) _7 O( x5 |7 e

& Y) q9 E' P- G9 N. A: |7 m       Post-FX10的水冷机箱能在2U尺寸内配备12个节点(1个节点=1个处理器,照片6)。一台2U机箱的运算性能几乎等于京的一台机柜。机箱之间采用光纤连接。! P3 \! W. A4 d' o/ q* P* W
' E7 H* I) l' J2 \
) z8 T, c* x8 T% |2 [5 z
照片6:Post-FX10的水冷机箱。Post-FX10每台机柜可配备200多个节点
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-11-23 01:49 , Processed in 0.187500 second(s), 29 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表