EDA365电子论坛网

标题: 富士通首次公开下一代超极计算机主板,单位尺寸处理能力高达“京”的22倍 [打印本页]

作者: stupid    时间: 2014-5-24 11:13
标题: 富士通首次公开下一代超极计算机主板,单位尺寸处理能力高达“京”的22倍
本帖最后由 stupid 于 2014-5-24 11:16 编辑 . u. u. ?( D* J6 O! ^6 c) k
4 S4 Q! T0 L- s) \  D6 x5 @9 M
富士通在东京举办的“富士通论坛2014”(5月15~16日)上公开了正在开发的下一代超级计算机主板,以及收纳该主板的2U(约9cm)高度机箱。这个高约9cm的机箱所容纳的处理能力为12TFLOPS左右,与两代前的超级计算机“京”的一台机柜(高约2m)相同。单位高度的处理能力约为“京”的22倍。
7 O. u8 G2 M+ S, T" ]5 r! M$ V/ ]% g9 S$ x9 o
       “京”的MPU为“SPARC64 VIIIfx”,运算能力为128GFLOPS。富士通2011年发布的新一代超级计算机“PRIMEHPC FX10”配备的是新一代MPU“SPARC64 IXfx”。该MPU的运算能力为236.5GFLOPS。目前正在开发的超级计算机的MPU为SPARC64 IXfx的新一代芯片。尽管名称尚未确定,但运算能力可达到约1TFLOPS。' X1 [: T3 F# y- J: u- c' ]
& J1 [" t% V% A3 V0 _* s
左为机箱,右为主板。2 d2 t* ~) X7 v: Z) G
' x" m9 R# V% N6 ]+ R* F$ e

) M" d8 |7 }0 F: W0 R! ]% f与“京”的比较 富士通的介绍展板。
( G4 A. q9 P# v+ G
2 l5 p( Z3 a7 \5 H- d" P; ]% Y       在“京”上用于连接各处理器的“TOFU”互联芯片被内置在该MPU里。正在开发的下一代超级计算机主板上装有3个这种MPU。每个主板的运算能力约为3TFLOPS,一个2U机箱装有4块主板,其运算能力约为12TFLOPS。. t1 V- A8 F  g( e- y3 Y
- z' @8 A) b/ o6 r4 k5 N( U! m1 S
       据富士通介绍,主板上每个MPU都配备8个DRAM模块。DRAM模块为美国美光科技(Micron Technology)公司的“Hybrid Memory Cube(HMC)”。HMC为纵向堆叠多个DRAM裸片、使用TSV(硅通孔)来连接的三维封装DRAM。截止目前,HMC的容量以及堆叠的DRAM裸片个数均未确定。通过将互联芯片内置于MPU以及使用HMC等措施,使主板布局变得十分简洁,水冷管的设置也较现行超级计算机有了大幅改善。
$ ~* Z0 U' Q$ Q0 C7 P/ d: d7 E2 S5 n4 \( I
1 m& L4 W" M# v/ |& t+ d$ C! V7 w
主板的概要 富士通的幻灯片。       
) t/ F1 h) ~! y4 i: D" M0 b# y( k4 y6 E& s8 p( `

, Z! Q* \8 a7 f, x* q4 ?机箱等的概要 富士通的幻灯片。
* I& r! \/ @/ v  t7 |       除了三维封装DRAM之外,富士通还在超级计算机上首次采用了光纤连接技术。各个机箱之间采用光纤连接。但主板上的部件与主板之间仍与原来一样为电信号连接。3 Y, w  U* ~; Z3 A
  _, P0 C& v' F8 k
       富士通目前已经接到了此次公开的下一代计算机订单。订购方为日本独立行政法人宇宙航空研究开发机构(JAXA)。从JAXA获得订单的超级计算机的系统总体理论峰值性能将达到3.4PFLOPS。据富士通介绍,该系统将分阶段导入JAXA,计划2014年10月启动部分系统,2016年4月开始全面运行。
作者: stupid    时间: 2014-6-30 16:21
本帖最后由 stupid 于 2014-6-30 16:33 编辑
8 c8 ]6 o+ x- Z' A" Z* B" \4 @3 E- N1 B" N
富士通2014年6月23日在于德国举行的超级计算机国际会议“ISC'14”上,公布了现有超级计算机“PRIMEHPC FX10”的后续机型“Post-FX10(暂称)”的详情(照片1、2)。新机型目前正在通过实机测评其性能,预定2015年开始供货。
: ?0 T8 e8 i4 V4 e- [5 N/ L& y) i. t1 R7 R! _$ M3 D* `

6 W' X. i9 r# B# Y% b2 B% Y照片1:Post-FX10的概要
) R! W! k$ L% D& n% u" e- k$ R, o  T+ ~# b% o& l% e; }1 B
( n$ f9 \5 H& e
照片2:富士通公开的产品发展蓝图以及针对EXAFLOPS级超级计算机的研究开发
% q# M  P% G" K       Post-FX10配备的新处理器“SPARC64 XIfx”有34个SPARC内核,其中32个用于计算,2个用来辅助OS和MPI等(照片3、4)。通过将SIMD运算电路的bit长度扩展至原来2倍的256bit,提高了单线程性能。每个处理器的运算性能约为1TFLOPS,相当于“京”的处理器的约8倍、现行机型的约4倍。3 f' P! L; P: |# E# _8 p6 c% l

4 E  K7 c" b5 X9 u
" e8 }2 B5 Y  }/ W. E5 r照片3:此次公开的“SPARC64 XIfx”的晶圆
2 P% M6 g- c/ e! g; L. }' X2 f" z) O) U
) a# R' [5 [, w9 Q* V* F
照片4:配备34个SPARC内核,32个用于计算,2个用于辅助 # g  p  j: b4 \2 _: u* l8 e; Q
       每个处理器配备8个美光科技的大带宽HMC(Hybrid Memory Cube,照片5)。从这一点来看,可以说,与存储容量相比,Post-FX10更重视存储带宽。富士通没有公布存储容量和存储带宽的详情,但透露说“计划使B/F值(存储带宽与运算性能的比例)达到与京相同的水平”。7 z. `& Q0 v' ?4 V, @( {  {( z
+ h0 t; d& B. r( L

7 z/ G3 E! q3 H& ~照片5:“SPARC64 XIfx”的主板。每个板卡上配备3个处理器。每个处理器配备8个美光的HMC。
  F1 y& O3 w2 a, Z+ l/ F       连接各处理器的“Tofu Interconnect 2”整合到了处理器中。每条链路的带宽为12.5GB/秒×2(双向),提高到了5GB/秒的京的2倍以上。, ~# S7 i7 }. K& q. W' ]% m

- o9 G' y+ `9 I7 `" e       Post-FX10的水冷机箱能在2U尺寸内配备12个节点(1个节点=1个处理器,照片6)。一台2U机箱的运算性能几乎等于京的一台机柜。机箱之间采用光纤连接。
. y& S' ^; t% G3 A
4 z  U6 b! X$ Y1 q8 w! l
( U9 U4 \( ~2 y* m# t照片6:Post-FX10的水冷机箱。Post-FX10每台机柜可配备200多个节点




欢迎光临 EDA365电子论坛网 (https://bbs.eda365.com/) Powered by Discuz! X3.2