找回密码
 注册
关于网站域名变更的通知
查看: 3549|回复: 1
打印 上一主题 下一主题

[仿真讨论] 富士通首次公开下一代超极计算机主板,单位尺寸处理能力高达“京”的22倍

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2014-5-24 11:13 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
本帖最后由 stupid 于 2014-5-24 11:16 编辑
5 ^8 ?5 D. M4 J2 H; h' v9 \3 b- |8 n0 o1 d; K; Y1 F! ^: T
富士通在东京举办的“富士通论坛2014”(5月15~16日)上公开了正在开发的下一代超级计算机主板,以及收纳该主板的2U(约9cm)高度机箱。这个高约9cm的机箱所容纳的处理能力为12TFLOPS左右,与两代前的超级计算机“京”的一台机柜(高约2m)相同。单位高度的处理能力约为“京”的22倍。
3 B' {  Q7 D7 |' k6 p) C# P, a5 w) _6 v# q! e
       “京”的MPU为“SPARC64 VIIIfx”,运算能力为128GFLOPS。富士通2011年发布的新一代超级计算机“PRIMEHPC FX10”配备的是新一代MPU“SPARC64 IXfx”。该MPU的运算能力为236.5GFLOPS。目前正在开发的超级计算机的MPU为SPARC64 IXfx的新一代芯片。尽管名称尚未确定,但运算能力可达到约1TFLOPS。; ~& m, O9 B; Z

( R4 _" n& {0 P  _- d左为机箱,右为主板。$ ^; r9 D/ ^  R3 q: {- g

2 c0 Y/ j  C: g7 p' c* v
1 A' N+ r7 y. S与“京”的比较 富士通的介绍展板。* s! b2 `# |6 ]' F2 _

' P  l. Q5 s, ^  l( o       在“京”上用于连接各处理器的“TOFU”互联芯片被内置在该MPU里。正在开发的下一代超级计算机主板上装有3个这种MPU。每个主板的运算能力约为3TFLOPS,一个2U机箱装有4块主板,其运算能力约为12TFLOPS。
1 U) M" d& o* \0 x; b& _, X9 ?4 Y) n) F8 D
       据富士通介绍,主板上每个MPU都配备8个DRAM模块。DRAM模块为美国美光科技(Micron Technology)公司的“Hybrid Memory Cube(HMC)”。HMC为纵向堆叠多个DRAM裸片、使用TSV(硅通孔)来连接的三维封装DRAM。截止目前,HMC的容量以及堆叠的DRAM裸片个数均未确定。通过将互联芯片内置于MPU以及使用HMC等措施,使主板布局变得十分简洁,水冷管的设置也较现行超级计算机有了大幅改善。
% g4 g% |; H5 ~! }* |, v) t
/ y- M; ?/ \: ]7 x; L9 Z 7 u3 n+ Q: t+ t' @/ ]( B( X# {
主板的概要 富士通的幻灯片。       
6 ^! T- E9 `' s4 S9 W! V) G4 u2 u, ^: T  ~  O
* N. V5 S$ E2 }/ ]; `
机箱等的概要 富士通的幻灯片。- j! m' Y0 f! u- p( t+ E9 h% C
       除了三维封装DRAM之外,富士通还在超级计算机上首次采用了光纤连接技术。各个机箱之间采用光纤连接。但主板上的部件与主板之间仍与原来一样为电信号连接。2 f& J# `2 Z% [% S

: R: _- o# k9 U       富士通目前已经接到了此次公开的下一代计算机订单。订购方为日本独立行政法人宇宙航空研究开发机构(JAXA)。从JAXA获得订单的超级计算机的系统总体理论峰值性能将达到3.4PFLOPS。据富士通介绍,该系统将分阶段导入JAXA,计划2014年10月启动部分系统,2016年4月开始全面运行。

本帖被以下淘专辑推荐:

  • · 超算|主题: 1, 订阅: 0

该用户从未签到

2#
 楼主| 发表于 2014-6-30 16:21 | 只看该作者
本帖最后由 stupid 于 2014-6-30 16:33 编辑 ( ?3 ]5 H3 s* U% p2 ]) j! v$ K
) g5 Y7 B  T% ]. |* ~/ @
富士通2014年6月23日在于德国举行的超级计算机国际会议“ISC'14”上,公布了现有超级计算机“PRIMEHPC FX10”的后续机型“Post-FX10(暂称)”的详情(照片1、2)。新机型目前正在通过实机测评其性能,预定2015年开始供货。
; f% U9 s5 E' E" P' e7 \3 ^1 e; J! J: w' ^3 ~
# W0 @0 {/ Z+ i" t# j6 @( b( W( w
照片1:Post-FX10的概要 / [0 j9 g8 s. S- B3 s0 D
- I- y4 m# }) `
' }; ]" A" ?4 q3 C) I2 r/ J
照片2:富士通公开的产品发展蓝图以及针对EXAFLOPS级超级计算机的研究开发
2 V9 `! e; o  t       Post-FX10配备的新处理器“SPARC64 XIfx”有34个SPARC内核,其中32个用于计算,2个用来辅助OS和MPI等(照片3、4)。通过将SIMD运算电路的bit长度扩展至原来2倍的256bit,提高了单线程性能。每个处理器的运算性能约为1TFLOPS,相当于“京”的处理器的约8倍、现行机型的约4倍。
4 K% e0 E7 v; O0 R# w
* O& [! o3 l, \4 n. S
5 q) H0 U; y5 _) P4 o. D照片3:此次公开的“SPARC64 XIfx”的晶圆 9 x. `! i  t8 F  z

6 t7 M+ \8 |6 V; P & t' G7 s* v6 F3 f8 k* z1 k
照片4:配备34个SPARC内核,32个用于计算,2个用于辅助 / g8 a' i9 e. c+ ]+ ?" F4 I
       每个处理器配备8个美光科技的大带宽HMC(Hybrid Memory Cube,照片5)。从这一点来看,可以说,与存储容量相比,Post-FX10更重视存储带宽。富士通没有公布存储容量和存储带宽的详情,但透露说“计划使B/F值(存储带宽与运算性能的比例)达到与京相同的水平”。; S8 I7 [. @9 j  j' O

: C9 A  x/ b4 P$ e 8 ~# u8 |* Y. m' E
照片5:“SPARC64 XIfx”的主板。每个板卡上配备3个处理器。每个处理器配备8个美光的HMC。
7 R. p0 |1 m. Q! ]2 E" q% f7 _       连接各处理器的“Tofu Interconnect 2”整合到了处理器中。每条链路的带宽为12.5GB/秒×2(双向),提高到了5GB/秒的京的2倍以上。% M5 C1 |2 B. K. @  K) n1 _

2 Q+ S& }% e( K5 r       Post-FX10的水冷机箱能在2U尺寸内配备12个节点(1个节点=1个处理器,照片6)。一台2U机箱的运算性能几乎等于京的一台机柜。机箱之间采用光纤连接。( D& k5 F& r9 i9 Z4 U) Z

' W( F# y" d  L
+ ~' }) C7 ^4 Q( e. e; ^照片6:Post-FX10的水冷机箱。Post-FX10每台机柜可配备200多个节点
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-11-22 16:13 , Processed in 0.187500 second(s), 29 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表