找回密码
 注册
关于网站域名变更的通知
查看: 3604|回复: 1
打印 上一主题 下一主题

[仿真讨论] 富士通首次公开下一代超极计算机主板,单位尺寸处理能力高达“京”的22倍

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2014-5-24 11:13 | 只看该作者 |只看大图 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
本帖最后由 stupid 于 2014-5-24 11:16 编辑 & X; A2 o6 K, b
% q: C- M8 r( ~( l, q
富士通在东京举办的“富士通论坛2014”(5月15~16日)上公开了正在开发的下一代超级计算机主板,以及收纳该主板的2U(约9cm)高度机箱。这个高约9cm的机箱所容纳的处理能力为12TFLOPS左右,与两代前的超级计算机“京”的一台机柜(高约2m)相同。单位高度的处理能力约为“京”的22倍。- o/ s7 B2 u3 N8 K3 \

" \  C& n, H' F. o# H$ y7 d       “京”的MPU为“SPARC64 VIIIfx”,运算能力为128GFLOPS。富士通2011年发布的新一代超级计算机“PRIMEHPC FX10”配备的是新一代MPU“SPARC64 IXfx”。该MPU的运算能力为236.5GFLOPS。目前正在开发的超级计算机的MPU为SPARC64 IXfx的新一代芯片。尽管名称尚未确定,但运算能力可达到约1TFLOPS。& l9 f6 Y5 u, k8 J/ A
0 I/ \" @* p! {! `- Z
左为机箱,右为主板。0 ~3 @" V/ r; l( m- i2 Q
- v1 K3 q& l. R9 Q1 T
9 _. m6 G& C+ V$ ?- @' \, O
与“京”的比较 富士通的介绍展板。; P% G# \6 k8 _+ B" K$ V* S; u/ l
' G0 l/ A8 D3 o2 @
       在“京”上用于连接各处理器的“TOFU”互联芯片被内置在该MPU里。正在开发的下一代超级计算机主板上装有3个这种MPU。每个主板的运算能力约为3TFLOPS,一个2U机箱装有4块主板,其运算能力约为12TFLOPS。
  H# d" |  F: Z- N. Y/ T- q
- y; H; K+ [; j: z       据富士通介绍,主板上每个MPU都配备8个DRAM模块。DRAM模块为美国美光科技(Micron Technology)公司的“Hybrid Memory Cube(HMC)”。HMC为纵向堆叠多个DRAM裸片、使用TSV(硅通孔)来连接的三维封装DRAM。截止目前,HMC的容量以及堆叠的DRAM裸片个数均未确定。通过将互联芯片内置于MPU以及使用HMC等措施,使主板布局变得十分简洁,水冷管的设置也较现行超级计算机有了大幅改善。2 s. ]9 P. J# K, }2 B
8 _9 g% f  Q+ V" U' c
8 S8 q0 N/ X4 Y" J4 I+ C* A) w3 l
主板的概要 富士通的幻灯片。       
9 i# A9 @- {& y' D" s, R" U& O$ y  }  Y
3 A: E' h2 b0 v4 ]  ?0 _( o
机箱等的概要 富士通的幻灯片。
) c* O; y, N% d! B       除了三维封装DRAM之外,富士通还在超级计算机上首次采用了光纤连接技术。各个机箱之间采用光纤连接。但主板上的部件与主板之间仍与原来一样为电信号连接。
+ q1 n1 G. G& A* f$ ]9 I( x
' N. P5 O' g' a( @2 j# @       富士通目前已经接到了此次公开的下一代计算机订单。订购方为日本独立行政法人宇宙航空研究开发机构(JAXA)。从JAXA获得订单的超级计算机的系统总体理论峰值性能将达到3.4PFLOPS。据富士通介绍,该系统将分阶段导入JAXA,计划2014年10月启动部分系统,2016年4月开始全面运行。

本帖被以下淘专辑推荐:

  • · 超算|主题: 1, 订阅: 0

该用户从未签到

2#
 楼主| 发表于 2014-6-30 16:21 | 只看该作者
本帖最后由 stupid 于 2014-6-30 16:33 编辑 $ [; C) w1 M9 `/ \1 j; b

* L3 B: R' T' R# {8 n4 D+ _富士通2014年6月23日在于德国举行的超级计算机国际会议“ISC'14”上,公布了现有超级计算机“PRIMEHPC FX10”的后续机型“Post-FX10(暂称)”的详情(照片1、2)。新机型目前正在通过实机测评其性能,预定2015年开始供货。
# u, U& x6 c0 x/ v
' W! v) G8 B# @, E" W+ X7 m
. X5 G/ n1 `, B3 Y$ e" M' Z照片1:Post-FX10的概要
7 X8 {* M! E$ D( I: e' c& J
" u  c% w/ e: w: S) _$ {! E9 E
* R2 U% [: G# s0 A5 Y照片2:富士通公开的产品发展蓝图以及针对EXAFLOPS级超级计算机的研究开发   y1 n$ A. g0 Y, o
       Post-FX10配备的新处理器“SPARC64 XIfx”有34个SPARC内核,其中32个用于计算,2个用来辅助OS和MPI等(照片3、4)。通过将SIMD运算电路的bit长度扩展至原来2倍的256bit,提高了单线程性能。每个处理器的运算性能约为1TFLOPS,相当于“京”的处理器的约8倍、现行机型的约4倍。4 {: P* d( f3 l2 Y; I  Y: C

" e5 M3 K$ b: | % }& p8 O" ]; Z8 R
照片3:此次公开的“SPARC64 XIfx”的晶圆 # g  ?5 V: H* T& S7 R1 [

4 r7 f/ i+ ^- H. |& j
$ c# J5 Q- i# z9 n# I* @5 s+ C照片4:配备34个SPARC内核,32个用于计算,2个用于辅助 " E+ I" Z  T' l6 |$ g2 w
       每个处理器配备8个美光科技的大带宽HMC(Hybrid Memory Cube,照片5)。从这一点来看,可以说,与存储容量相比,Post-FX10更重视存储带宽。富士通没有公布存储容量和存储带宽的详情,但透露说“计划使B/F值(存储带宽与运算性能的比例)达到与京相同的水平”。& {6 D/ ?9 a: {3 {- r
. l0 e$ K* \  W; q

# Z3 G+ G2 {/ S, b, R' K照片5:“SPARC64 XIfx”的主板。每个板卡上配备3个处理器。每个处理器配备8个美光的HMC。 3 s) i; V: w$ @' i7 o0 [" M
       连接各处理器的“Tofu Interconnect 2”整合到了处理器中。每条链路的带宽为12.5GB/秒×2(双向),提高到了5GB/秒的京的2倍以上。% {6 m8 Q8 L* @; t: D1 o

2 Q6 E8 I, i; f1 u       Post-FX10的水冷机箱能在2U尺寸内配备12个节点(1个节点=1个处理器,照片6)。一台2U机箱的运算性能几乎等于京的一台机柜。机箱之间采用光纤连接。
6 b: ~  C2 _/ l" p1 R
& U, m- Z" n+ U3 E" K" [& i
! v, m. Y/ J- H- t; ^照片6:Post-FX10的水冷机箱。Post-FX10每台机柜可配备200多个节点
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2026-4-18 23:55 , Processed in 0.109375 second(s), 30 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表