找回密码
 注册
关于网站域名变更的通知
查看: 236|回复: 1
打印 上一主题 下一主题

 转——DSSD的研发车间

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2019-4-8 09:58 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
转——DSSD的研发车间

' {8 b  Q" N1 ^8 C
5 D$ b: q0 h! `8 V% J+ `我们来看看一个老外对神秘的[url=]DSSD[/url]内部的参观,可以知道他们在干什么。
9 B, ?$ W$ o. X7 U+ v7 A3 b; n* \ ' K& g3 Y$ G5 w& N; ]% U. @, J: a& Y
首先,来猜一下什么是[url=]DSSD[/url]的产品:
- Y7 S2 `2 ?' f5 H- T$ M. |2 e1. 并不是传统的磁盘阵列,因为是用在Server上面的;, ~7 @- \* k! {- B) ?
2. 存储密度会非常高。性能和密度都会超出你的想象,因为它的目标是要当一个大内存使用,能跑内存数据库等。
* D: Q- k( C4 s3. 延迟会非常低。大概几十微秒,要知道NAND Flash MLC的写时间是毫秒级,读是几百微秒,所以DSSD肯定要用DRAM或者SLC做Cache层。( X5 y2 N% `1 \& [5 T- }* c6 K
3 e+ t% n) ~% y2 H1 R
再来猜一下DSSD的用途:
* b; y" C$ e5 t2 u; k9 b1 x1. 需要高频读写的数据存储。基于分布式文件系统,分布式意味着每个server都有数据存储,而不是存储阵列一样集中。- G6 V7 a* [+ i) Z
2. 需要高频读写的数据,同时有key-value存储,高性能计算,尤其是数据密集的高性能计算。
* f1 y3 `0 a+ g说白了,就是对大内存的要求。) J; l& i$ J* B: C. B

2 p$ ?. S% b) K( m# q8 [' S聊完技术,咱们就开始DSSD之旅了。
- _$ r- E5 j  @DSSD位于加州的Menlo Park,反正就是大牛们扎堆的硅谷了。
* I% p! ^/ C( T, i% l( J 2 J& b; `0 ^+ y6 l& f
一栋老房子,新装修了一下。记者大清早过去,大家还忙忙碌碌的。大厅里面好多新员工,软件工程师、客户支持之类。今年五月的时候有160多名员工,而且还在快速增长。毕竟被收购了,有的是银子发工钱。
9 O* Q2 W/ ~1 A  R- D+ j& k * b; Q% t+ u" d0 w3 v
下面是个DSSD的早期原型机,O(∩_∩)O哈哈~ 很山寨,风扇,电源,网线,板子上的飞线,下面的板子上好像是4个插槽,紫色的应该是PCIe线缆,所以估计是PCIe接口,密集的PCIe接口确实很恐怖,最终会制造出怎样高的带宽呢?拭目以待~
0 T- J3 A- w3 k: U/ G * s$ h; Z, Q3 k: M; x+ i* l
下面这台主机里面插了8块PCIe接口卡,从服务器的两个散热盒看有点像是NUMA架构的机器。一条线是PCIe Gen 3 x 4 Lane,8条的速度将近32GB/s。/ a/ P" V; A% G

. u# X, E5 r" X: BPCIe接口卡的原型,它的作用就是把PCIe线缆接口转为主板上的PCIe插槽接口。
* A6 f" S/ E$ H: ?5 i+ O
5 J3 A! H6 @' Y9 ]0 ^5 g# {为了达到这么高的带宽和延迟,DSSD的Flash用了很多模组,如下图,你能想象里面有512个Flash Die(几个Die可以封装成一个芯片)并行工作吗?要知道一般的消费级SSD里面只有4到8个数据通道,DSSD这个模组里面估计至少有几十个通道。
4 ]/ h2 g1 p( b1 G) d$ h1 P
- \0 k+ v, J! d# U) z1 G打开看看里面的电路板,有很多Flash,SRAM作为Cache(没用DRAM,好奢侈),还有DSSD自己的控制器,外壳上涂了散热胶。整体功耗45-60W,其实还挺高的。从右往左详细看看:: i- k  J# s& u7 y& H
1. 最右边是接口,像是PCIe。) N, J, x$ K/ [. n- w
2. SRAM做Cache。
$ w- T( O+ c1 s( T( u3. 控制器芯片,在背面。
# R# j& j! y! u0 o4 `. S4 |' J$ m+ y4. 一大波Flash。
. \# ]5 G. b. x/ j3 Z4 x& Z- o9 {5. 有点像是锂电池,估计是来做掉电保护的。
: c( ]' K' O' B9 k; ]( I9 K: N ' ^! G- i8 X% t9 [! f5 @
来看看DSSD的整体,它是个5U的机箱,功耗是2000W,所以散热很重要。可以看到上下都有一堆风扇,这要是都转起来,声音可是震耳欲聋啊。
# S3 R, i+ c9 s3 Q% |  J 7 i. E/ z" v& a6 v" g  ?' s
散热的设计其实是很复杂的,有点像是混沌,一个很小的因素可能导致很大的不可预期的结果。DSSD的团队非常专业,用3D打印来制造原型,做实验并不断修改。下图是他们的Makerbots 3D打印机。
. H6 r& Y8 N* i. K6 Q$ U  X1 k$ }
- ]! x$ ^: x. p# f
, r) T9 a5 i, i3 r
! H# L- ?/ y& X& b6 t0 a* ?  T8 Q0 l* d3 h2 C* A$ |( |1 h
会议室旁边就是测试机房。
# \4 `; ^0 N2 [- U4 o5 v" D8 D
. ^4 C2 i9 |- e9 l& x. `8 \- G这台5U的DSSD连到了48个主机上,里面每个白色的就是1个之前看到的Flash模组,可见容量和性能有多大。我数了一下,有36块!!可以想象最终的性能和容量了。中间那个白色的是DSSD,上下都是测试的主机。( s+ }+ x5 J' f+ C
% |' b& E/ ^$ k6 R

/ c; d* Y& n, b& o: K* g( N+ P 3 {8 G+ v7 X' y9 a( f7 S

4 D& c: K' ]0 i% S% @# w4 j7 t+ B看看后面,可怕的PCIe线缆。。。。每台主机都连了冗余的PCIe线缆。下图是DSSD的背后,一堆PCIe线。
! i. Q2 H- p, b' P 4 t( ?& o4 D+ F, X1 n
4 _  z2 ^6 I* A0 ~
. _/ z8 _8 c( ^$ B# `

1 u) E' \& Q: g
' E, U) P8 l) G! k: Y7 Y, k1 }其实这栋楼以前就是Sun当年风光无限的时候持有的,所以DSSD的很多员工可能又回到了当年的地盘。6 Q5 |3 v6 w' Z- Z" e
4 t3 N& C7 P0 }, m" n+ a3 @6 f9 j
; W9 S4 l" e  |8 Q- U- q1 g; x9 D
2 F- i& g% w0 Z/ L0 H( O: M
2013年做的PCIe Switch原型板。
0 H- C+ g8 r1 X+ N8 C) G2 N. u
+ h5 @( a7 |( A9 T* e, M, S ! f8 n0 \& y$ E) D- h9 l
) i+ O' B+ q! Z+ G) r) ~
再来回顾一下DSSD的软硬件特点:
  P4 q5 l, i9 e, Q, }% j% s! U+ F
5 W0 _" Q6 m; M4 s0 c- J0 c
1. 硬件:接近DRAM的延迟,超高存储密度,高IOPS,高带宽;
1 q- f0 [: e2 J7 m8 L# z- l4 }

1 B0 X! {/ ?$ O" J, S9 }: N/ ^2. 软件:支持Key-Value存储 API,MEMCacheD,交易型分布式文件系统。: Z, i( o$ _/ P- K7 J  e8 ?) N

该用户从未签到

2#
发表于 2019-4-8 15:57 | 只看该作者
看上去很高大上啊
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-7-29 22:14 , Processed in 0.125000 second(s), 23 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表