找回密码
 注册
关于网站域名变更的通知
查看: 299|回复: 4
打印 上一主题 下一主题

独立DSP芯片兴衰史:FPGA吹响了丧钟

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-11-3 09:59 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
DSP可以追溯到数字时代的开端,甚至可能更早一些。如果说1946年第一台数字计算机ENIAC的建造标志着1946年数字时代的开始,那么DSP则在两年后出现。
9 X! j0 O# m7 t: e7 _! hIEEE于1998年出版了一本名为《Fifty Years of Signal Processing: The IEEE Signal Processing Society and its Technologies 1948-1998》的专著,将DSP开始的时代1948年称为DSP annus mirabilis。同年,贝尔电话实验室的Claude Shannon发表了题为“A Mathematical Theory of Communication”的具有里程碑意义的论文,该论文将可实现的比特率、信道带宽和信噪比之间的关系刻在石头上。5 [) n0 U! |- g8 Q
同一年,贝尔实验室的Shannon、Bernard M. Oliver 和 John R. Pierce发表了“The Philosophy of PCM”,记录了脉冲编码调制的实用性,并在PCM上打上了实用性的烙印,这个理论的首次设想是由Alec Reeves于1937年撰写。(伯纳德·奥利弗(Bernard Oliver)在更广的圈子中可能更为人所知的是巴尼·奥利弗(Barney Oliver),他是1966年创立惠普实验室的杰出人物,但那完全是另一回事。) Shannon、Bernard M. Oliver 和 John R. Pierce 正在记录一些PCM用于构建绝密SIGSALY安全语音系统的概念,这是一个房间大小、重50吨的庞然大物,为二战期间盟军最重要的语音通信进行编码和加密。
- W  P/ J, p/ y+ l) u巧合的是,贝尔实验室于1948年6月30日宣布开发晶体管,同年发表了两篇引发DSP革命的里程碑式论文。(晶体管的实际发展发生在前一年。)我们需要晶体管和固态电子设备将Shannon, Oliver和Pierce发表的论文中的概念转化为价格低廉的实用技术,以改变电子产品的世界,所以1948年确实是DSP的奇迹年。6 r: B: ~/ X2 y5 @" z0 L( v
1948年之后,很长一段时间内DSP技术都没有发生太多变化。数字电子技术对于DSP来说太新了,无法实用,至少不能用于实时信号处理。在此期间,许多DSP涉及将数字手动输入Friedan和Marchant机械计算器,这对于音频或视频通信来说非常不切实际。DSP的萌芽世界等待着关键的发展。实际上,有几个关键的发展。
7 ^" ^5 r1 C) m* [) i8 g这是DSP和单芯片DSP如何接管整个信号处理世界的故事。它与数字电子本身的历史相似,跨越了集成电路 (IC)、微处理器、DSP和FPGA的发展。在我们看来,FPGA最终大获全胜。
! d. P9 r7 F  v, @一些不稳定的步骤
+ y5 L5 ^, F9 D: n使DSP实用化所需的第一个关键发展是 IC 的发明。几乎同时,德州仪器 (TI) 的 Jack Kilby 和仙童半导体的Robert Noyce设想了两种截然不同的方法来构建第一个集成电路。1959年2月,TI的Kilby首先申请了专利。Kilby曾设想在一根硅棒上构建多个电子元件,然后使用小的金键合线将它们连接在一起。在申请专利之前,他实际上确实在1958年建造了这样的电路。然而Kilby错综复杂的手工组装过程是完全不切实际的,而且不太可能扩大到商业批量生产。) l# C6 b. Z7 }' y2 T* O0 e9 a$ g
Noyce于1959年初提出的想法是使用光刻技术,仙童半导体已经使用这种技术制造硅晶体管,在一个芯片上对多个电子元件进行成像,然后使用相同的光刻技术将这些元件与金属互连层互连。他将细节留给Jean Hoerni,后者开发了自那时以来一直用于制造 IC 的平面工艺。Noyce和Fairchild比Kilby晚,但仍是在1959年就这些想法申请了专利。
2 |$ F1 {* p4 ], P. k用于制造IC的实用制造方法只是所需的许多关键发展中的第一个。早期的数字IC太原始,并且包含的晶体管太少,无法认真考虑将它们用于实际的DSP。那是因为DSP涉及一个非常深奥的概念——称为数学。特别是,您需要两个关键的数学运算符——乘法和加法——并且您需要使用大量这些运算来执行DSP。我们中的一些人成为了数字工程师,所以我们可以忘记数学。
. I! h: J. t. K) kDSP工程并非如此。使用DSP时,无法逃避数学运算。+ R' P2 `( D" y. v- }
当电子世界正在等待足够的半导体技术进步使DSP成为一种实用技术时,世界其他地方已经迫不及待了。Bell System需要开发方法来通过其庞大的线路安装基础来填充更多语音容量,而PCM显然是第一步。此外,二战后军队对雷达和声纳的使用蓬勃发展,DSP显然是改进和提高这些系统能力的途径。通信卫星最初是在1945年由Arthur C. Clarke撰写的一篇论文中设想的,它将需要数字通信来解决一些可怕的信噪比问题,这些问题涉及向地球轨道发送信号和从地球轨道接收信号。
$ A+ e0 w1 ~$ C2 N8 N; n世界已准备就绪,但IC尚未准备就绪。
, a& v; s1 @/ @7 f1 W- |当DSP世界等待半导体技术迎头赶上时,信号处理理论家却没有。贝尔实验室的Binshu Atal和Manfred Schroeder于1967年开发了自适应预测编码 (Adaptive Predictive Coding:APC),这使得从4.8kbps比特流中获得适度的音频成为可能。% E2 b5 L- w0 K! |
然后,Atal开发了用于语音压缩的线性预测编码 (Linear Predictive Coding:LPC)。几乎同时,名古屋大学的Fumitada Imakura和NTT的Shuzo Saito开发了偏相关(partial correlation:PARCOR)编码,这是一种非常相似的算法。这些新的语音处理算法自然需要更多的计算——更多的乘法和加法——这使得需要专门的IC来使DSP实用且具有成本效益变得越来越明显。
% h) _7 f0 u# y- H2 G但是,通过带宽受限的电话信道运行的语音并不是唯一需要DSP信号的地方。雷达和声纳信号处理算法也需要它。真正占用带宽的电视信号需要它。只要技术实用,生成和接收的每个信号都可以从DSP中受益。如果它不需要装满 TI 和许多其他供应商在1960年代销售的中型IC的机架和电路板机架就好了。
' u, s% _; R5 Q: c7 @7 y. A$ S英特尔于1971年推出的第一个商用微处理器4004是对即将到来的事物的第一个暗示。Intel 4004微处理器当然可以进行乘法和加法运算,但是一次只能加四位,而且乘法是一个多步指令序列。硅是愿意的,但ALU和位宽很弱。' G- C, a$ H/ m" F- D' U
第一个DSP芯片并没有完全削减它
2 P  U2 w! c' r$ f2 NTRW于1976年设法创建并销售了16×16位单芯片数字乘法器——MPY016H——这是一款采用1微米双极工艺技术制造的产品。TRW MPY016H可以将两个16位数字相乘以在45纳秒内产生32位结果(dash-1 部分为40纳秒),但无法相加。您需要添加额外的IC以将累加器连接到乘法器。此外,您无法在一次操作中提取32位结果。您通过IC的16位输出端口将结果分成两部分。所以这个产品真的不是DSP。它只是DSP的一部分。此外,由于具有两个16位输入端口和一个16位输出端口,TRW MPY016H必须封装在64引脚宽DIP中。它以5V电压运行,但它几乎需要一个放大器才能启动。在5瓦时,它也需要一点冷却。
7 p+ A  S9 d0 P* `: r- p1 w
3 X: t0 T. c+ k" {5 a9 h: R5 Q0 b+ oAMI于1978年推出了S2811信号处理外设,它是一个带有12位硬件乘法器、一个16位ALU和一个16位输出的DSP,但它并不是作为单芯片DSP设计的AMI将S2811设计为用于8位6800微处理器的存储器映射外围设备,AMI还制造该产品作为微处理器的创始人摩托罗拉半导体的替代来源。AMI的6800 微处理器版本被称为S6800。9 W, E: v2 t3 h$ T' e; T( [+ w
6800微处理器通过一个小型和三个较大的片上多端口RAM配置和访问AMI S2811。尽管AMI S2811于1978年发布,但它基于一种难以制造的VMOS工艺技术,因此推迟了几年的到来。到那时,已经发布了几款单芯片DSP;随着Intel 8088、Zilog Z8000 和 Motorola 68000的推出,16位微处理器时代已经到来;6800微处理器外设市场开始迅速萎缩。那就使得过时的AMI S2811从未取得商业成功。, M1 S: ~  O8 y/ P
在AMI推出S2811信号处理外设的同一年,TI向消费者推出了一款基于DSP 的玩具,即电池供电的“Speak & Spell”,该玩具采用LPC作为其核心语音编码技术。Speak & Spell玩具采用了TI TMC0280语音合成器芯片,该芯片在硬件中实现了Binshu Atal的LPC算法。TO TMC0280本质上是一个专用的DSP。
9 B; X2 f, I% P. M4 B, E尽管当时的半导体技术将TI Speak & Spell的词汇量限制在165个单词,但这款玩具的稀疏词汇量对于儿童玩具来说是一个巨大的技术飞跃,即使零售价高达(当时)50美元。尽管TI TMC0280是一种专门的专用语音DSP,但其低成本和电池运行时间的能力为即将到来的DSP IC指明了道路。
0 B' D2 u3 E0 P7 D) {/ [( f& X6 A1979年2月,英特尔试图通过宣布英特尔2920“模拟信号处理器”来表达“是的,我们可以做到”。这个奇怪的集成DSP在前端有一个9 位ADC(8 位加符号)和一个四输入模拟多路复用器,一个9位DAC有一个8通道模拟采样保持电路和模拟多路复用器在前端后端,中间的数字ALU能够执行加法、减法和绝对值运算以产生25位结果。缺少乘法和除法指令迫使使用多指令序列来执行这些所需的DSP数学运算。每个乘法运算需要12条指令,除法运算需要14条指令。每条Intel 2920指令需要大约半微秒来执行,8 g* s7 H3 F: i: h, H% E8 v
Intel 2920是为信号过滤应用而设计的,但它的执行速度慢、数据路径有限、指令集独特、缺少硬件乘法器、模拟输入和输出电压范围有限以及其他严重的限制,这些都注定了该IC的商业失败。
& ?: i( k0 v: ?1 d3 }9 G因此,尽管很少有人记得英特尔2920,但它也预示着DSP的到来。- @, Z1 _4 i- x0 O: o- G
随着1970年代结束,世界显然已经准备好,甚至渴望真正的单芯片DSP。多亏了理论家,算法才得以开发并准备就绪。许多信号处理应用都在乞求功能强大的DSP芯片。剩下的就是开发能够支持这些要求的芯片设计和工艺技术。AMI、AT&T、英特尔、松下、摩托罗拉、NEC、TI、ADI公司和其他公司都在为这个问题而疯狂地工作。DSP芯片的爆炸式增长迫在眉睫。! V6 x* k6 o) h; b
在1948年DSP的奇迹年之后,又过了三个十年,实际的、实用的DSP芯片才会出现。像TRW的MPY016H硬件乘法器和TI 的 TMC0280 LPC语音芯片这样的DSP零碎部件被戏弄了——真正的集成DSP指日可待——但直到1980年代,半导体技术才发展到足以使可编程DSP芯片实用化。1980年代和1990年代,单芯片DSP的数量呈爆炸式增长。
! D! Q$ ]2 W; Z然后,20年后,单芯片DSP的时代戛然而止。; V! J( ?, w5 k: Y- Z9 X5 e
Wally Rhines在1970年代为德州仪器 (TI) 工作,他非常想离开TI在德克萨斯州Lubbock的工厂。当他有机会管理TI在休斯顿的微处理器业务时,他选择了这个职位,因为他发现休斯顿是一个更具吸引力的居住地。此外,没有人想要这份工作。TI的16位9900微处理器由于其缺乏竞争力的16位地址空间而陷入困境。由于未能在通用微处理器市场上分得一杯羹,莱茵斯在休斯顿TI新采用的微处理器团队创建了一个四管齐下的专用处理器战略。TI分叉战略的四个方面是:8 g  F, G8 b: T# o; {3 A/ m- ]& K
TMS320 DSP系列
& p/ O2 E7 M4 r' D" [, W
3 f! I, L% b* z0 [% V- _TMS340系列图形处理器& ]  D. {6 J- Z1 f" F
" Y1 a2 h  ~! h: F. f
TMS360大容量存储处理器(很快无处可去)
; M5 v8 f+ n$ J, L& `3 E
& N3 @1 E. W  c- F; C& z" Y% h! [用于IBM网络架构的 token-ring LAN处理器TMS3803 {  M( e  ^  X
5 {: ]1 t0 N0 `5 u
其中,TMS320 DSP系列成为战略中的摇滚明星。正如Rhines在接受采访时所说,“……它给我们上了一课:绝望是创新之母。” 经过几年的酝酿,TI于1982年4月推出了第一批TMS320 DSP。然而,对于这样的新技术来说,仅仅构建芯片是不够的。多年来,TI一直在宣传DSP,并通过软件开发工具和培训为其新DSP提供支持,然后才看到这些部件取得重大成功。根据Rhines的说法,TI又过了五六年才开始从这些产品中看到一些真正的收入。
8 P, b% O/ V8 z4 ^5 n1 DTI不是第一个
, ^/ x( L. i; f0 v然而,TI的DSP芯片肯定不是市场上的第一个。英特尔早在1979年就推出了命运多舛的2920模拟信号处理器,但该公司的另一款产品16位8086微处理器在其拥有8位外部数据总线的“弟弟”—— 8088微处理器——成为IBM PC的核心。Intel 2920从视线中消失了,很可能是因为Intel的全部注意力都被吸引到了通用微处理器市场。! |+ ~. T2 t" o8 u% p# y9 t
TI只是1980年代初期准备进入DSP领域的几家半导体公司之一。根据Forward concepts总裁和数十年来一直聚焦在DSP的分析师Will Strauss的说法,第一批发布的带有硬件乘法器/累加器的“真正”单芯片DSP是AT&T DSP-——由贝尔实验室开发,并1979年5月的AT&T内部会议上亮相 。1980年2月在IEEE固态电路会议上,NEC又带来了NEC μPD7720。AT&T 将DSP-1纳入其开创性的电话网络5ESS电子交换系统。随后,AT&T 继续开发了几代设备,其中包括DSP16和DSP32(第一个浮点 DSP 芯片)。然而,AT&T DSP-1及其后继者仍然被贝尔系统所拥有,
& q4 E9 ]; g; M4 J1 O- _NEC μPD7720有一个16×16位乘法器和两个16位累加器,因此它是一个真正的单芯片DSP。尽管NEC在1980年初宣布了该设备,但它直到1981年才与所需的开发工具一起上市。Strauss指出,NEC μPD7720在日本取得了最大的成功,就像日本的许多可编程IC 一样,这颗芯片在欧洲也很流行。
8 E6 z4 [% F) k6 n5 f  y6 [从1986年推出的DSP56000处理器开始,摩托罗拉半导体成为1980年代争夺DSP芯片主导地位的另一个早期竞争者。摩托罗拉DSP56000有一个24位硬件乘法器和两个可以再扩展8位的48位累加器使用一对扩展寄存器。这种大数据字能力使摩托罗拉DSP56000能够处理高精度音频,因此摩托罗拉DSP56000迅速受到高端音频系统开发商的欢迎。, A4 D1 a2 H+ f% h
在1990年代决斗% D; E6 X6 r" c" M' n7 D
DSP领域的主要参与者在1980年代和1990年代争夺主导地位。他们生产了多代越来越强大的设备,这些设备具有多个硬件乘法器、浮点硬件乘法器和更大容量的片上存储器。到1990年代后期,TI、摩托罗拉和飞利浦已经开发出具有VLIW架构、多个乘法器/累加器以及用于特殊操作(例如位混频)的附加功能单元的DSP怪兽处理器。
$ K% E" P. l/ ?' d  [当竞争性芯片技术突然出现并让DSP供应商蒙蔽时,更大、更强大的独立DSP芯片的开发突然停止。正如希克苏鲁伯小行星在6600万年前消灭了恐龙,并在岩层中留下一层薄薄的铱作为名片一样,FPGA在千禧年之交让单芯片DSP党崩溃了。( M; L& O8 q0 A/ L; O' V4 u, u
DSP的一个基本原理和一些历史相结合,解释了FPGA如何以及为什么迅速消灭单芯片DSP作为一个充满活力的处理器类别。
& @2 Q* D  f( t0 U; _' @首先,原理:DSP全是数学,DSP性能依赖于非常快速地执行大量乘法/累加运算 (MAC) 的能力。这就是为什么最新的单芯片DSP具有多个硬件乘法器/累加器单元和附加功能单元以从乘法器/累加器路由非MAC操作的原因。设备拥有的MAC单元越多,执行DSP操作的速度就越快,因为大多数DSP算法都包含多个MAC单元可以利用的许多固有并行性。
: t( e5 D* x2 d6 \5 D2 E! T. h1 s, b现在,回顾历史:FPGA于1984年首次亮相,当时Xilinx推出XC2064。第一个FPGA只不过是一堆非常慢的门(实际上是基于查找表的可编程逻辑块),周围有很多可编程互连。这种早期的架构设计使FPGA能够在电路板设计上吞噬许多TTL芯片的逻辑。但是最早的FPGA速度很慢。他们没有威胁到当时的处理器,当然也没有影响到DSP领域。反正一开始不是。
; S" a: S% c7 @4 Y$ PFPGA扩张时代
% \* O  |/ C; N$ z8 b8 S由于从一开始FPGA就打算骑着摩尔定律,因此FPGA发展到2000年,就从原来的Xilinx XC2064微不足道的64逻辑块增长到数以万计的逻辑块。在一篇题为“Three Ages of FPGAs: A Retrospective on the First Thirty Years of FPGA Technology”的文章中,前Xilinx研究员Steve Trimberger将1990年代的FPGA增长时期称为“扩展时代”。在这个时代,FPGA沿着摩尔定律曲线发展,并通过集成越来越多的可编程逻辑块而变得越来越大。然而,与ASIC相比,在FPGA内用可编程逻辑构建的电路相对较慢,在硅片使用方面效率低下,而且价格更高。因此,使用可编程逻辑构建的MAC相对较慢且成本较高。
7 ?8 Y: z  b3 _+ ~后来,在Trimberger的“积累时代”——当FPGA添加硬化MAC块时——FPGA突然成为DSP的重要竞争对手。FPGA并不仅仅增加了一两个硬件乘法器;在摩尔定律的慷慨支持下,他们增加了几十个。
/ h0 }9 H: O4 E第一个集成快速硬件乘法器的FPGA器件系列是Xilinx Virtex-II FPGA系列。2001年7月,Xilinx宣布它已经出货了价值100万美元的Virtex-II XC2V6000 FPGA,每个FPGA都有144个硬化的片上18×18位乘法器。因此,第一个包含硬件乘法器的FPGA的性能已经超过了当时存在的每一个单芯片DSP,而且很可能超过了所有将要存在的单芯片DSP。
+ m! c, V' G) w: `+ vAltera紧随Xilinx并于2002年发布了其第一代具有36×36位硬件乘法器的Stratix FPGA。Stratix FPGA中的硬件乘法器可拆分为18×18位或9×9位乘法器,以允许更多的 MAC 运算,尽管位分辨率较低。在本世纪的头几年,Xilinx和Altera FPGA系列在可以执行的同步MAC操作数量上远远超过单芯片DSP。
( |. M: l) D: H/ M7 G, y& b今天的FPGA有很多MACS
9 V) C* ]! h2 U( ^" Q今天,英特尔(2015 年收购了 Altera)和赛灵思的一些最小的FPGA提供了大量的硬件乘法器。较旧但仍然可用的Intel Cyclone IV FPGA系列的成员包含80到532个18×18位嵌入式乘法器。同样,较旧的Xilinx Spartan 6 FPGA系列包括具有8到180个DSP48A1 slice的器件,而较新的Xilinx Artix FPGA系列的成员包含多达740个DSP48E1 slice。每个DSP48A1 Slice包含一个18×18位乘法器和一个48 位累加器,而每个DSP48E1 Slice包含一个25×18位乘法器和一个48位累加器。DSP48切片乘法器中的位数似乎随着时间的推移而增加。' O8 Q& ?: `% W) e
/ D" x) J3 `2 d4 \0 H1 x! E, g; i7 I- F) G
Intel 和 Xilinx 的最大FPGA具有数千个DSP模块,并且能够比最快的DSP芯片每秒提供三个数量级的MAC。例如,最大的Intel Stratix 10 TX FPGA系列的成员提供5760个精度可调DSP模块,每个模块包含两个18×19位硬件乘法器,可以配置为一个27×27位乘法器。在一个大芯片上多达11,520个硬件乘法器。最大的Xilinx Virtex UltraScale Plus FPGA包含12,288个DSP48E2 slice,每个slice包含一个27×18位乘法器和一个48位累加器。
+ U. p; g' Z  R. s请注意,英特尔和赛灵思并不是唯一将硬件乘法器塞入其FPGA的FPGA供应商。您可以从Achronix、Lattice 和 Microchip 获得FPGA,这些FPGA具有内置在设备中的各种DSP硬件(MAC)。例如,最近发布的Lattice CertusPRO-NX FPGA有两种尺寸可供选择,具有96或156个片上18×18位乘法器。# o, X; U7 ]" _3 O
如果您仍想编写DSP代码并在单片DSP上运行它,你可以使用恩智浦提供DSP56300、DSP56700 和 MSC8000 DSP系列。这些是摩托罗拉DSP系列最新的——也可能是最后的——单芯片后代。此外,您仍然可以购买现成的TI TMS320 FPGA系列成员。同时,硬件乘法器在通用处理器的设计中变得非常普遍,在那里您可以找到完全能够提供可观的 DSP 性能的巨型512位SIMD矢量单元,甚至在微控制器中,这样您就可以更轻松地将DSP集成到即使是最小的嵌入式设计。
6 B( L8 m! d. _: ^对于这一切,要感谢摩尔定律。  `6 _3 M# ]1 U) J, \7 V2 m" y
然而,在这一点上根本没有可比性。如果您的高性能DSP应用需要大量快速 MAC 运算,那么具有成百上千个快速硬件乘法器的FPGA是独一无二的合格产品。

, \: w; S" b- J% @( e3 U( w

该用户从未签到

2#
发表于 2021-11-3 10:32 | 只看该作者
6 ^( s& `2 C' a4 q- _
DSP可以追溯到数字时代的开端,甚至可能更早一些
% h7 ^  `5 i2 Q/ R9 o' v

该用户从未签到

3#
发表于 2021-11-3 10:47 | 只看该作者
由于从一开始FPGA就打算骑着摩尔定律,因此FPGA发展到2000年,就从原来的Xilinx XC2064微不足道的64逻辑块增长到数以万计的逻辑块; [' M/ N& h- l

该用户从未签到

4#
发表于 2021-11-3 11:09 | 只看该作者
当竞争性芯片技术突然出现并让DSP供应商蒙蔽时,更大、更强大的独立DSP芯片的开发突然停止* I( G, l+ G+ E( L7 ^9 q9 K: L

该用户从未签到

5#
发表于 2021-11-4 11:53 | 只看该作者
....只是觉得钟也能吹响,功夫了得。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-8-3 04:07 , Processed in 0.125000 second(s), 23 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表