FCRAM技术应用第二部分:OC-192系统中的存储器架构设计
[复制链接]
鉴于网络架构的速度越来越高,对新型存储器架构的需求也日渐迫切。FCRAM填补了DRAM和SRAM之间性能上的空白,并且具有和DRAM相似的成本,特别是在存储空间不断增长而功能日渐趋同的趋势下,它将在OC-192以及更高等级的应用中更多地被选择。本文详细探讨了将FCRAM应用于OC-192以及更高等级通信系统中的设计考虑。 由于网络设计已经跨越OC-48达到OC-192以及更高的等级,存储架构就成为系统设计过程中的关键瓶颈。目前,网络设计师已经被迫在网络设计中采用针对PC优化的存储器件。在速度等级达到10Gbps范围之时,这些足够满足更低速度需求的存储架构也开始突破应用的限制。 FCRAM架构是专为高速网络应用而开发的。上一期刊登的第一部分文章已经对FCRAM架构进行了详尽的探讨。本文作为第二部分,将探究FCRAM如何解决网络应用尤其是在OC-192/10Gbps线卡中遇到的问题。 线卡的存储器需求 图1显示了一种典型的高端Sonet线卡设计。在此类卡中通常应用的RAM功能包括:CPU数据存储器、接收/发送缓冲存储器、路由(查找)表存储器以及数据包存储器。 线卡上使用的CPU数据存储器需要快速地缓存并处理送来的数据。但是,与网络应用中使用的其它存储器相比,此项功能所要求的存储器密度与速度还是相对较低的。因此,在这种场合通常使用并非最先进的高速静态RAM(HSSRAM)。一种更常见的HSSRAM是同步流水线突发SRAM,密度通常为2至4Mb,而时钟速度则为100到133MHz。 然而,设计师们正努力尝试从线卡设计中移除CPU数据存储器。由于其存储密度不高,CPU设计师已经将其集成到了CPU芯片上,因此不在需要独立的存储器IC。 CPU存储器正在从线卡设计中消失,缓冲存储器却继续作为高速线卡设计师所关注的焦点而存在。网络应用中的缓冲存储器必须支持在某种程度上数量平衡的读与写操作(所有写入的数据最终都将被读出,反之亦然),相对较长的突发操作(4字、8字甚至更长),有限的数据随机性,以及相对较高的存储密度。因此,以峰值带宽衡量的突发速度是至关重要的,而随机周期时延以及总线转向时间则并非问题关键所在。基于以上需求,SDRAM或HSSRAM是当今网络设备(例如OC-12以及OC-48接口设备)存储架构的当然之选。 OC-192应用的缓冲存储器也有相似的功能特性,除了密度通常更高以支持更多的处理和更大的数据包,其时钟速度和数据传输率也必须高得多。10Gbps的数据传输率折合到64位的存储器总线上,每一位数据线的传输率就是156Mbps。 对目前存储器解决方案的检视表明,只有不多的几个产品可以达到或超过156Mbps的带宽。很明显,传统的SDRAM以及SRAM即使其时钟频率超过156MHz,但由于一些限制其有限带宽的因素而无法达到156Mbps的带宽(如上期第一部分所述)。一些较新的存储器解决方案,包括SRAM阵营中的DDR、QDR、SigmaRAM产品以及DRAM阵营的FCRAM、DDR(时钟频率必须超过133MHz)、RDRAM可以满足高性能缓冲存储器的要求。 在以上各种选项中,DRAM解决方案,特别是FCRAM提供了更低的每位成本,但其初始存取时延指标却不如SRAM。但是毕竟初始存取时延没有峰值带宽那样至关重要,而且FCRAM在理论上与SRAM具有相当的峰值带宽,决定究竟选择哪一种方案的主要因素是存储密度。FCRAM通常的最低存储密度是256Mb(×16位配置),所以DRAM是容量大于或等于128MB的缓冲存储器的最佳替代方案(假定存储数据总线宽度是64位)。 必须注意到是,由于当今的DRAM产品只能以公共I/O配置来供应,一些分离I/O的SRAM产品,例如QDR,确实提供了比诸如FCRAM等DRAM方案更高的峰值带宽。但是,究竟选择DRAM还是SRAM归根到底是性能与成本的权衡。另外由于缓冲存储器密度的需求不断提升,DRAM将在高端系统中流行开来。 路由表查找存储器 与网络应用中的缓冲存储器相反,查找表存储器需要支持不平衡的读写周期比例(有时甚至超过10:1),相对较短的数据突发,高度的数据随机性和相对较低的存储密度。因此,初始存取时延以及总线转向时间就成为比峰值带宽或突发速率更重要的指标。 当今查找表存储器的常见解决方案主要包括传统同步SRAM,与DRAM相比,其较低的初始存取时延是其主要特性。更进一步,许多同步SRAM还增加了一些新特性来改进其总线转向时间。 在OC-192实现中,可以预见出于很多与缓冲存储器相同的考虑,查找表存储器的密度将不断增长,主要是为了在每一块线卡上支持更多的流量和用户。对更快总线转向时间的需求也是如此,尽管对于SRAM和DRAM而言,如果不在系统架构上作重大改变是很难做到这一点的。实际上,很多像分离I/O SRAM这样的新产品确实已经改善了其总线转向时间,但却极大损害了其在非平衡读写应用中的性能。 内容寻址存储器(CAM)这一存储架构确实同时提供了非常低的初始存取时延和总线转向时间。CAM,作为具有最高性能的查找表存储器,在每位(bit)成本上也是最昂贵的。因此,CAM被归类到性能分类的最高端,在这里密度需求并不高而成本因素也是次要的。 基本上,OC-192线卡的设计师将不得不在CAM方案、快速总线转向SRAM或FCRAM中选择其一作为查找表存储器。这几种存储器的主要区别在于初始存取时延,也称为随机周期间(tRC)。与普通DRAM包括DDR(tRC范围在60到70ns之间)相比,当今的CAM和SRAM的tRC可以小于10ns,一些非常高端(同时也非常昂贵)的产品甚至小于5ns。FCRAM则弥补了tRC在20到30ns这一范围的空缺,这使其成为高密度、低成本的查找表存储器候选方案。 另外,SRAM的成本是DRAM的四倍,这使得存储密度问题不是那么绝对。例如,如果需要的查找表大小为32MB,两片256Mb的FCRAM器件将总共提供64MB的存储空间。虽然有些浪费,但比一个使用HSSRAM的32MB方案要划算。 数据包存储器 与将送往来CPU的输出或输入数据包排成队列的发送或接收缓冲存储器相反,网络应用中所使用的数据包存储器是用来存储并缓冲由线卡CPU或ASIC处理后的数据包。数据包存储器的特性与发送或接收缓冲存储器相似,主要的不同是数据包存储器的密度较低,往往性能也较差,这取决于CPU或ASIC的数据传输率。因此,在这些场合,SDRAM是目前主流的选择,而在包括OC-192的未来应用中,人们越来越多地考虑采用FCRAM。 表1给出了网络应用中主流RAM的主要特性的定性总结,同时也给出了每种器件最适宜的网络应用。必须注意的是,OC-192应用中可行的存储方案包括FCRAM、DDR SRAM以及分离I/O SRAM,而FCRAM是唯一的DRAM方案。FCRAM相对于其它DRAM方案的优点很明显:更高的性能(时延、总线转向时间以及有效带宽)和最低的成本增加,同时和DDR DRAM兼容。 很明显,SRAM的有效带宽伴随的是四倍甚至更高的成本增加(与DRAM相比)。提高带宽最有效的方法是增加每时钟周期的数据率,例如DDR,和/或单独采用分离的读写端口。因此,用于OC-192的最佳SRAM方案很明显就是DDR或分离I/O产品。 分离I/O产品最适合用于缓冲存储器应用,这是由于具有平衡读写周期的系统可以最充分的利用其峰值带宽。另一方面,公共I/O DDR(通常简称为DDR)与分离I/O相比,其快速的初始存取时延和总线转向时间使得DDR方案成为查找表应用类型的最优之选,通常这些应用场合的读写操作数量是不平衡的。因此,公共I/O和分离I/O SRAM产品有望与FCRAM共存,选择哪一种取决于具体应用场合。这三种产品经常可以用于同一种应用中。 关于时延的进一步讨论 正如前面所述,SRAM和DRAM相比,其主要优势在于初始存取时延。因此,在像网络缓冲存储这样数据随机性极小的应用中,DRAM可以提供和SRAM基本相同的有效带宽。而在同样的场合,分离I/O器件与公共I/O器件(无论SRAM还是DRAM)相比,前者性能优势就很明显了。因此,随着缓冲存储器的存储密度随着每块线卡上承载的网络流量不断增加,在缓冲应用中究竟选用FCRAM还是分离I/O SRAM将取决于性价比的权衡,而不是仅因为存储密度需求较低而选择SRAM。 如果性能是首要考虑而成本是第二位的,分离I/O SRAM是OC-192应用中缓冲存储器的正确选择。另一方面,如果FCRAM的性能够用,考虑成本节约(在元件价格以及电路板资源方面)就是更现实的。 对于查找表存储器,情况在某种程度上相反。由于这种应用本质上的随机性,初始存取时延就成为重要的因素,而SRAM就比DRAM在这方面有明显的优势。事实上,人们更多地考虑并在查找表应用设计中使用CAM主要是因为其在时延上最出色的表现。 另一个重要原因是查找表的存储密度通常比缓冲存储器要小。但是,随着查找表存储密度的增加以及FCRAM在初始存取时延上与SRAM越来越接近,FCRAM已经成为OC-192应用中查找表存储器的有力竞争者。假定存储总线的宽度为64位,SRAM与FCRAM在成本上的交叉点在32MB左右。32MB以下,SRAM具有最佳的性价比,而在32MB以上,设计师就必须考虑FCRAM的性能也许更适合。 最后要考虑的问题就是在特定器件中集成某种存储器的可行性,这实际上意味着减少相应的存储总线或接口。就像在其它应用(例如计算机)中日渐普遍一样,这一点肯定将成为影响网络应用的一个趋势。例如,收发缓冲器能否集成在一起或与数据包缓冲存储器集成在一起? 或者,相对较小的查找表存储器能否与数据包缓冲存储器集成到一起? 如果答案为“是”,并且采用FCRAM时的性能是可接受的,那么系统成本得到较大幅度的降低就可以实现了。 本文总结 总而言之,当今网络应用可选择的DRAM/SRAM解决方案很多,而且在下一代系统中可考虑或要设计的方案就更多了。特别是,OC-192线卡在相同应用中具有多种独特的存储器需求。 FCRAM填补了DRAM和SRAM之间性能上的空缺,并且具有和DRAM相似的成本,特别是在存储空间大小不断增长而功能日渐趋同的趋势下,它将在OC-192以及更高等级的应用中更多地被选择。作为对未来的考虑,人们期待FCRAM将不断吸收与SRAM相似的功能或特性,同时不断弥补性能上的差距并逐步抢占一度被SRAM占据的应用市场。
|