发表于:2008-05-13 16:22:44
楼主
用于纳米集成电路设计的全芯片分级模拟与分析
集成电路的发展趋势表明,纳米时代已经来临。目前主流设计已利用180nm(0.18μm)工艺实现,而一些前沿设计,如高速微处理器和高级存储器等,正开始用130nm(0.13μm)甚至100nm(0.1μm)技术进行制造。纳米技术的应用会使设计人员遇到一些以前没有碰到的问题,需要新的工具加以解决。本文介绍一种全芯片分级电路模拟分析方法,可用于纳米芯片的开发与设计中。
现在不断涌现的新工艺技术可以将上亿个晶体管装入一个芯片内,并使CMOS设计的芯片速度超过1GHz时钟频率。而纳米技术更为IC设计人员打开新的道路,可利用它开发出多种工作频率在数GHz的大型复杂系统级芯片(SoC)设计。
确实,SoC设计已经成为潮流,而且现今大部分设计都包含多个嵌入式存储器和大量混合信号内容。为了保证这些复杂设计能够成功,设计人员正在寻找新的电路验证方法,可立刻处理整个芯片设计,同时速度也要足够快以便在一天就能完成数个全芯片验证。但是纳米工艺技术带来了很多新的电气和物理影响,早期工具和方法对此无能为力,因而需要一种创新的验证方法。
纳米设计挑战
尽管纳米技术的优势非常明显,但它产生的更高电路密度、更小器件和互连尺寸以及更快时钟速度给当今IC设计人员带来了新的高难度挑战。有报告表明,180nm设计的芯片一次成功率不到一半。为什么会这样?因为在高密度存储器和SoC设计中发现了越来越多非线性特征,使众多EDA工具在应对纳米设计验证中的新型混合信号难题时变得软弱无力。同时,纳米设计中的复杂电气性能和物理性能交互作用要求作全芯片验证,而这些电路的绝对尺寸和复杂性又突破了EDA工具覆盖的范围,因此降低了用户准确预计设计中可能出现问题的能力,现在能够处理几百万个晶体管电路的快速时序模拟器将不能满足几千万到几亿个晶体管电路的纳米芯片模拟验证要求。
在电气性能方面,交互耦合电容量增大而造成的耦合噪声提高会带来严重的信号完整性问题。这些噪声产生的问题对用户来说既新颖又难以捉摸,使电路诊断更加困难并需要多次芯片反复,造成成本上升。由于250nm和180nm两种技术的信号传播延迟中起主要作用的是互连寄生,所以它们会使互连寄生建模和时序延迟精度中已存在的问题变得更加严重。
随着时钟速度接近1GHz,诸如地线反弹和传输线信号延迟等电感效应也更加突出,不能再忽略不计。这些电感效应在电路信号和交互耦合噪声上增添了很多不同的摆动信号,进一步使信号集成和电路分析过程愈加复杂。
从器件物理学观点来讲,纳米电路具有越来越多非线性特征。鉴于此,再加上前述噪声和电感效应,使得传统逻辑模拟器不能准确可靠地分析数字性能。事实上大多数纳米电路可能会建模成混合型模拟-数字电路,而不是单纯数字电路,所以如果忽视芯片效应,逻辑模拟器最终只能成为功能规范或测试生成工具。
对于管理和优化时序来说,电源和可靠性设计在新的纳米设计中也是一个困难费时的工作,这是由于电路尺寸、复杂性和重要模拟效应引起的大量互连数据都需要做准确分析。传统的时序、电源和可靠性分析方法与芯片测量数据相比较有很大差异,使得用户开始失去信心,显然此时需要一种管理时序、电源和可靠性分析的新工具和新方法。
纳米设计的危机已经出现,开始阻碍前沿设计的进程并放慢这些设计的设计速度,它对设计人员的挑战在以后十年会变得更加严峻和普遍。面临上述纳米问题的设计人员需要新的工具和解决方法,否则就会失败,既不能满足设计目标,也不能及时把产品推向市场。
全芯片电路模拟技术
由于上述很多纳米问题,如耦合噪声、地线反弹、传输线波形延迟、动态泄漏电流、电源电压下降和非线性器件及电路性能等,都与动态电路响应有关,因此详细的全芯片电路模拟应该是研究和解决SoC、存储器和混合信号设计的最有效方法。以前的电路模拟器由于采用“扁平式”电路数据存储方法而受到容量的限制,一般来讲,这些模拟器需要几百个字节的内存才能存储一个晶体管的电路信息,因此模拟一个上千万晶体管规模电路需要有几十亿字节的RAM内存。
毋庸置疑,用现有任何电路模拟器对一个大规模电路进行全芯片模拟会占用大量CPU时间,因此它无法用于实际设计流程。由于这种限制,用户经常把整个电路分成若干小块,一块一块地对这些局部电路进行模拟。但是这种电路划分过程既繁重又容易出错,而且分开模拟的模块电路经常因为其邻近电路模块的接口模型不准确,性能可能与它在全芯片环境下工作表现不同,因此能够不用任何分割就模拟和认识整个电路性能的技术将极具吸引力。
为了扩充传统SPICE的容量和速度,在1990年代初期开发了晶体管级快速时序模拟器,但它在精度上打了折扣。通过使用事件驱动算法,这类模拟器的性能比SPICE快两个数量级(图1)。
另一方面,以前的模拟器充分利用电路等待时间,并假定非活动电路模块不需要计算,以此来提高性能。而现在这个假定对纳米设计就很成问题,因为某些分支电路在功能上可能不起作用,但由于Vdd和Gnd总线上电压变化,或者耦合信号中小的串扰而使其对电信号产生影响。另外,事件驱动算法一般不足以处理模拟信号传播,它需要用一个更加严格的算法来补充,才能以放慢速度为代价来模拟模拟电路。这些快速时序模拟器的容量受电路尺寸的限制,一般在1,000万个晶体管以下,所以它们不能够对大电路进行全芯片模拟,同时模拟时间将因很多自感、互感或者大量交互耦合电容而大幅度增加。
全芯片分级结构电路模拟技术
Nassda开发出新一代分级结构储存技术,可以有效储存大量全芯片电路数据,并已申请了专利。该技术具体而言是一个分级结构电路数据库,只需要一个模板就可储存不同的基础分支电路,如存储单元或者与非门,其它结构完全相同的存储单元或与非门则不必再使用实际固定的存储空间,如用这个分级结构数据库在一个不到512M RAM内存的工作站上能模拟含有2.84亿个晶体管的256Mb DRAM。
为了详细研究纳米问题,Nassda还开发了高精度和高效模拟算法,这些算法能以极快的计算速度实现SPICE精度,且通常比SPICE速度快3~4个数量级,例如2.84亿个晶体管全芯片DRAM电路的运行时间在1GHz工作站上只需1小时就能完成。模拟算法还能有效处理大量电容交互耦合和大电路上的电感反弹效应,而无需大幅放缓模拟速度。此外,它采用了有效的RC抑制能力,可减少大量过多互连寄生数据。为加强布局之后的模拟性能,它使用一种分级构造技术,可把布局数据库分解出的扁平网表自动提升到Nassda内部分级结构数据库中。
为加快模拟性能,该方法引入了一种同构匹配技术,它可以复制在相同电路条件下工作的同类分支电路结构的模拟电路响应。例如位置相邻的存储单元,其电信号在非常相似的条件下到达和上升,对这类结构相同的电路就不需要一次次地重复进行相同的电路响应模拟。
Nassda的HSIM综合了所有这些技术的优点,它是第一个商用分级结构电路模拟器,其设计符合大内存、混合信号和SoC电路的纳米设计挑战要求。HSIM在速度、容量和精度等三个性能方面都有良好表现,不像早一代的模拟器,只在一个或两个方面占优(见图2)。
HSIM为高级IC设计人员提供了一整套全芯片电路验证所需要的功能,包括:
·分级存储:应用高效分级结构数据库减少内存使用量并扩大电路尺寸。
·回归模块矩阵解算程序:采用分级结构进行电路模拟,精度接近SPICE。
·分级RC抑制算法:降低分级结构电路数据库中寄生电阻和电容的复杂程度,减少精度损失。
·布局之后寄生现象的后向注解:提供有效的布局后模拟和分析,存储器需求少。
从分级结构存储中省下来的内存可以使HSIM进行全芯片模拟,实际上也没有电路尺寸方面的限制。HSIM通过应用先进技术实现速度与效率,而不是简化电路模型或模拟算法,所以HSIM模拟结果能精确地和SPICE模拟相匹配,甚至对于敏感的模拟电路也是同样。图3是一个SRAM电路响应的HSIM和SPICE结果比较。尽管HSIM采用与SPICE不同的模拟算法,但其用途几乎与SPICE一样,它还支持所有标准的BSIM和很多其它通用MOS和双极电路模型。
HSIM运用标准电路模型和SPICE格式的能力对全芯片验证混合信号设计如调制解调器、无线通信集成LAN/WAN芯片等特别重要。由于设计人员把越来越多的模拟功能纳入SoC,他们发现正面临越来越多的验证挑战,因为通常的HDL设计验证工具数字模拟引擎在应付这些设计的模拟部分时常被证明是无效的。在某些情况下,一些公司试图采用通过集成接口连接的SPICE模拟器和数字模拟器协同模拟环境,分别解决电路的模拟和数字部分问题,但在实践中,设计人员发现