内容简介
本书系统阐述了软错误发生的复杂物理过程,全书共分为10章。主要介绍了软错误研究历史和未来发展趋势; 单粒子效应发生机制与分类;JEDEC标准;门级建模与仿真;电路级和系统级单粒子效应建模与仿真;硬件故障注入;采用加速测试与错误率预估技术,评估验证面向空间或地面环境的集成电路;电路级软错误抑制技术;软件级软错误抑制技术;高可靠电子系统软错误性能的技术指标与验证方法。全书总结了过去,预测了未来趋势,阐述了单粒子的翻转物理机制、建模、软错误抑制技术以及业界和学界的研究成果。
目录
第1章 天地间的软错误: 历史回顾、 实验证据和未来趋势
1.1 介绍
1.2 历史
1.3 电子系统中的软错误
1.4 等比例缩小对于软错误的影响
1.4.1 SRAM软错误率的变化趋势
1.4.2 DRAM软错误率的变化趋势
1.4.3 锁存器和触发器的软错误率
1.4.4 组合逻辑电路软错误率
1.4.5 单粒子闩锁变化趋势
1.4.6 未来趋势
1.5 结论
参考文献
第2章 单粒子效应: 机理和分类
2.1 介绍
2.2 背景环境、 作用机理及反冲能量损失
2.2.1 自然辐照环境
2.2.2 中子和物质的相互作用: 产生高能反冲物
2.2.3 反冲物: 离化和射程
2.2.4 电离
2.2.5 结论
2.3 电子元器件和系统中的单粒子效应
2.3.1 单粒子效应定义
2.3.2 软错误率
2.3.3 临界电荷标准
2.3.4 电路仿真中的电流脉冲描述
2.4 器件敏感度
2.4.1 单粒子瞬态
2.4.2 单粒子翻转
2.4.3 SRAM和DRAM中的多位翻转和多单元翻转
2.4.4 单粒子功能中断
2.4.5 单粒子事件闩锁
2.5 结论
参考文献
第3章 JEDEC标准: 用于测试和报告α粒子和地表宇宙射线引起的软错误
3.1 介绍
3.1.1 JESD89系列标准的意义
3.1.2 术语和定义
3.1.3 标准所涵盖的器件
3.1.4 报告要求
3.2 加速α粒子软错误率测试(参见JESD89A第四部分和JESD89?2A)
3.2.1 α粒子能谱和发射率(参见JESD89A 附录D)
3.2.2 α粒子源的选择(参见JESD89A 5.4.1节和JESD89?2A 4.2.2.1节)
3.2.3 封装和制样(参见JESD89A 5.3节和5.4.5节以及JESD89?2A 4.4节)
3.2.4 外推加速失效率至现场使用环境(参见JESD89A 5.6.4节)
3.2.5 加速α粒子测试的优势和局限性
3.3 加速高能中子测试(参见JESD89A第六部分和JESD89?3A)
3.3.1 地球环境高能中子注量与能谱(参见JESD89A 6.6.2.4节)
3.3.2 基于参考谱外推至其他位置和条件(参见JESD89A附录A.3)
3.3.3 测试装置(参见JESD89A 6.2节)
3.3.4 封装、 制样和次级离子效应(参见JESD89?3A 5.4节和附录A)
3.3.5 束流特性(参见JESD89A 6.5节)
3.3.6 单一能量束流下的软错误率(参见JESD89A 6.6节)
3.3.7 基于宽谱中子束流的软错误率(参见JESD89A 6.6.2.4节)
3.3.8 加速高能中子测试的优点和局限性
3.4 加速热中子软错误率测试
3.4.1 背景(参见JESD89A 7.1节)
3.4.2 热中子谱(参见JESD89A附录A.4)
3.4.3 封装和制样(参见JESD89A 7.3节)
3.4.4 热中子源的选择、 校准和屏蔽效应(参见JESD89A 7.4节)
3.4.5 单粒子翻转截面和单粒子翻转率(参见JESD89A 7.6.2节)
3.4.6 加速热中子测试的优势和局限性
3.5 实时(非加速)软错误率测试
3.5.1 测试方法目标
3.5.2 大样本和长时间测试
3.5.3 区分α粒子和中子对于软错误率的影响
3.5.4 高空测试以增加中子对软错误率的影响
3.5.5 建筑物的屏蔽效应(参见JESD89A附录A.5)
3.5.6 最小FIT和置信度(参见JESD89A附录C)
3.5.7 实时测试的优点和局限性
3.6 结论
参考文献
第4章 门级建模和仿真
4.1 介绍
4.2 基于核反应的蒙特卡罗选择和器件仿真, 从核交互到瞬态电流计算
4.2.1 中子/物质核反应数据库
4.2.2 次级离子引发的瞬态电流
4.2.3 举例: 高能中子在SRAM中引发的单粒子翻转和多单元翻转
4.3 逻辑门电路SET和SEMT蒙特卡罗仿真
4.3.1 单个粒子引起多个瞬态电流
4.3.2 拓扑描述和工艺描述
4.3.3 核反应实例
4.3.4 瞬态脉冲计算
4.3.5 电流脉冲统计
4.4 时序电路和组合电路的软错误评估SPICE分析方法学
4.4.1 精简的瞬态电流分析
4.4.2 敏感结点列表
4.4.3 自动化多瞬态电流仿真
4.4.4 结果分析
4.4.5 以反相器为例
4.4.6 多瞬态故障注入结果
4.5 结论
参考文
前言/序言
译 者 序
电子系统的软错误,对于许多人来说可能还比较陌生。搞过电子系统测试和维修的人都有体会,系统的短路或断路这些硬错误比较好找到,也好处理。而对于线路受伤、接触不良等错误,查找起来挑战就比较大。
随着集成电路按照摩尔定律快速发展,器件的特征尺寸越来越小、电路规模越来越大、电路速度越来越快、系统功能越来越复杂。由其组成的电子系统出现的软错误更加怪异,对其进行的测试、诊断难度更大,对其预测和采取保护措施的代价越来越大,如以牺牲面积、速度来换取高可靠性。以往在空间等不计成本的特殊领域才用到的冗余技术、容错纠错技术,在使用最新技术的产品中也不得不采用。
本书是为应对这些挑战所编著的,介绍了器件级、电路级、行为级和系统级等不同层次消除或抑制软错误的技术。
本书第1章至第6章由毕津顺翻译,第7章至第10章由韩郑生翻译。由于译者水平所限,译本中错误在所难免,敬请广大读者批评指正。
韩郑生中国科学院微电子研究所
序 言
von Neumann在1963年的论文中提出了计算可靠性的想法[1]。在早期阶段,人们认为半导体电路天然具有可靠性,后来发现随着复杂度的增加,半导体电路中出现的错误越来越多。
随着数字技术时代的来临,基于该技术的电子产品对家庭内的电学噪声具有抵抗能力。当时我们还在幻想着星外来客,却没想到它们已经影响到了我们的电子系统。请允许我引用近期发表的一篇论文中的话:“有史以来,人类一直认为天体会影响地球上的生命体,而机械设备和电子设备属于科学物体,它们的命运由人类掌控。尽管我们清楚这些设备的生产日期,却不能为这些设备进行占卜。后来我们开始注意到,当代电子系统的某些特定行为可以追溯到地外天体”[2]。
Intel公司的研究人员May和Woods报道了α粒子在2107系列16 kB DRAM中引起软错误的现象。实验表明在海平面高度的DRAM和CCD中会发生翻转现象。他们确定,这些错误是由α粒子引起的,而α粒子来自于封装材料中痕量元素铀和钍的放射性衰变。该文首次报道了海平面高度上辐照在电子器件中引起的翻转现象,并将该类错误称为“软错误”[3]。
自20世纪40年代,人们已经认识到电磁脉冲(EMP)会导致电子系统发生暂时失效甚至是永久性损伤。EMP指的是高能电磁辐照,通常由闪电或者上层大气中带电粒子与γ射线/X射线间的相互作用产生。Carl E.Baum是EMP领域最重要的研究人员之一,他追溯了EMP现象的相关历史,调研了大量的文献,并进行了综述[4]。除了提供辐照加固、屏蔽和容错技术,还进行了大量的实验工作,用于开发EMP仿真器硬件。我特别提到这些,是因为我认为软错误研究领域和EMP研究领域的合作是有可能的,对双方都有益。
本书的发表具有里程碑意义。本书第一作者Michael Nicolaidis是软错误研究领域中的权威,他曾开展过很多原创性的研发工作,发表过大量学术论文,申请和拥有很多发明专利,并且建立了iROC Technologies公司。该公司针对电子系统提供完整的软错误分析和设计服务方案。
Michael Nicolaidis汇聚其他著名学者,从深度和广度出发,共为本书撰写了10章内容,几乎涵盖了软错误研究的所有方面。本书介绍了软错误的研究历史和未来发展趋势,单粒子翻转的物理机制,工业标准和实用化模型,降错技术,以及学界和业界的研究成果。可以说,本书是目前介绍软错误研究最全面的著作。
本书填补了技术文献所存在的空白。正如我指导的刚毕业的研究生Fan Wang所说,“当我还是研究生的时候,我尝试去理解关于软错误的不同议题,这一过程很痛苦。我阅读了两百多篇文献,VLSI可靠性、硅基技术、VLSI缺陷和测试等都有涉及软错误,然而却没有关于软错误的专著。有时文献中报道的实验结果差异很大,甚至相互矛盾。我相信本书对于学界研究非常有帮助,也可以为工业界提供参考。”
书中有些章节非常有趣,软错误研究的早期历史就像是一部侦探小说。
第1章介绍了Intel 2107系列16 kB DRAM中的软错误,结果发现罪魁祸首是α粒子,而α粒子来自于封装材料中痕量元素铀和钍的放射性衰变。而Sun公司服务器软错误问题的曝光,导致了在服务器中应用编码理论和新的设计技术。
第2章中给出了相应的术语和定义。
第3章阐述了相关的标准。
第4章和第5章讨论了门级、电路级和系统级的建模与仿真方法。
第6章给出了故障注入技术。
第7章讨论了加速测试的方法。
第8章和第9章从硬件和软件层级提出