Godson-3多核处理器的可测性设计
Design for Testability Features of Godson-3 Multicore Microprocessor
-
摘要: 1.本文的创新点处理器的多核结构设计已成为提升处理器性能的重要方法,然而随之集成度增大、功能模块增多的趋势使得多核处理器测试面临着高功耗、高成本及低效率的挑战。在Godson-3-四核处理器的测试设计中,为解决高测试功耗及测试时间、管脚资源有限等问题,本文提出一种多核测试访问机制,基于分治思想,并利用多核处理器的同核架构特点,来进行模块化、多模式向量生成及测试施加,在对IEEE1149.6标准的兼容基础上,可实现60余条测试指令,从而大幅提高芯片测试质量,并有效控制了向量生成及测试时间。同时,本文提出使用三级时钟门控设计来灵活控制模块化测试,在不影响测试覆盖率要求下,测试功耗明显降低。此外,对Test Wrap的复用设计和Scan collar的应用使得Godson-3芯片在较小的额外面积开销情况下有效增加了芯片的可测试性,提高测试质量。 2.实现方法基于“先模块、后整体”的思想,Godson-3使用一种可扩展的层次式多核测试访问机制TAM,利用三级测试控制单元进行六模块分块测试。其中顶级控制单元TCU通过JTAG接口将IEEE1149.1兼容测试指令传入到各个核级控制单元NCU;NCU则与IP核一一对应,根据测试指令,设定待测核内的待测模块状态,同时将指令传给相应的模块级控制单元BCU; BCU根据指令译码的测试模式来设定扫描结构的连接关系,包括压缩模式、内联模式、长链模式及调试模式,这四种模式可灵活调节测试时间、覆盖率等因素,以达到最优测试效果。其次,该TAM包含了数据同步比较器DSC。在多个同构核同时测试中,DSC一方面实现基于X-Mask方式的核内测试结果比较,提高测试效率,另一方面,它仍支持对指定核的测试结果输出,为故障诊断提供依据。这种方式在不降低测试质量同时,有效降低了测试时间。为有效降低测试功耗,Godson-3针对时钟实现三级门控设计。其中,1级门控单元用来确保仅当某区块被测时其时钟打开,避免非测试区块寄存器翻转,2级门控单元用于存储单元BIST与功能逻辑的分离,而3级门控单元则用于全局测试的低功耗向量生成。为降低物理设计的面积开销,Godson-3采用复用式Wrapper结构,在复用原有的模块接口寄存器的同时,通过测试指令使得Wrapper链既可当作控制输入点,也可当作观察输出点。此外它还加入Scan collar链式结构,用来直接控制及观察片上cache,提高了芯片的可测性。 3.结论及未来待解决的问题为应对多核测试的功耗、测试成本及效果等方面的挑战,本文提出的层次式多核测试访问机制及时钟门控单元设计等方法,能够将多核测试的测试功耗、覆盖率及向量生成时间都控制在理想范围,提高了测试质量。该方法的提出,也同时为多核芯片上异构核测试及低功耗向量生成提供了有益参考。 4.实用价值或应用前景本文提出了一种多核测试方法并应用于Godson-3-四核微处理器中,使该芯片达到了理想的低功耗、低测试开销及高覆盖率的测试效果。同时,该方法具有较好的可扩展性及移植性,在Godson-3的八核及十六核等微处理器中均具有应用及参考价值。Abstract: This paper describes the design for testability (DFT) challenges and techniques of Godson-3 microprocessor, which is a scalable multicore processor based on the scalable mesh of crossbar (SMOC) on-chip network and targets high-end applications. Advanced techniques are adopted to make the DFT design scalable and achieve low-power and low-cost test with limited IO resources. To achieve a scalable and flexible test access, a highly elaborate test access mechanism (TAM) is implemented to support multiple test instructions and test modes. Taking advantage of multiple identical cores embedding in the processor, scan partition and on-chip comparisons are employed to reduce test power and test time. Test compression technique is also utilized to decrease test time. To further reduce test power, clock controlling logics are designed with ability to turn off clocks of non-testing partitions. In addition, scan collars of CACHEs are designed to perform functional test with low-speed ATE for speed-binning purposes, which poses low complexity and has good correlation results.