芯谷地下二层的验证中心,在这座建筑里是一个特殊的存在。它不像研究院那样窗明几净,也不像追光厂房那样充满工业感。这里的走廊只有一米二宽,天花板上的灯管每隔一根就拆掉了一根,照度刻意保持在偏暗的水平——不是因为省电,而是因为亮度过高会影响某些光学检测设备的精度。

走廊两侧是一扇扇厚重的金属门,每扇门后面都是一个独立的环境测试舱。这些测试舱是两年前天权3號流片时建的,当时只有六个,现在扩展到了十八个,占据了地下二层將近一半的面积。每个测试舱都可以独立控制温度、湿度、气压、振动频率和电磁辐射强度,模擬从北极圈到热带雨林、从海平面到高原、从实验室到发动机舱的各种极端环境。

章宸站在六號测试舱的观察窗前,手里拿著一个平板,屏幕上显示著天权4號在过去七十二小时里的全部测试数据。他穿著一件深灰色的工装外套,口袋里插著三支不同顏色的马克笔,胸前的工牌背面写满了今天要確认的测试项。

六號测试舱里,一块天权4號的工程验证板被固定在振动台上。验证板上有十二颗晶片,每一颗都连接著独立的电源监控、温度传感器和功能安全监测电路。振动台以每分钟三千次的频率、三个方向同时施加隨机振动,模擬的是汽车发动机舱在顛簸路面上的工况。验证板旁边的温控箱显示实时温度:零下四十度,湿度百分之八十五。

这个测试条件,比车规级標准要求的最严苛工况还要高出百分之二十。

章宸不是个喜欢“加码”的人。但天权4號的情况特殊——它是因为npu调度器效率问题回退rtl、流片延迟五周的晶片。延迟的五周被用在了修改和验证上,但修改后的设计能不能在真实环境中稳定运行,不是仿真能完全回答的。所以他在测试大纲里加了三组比標准更严苛的条件:更宽的温度范围、更长的测试周期、更复杂的复合应力组合。

“七十二小时,零故障。”站在他旁边的测试工程师老葛说,语气里带著一种小心翼翼的乐观。“十二颗晶片,七十二小时,每颗晶片跑了两百四十万个测试向量,没有发现任何功能错误。温度循环、振动、电压拉偏、时钟抖动注入,全部通过。”

章宸没有接话,而是用手指在平板上滑动,调出了每一颗晶片的温度曲线。十二根曲线在七十二小时的时间轴上几乎完全重合——最高温度六十二度,最低温度零下四十度,温度变化率每秒钟十五度。在这么剧烈的温度衝击下,晶片內部不同材料的热膨胀係数差异会导致微米级的形变,长期累积可能造成焊点疲劳、封装开裂、甚至晶片和基板之间的连接断裂。

天权4號的封装团队在流片前做过仿真,理论寿命是两千次温度循环。但章宸知道,仿真和实测之间有一道鸿沟。这道鸿沟的名字叫“现实”。

“温度循环还要跑多久?”他问。

“计划是跑一千次,现在跑了三百二十次。按目前的进度,还需要大概五天。”老葛调出测试计划,“但有一个问题——七號舱的温控系统昨天下午出了点异常,温度过冲超过了设定值三度,持续时间大概两秒。虽然很快恢復了,但按照测试规程,那批晶片的测试数据需要標记为『有异常干扰』,不能作为有效数据。”

章宸皱眉:“七號舱里跑的是什么?”

“天权4號的另一组工程样片,十二颗,跑的是高温高湿加速寿命测试。温控系统异常发生在测试开始的第十七个小时,之后我们重启了测试,但已经跑的那十七个小时的数据不能用了,要重新跑。”

“异常原因查清楚了吗?”

(请记住 看书首选 101 看书网,101??????.??????超给力 网站,观看最快的章节更新)

老葛调出了七號舱的温控系统日誌:“温控系统的pid控制器参数漂移了。这台设备用了三年,pid参数是出厂时设定的,没有做过自適应校准。温度过冲的原因是控制器的积分项累积误差过大,导致输出超调。”

章宸在平板上记下了这个问题,然后走到七號舱的观察窗前。里面的测试已经重新开始了,十二颗晶片正在八十五度、百分之八十五湿度的环境下运行。这个测试条件模擬的是热带地区高温高湿环境下的长期可靠性,通常跑一千个小时相当於设备在真实环境中使用三年。

“所有测试舱的温控系统,今天之內全部做一次pid参数校准。老化的设备標记出来,排进更换计划。”章宸说,语气不是责备,而是陈述一个必须完成的任务。“天权4號的可靠性测试不能因为设备问题中断或失真。如果设备不行,就换设备;如果设备要修,就等修好了再跑。测试周期可以延长,但数据必须可信。”

老葛把任务记下来,然后问了一个章宸已经在想的问题:“测试周期延长了,天权4號的量產时间表要不要调整?”

章宸没有立刻回答。他走到地下二层的中央监控室,这里有一整面墙的屏幕,显示著十八个测试舱的实时状態。六號舱的振动台还在震动,七號舱的温控曲线稳定爬升,九號舱在跑电磁兼容测试,十一號舱在跑电源瞬態响应。每一块屏幕上都有数字在跳动——温度、湿度、电压、电流、频率、误码率、错误计数。

天权4號的量產时间表,是两个月前就定下来的。流片延迟五周已经让天衡5的量產计划承受了巨大压力,如果可靠性测试再延期,整条產品线都会受影响。但章宸更清楚一件事:晶片量產最怕的不是延期,而是带著隱藏问题上线。隱藏问题会在用户手里爆发,到那时,损失的不是时间,是信任。

“时间表先不调。”他说,“我们先把能並行的事情並行。可靠性测试继续跑,量產准备工作同步推进。等测试数据出来,如果有问题,再决定要不要延期。”

老葛点了点头。

章宸在监控室坐了半个小时,看著每一块屏幕上的数字。十八个测试舱,两百一十六颗天权4號工程样片,正在同时经歷著高温、低温、高湿、振动、电磁干扰、电压波动、时钟抖动的轮番考验。这些考验是残酷的,但晶片的设计目標就是在残酷中保持稳定。

他想起林薇在追光设备国產化会议上说的那句话——“晶片是承诺,不是妥协。”

天权4號的承诺,就是在零下四十度到零上八十五度的温度范围內、在百分之五到百分之九十五的湿度范围內、在每秒三千次的振动下、在几十伏每米的电磁场中,依然能正確地执行每一条指令,依然能稳定地输出每一个计算结果。

这个承诺,过去七十二小时里,两百一十六颗晶片全部兑现了。

但七十二小时不够。章宸要的是两千个小时、一万个小时、十万个小时。他要的是天权4號在真实世界中被用户用三年、五年、七年之后,依然能兑现这个承诺。

下午,赵静来了。

她不是来参加测试的,而是来送小芯对天权4號测试数据的分析结果。悟道算力平台的负载调优和天程车规晶片的样车集成占用了她大部分时间,但章宸一周前就请她帮忙跑一组分析——用小芯的异常模式识別能力,在天权4號的测试数据里找那些人类工程师可能会忽略的微小异常。

“小芯在温度循环测试的数据里找到了一个模式。”赵静把分析报告递给章宸,然后走到监控墙前,指著六號舱的数据曲线。“你看这十二颗晶片的温度曲线,表面上看完全重合,但如果把温度变化率放大一百倍,就能看到差异。”

她调出了小芯的分析结果——一张放大后的曲线图。十二根曲线在温度变化的拐点处出现了微小的分离,有的晶片温度上升得快一点,有的慢一点,差异在零点零几度的量级。

“这不是问题。”章宸说。

“单独看不是问题。但小芯把这种微小差异和另一组数据关联起来后,发现了一个规律。”赵静调出了第二张图,是这些晶片的电源纹波数据。“温度上升快的晶片,电源纹波也稍微大一点。纹波大的晶片,功能安全监测电路的自检周期会稍微长一点。所有差异都在规格范围內,但它们之间存在相关性。”

章宸盯著那几张图看了很久。

“小芯的判断是什么?”

“不是故障,是特徵。这些晶片的物理特性存在细微差异,导致它们在温度响应、电源纹波、自检周期上表现出不同的特徵。这些特徵在规格范围內,不会影响功能和可靠性。但小芯发现,这些特徵和晶片在晶圆上的位置有强相关性——晶圆边缘的晶片和中心的晶片,表现不一样。”

章宸明白了赵静的意思。

这不是一个需要修復的问题,而是一个需要被理解的现象。天权4號的晶片从晶圆上切下来的时候,因为晶圆製造过程中的工艺偏差,边缘和中心的晶片確实会有细微差异。这些差异在设计阶段就被考虑到了,规格范围也覆盖了这些差异。但小芯的分析提供了一个新的视角——这些差异不是隨机的,而是有规律的,可以被预测、被分类、被用於更精细的筛选。

“这个分析结果,我要用到天权5的设计里。”章宸说,“晶圆边缘和中心的差异,我们之前在设计余量里已经覆盖了,但没有做针对性的优化。天权5可以在版图设计阶段就把这种差异考虑进去,让边缘的晶片和中心的晶片在关键参数上更一致。”

赵静把这句话记了下来,然后问了一个更实际的问题:“天权4號的这批工程样片,按现在的测试数据看,能进入小批量试產吗?”

章宸沉默了几秒。

“能。但不是因为测试数据完美,而是因为我们知道所有不完美的地方在哪里,知道它们的影响范围,知道怎么在量產测试中把它们筛出来。晶片量產不是追求每一颗都一样,而是追求每一颗都在规格范围內,並且我们知道每一颗在规格范围內的具体位置。”

赵静点了点头,离开了监控室。

章宸一个人坐在监控室里,继续看那些屏幕。

下午四点,方程来了。

方程不是来参加测试的,他是来问一个问题的。天罡生態的商业化服务试点需要跑在天权晶片上,方程需要知道天权4號的可靠性数据,才能確定商业化服务的sla——服务等级协议。如果晶片的可靠性不够,天罡生態就不敢承诺百分之九十九点九的可用性。

章宸把今天的测试数据调出来,一页一页地给方程看。

“七十二小时,两百一十六颗晶片,零功能故障。温度循环、振动、高湿、电磁兼容、电源瞬態,所有测试项都通过了。但这不是最终结论,可靠性测试要跑完完整周期才能下结论。”

方程看著那些数据,问了一个章宸没想到的问题。

“天权4號和天权3號比,可靠性是提升了还是下降了?”

章宸调出了天权3號在同样测试条件下的歷史数据。两张表並排放在屏幕上,对比一目了然。天权4號的温度循环寿命预期比天权3號高了百分之四十,电源纹波低了百分之三十,功能安全诊断覆盖度从百分之九十七点二提升到了百分之九十九点一。

“提升了。”章宸说,“不是因为天权3號做得不好,而是因为天权4號在设计阶段就把天权3號在可靠性测试中暴露的所有问题都解决了。npu调度器的修改不只是解决了效率问题,也顺便优化了电源管理和热管理,所以可靠性反而比预期更好。”

方程在笔记本上写了几个数字,然后抬头看著章宸。

玄幻魔法小说相关阅读More+

我成了恋游女主们的隐藏路线

佚名

年代:狂赚百亿,我去苏联当倒爷

佚名

完美人生,从改变时间线开始

佚名

开局抽到雷祖,隔壁圣女气得自爆

佚名

明末,我朱由梁靠工业重铸大明

佚名