存算一体架构,没有现成的设计流程,一切从零开始。苏清颜负责存储器阵列的设计,方远负责计算单元的集成,赵宇负责验证方案,周明负责软件栈。林默负责整体架构和协调。
第一个月,团队陷入了困境。存算一体的仿真模型始终跑不通,每次写入数据后,存储阵列的状态就乱了,读出来的结果全是错的。
林默用科研助手模拟了各种可能的故障模式。
“叮——模拟完成。问题定位:写入干扰导致相邻存储单元的电荷泄漏。建议采用‘写验证-重写’机制,每次写入后读取验证,不通过则重写,最多重写三次。”
林默按照建议,修改了设计。加了一个写验证逻辑,每次写入后自动读取,如果数据不对就重写。
仿真模型跑通了。
“成了。”苏清颜看着屏幕上正确的输出结果,长长地呼了一口气。
“别高兴太早。”林默说,“这是仿真。流片回来能不能跑通,还不一定。”
“我知道。但至少,理论可行了。”
第二个月,团队完成了架构设计。第三个月,完成了前端实现。第四个月,进入了后端。
方远带着后端团队没日没夜地画版图。存算一体的版图比传统架构复杂得多,存储阵列和计算单元紧密耦合,布线密度极高,时序收敛非常困难。
“时序收敛不了。”方远在项目周会上说,脸色很难看,“关键路径的延迟比要求的高了20%。我把能优化的地方都优化了,还是不行。”
“换一个工艺?”周明建议。
“换工艺要重新设计整个版图,至少三个月。”
“不换工艺。”林默说,“改架构。把关键路径上的逻辑级数从8级降到6级。”
方远皱眉。“那要改前端设计。”
“改。苏清颜,你配合方远。一周之内,改完。”
苏清颜点头。
团队又进入了一轮紧张的迭代。改架构、改前端、改版图、重新仿真、重新时序分析。一周后,关键路径的延迟降到了要求值的95%。
“还差5%。”方远说。
“加pipeline。把关键路径再切一刀。”
“加pipeline会增加延迟。”
“增加的延迟可以接受。只要时序收敛就行。”
方远想了想,点头。
又过了一周,时序终于收敛了。
方远看着时序分析报告,沉默了很久,然后说了一句:“林工,你的‘加pipeline’建议是对的。时序收敛了,裕量5%。”
“好。送流片。”
六月中旬,MA-3(天眼定制版)送走流片。流片周期四个月,预计十月回来测试。
等待的日子里,林默没有闲着。他带着团队,开始设计“天眼”项目的其他配套芯片——数据链芯片、信号处理芯片、电源管理芯片。每一颗都有严格的技术指标和苛刻的时间节点。
周明说他“疯了”。“一颗MA-3还不够,还要做三四颗?我们哪有那么多人?”
“招人。”林默说,“陈芳,再招二十个人。”
陈芳皱眉。“二十个人,成本增加不少。”
“成本不是问题。‘天眼’项目的经费够。关键是人。没有人,什么都做不了。”
陈芳点头,去安排了。
七月初,林默接到了一个让他意外的电话。
是赵宇打来的。赵宇在公司,声音有点激动。“林工,你快来一下。出事了。”
林默赶到公司,看到赵宇站在测试间里,手里拿着一颗芯片,脸色很难看。
“怎么了?”
“MA-3的样片,我们提前拿到了。晶圆厂说良率太低,只有不到30%,让我们先看看是不是设计问题。”
林默接过芯片,放在显微镜下。芯片表面有几处明显的缺陷——金属层的线条有断裂,可能是工艺问题。
“不是设计问题。是工艺问题。”林默看完后说,“晶圆厂的工艺不稳定。”
方远也过来了,看了芯片后说:“这批次是晶圆厂边缘区域的芯片,工艺波动大。中间区域的应该会好一些。”
“让晶圆厂只给我们中间区域的芯片。边缘的不要。”
“成本会增加30%。”
“成本增加也比不能用的好。”
方远点头,去联系晶圆厂。
七月中旬,第二批样片回来了。良率65%,虽然不高,但至少能用了。
林默带团队开始全面测试。功能测试、性能测试、可靠性测试、环境测试——一项一项地过。
一个月后,测试完成。MA-3(天眼定制版)的各项指标基本达到了设计要求。算力是MA-2的2.1倍,功耗增加了28%,工作温度范围-55℃到125℃通过,抗辐照能力满足卫星平台要求。
林默把测试报告发给了陈局长。
陈局长的回复只有一句话:“好。尽快安排装机测试。”