0
做AI芯片的人有个共同的噩梦:流片回来发现架构瓶颈,几亿打水漂。MIT团队开源的SCALE-Sim,专门用来在代码阶段就掐死这种风险。
它模拟的是脉动阵列(systolic array)——谷歌TPU同款架构。这种设计把计算单元排成网格,数据像心跳一样节律流动,能效比传统方案高一个数量级。但代价是灵活性差,一旦阵列尺寸、数据流策略选错,后期改不了。
SCALE-Sim的解法是给架构师一个"沙盒"。输入CNN模型和硬件参数,它能算出每层的计算周期、内存访问量、PE利用率。比如ResNet-50配256×256阵列,是权重固定(WS)还是输出固定(OS)更省带宽?模拟器跑完就有数。
工具已经集成到多个学术项目里。对国内团队来说,流片前多跑几遍仿真,比赌运气靠谱得多。