第975章 员工福利提升,新的一年发展规划 宝宝小蛮腰
辅助预测单元旁边飞快地写了一组数学公式。
笔尖划过白板的沙沙声越来越快,写到最后一个等号时他的手微微发抖,不是紧张,是兴奋。
“把预测逻辑拆出来独立运行,主流水线不用等,取指不用抢。王总,你这个思路不是优化,是直接改架构。但辅助单元和主流水线之间的数据同步怎么解决?预测单元跑得再快,如果和主流水线的状态不同步,预测结果就是废的。”
王东来在辅助单元和主流水线之间补了一根虚线,旁边标注了同步锁存的时序图。
“用异步fifo缓冲,深度不用大,够存两次预测结果就行。预测单元提前算完就扔进去,取指单元到点自己取。主流水线永远不等预测,预测永远不拖主流水线,异步时钟域,各跑各的。娲之前在设计鸿蒙内核调度器时用过类似的异步缓冲思路,fifo的深度参数可以直接调过来。”
陈远洲把手里的红色记号笔搁在白板槽里,后退几步看着那张被画得密密麻麻的架构图,沉默了好一会儿。
然后他转过身对着团队里一个戴眼镜的年轻人说:“小刘,把王总刚才画的辅助预测单元用verilog搭一版原型,时钟约束按异步fifo的方案来设,今天搭完直接跑仿真。王总,如果这版跑通,预测准确率应该能再往上提好几个百分点。”
他又补了一句,语气很笃定:“不是线性提升,是直接把预测延迟砍掉。这套分支预测逻辑如果跑通,鸿蒙在低端芯片上的实时性至少能追上现在中高端芯片的水平。”
王东来点了点头没有多说什么。
他在实验室里又待了一段时间,逐项看了缓存一致性协议的优化方案和低功耗模式下的时钟门控设计,分别提了几个调整建议,然后离开了指令集实验室。
走廊里灯光调得很暗,只有应急灯还亮着。
他走进电梯按下另一层的按钮,那是ai芯片研发团队所在的楼层。
ai芯片实验室里的气氛比指令集那边更凝重。
长桌上摊着好几块测试板,每块板上都焊着不同版本的ai加速核心。
测试板旁边堆着厚厚一摞功耗曲线报告,每一页的页脚都被翻得起了毛边。
项目负责人姓周,是从英伟达挖过来的资深架构师,头发已经白了大半,但眼神极其锐利。
“王总。”
周工把他引到主测试台前,屏幕上正跑着一组ai推理任务的功耗曲线。
“我们目前基于传统sid架构做的ai加速核心,在图象识别和自然语言处理上的性能已经追平了英伟达同级别产品,但功耗始终偏高。主要是数据搬运太频繁,神经网络每一层都要从外部dra里反复加载权重,加载一次能耗比算一次还高。这个问题不解决,我们的ai芯片就只能用在服务器端,塞不进车机和手机。”
他把功耗曲线逐层拆解开来,每拆一层就在屏幕上标一个对应的数据搬运量。
从卷积层到全连接层再到注意力机制,搬运量的峰值越来越高,整张图看上去就像一面正在倾斜的墙。
王东来没有直接回答。
他走到白板前拿起记号笔,画了一个全新的架构草图。
不是传统的sid
章节内容不完整,请退出阅读模式查看完整内容!