第174章 绝密会议 一(2/2)
会议室设在三號楼的地下二层。
厚重的防爆门缓缓关闭,將外界的喧囂彻底隔绝。
会议室大得有些空旷,没有窗户,四壁贴著吸音材料,让室內的空气显得异常凝滯。
长桌两侧,坐著掌控中国半导体命脉的几位巨头。每个人面前,只放著一份用红色铅印標註了“绝密·编號0x”的文件。
只有薄薄的三页纸。
王至刚坐在主位,他没有说话,留足了十分钟,让这几位顶级大脑去消化那三页纸上掀起的数学风暴。
终於,他放下了文件,指节在桌面上轻叩了两下。
“都看完了。我就直接说科技部的想法。”
王至刚的声音不大,但语速很快:“这不是一次简单的技术升级,这是一次换道超车。基於最新的slrm模型,我们计划启动『双轨並行』战略。”
他伸出一根手指:“第一轨,存量市场。transformer架构依然是主流,英伟达的cuda生態我们暂时动不了。壁仞、摩尔线程,你们继续在兼容性上做文章,稳住当下的基本盘。”
“第二轨,也是今天的重点——增量突围。海丝、寒武纪,我要你们牵头,根据这个数学模型,定义全新的『lpu』架构。这不仅仅是晶片设计,还包括配套的eda工具链改造,以及最难啃的软体生態。”
“科技部负责统筹,发改委负责立项。我的设想是:三个月內,跑通全流程验证。”
……
话音刚落,海丝的何亭波率先摘下了眼镜。
“部长,战略我认同。但在工程落地前,我有两个技术顾虑,必须摆在桌面上。”
“讲。”
“第一,是『验证闭环』的死结。”
“在工业界,正常流程是先做fpga原型验证,再做小规模mpw(多项目晶圆)流片,拿著硬体测出的真实数据去修正算法,如此叠代三轮,至少需要两年。但您要求三个月?”
何亭波指著文件上的公式,“slrm算法目前只是数学推导。如果没有硬体,算法跑不起来,我们不知道真实的能效比;反过来,如果不知道算法在硬体上的真实行为,我们没法確定缓存的大小和指令流水线的深度。”
“这是一个鸡生蛋、蛋生鸡的死循环。贸然流片,几十亿打水漂事小,浪费的时间窗口事大。”
王至刚微微頷首,示意她继续。
她顿了顿,继续道:“第二,是『算子硬化』与eda工具库的匹配问题。”
何亭波在白板上画了一个简图:“现在的gpu架构,大约60%的面积是通用的,比如內存控制器、总线、指令调度,这些我们可以直接復用昇腾现有的成熟设计。这也是我们能快速突破的基础。”
“但是,”她在核心计算区域画了个圈,“剩下的40%,也就是『计算核』(core),必须彻底置换。”
“现在的gpu核心,也就是所谓的tensor core,全是为『乘加运算』设计的,里面堆满了乘法器和加法器。但lpu的核心是几何逻辑,它需要的是大量的『比较运算』、『集合运算』以及特殊的『gumbel分布採样』。”
“这意味著什么?”王至刚问。
“意味著我们现有的『宏单元库』失效了。”
何亭波解释道:“我们现有的eda工具,synopsys也好,华大九天也好,它们的综合引擎都是为了『算术逻辑』优化的。当我们输入一个乘法指令,工具能自动生成最优的电路结构。但如果我们输入一个『高维几何交集』指令,现有的工具根本不知道该怎么把这一堆电晶体摆放才是最优的。”
“所以,”何亭波总结道,“这不是简单的把gpu里的乘法器拆下来换个零件。这涉及到最底层的物理实现。我们需要重新设计一种『专用定製单元』,並让eda工具『学会』怎么去调用它。”
她看向王至刚,提出了一个明確的要求:“我们需要华大九天的底层算法团队,直接进驻海丝。我们不能只用通用的商用工具,我们需要他们开放后端综合引擎的源码,配合我们的架构师,现场手搓一套专门针对『几何算子』的物理综合规则。”
“设计与工具协同进化?”
“没错。”何亭波双手紧扣,“我们定义算子,他们修改工具。只有当eda工具能『理解』这种新的几何逻辑时,我们才能在有限的硅片面积上,塞进比英伟达多十倍的逻辑算力。”
……