第174章绝密会议一（2/2）

会议室设在三號楼的地下二层。

厚重的防爆门缓缓关闭，將外界的喧囂彻底隔绝。

会议室大得有些空旷，没有窗户，四壁贴著吸音材料，让室內的空气显得异常凝滯。

长桌两侧，坐著掌控中国半导体命脉的几位巨头。每个人面前，只放著一份用红色铅印標註了“绝密·编號0x”的文件。

只有薄薄的三页纸。

王至刚坐在主位，他没有说话，留足了十分钟，让这几位顶级大脑去消化那三页纸上掀起的数学风暴。

终於，他放下了文件，指节在桌面上轻叩了两下。

“都看完了。我就直接说科技部的想法。”

王至刚的声音不大，但语速很快：“这不是一次简单的技术升级，这是一次换道超车。基於最新的slrm模型，我们计划启动『双轨並行』战略。”

他伸出一根手指：“第一轨，存量市场。transformer架构依然是主流，英伟达的cuda生態我们暂时动不了。壁仞、摩尔线程，你们继续在兼容性上做文章，稳住当下的基本盘。”

“第二轨，也是今天的重点——增量突围。海丝、寒武纪，我要你们牵头，根据这个数学模型，定义全新的『lpu』架构。这不仅仅是晶片设计，还包括配套的eda工具链改造，以及最难啃的软体生態。”

“科技部负责统筹，发改委负责立项。我的设想是：三个月內，跑通全流程验证。”

……

话音刚落，海丝的何亭波率先摘下了眼镜。

“部长，战略我认同。但在工程落地前，我有两个技术顾虑，必须摆在桌面上。”

“讲。”

“第一，是『验证闭环』的死结。”

“在工业界，正常流程是先做fpga原型验证，再做小规模mpw（多项目晶圆）流片，拿著硬体测出的真实数据去修正算法，如此叠代三轮，至少需要两年。但您要求三个月？”

何亭波指著文件上的公式，“slrm算法目前只是数学推导。如果没有硬体，算法跑不起来，我们不知道真实的能效比；反过来，如果不知道算法在硬体上的真实行为，我们没法確定缓存的大小和指令流水线的深度。”

“这是一个鸡生蛋、蛋生鸡的死循环。贸然流片，几十亿打水漂事小，浪费的时间窗口事大。”

王至刚微微頷首，示意她继续。

她顿了顿，继续道：“第二，是『算子硬化』与eda工具库的匹配问题。”

何亭波在白板上画了一个简图：“现在的gpu架构，大约60%的面积是通用的，比如內存控制器、总线、指令调度，这些我们可以直接復用昇腾现有的成熟设计。这也是我们能快速突破的基础。”

“但是，”她在核心计算区域画了个圈，“剩下的40%，也就是『计算核』（core），必须彻底置换。”

“现在的gpu核心，也就是所谓的tensor core，全是为『乘加运算』设计的，里面堆满了乘法器和加法器。但lpu的核心是几何逻辑，它需要的是大量的『比较运算』、『集合运算』以及特殊的『gumbel分布採样』。”

“这意味著什么？”王至刚问。

“意味著我们现有的『宏单元库』失效了。”

何亭波解释道：“我们现有的eda工具，synopsys也好，华大九天也好，它们的综合引擎都是为了『算术逻辑』优化的。当我们输入一个乘法指令，工具能自动生成最优的电路结构。但如果我们输入一个『高维几何交集』指令，现有的工具根本不知道该怎么把这一堆电晶体摆放才是最优的。”

“所以，”何亭波总结道，“这不是简单的把gpu里的乘法器拆下来换个零件。这涉及到最底层的物理实现。我们需要重新设计一种『专用定製单元』，並让eda工具『学会』怎么去调用它。”

她看向王至刚，提出了一个明確的要求：“我们需要华大九天的底层算法团队，直接进驻海丝。我们不能只用通用的商用工具，我们需要他们开放后端综合引擎的源码，配合我们的架构师，现场手搓一套专门针对『几何算子』的物理综合规则。”

“设计与工具协同进化？”

“没错。”何亭波双手紧扣，“我们定义算子，他们修改工具。只有当eda工具能『理解』这种新的几何逻辑时，我们才能在有限的硅片面积上，塞进比英伟达多十倍的逻辑算力。”

……

第174章 绝密会议 一（2/2）