第261章 新春座谈会 一(2/2)
於是,在西单附近的一座幽静、没有任何招牌的內部招待所里,第一场“技术研討预演会”秘密召开了。
招待所的走廊里舖著厚厚的红地毯,踩上去悄无声息。会议室的门窗都经过了特殊的电磁屏蔽处理,白瓷盖碗里的茶水冒著热气,空气中透著一种只有在权力核心圈才能感受到的、粘稠而严肃的压力。
徐辰在座位上坐定,环顾了一下四周。
坐在左手边的,是中科院自动化所的潘院士,国內模式识別的泰斗;旁边是清华交叉信息研究院的几位大牛。而坐在对面的,则是產业界的技术大牛,比如华为海思的首席架构师、字节跳动的ai负责人……
其中,徐辰看到了一个熟悉的名字:梁文锋。
不同於那些传统的ceo,梁文锋在圈內,被公认为极少数能从底层数学逻辑一路杀到万亿参数工程落地的“技术统帅”。
就在2025年初,那篇震惊全球、让硅谷巨头集体失眠的《deepseek-r1:通过强化学习激励大模型的推理能力》横空出世。梁文锋不仅是deepseek的创始人,更是该论文的核心作者与通讯作者。
因此,梁文锋作为技术顾问出现在这里,倒也並不奇怪。
……
主持会议的是科技部高新司的司长。他看向徐辰,语气温和却透著审视:“徐辰同志,明天的正式会议,部领导会重点询问slrm架构对transformer的替代可行性。几位专家对此还有些保留意见,咱们现在先『內部消化』一下。”
隨后,几位来自中科院和头部大厂的专家轮流发言。
徐辰敏锐地察觉到,这些大佬的发言非常有意思。他们並没有像在学术期刊上那样大谈算法优劣,而是更多地討论“生態迁移成本”和“算力利用率”。
主流的声音是“谨慎乐观”。
在华国的决策语境里,“谨慎乐观”是一个很有深意的词。它代表著:方向是对的,但困难是巨大的,如果出了问题,是因为“谨慎”得不够;如果成功了,是因为“乐观”得有理。
徐辰作为slrm的提出者,自然是“积极乐观派”。
但他心里清楚,slrm是系统出品,其底层逻辑的超前性无法用目前的工程经验来解释。他拿不出那种特別扎实的证据,因此在面对专家们关於“大规模並行训练稳定性”的质疑时,他表现得异常沉稳。
他没有做过多的发散,只是针对专家们担心的几个数学层面的问题,进行了简短而精准的回答。
……
会议进行了整整两个小时,最终形成了一份初步的结论报告。
司长清了清嗓子,缓缓说道:
“关於本次技术预演的结论,我们初步擬定为以下四个维度,大家听一下,看是否准確。”
“第一,在战略定位上,会议一致认为:slrm架构不仅是技术层面的『局部创新』,更是具备『范式变革』潜力的原创性路径。它是我们实现算力底座『全栈自研』、打破路径依赖的关键抓手。对此,我们要保持『战略定力』,坚持『適度超前』的布局原则。”
“第二,在技术评估上,专家组初步达成共识:slrm在逻辑推理深度与能效比表现上,相较於传统transformer架构具备『代差级优势』。虽然在大规模工程化落地方面仍存在『阶段性挑战』,但其底层数学逻辑严密,具备『跑通全流程的充分必要条件』。”
“第三,在实施路径上,建议採取『双轨並行、增量替代、试点先行』的稳健策略。不搞『一刀切』的推倒重来,而是在特定垂直领域开展『先导性应用』,在实战中完成生態的『叠代演进』。”
“第四,在资源保障上,部里將协调相关职能部门,通过『揭榜掛帅』、『专项资金』等形式,引导社会资本与科研力量向该领域『高强度集聚』。同时,要建立『容错机制』,鼓励顛覆性创新。”
徐辰前几条听得似懂非懂,能明白大概要做什么事,但也感嘆这种官场人士精炼的语言表达能力。
不过最后一条徐辰还是听明白了。
容错机制翻译过来就是——钱管够,人管够,万一搞砸了,只要你是真在搞创新,上面不追责。
……