第170章 《Logic Is also You Need》(2/2)
北大人工智慧研究院,院长办公室。
朱宋纯教授正戴著眼镜,审阅著一份关於“通用人工智慧(agi)”的战略报告。作为享誉全球的计算机视觉与认知科学专家,他回国后一直致力於推动华国原创ai理论的发展。
“叮咚。”
邮箱提示音响起。
朱宋纯扫了一眼屏幕。
【发件人:徐辰(数学科学学院)】
【主题:关於大模型逻辑推理能力的一点思考(附论文初稿)】
“徐辰?”
朱宋纯放下手中的报告,眼中闪过一丝好奇。
“原来刚才张伟平特意发微信来打招呼的就是他啊。这小子不是搞数论的吗?怎么突然跨界搞起ai来了?”
徐辰这个名字,最近在北大可是如雷贯耳。数院那个搞定哥德巴赫猜想的大一新生,连他这个外院的人都听说了。
带著一丝疑惑,他点开了邮件。
“朱老师您好,我是数院的徐辰。最近閒暇之余,我对大语言模型的逻辑推理问题做了一些研究,提出了一种基於几何嵌入的新方法。考虑到该技术的敏感性,特请您指正……”
“閒暇之余?”朱宋纯笑了笑,“现在的年轻人,口气倒是不小。”
他隨手点开了附件里的pdf。
映入眼帘的第一个標题,就让他愣了一下。
《logic is also you need》
“嚯,这標题,够狂的啊。”
朱宋纯挑了挑眉。
在ai界,虽然起標题向来比较隨意,什么“yolo”、“bert”满天飞。
但敢直接对標谷歌那篇奠基之作《attention is all you need》的,要么是譁眾取宠的水文,要么……就是真的觉得自己搞出了能与之比肩的顛覆性成果。
“初生牛犊不怕虎。”
朱宋纯心里並没有太当回事。每年都有无数这种“標题党”论文,声称拳打gpt,脚踢transformer,结果打开一看,全是些微创新或者缝合怪。
……
他带著几分审视,翻到了摘要和引言部分。
“符號逻辑推理模块(slrm)……將一阶谓词逻辑引入transformer……”
看到这里,朱宋纯的眉头微微皱了起来,眼中闪过一丝失望。
“又是符號ai的老路子吗?”
作为业內泰斗,他太清楚符號主义的弊端了。
上世纪的专家系统就是符號ai的巔峰,逻辑严密,可解释性强。但它有一个致命的死穴——“符號落地问题”。符號是离散的、刚性的,而现实世界是连续的、模糊的。
更要命的是,符號逻辑是不可微的。这意味著它无法像神经网络那样,通过“梯度下降”算法进行大规模的自我学习和训练。
“想把刚性的逻辑规则,硬生生嫁接到柔性的神经网络上,这就像是想把齿轮装进水流里,只会卡死。”
朱宋纯心里暗嘆,觉得这个数学天才可能在工程上还是太天真了,低估了“神经-符號”融合的难度。
“年轻人有想法是好的,但这个问题困扰了学界几十年,哪有那么容易……”
……
朱宋纯带著一丝审视,继续往下看。
然而,当他耐著性子翻到第二页,看到那个复杂的“gumbel-box”几何模型定义时,他的瞳孔猛地收缩了一下。
“等等……”
“这是……?”