第129 章 去沈默的公司上班?(1/2)
奖励函数的设计,不再是他们那种理想化的单一指標。
而是引入了多目標加权,还加了动態调整机制。
探索策略也用了改进版的ucb,既保证了探索效率,又避免了陷入局部最优……
原本困扰他们的核心难点,沈默凭藉一己之力,几乎全都解决了。
而且,可以算得上是创新性的解决。
至少在他经手过的那些大厂项目,是都没有这么构建代码的。
“这……这是怎么想到的?”
宋远忍不住惊嘆道。
旁边几个研发人员听到动静,凑了过来。
“看什么呢?”
“沈总写的框架。”宋远声音发抖,“你们快过来看看!”
几个人围到屏幕前。
一开始还有人面带疑惑,觉得一个花花公子能写出什么好东西。
可看著看著,那些疑惑的表情就凝固了,七嘴八舌地討论起来:
“这奖励函数……靠,我怎么没想到?”
“你看这个探索策略,我之前在论文里看到过类似的,但一直不知道怎么实现……”
“等等,这个跳层设计是什么原理?我没见过这种写法。”
宋远没有回答。他也在思考这个问题。
那个跳层设计,看起来简单,但却內有乾坤。
它既解决了梯度消失,又避免了梯度爆炸;
既保证了信息传递,又控制了计算量。
这需要对深度学习理论有极其深刻的理解,甚至可以说是融会贯通之后才能创造出来的。
“宋总,”旁边一个年轻研发人员小声问:
“这……真的是沈总一下午写出来的?”
宋远沉默了几秒。
“u盘是他刚才给我的。”
他声音艰涩,“上午他来的时候,还没这个。”
这算是变相默认了。
一时间,没人再说话。
他们都记得上午沈默来的时候,自己心里那些轻视和不屑……
这时,研发部的玻璃门再次被推开。
沈默走进来,朝宋远淡淡道:
“刚才有几点忘记说了,关於后续优化的方向,我说几点,你们记一下。”
宋远连忙拿起笔。
“第一,训练数据需要做增强,现有的样本量不够,容易过擬合。”
“第二,模型收敛后,要做剪枝和量化,把推理速度提上来。”
“第三,api接口的设计要考虑扩展性,后续要接入不同业务线。”
他顿了顿,补充道:
“具体的实现细节,框架里都有注释。你们按照这个思路往下做,有问题隨时找我。”
说完,他扯了扯嘴角,转身离开。
这一次,没有人再敢轻视那个背影。
会议室里安静了很久。
宋远慢慢坐回椅子上,盯著屏幕上的代码,久久没有说话。
旁边有人小声问:
“宋总,如果按照这个框架往下做,最终產品能达到什么水平?”
宋远沉默了很久。
他想起自己这些年在海外大厂见过的各种ai產品,想起那些號称行业领先的算法模型。
然后他缓缓开口:
“如果真能做出来……绝对是世界领先。”
“目前市面上,还没有这么完善的自我学习ai模块。”
眾人不约而同地抬头看向重新关上的玻璃门。
心里同时涌起了对沈默个人能力的讚嘆和敬佩。
本章未完,点击下一页继续阅读。