聊一下学霸+商业的剧情(1/2)
好书推荐: 明末:从流寇开始一统天下
奥特:光之国蹲大牢,狱友贝利亚
斗罗:武魂MC,成就概念神!
恶龙只想宅,玩家却狂攀科技
[阴阳师同人] 攻略鬼王的一百种方式
剑敕天下
全民武魂:我的武魂无上限!
秘密的掠夺(1v1纯爱)
洪荒:蹭出一个混元道果
朝露圣约
这本书是按照学霸+读书创业的方向来走的。
有朋友说,高中因为有高考主线,所以还很好,但上了大学马上就“高开低走”。
这是我的问题,我並没有考虑到並不是每个人都能清楚神经网络大模型的发展歷程,重要时间段。
如书中所言,现实中,神经网络/深度学习领域,进入90年代后一直遇冷到了2006年——直到辛顿在nature上提出深度信念网络,nivdia开启cuda,李飞飞创建imagenet数据集。
直到这时,算法,算力,数据,三驾马车勉强凑齐。
但深度学习领域还是冷。
(可能大家听过一个笑话,x度的自动驾驶里面,有上百万个if else……)
那会为了提高研究热情,李飞飞让人免费用数据集又搞训练比赛……
可以说,大模型就是一帮坐冷板凳的科学家坚持走出来的。
现在回到书中,时间是2000年。
大家有个普遍的误区是认为有算力、超算就可以搞训练。
不是的,深度信念网络(dbn)逐层预训练是串行逻辑,分布式只会增加延迟,而超算都是分布式集群的,哪怕银河二號超级计算机,都不如一块奔腾4跑得快。
但你说能训不呢?那当然还是能的。
本章未完,点击下一页继续阅读。