027 低调校花吴小满(1/2)
三月,春天到了,万物復甦,又到了动物们交配的季节。
半个月过去,街头的春风,褪去了料峭寒意,变得温软起来。
传媒大学校园里的姑娘们,早早换上轻薄的春装,肉色光腿神器闪耀著动人的光彩,增添几分鲜活的春意。
饶佳的到来,让蝴蝶效应走上发展的快车道,也让夏伟閒下来,有时间欣赏大好春光。
算法岗、视频工程师、財务岗、运营岗、內容岗......一位接一位新员工,由饶佳招聘入岗。
值得一提的是新招的算法架构师:
他叫丁明,月base55k,是全公司薪酬最高的一位。
他今年36岁,本硕均为华理工计算机专业,离职时是字符的算法架构师,职级2-3。
他是字符经验最足、最懂线上落地的老工程师之一。
熟练使用分布式机器学习平台,深度参与头条的资讯推荐算法叠代,能独立带队落地一套推荐系统。
他因晋级败给一位能力不如他的人而离开字符,被饶佳找到。
夏伟和他经歷一番长谈,描绘出把“机器学习平台”和“推荐算法”组合成个性化短视频推荐算法的思路。
丁明听完这套方案,对夏伟惊为天人。
他不仅了解字节的东西,还开创性地想出把推荐算法从“图文”適配到“短视频”场景上。
这个想法很有建设性,似乎很有搞头,市面上没有一家公司这么做——字符都没有。
他非常感兴趣,一拍即合,同意来蝴蝶效应当算法负责人。
当他入职后,就能谈更深层次的技术方案了,面试时不方便聊太深。
夏伟直接给出第一版算法思路,让他落地实现,具体动作很简单:
第一步:先解耦字节的“资讯推荐算法”与“分布式机器学习平台”的核心模块,保留底层架构不变,节省90%的底层开发成本;
第二步:重构內容理解模块,打破图文场景局限;
摒弃原资讯算法依赖的正文关键词、段落语义等特徵,转为提取短视频核心动作特徵。
再通过图像识別、音频解析、提取视频封面特徵、bgm曲风、画面场景標籤等元素,完成內容侧的场景適配;
第三步,搭建个性化兴趣推荐筛选体系,精准筛选出用户可能喜欢的视频。
一方面,通过用户过往刷过、点讚、停留过的视频,推算出他长期喜欢的內容;
另一方面,捕捉用户当下刷视频的行为,更新短期兴趣。
从而做到“长期+实时”的双重兴趣捕捉,精准匹配每一个用户的口味。
第四步:將用户兴趣標籤、短视频內容特徵,结合短视频专属行为数据——如:三秒留存、完播率、播赞比等。
输入浅层dnn模型,进行深度学习与重训,不断优化兴趣匹配权重。
——这样,就能实现两套技术的合二为一,落地全球第一版个性化短视频兴趣推荐算法。
——从而实现“千人千面”的个性化內容推送。
丁明当时直接愣在原地,小手直打颤,眼神里满是难以置信,脑子里嗡嗡作响。
他从企鹅到字节,深耕算法七年,亲手参与今日头条资讯推荐算法的叠代。
他比谁都清楚,把图文推荐適配到短视频,最难的是创意,是第一个想到这个点子。
第二个,就是如何构建一套適用於短视频的全新特徵体系、內容理解、用户动態兴趣的实时建模。
夏伟直接给出一套端到端的工程技术方案,把每一步都想得明明白白,全是能直接落地的乾货。
虽然没有一行代码,但只需照做,一套粗糙的短视频兴趣推荐算法,便能落地。
这套方案,一旦落地运行,大概率是能碾压当下所有短视频平台的降维打击。
什么大手,什么美拍,什么秒拍,统统滚蛋。
他判断的没错,夏伟比他更清楚这套方案的妙处和威力,迫不及待地想看到它提前大半年上线的效果。
直接告诉他:
第一版不用尽善尽美,能用就行,先確保上线;
上线后再慢慢叠代优化。
算法需要大量用户数据做深度学习,数据越多,推荐越精准。
赶紧上线拿到大量用户数据,在使用中进化叠代。
丁明深以为然,言听计从;
带著两位新招的专家,天天加班到深夜,爭取早日上线全球第一版短视频推荐算法.......
经过2月底一波节奏极快的铺垫,再补充关键岗位后,公司框架搭建完毕;
各部门齐头並进,內容部门突飞猛进,算法研发进度飞快,產品也一天一个样。
进入三月份这大半个月:
星动娱乐那边,陈默团队紧锣密鼓按他给的计划修改“晃咖app”,不日即將上线。
校园內容团队——內容一部,逐渐扩充到50人,入职一位內容策划,叫李淑仪,给张婷当副手。
提拔三个学生组长,引领整个团队日均產出400条短视频。
在学校创业孵化中心王老师的帮助下,学校迅速通过了夏伟的创业项目评审,特批120平共享办公空间。
办公地址位於学校1.5公里外的龙传文创园,有共享会议室,免租两年。
內容团队就在这里办公,二部也在,唯一的全职员工是范雪非。
阴差阳错之下,舍友陆梓承被调到內容二部当水军——哦,不,是运营。
他,还有另两位兼职学生,成立运营小组,他当组长。
三个人在围脖音乐区、豆瓣音乐区、企鹅音乐、知乎、贴吧这五个地方,註册了100个帐號。
搞风搞雨,呼风唤雨,引导音乐爱好者去欣赏《跳楼机》和《野狼disco》。
本章未完,点击下一页继续阅读。