XM外汇平台

梁文锋惊醒张一鸣雷军(2025年02月23日)

XM

千万年薪的人才争夺战 ,又一次在科技大厂间打响。DeepSeek,则一定程度上担纲了导火索的角色 。

近期,此前传出被雷军千万年薪邀约的AI大牛罗福莉 ,被红星新闻报道已正式加盟小米;字节挖来了谷歌DeepMind研究副总裁吴永辉,后者深度参与了谷歌Gemini系列模型的研发;阿里招揽了全球顶尖AI科学家 、前Salesforce集团副总裁许主洪,出任阿里集团副总裁。

尽管字节和阿里挖人的筹码未被曝出 ,但以两人的职位而言 ,“年薪肯定过千万,不过其中大比例会以股票形成呈现,可能涉及一些绩效考核。 ”服务大厂的猎头公司嘉明创始人邢泽分析道 。

DeepSeek爆火出圈 ,激活的不只是顶尖人才市场,大模型行业对一般人才的渴求度也迎来新的变化。

过去一年中,随着大模型技术迭代趋缓 ,行业对人才的争抢已经显现出放缓的迹象,科技大厂更是开启了优中优选模式,“一般的数据标注工程师、测试工程师等大模型相关岗位 ,已经变得不再抢手,甚至预训练算法方面的人才需求度,也开始下滑。”某科技大厂HR李南说道 。

字母榜获悉的一份2024人才白皮书报告也佐证着上述转变 。根据前程无忧数据统计 ,包括大模型在内的高科技行业,离职率从2023年的17.7%,下滑至2024年的16.1%。离职率下降的背后 ,则透视出大模型行业对人才需求度的减弱。

但就在外界以为国内大模型行业竞争格局渐渐明朗 ,开始演变为一场大厂和AI创业新贵之间的资本游戏之际,DeepSeek凭借在过去一个月内的惊艳表现,正在重新改写游戏规则 。

一众大模型厂商 ,又再次回到了比拼技术创新和研发实力的基础阶段。行业对一般人才的渴求度,也因此被重新激活。

阿里是最先释放信号的一家 。在招揽完许主洪后,阿里近期的AI To C业务 ,开启了一轮大规模人员招聘,开放招聘岗位达到数百个,其中AI技术、产品研发岗位占比达到90%。官方信息显示 ,新聘人员将重点投入文本 、多模态大模型、AI Agent等前沿技术与应用的相关工作中。

上述变化也让邢泽再次忙了起来,“2月份以来,大模型行业的招聘需求又有了2023年时的热闹场景 。”

越是在大模型上落后一步的大厂 ,越舍得砸钱挖人。

在大模型领域落后百度、阿里一步的字节,便成了国内挖人最疯狂的科技大厂。张一鸣再次找回了当年创办今日头条时的状态,开始化身公司头号HR 。据外媒报道 ,字节内部人士称 ,虽然已卸任公司CEO一职,但从2023年中开始,张一鸣一直在积极参与公司的AI战略 ,并亲自监督从竞争对手公司招聘中国AI工程师和研究人员。

此后,包括光年之外原技术骨干田值 、谷歌原VideoPoet项目负责人蒋路,零一万物原预训练负责人黄文灏 ,以及阿里通义大模型原技术负责人周畅,到现在的谷歌DeepMind原研究副总裁吴永辉,相继被字节重金招募。

据晚点LatePost报道 ,在黄文灏提出离职,称要 “奔赴AGI梦想 ”,并讲了字节开的条件时 ,零一万物内部都不好意思做挽留动作 。

雷军豪掷千金邀约罗福莉之前,张一鸣就曾因千万年薪招揽周畅,而引发了一场字节和阿里两家公司的纷争 。2024年12月初 ,界面新闻报道称 ,通义前员工周畅因违反竞业协议跳槽字节,已遭到阿里起诉索赔,目前暂未有新的进展传出。

出任字节AI研究部门Seed新负责人的吴永辉 ,则成了迄今为止,字节在大模型领域挖到的级别最高的科学家。

国外被OpenAI打乱阵脚的科技大厂,为了在AI领域提速 ,几乎同时选择了跟字节一样的砸钱挖人策略 。

去年,微软以超6亿美元收购了AI初创明星公司Inflection核心资产,谷歌更是以超26亿美元拿下了Character.AI核心资产。

无论微软还是谷歌 ,最为看重的核心资产都是创始团队的人才价值,尤其是各家公司的创始人:Inflection创始人穆斯塔法·苏莱曼(Mustafa Syleyman),曾是DeepMind联合创始人;Character.AI创始人诺姆·沙齐尔(Noam Shazeer) ,曾是谷歌大脑和“Transformer八子”之一。

尤其是沙齐尔的回归,外媒爆料称,谷歌为这笔超26亿美元的交易 ,特意注明了一个绑定条款 ,即沙齐尔同意重返谷歌 。

少有发声的谷歌联合创始人谢尔盖·布林(Sergey Brin),更是在一次演讲中兴奋地提到,“Noam已经回来了 ,这太棒了。”

国内外科技大厂围绕顶尖人才的争夺,一度引得世界首富马斯克都连连感叹,并在去年4月发文称 ,AI工程师的竞争“是我见过的最疯狂的人才争夺战 ”。

部分不愿被大厂“绑架 ”的AI大牛,则趁着风口选择独立创业 。最具代表性的人物非OpenAI原联创伊利亚·苏茨克维(Ilya Sutskever)莫属。

去年5月从OpenAI离职后,伊利亚确定创业 ,并组建新公司Safe Superintelligence(简称SSI)。一年时间不到,在没有任何产品和PPT介绍的情况下,近期SSI估值已飙升到超300亿美元 。据外媒爆料 ,伊利亚正在以投后300亿美元的估值,寻求新一轮10亿美元融资。

无论是去大厂拿千万年薪,还是下场创业收获百亿估值 ,这一波AI人才 ,都应该感谢大模型开启的AI 2.0时代新机遇。

2016年,AlphaGo用一场围棋大战,正式叩开AI 1.0创业时代的大门 。国内科技大厂纷纷组建AI相关研究院 ,并大肆招兵买马:百度挖来陆奇All in AI,阿里挖来漆远等人组建达摩院,字节同样挖来了马维英 、李磊等一批AI大牛 。

但好景不长 ,随着AI 1.0热潮褪去,陷入商业化困境的大厂,纷纷缩减AI研究院规模和开支 ,到2020年左右,上述科学家中的绝大多数,相继逃离大厂 ,重回学界担任教职。

大模型的爆发,则重新引发了科学家从学界回归产业界的新浪潮。

ChatGPT尚未出现的2020年之前,据月之暗面创始人杨植麟回忆 ,当时的OpenAI风评很差 ,“我们圈子的人找工作,一般考虑像谷歌 。很多人跟伊利亚聊完,觉得这个人疯了 ,太自以为是了——OpenAI不是疯子就是骗子。”

OpenAI遭遇的招人和融资困境,彼时同样成为笼罩在国内大模型上空的一朵朵乌云。“当时投资人既不了解,也不愿多听介绍 ,路演很快就会遭遇闭门羹 。”大模型创业公司aiXCoder创始人李戈向字母榜回忆道。

ChatGPT出现后,AI技术人才的价值又一次被无限放大。

相关数据也印证着这一转变 。前程无忧统计数据显示,包括大模型在内的高科技行业 ,连续两年调薪幅度位居第一(2023年5.7%,2024年5.2%),预计2025年调薪幅度为5% ,依然是行业第一。

“这轮大模型创业,投资圈的一个共识是,要找有技术背景的人。 ”恒业资本创始合伙人江一说道 ,其中清华大学和卡内基·梅隆大学 ,则成了大模型人才输出的两大重镇 。

AI六小虎中,智谱张鹏、月之暗面杨植麟、百川智能王小川都是清华毕业,零一万物李开复出身卡内基·梅隆大学。

清华和卡内基·梅隆双身份加持下的杨植麟 ,更是成为2023年大模型创业的种子型选手。前红杉中国合伙人曹曦创立的砺思资本(Monolith),在其他投资机构广泛撒网的时候,选择把所有赌注都押在杨植麟身上 ,接连投资了月之暗面一 、二、三轮 。

无论出身哪所高校,AI六小虎创始人(加上MiniMax闫俊杰、阶跃星辰姜大昕)的一个共同点则是,均有技术背景 。

在过去两年的大模型创业热潮中 ,唯一不遵循技术背景创业变数的,只有一个人,即光年之外创始人王慧文。但非技术出身带来的代价便是 ,在需要投入更大精力来判断技术路线和资源分配的决策中,王慧文身体先一步吃不消,被迫退出了这场AGI(通用人工智能)争夺战。

据腾讯科技报道 ,2023年6月 ,王慧文毫无预兆的“疑似抑郁”,都源于他太负责了 。虽然不懂大模型,但考虑到大模型的任何一个决策 ,都涉及过亿资金的投入,在决策试错成本极高的前提下,王慧文想要把事情想得更清楚些 ,就不可避免要投入远超技术人员的精力,去补课大模型知识。

王慧文退场后的一年时间内,国内大模型领域也开始因技术趋缓 ,而陷入融资难和人才流动降低的新状况。

“除了数据科学家(非数据标注工) 、产品应用专家还供不应求之外,负责预训练、后训练和微调等的人才需求,明显降低 ,且待遇也有所下降 。”李南总结道。

李开复的转舵,更是为大模型遇冷行情又泼了泼凉水。1月份,零一万物正式调整策略 ,成为首家放弃追求AGI的大模型厂商 ,李开复一手组建起来的预训练人才队伍,被阿里接管 。

大模型似乎开始仿照移动互联网时代,进入到了一场比拼资本的旧模式。但DeepSeek的出圈 ,成了打破这一旧模式的新变量,并重新搅动起大模型行业的人才流动。

无论是AI六小虎,还是科技大厂 ,想要在大模型领域重获用户青睐,唯一的捷径便是学习DeepSeek,通过技术创新证明自己 。

为此 ,吴永辉、许主洪等顶尖大佬之外,更多年轻人才开始获得科技大厂的新一轮青睐。

DeepSeek之前,唯有OpenAI敢于将毫无经验的应届生 ,或者辍学生用来参与大模型研发,并能成功上线产品。国内AI六小虎中,从王小川的百川智能 ,到姜大昕的阶跃星辰 ,再到李开复的零一万物,都招募了一众自己的老部下和前同事 。

作为DeepSeek创始人的梁文锋,更是将人才组织 ,视为自家在AGI大战中的护城河,不是闭源,更不是招募行业顶尖牛人 。

如同OpenAI一样 ,梁文锋为DeepSeek寻找到的,同样是一批由更多TOP高校应届毕业生,和一些毕业才几年的年轻人组成的队伍 ,并对这些人的GPU资源调动不设上限。“如果有想法,每个人随时可以调用训练集群的卡无需审批。同时因为不存在层级和跨部门,也可以灵活调用所有人 ,只要对方也有兴趣 。 ”梁文锋说道。

在大模型热潮爆发之前,GPU已经是业内招揽人才的最具诱惑力条件之一。“深度学习之父”杰弗里·辛顿(Geoffery Hinton),早年的AI研究便一直受困于从哪里能获得更多的卡 。直到其联手自己的学生伊利亚等人 ,在2012年的ImageNet(一项图像识别竞赛)挑战赛中夺魁 ,一夜成名后的辛顿,最终被谷歌开出的GPU充足供应条件而吸引,在一众邀约中 ,选择了加盟谷歌。

从十年前辛顿加盟谷歌,到现在雷军 、张一鸣,乃至马云 ,纷纷豪掷千万年薪招收顶尖技术人才,他们无一例外看中了这些AI大牛会带来的人才“滚雪球”效应。在刑泽看来,“大厂用行业顶薪招揽人才的举动 ,也是一种雇主品牌宣传 。重视人才的印象一旦传遍行业,对于后期社招也会增加吸引力。 ”

参考资料:

《阿里加速“抢人”:开放数百个招聘岗位,九成与AI相关》界面新闻

《Google Fellow吴永辉博士加盟字节跳动 ,负责AI基础研究探索工作》智能涌现

《只招1%的天才,这家中国公司让硅谷难安》凤凰网科技

《中国大模型生存战:巨头围剿,创业难熬》晚点LatePost

《大模型的扑克牌:独家内幕故事》腾讯科技

《月之暗面杨植麟复盘大模型创业这一年:向延绵而未知的雪山前进》腾讯科技

《月之暗面杨植麟:创新、长期、第一性》 Monolith砺思资本