教育

MIT中国小伙刚毕业就被众人抢,年薪300万起步!

近日,肖光烜(Guangxuan Xiao)在社交平台宣布完成 MIT 博士学位,下一站将加入 Thinking Machines,从事大模型预训练相关研究。这家公司由 OpenAI 前 CTO Mira Murati 创立,消息一出,迅速引发关注。英伟达、xAI、UCSD 等机构的多位研究人员也在评论区送上祝贺。

清华起步,MIT 深造的“开挂”履历

翻看肖光烜的背景,可以说是一路高配。

他本科就读于清华大学,获得 计算机科学 + 金融学双学位,期间囊括了综合优秀奖学金、国家奖学金、数学建模竞赛一等奖等多项重量级荣誉。

2020–2021 年,他以访问学生身份前往 斯坦福大学计算机系开展科研。

2022 年进入 MIT EECS 攻读博士,师从知名教授 韩松(Song Han),研究方向集中在 高效深度学习算法与系统,尤其是大规模基础模型。

在 MIT 期间,他长期担任全职研究助理,并多次进入顶级科技公司进行研究实习,积累了扎实的一线工业经验。

从量化到长上下文:直击 LLM 工程痛点

相比耀眼履历,更值得关注的是他的博士研究成果。

在论文 Efficient Algorithms and Systems for Large Language Models 中,他系统性地回应了当前大模型最棘手的三大问题:成本高、推理慢、长上下文吃显存。

理念过于复杂,简单来说就是整体看,这并非零散优化,而是一套覆盖算法、系统与硬件协同的完整高效大模型框架。

年薪 350 万起,Thinking Machines 抬高天花板

最后绕不开的,是待遇问题。

据公开招聘与申报信息,Thinking Machines 为技术员工开出的基础年薪普遍在 45–50 万美元,平均约 46.25 万美元(约 350 万人民币),且数据来自 2025 年初、公司完成百亿美元估值融资之前。虽然还未达到 Meta 的“天价挖人”水平,但在硅谷已属顶尖行列。

一句话总结:在大模型时代,最昂贵、也最稀缺的,依然是能把理论跑进工程的人才。

发表回复