MIT中国小伙刚毕业就被众人抢,年薪300万起步!
近日,肖光烜(Guangxuan Xiao)在社交平台宣布完成 MIT 博士学位,下一站将加入 Thinking Machines,从事大模型预训练相关研究。这家公司由 OpenAI 前 CTO Mira Murati 创立,消息一出,迅速引发关注。英伟达、xAI、UCSD 等机构的多位研究人员也在评论区送上祝贺。
清华起步,MIT 深造的“开挂”履历
翻看肖光烜的背景,可以说是一路高配。
他本科就读于清华大学,获得 计算机科学 + 金融学双学位,期间囊括了综合优秀奖学金、国家奖学金、数学建模竞赛一等奖等多项重量级荣誉。
2020–2021 年,他以访问学生身份前往 斯坦福大学计算机系开展科研。
2022 年进入 MIT EECS 攻读博士,师从知名教授 韩松(Song Han),研究方向集中在 高效深度学习算法与系统,尤其是大规模基础模型。
在 MIT 期间,他长期担任全职研究助理,并多次进入顶级科技公司进行研究实习,积累了扎实的一线工业经验。

从量化到长上下文:直击 LLM 工程痛点
相比耀眼履历,更值得关注的是他的博士研究成果。
在论文 Efficient Algorithms and Systems for Large Language Models 中,他系统性地回应了当前大模型最棘手的三大问题:成本高、推理慢、长上下文吃显存。
理念过于复杂,简单来说就是整体看,这并非零散优化,而是一套覆盖算法、系统与硬件协同的完整高效大模型框架。
年薪 350 万起,Thinking Machines 抬高天花板
最后绕不开的,是待遇问题。
据公开招聘与申报信息,Thinking Machines 为技术员工开出的基础年薪普遍在 45–50 万美元,平均约 46.25 万美元(约 350 万人民币),且数据来自 2025 年初、公司完成百亿美元估值融资之前。虽然还未达到 Meta 的“天价挖人”水平,但在硅谷已属顶尖行列。
一句话总结:在大模型时代,最昂贵、也最稀缺的,依然是能把理论跑进工程的人才。

