
知名Transformer作者在谷歌工作近18年如果从生成式AI的发展史来看Noam Shazeer几乎参与了每一个关键节点。他于2000年加入谷歌先后担任软件工程师和首席软件工程师累计工作超过18年。2017年他与Ashish Vaswani、Jakob Uszkoreit等8位谷歌研究员共同发表经典论文《Attention Is All You Need》提出Transformer架构。相比此前主流的RNN和LSTM模型Transformer能够更高效地处理长文本并具备更强的扩展能力。过去几年无论是OpenAI的GPT系列、谷歌Gemini、Anthropic Claude还是DeepSeek、Llama等模型底层几乎都建立在Transformer架构之上。换句话说今天这场席卷全球的大模型浪潮很大程度上都建立在这篇论文奠定的技术基础之上。不过Transformer只是Noam Shazeer众多代表作中的一个。在谷歌任职期间他还参与推动了多项影响深远的大模型技术。2017年他作为第一作者提出稀疏门控混合专家MoE架构为后来的GPT - 4、Gemini、DeepSeek - V3等模型提供了重要技术思路2018年他又参与开发Mesh TensorFlow为超大规模Transformer训练提供基础工具此后他还参与T5模型以及谷歌对话模型LaMDA等多个关键项目研发。从谷歌离职创业又被182亿买回2021年Shazeer离开谷歌与Daniel De Freitas共同创办Character.AI。当时大语言模型尚未迎来ChatGPT时刻但Character.AI已经率先尝试将聊天机器人产品推向大众市场并迅速积累大量用户。2024年谷歌以约27亿美元约合人民币182.66亿元的合作交易重新将Shazeer及其核心团队纳入DeepMind体系。随后他成为Gemini项目的重要负责人之一并参与Gemini新一代模型的预训练工作。Shazeer回归的时间点正值谷歌AI业务承受巨大压力。彼时ChatGPT爆火Gemini仍处于追赶阶段。重返DeepMind后Shazeer参与模型研发并最终出任Gemini联席负责人成为谷歌AI技术领军人物之一。此后Gemini 3系列模型在编程、推理等多个基准测试中跻身行业前列成为谷歌与OpenAI、Anthropic竞争的重要筹码。从谷歌研究员到创业者再到Gemini联席负责人Shazeer几乎见证了谷歌近十年来AI发展的每一次重要转折。因此此次离开谷歌加入OpenAI也被不少业内人士视为谷歌近年来最重要的人才流失事件之一。OpenAI的人才争夺战还在升级Shazeer加盟的背景是AI行业愈发激烈的人才竞争。过去一年里OpenAI与Anthropic之间的竞争持续升温。双方不仅围绕模型能力展开较量也在不断争夺顶级研究员和核心工程师。英国《金融时报》报道称OpenAI内部将Shazeer的加入视为一次重要补强。未来他将重点研究Transformer之后的新架构方向以及如何进一步提升模型能力。值得注意的是Transformer已经统治AI领域近十年。随着推理模型、多智能体系统以及世界模型的发展越来越多研究人员开始思考Transformer是否会迎来下一次重大架构升级而Shazeer恰恰是最有资格回答这个问题的人之一。对于谷歌而言这意味着失去了一位Transformer作者、Gemini联席负责人以及最资深的AI架构设计者之一。对于OpenAI而言其实验室则迎来了一位曾亲手塑造现代AI技术栈的人。结语Transformer时代重要人才流动随着技术逐渐逼近前沿顶级研究员本身也成为最稀缺的资源之一。Noam Shazeer的职业轨迹几乎串联起了Transformer、Character.AI、Gemini和OpenAI四个重要节点。如今这位Transformer作者离开谷歌、加入OpenAI既是一场人才流动也折射出当下AI巨头之间愈发激烈的竞争态势。尤其是在OpenAI与Anthropic围绕下一代模型、企业市场和顶级研究人才展开白热化竞争的当下谷歌也正通过Gemini持续追赶。此时失去一位Transformer奠基人和Gemini联席负责人对谷歌而言无疑是一笔不小的损失。对于整个行业来说后续值得关注的问题或许是当Transformer作者亲自研究“Transformer之后的架构”时下一代AI模型会走向何方。