4 月 9 日消息,据美媒 theinformation 报道,谷歌人工智能部门的主管德米斯·哈萨比斯(Demis Hassabis)对公司在推动人工智能商业化上的新策略深表失望,并曾在两个 AI 部门合并成立新实验室时考虑过离职。他向同事透露,谷歌在追赶 OpenAI 的 Sora 项目方面可能面临着重重挑战。
以下是翻译内容
今年 3 月初,在度过数周的艰难时刻之后,谷歌 AI 部门 Google DeepMind 负责人哈萨比斯试图重振团队士气。此时,谷歌刚发布 Gemini,这款基于哈萨比斯团队研究的聊天机器人,被视为谷歌与 OpenAI ChatGPT 竞争的有力武器。然而,Gemini 因错误回答用户问题而遭到公众嘲讽。
据知情人士透露,哈萨比斯在一次团队会议上强调,他们负责开发谷歌内部的底层 AI 技术,而把这些技术交给亿万用户的责任则由公司其他同事承担。他还提到,为避免再出现尴尬,谷歌员工需要加强沟通。
这一事件也暴露出谷歌在 AI 领域的内部矛盾尚未解决。哈萨比斯领导的 DeepMind 与另一 AI 实验室谷歌大脑(Google Brain)之间长期存在着摩擦。一年前,为整合资源,谷歌匆忙将这两个实验室合并,并交由哈萨比斯统领,但二者之间的紧张关系并未得到缓解。
与此同时,在这家拥有 18.2 万名员工的科技巨头中,哈萨比斯正在适应新职位所带来的挑战。DeepMind 在谷歌内部曾享有一定独立性,专注 AI 研究而非商业化。而现在,他需与其他领导者紧密合作,把 DeepMind 的技术转化为产品。据两位近期与他交流的人士透露,这种新的工作模式让这位富有远见的创业者感到沮丧。
为提升纯 AI 研究在谷歌的影响力,哈萨比斯近期进行了团队重组。3 月,他重新调整了管理团队,让更多研究主管能够直接与他沟通。如今,普什米特·科利(Pushmeet Kohli)、赖亚·哈德塞尔(Raia Hadsell)以及祖宾·加赫拉马尼(Zoubin Ghahramani)等负责不同 AI 领域的谷歌高管都直接向哈萨比斯汇报工作,而非之前的科雷·卡武克乔卢(Koray Kavukcuoglu)。卡武克乔卢虽然曾负责监督规模庞大的 Gemini 项目,但如今他获得了一个新的头衔——谷歌 DeepMind 首席技术官。
DeepMind 发言人阿曼达·卡尔(Amanda Carl)表示,谷歌大脑与 DeepMind 的合并顺利,最新重组有助提高效率。哈萨比斯在全体会议上的评论旨在阐明 DeepMind 在技术开发中的角色,并非推卸责任。她否认哈萨比斯对新工作感到沮丧,并称:“近 30 年来,DeepMind 一直是哈萨比斯的梦想,谷歌依然是我们实现使命的完美伙伴。”
从纸面上讲,哈萨比斯已经拥有击败 OpenAI 所需的所有关键要素。
他领导的团队由顶尖机器学习研究人员组成,但 OpenAI 和其他公司一直试图挖角他的精英成员。他还管理一个专门团队,负责将 DeepMind 的科学成果整合到 Gemini 项目中。然而,直接负责 Gemini 项目的关键人员变动频繁,包括约阿尼斯·安东卢(Ioannis Antonglou)和阿米莉亚·格莱泽(Amelia Glaese)在内的多位高级员工已离职,转投 OpenAI 或自立门户。
谷歌正积极研发下一波 AI 产品。Gemini 项目中,一个专门团队正在研发能自动执行计算机任务的智能主体,甚至吸纳了知名 AI 初创公司 Adept 的联合创始人安莫尔·古拉蒂(Anmol Gulati)。但 DeepMind 也在该领域失去了一些核心人才,如资深计算机科学家达恩·威尔斯查(Daan wierstra),他在谷歌收购 DeepMind 之前就加入了该公司,然而今年早些时候,他选择了离开,并加入了由 DeepMind 前研究人员创立的 Holistic。
DeepMind 背后还有谷歌庞大的数据中心网络和数十亿产品用户的支持,为推广新 AI 产品提供了广阔的平台。有传言称,谷歌与苹果正就增强 iPhone 功能(例如 Siri)进行合作谈判,若协议达成,哈萨比斯的产品将有机会接触到更多用户。
技术上,DeepMind 正在缩小与 OpenAI 的差距。尽管 Gemini 在某些方面优于 OpenAI 的 GPT-4,但 GPT-4 的模型较早推出,使 OpenAI 能收集到大量有价值的数据来优化模型。同时,OpenAI 的文生视频服务 Sora 引起极大关注,哈萨比斯近期对一位同事表示,他认为谷歌在这一领域赶超对手尤为困难。
一家大公司
2022 年 11 月,ChatGPT 的问世在人工智能界引发巨大反响,给谷歌带来了震撼。
长期以来,谷歌一直拥有全球领先的两支机器学习队伍。谷歌大脑不仅是大语言模型的开拓者,也是 Transformer(转换器)技术的缔造者,正是这项技术成为了构建 ChatGPT 的核心。同时,DeepMind 在 AI 领域取得了举世闻名的成就,其开发的人工智能系统在国际象棋和围棋等复杂游戏中屡获佳绩。然而,这两个团队在共享代码和计算资源等方面经常发生冲突。更重要的是,它们都没能推出像 OpenAI 那样能够引爆网络的产品。
ChatGPT 发布几周后,谷歌 CEO 桑达尔·皮查伊(Sundar Pichai)指令谷歌大脑和 DeepMind 的管理层放下各自的分歧,联手开发名为 Gemini 的 AI 模型。
同时,皮查伊还开始准备更大的计划——合并这两大 AI 团队。然而,哈萨比斯对这次重组显得不太热情。他私下向一位同事透露,对领导新合并部门并不自信,甚至考虑离开谷歌,筹资创立一个全新的研究实验室。这样的举动无疑将使他从日常繁琐的管理事务中解脱出来,专注于自己钟爱的研究工作。
但当皮查伊于 2023 年 4 月正式命令合并两个团队时,哈萨比斯还是接受了新职务。在当月的一次会议上,他向员工详细说明了合并的情况,并强调了合并对 DeepMind 员工的诸多好处,比如更广泛的服务器访问权限,以及两支团队研究人员合作的机会。
然而,据会议中的三位参与者透露,哈萨比斯的发言显得缺乏热情,似乎对合并并不太感兴趣。这让许多谷歌研究人员大感意外,因为就在几个月前,哈萨比斯还在努力限制 DeepMind 和谷歌大脑之间的合作仅在 Gemini 项目上进行。
这次重组并没有为谷歌的 AI 领域带来期待中的和谐,新团队在资源分配上依然存在冲突。谷歌把原本致力于通用人工智能(AGI)探索性研究的员工调整到了 Gemini 项目,该项目迅速扩大到约 1000 名员工。同时,公司还完全关闭了一些 AI 项目,让很多内部员工倍感沮丧。
与此同时,OpenAI 继续从谷歌挖走关键 AI 人才,这让哈萨比斯很不高兴。据最近与他交谈的一位人士透露,哈萨比斯抱怨谷歌的薪酬政策无法阻止研究人员被这家初创公司丰厚的待遇所吸引。之后,DeepMind 提高了研究人员的薪资,部分得益于一个特别的股票奖励计划。然而,哈萨比斯对于同事们在媒体上过度渲染一些关键人员的离职事件表示失望。
在展示 AI 研究成果的压力下,哈萨比斯和他的团队可能过度夸大了他们的成就。去年 12 月,谷歌发布了备受关注的 Gemini。然而,其视频演示的误导性引发了批评,为这项技术蒙上了阴影。视频中令人印象深刻的是,模型似乎能够即时回应语音提示,但实际上存在延迟,而且视频所示的生成提示与实际生成的回应用词不一。据一位参与者透露,哈萨比斯在随后的全公司会议上表示,他希望这次演示能“鼓舞人心”,展示这项技术最终能达到的目标。
另一个项目 AlphaGeometry 也遭受类似批评。今年 1 月,DeepMind 宣称该 AI 系统能“以接近国际数学奥赛金牌水平解决复杂几何问题”。然而,研究自动推理的纽约大学教授欧内斯特·戴维斯(Ernest Davis)指出,这未提及其明显的局限性。例如,该 AI 只能处理二维几何形状,对面积等概念理解有限。
DeepMind 的早期投资者弗兰克·米汉(Frank Meehan)对当前情况表示担忧,认为这些争议分散了哈萨比斯对 AGI 研究的关注,可能是其“持续感到挫败”的原因。他还指出,OpenAI 在生成引人注目的视频方面取得显著进展,而谷歌在一些图像生成问题上却遇到难题。
然而,哈萨比斯依然坚信 AGI 的到来。参与 Gemini 项目的一位人士透露,为了更好地衡量哈萨比斯长期目标的进展,DeepMind 正在开发针对 AGI 的新基准。另有人士称,团队希望 Gemini 不仅能强化谷歌产品,也能帮助他们推动研究进步,提出新方法和算法。
纽约大学心理学和神经科学教授加里·马库斯(Gary Marcus),曾将 AI 初创公司卖给优步,他对哈萨比斯的能力充满信心。他认为哈萨比斯能在 DeepMind 的研究和为谷歌产品提供动力间找到平衡。“如果有谁能把事情做成想要的样子,那就是哈萨比斯。但谷歌是大公司,压力自然大。我们只需耐心等待,看看最终结果如何。”(小小)