文硅基研究室,作者|kiki
无论是公开场合还是媒体爆料,尽管 OpenAI 创始人 Sam Altman 已多次剧透 GPT-5 的相关消息,但与这位创始人浮出水面的硬件、算力等野心相比,眼下最棘手的问题是—ChatGPT 的一群忠实用户们,正在发现 GPT-4 正在变得越来越「懒」。
所谓的「变懒」指的是 ChatGPT 的个人用户体验。近期,在 OpenAI 在线论坛上,不少用户正在抱怨 GPT-4 性能下降,包括推理变差、响应变慢等。一位用户甚至直言:“ChatGPT 已经完全无法使用了,今天我在等待答案的同时居然煮了咖啡。”
与变懒的 GPT-4 相比,OpenAI 对外正在讲述更多的「既要又要」的商业化故事,加速变现。
一是在 ChatGPT 这一对话式产品上,一面寻找更多的个人用户,如几天前开放免登录使用,争抢更多的流量和数据。另一面则是面向企业端的商业化前景。ChatGPT 首席运营官 Brad Lightcap 就在近期透露,已有 60 万用户正在 ChatGPT 的企业级产品(包括 ChatGPT Enterprise 和 ChatGPT Team)。Brad Lightcap 称,92% 的财富 500 强公司正在以某种形式使用 ChatGPT,每周有 1 亿人积极使用 ChatGPT。二是围绕硬件、算力和全球化上的布局。
对 OpenAI 来说,「既要又要」是某种必然,「模型变懒」也是其加速变现和跑马圈地所带来的直接结果。只不过,对 Sam Altman 和他的 OpenAI 来说,至少在拿出 GPT-5 前,需要解决的问题和麻烦还有很多。
GPT-4 又又又变懒了
“我曾经是一名 OpenAI 的布道者,总是告诉大家 GPT 有多棒以及该如何使用它。但现在我不再推荐它,因为它已经变得很难有效使用。”一位用户近期在 OpenAI 在线论坛上这样写道。
一些忠实用户选择放弃使用 GPT-4 图源:OpenAI 论坛
今年 3 月中旬,在一篇名为《How to deal with “lazy” GPT-4》的帖子下挤满了 OpenAI 变懒的「受害者们」。他们发现在使用 ChatGPT 的过程中,响应速度越来越慢,且回答问题的准确性也不及预期。
一部分个人使用者对 OpenAI 产生不满图源:OpenAI 论坛
有的人抱怨,GPT-4 没有遵循他们给出的指令,当用户需要它给出完整的代码时,GPT-4 会给出带有占位符(placeholders)的截断代码。当要求它给出用于更新代码的示例时,也更容易出错。有的人则发现,ChatGPT 的废话也越来越多,在被问及它的「来源」、它的背景以及它如何产生答案时,GPT-4 现在变得更加难以捉摸。还有的用户更是直接吐槽起了它的响应速度:“今天我在等待答案的同时居然煮了咖啡。”
开发者抱怨 GPT-4 变懒图源:OpenAI 论坛
事实上,这并不是 ChatGPT 第一次变懒。
早在去年 7 月,很多用户就在社交媒体和 OpenAI 开发者论坛里表达了自己的不满,变懒、变笨的 GPT-4 出现了逻辑弱化、错误响应、难以遵循指令、只记住最近的提示等问题。今年年初,更多的投诉下,Sam Altman 直接承认了 GPT-4「一直在偷懒」这一事实,并表示自己「已经发布了修复程序来解决投诉」。
Sam Altman 承认 GPT-4「偷懒」,图源:X
眼下,这一轮的「变懒抱怨」似乎没有等来 OpenAI 的回复。社区之内的 ChatGPT 用户们正在讨论 GPT-4 变懒的原因以及自己寻找解决上述问题的方法。「它曾经很聪明,现在确实一个彻头彻尾的白痴」「我感觉自己被骗了」,社区内的愤怒情绪正在增加。
对于「变懒」的原因,用户甚至猜测 OpenAI 是不是将背后的模型偷偷换成了 GPT-3.5,还有的则认为 OpenAI 正在将更多的精力放在其「企业级客户」上,而非「平民」上。
用户的抱怨和吐槽 GPT-4 性能下降其实反向印证了两点,一是目前用户对 GPT-4 已积累下用户心智,他们迫切希望 OpenAI 推出新的产品。二是,这很有可能是 OpenAI 发布的 GPT-5 的重要时机,AI 天使投资人 Allie K. Miller 就表示:“他们(OpenAI)有用户基础,有订阅,如果他们发现用户下降,或许将发布更新版本的模型,时机是关键。”
用户寻找替代方案,OpenAI 还有没有余粮?
对 OpenAI 来说,一个不太好的迹象是,随着 GPT-4 变懒,即便是它的忠实用户们,也开始寻找替代方案。
在上述抱怨 OpenAI 变懒的帖子下,不少用户就提到了至少在编码能力上,Anthropic 的 Claude Opus 3 显得可靠,在实际使用的性能方面似乎也与 GPT-4 不相上下。在截至 3 月 29 日的 Chatbot Arena 排行榜上,Claude Opus 3 就打败了 GPT-4,占据第一位置。
截至 3 月 29 日,Claude Opus 3 打败了 GPT-4, 位列第一 图源: Hugging Face
在过去人工智能的模型竞逐中,各类科技企业「追赶 GPT-4」已成为共识,各类评测和跑分表中「与 GPT-4 对比」也成了铁律。而 Chatbot Arena 排行榜的来源则来自用户实打实的投票,在用户体验端 Claude Opus 3 暂时跑赢 GPT-4,也说明了至少在个人用户眼中,OpenAI 所谓的用户护城河并不牢固。
榜单之上,除了老对手 Anthropic 的 Claude、谷歌的 Gemini 外,被称为「法国 OpenAI」,主打 MoE 架构的 Mistral AI 的名字也赫然在列。此前 Mistral-Medium 这一「中杯版」模型就因开源和强大性能十分受开发者的拥趸,而此前在 2 月底发布的「大杯版」Mistral Large 更是直奔着 OpenAI 的 GPT-4 去,顺便还官宣了和微软的闭源合作。
前有狼后有虎,何时发布 GPT-5 也还未有定论,OpenAI 手中余粮又还有多少?
OpenAI 和 Sam Altman 自然也没有闲着,刚刚结束的 2024 年 Q1,这家全球最火热的人工智能初创企业的日程表上写了三件事:一是寻找 AI 的下一个入口,二是更大的算力野心,三是全球化之路。
首先,寻找 AI 的下一个入口,也就是 OpenAI 野心勃勃的硬件计划。 除了此前出圈的人形机器人 Figure 01 外,据外媒最新报道,Sam Altman 正计划和前苹果设计师 Jony Ive 创立的一家神秘公司,推出一款人工智能驱动的个人设备,更早前,Altman 领投了 AI 硬件初创企业 Humane,OpenAI 也在讨论将其名为 GPT-4 with Vision 的物体识别软件嵌入到 Snapchat 母公司 Spectacles 的智能眼镜中。
其次,是更大的算力计划。Altman 此前在公开场合多次表明算力是掣肘模型进化的原因,AI 服务器芯片数量严重不足。为了寻求更稳定的芯片供应,除了自己下场投资 GPU 芯片公司和成立芯片公司外,OpenAI 和「最铁的盟友」微软被曝出计划砸 1000 亿美元建造名为「星际之门」的 AI 超级计算机。
不过,在硬件和芯片计划外,过去一年之中,OpenAI 也还在下一盘全球化的棋局。
今年 1 月,Altman 开启自己的韩国之旅,与韩国芯片巨头三星、SK 探讨合作的可能。近期,Altman 还前往日本与日本首相岸田文雄会面,并表示 OpenAI 正在考虑将日本作为其亚洲首个办事处。奥尔特曼在东京对当地记者表示:“看到这项技术在日本得到采用真是令人惊奇。”据「硅基研究室」不完全统计,除日本外,OpenAI 目前在伦敦和都柏林分别设立了国际办事处。
更大的野心面前,有更棘手的新麻烦
不过,在 GPT-5 以及种种野心计划外,摆在 OpenAI 眼前的,还有诸多需要解决的新麻烦。
如上文提到的「模型变懒」,OpenAI 究竟是继续缝缝补补旧模型,还是提早放出 GPT-5 的大招,还尚未确定。
另一个新麻烦则是数据问题。 视频巨头 YouTube 就在近期开战 OpenAI,其表示,如果 OpenAI 在未经许可的情况下使用其视频来开发文生视频模型 Sora,将违反 YouTube 的规则。OpenAI 首席技术官 Mira Murati 在接受采访时表示,她不知道 Sora 是否接受过 YouTube 视频训练,公司也没有透露数据来自哪里。
《纽约时报》在近期的一则报道中,揭开了 OpenAI 上述数据的来源。时间拨回 2021 年底,OpenAI 需要更多的数据,为此研究人员创建了一款名为 Whisper 的语音识别工具,该工具可以转录 YouTube 视频中的音频,生成新的对话文本,尽管一些的 OpenAI 员工讨论了此举可能违反 YouTube 的规则,但最终还是转录了超过 100 万小时的 YouTube 视频。OpenAI 并未立即回应上述媒体的评论。
大算力与大数据的 Scaling Law 奠定了 OpenAI 所有工作的基础。但如今,数据的获取与使用问题是包括 OpenAI 在内的人工智能企业必须要面临的问题,这涉及两个层面,一是商业层大公司间的竞争,更优质的用户数据决定模型的性能。二是社会层的用户隐私问题,这些科技公司必须要为用户隐私的安全性负责。
数据问题外,不可忽视的还有人们对科技公司情绪的变化。据《The Information》数据,当前人工智能初创企业估值可能正在从峰值回落,回归现实。 初创公司市盈率的下降反映出人们对人工智能初创公司前景并没有想象中那么乐观。更多投资者想要知道的是,随着业务边界的拓展,当这些初创企业拿到更多的钱时,除了如何花钱外,它们如何赚钱,如何应对更激烈的竞争,这些问题显得更为重要。
对 OpenAI 来说,他们或许更需要回应 GPT-4 变懒的问题,更好的产品体验依旧是核心护城河。正如论坛内一位用户所言:“如果有更好的产品,我会像在燃烧的船上一样跳船。”OpenAI 在造一艘更大的船,但它的用户此刻可能正在选择离开。
参考资料:
1、Business Insider:Uh-oh — it looks like ChatGPTs AI model got lazy again 2、The Information:AI Valuations May Be Coming Down to Earth; A Glimpse of OpenAI’s Search Engine 3、The New York Times:How Tech Giants Cut Corners to Harvest Data for A.I.