新智元报道
编辑:桃子好困
今天,OpenAI 发布了具备视觉功能 GPT-4 Turbo 的正式版,能处理 128k 上下文。与此同时,GPT-4 每 3 小时 40 条消息限制似乎也取消了。
趁着谷歌开大会,OpenAI 果然又来定向狙击了。
谷歌前脚刚官宣一系列更新,OpenAI 立马跟着抛出重大消息——
GPT-4 Turbo 迎来「重大升级」!
OpenAI 今天官宣称,配备视觉能力的 GPT-4 Turbo 已经可以通过 API 调用了。
最新模型有 128k 上下文,训练数据截止到 2023 年 12 月。同时,Vision 请求也可以使用 JSON 模式和函数调用。
而现在,早已有开发者用上了最新的模型。
爆火全网的 AI 工程师 Devin 就是通过 Vision 来执行各种编码任务。
Healthifyme 团队通过 GPT-4 Turbo with Vision 构建的应用 Snap,可以对各种美食进行拍照识别,为你提供营养洞察。
还有更牛的应用 Make Real,直接勾画几笔 UI,就能构建出由真实代码支持的网站。
显然,新模型可以有助于简化开发人员的工作流程,创造出更高效的应用程序。
但代码能力变差了?
不过,有研究发现,GPT-4 Turbo with Vision 在编码方面较差。
尤其是,新模型似乎比现有的 GPT-4 Turbo preview 模型更加懒惰。
代码编辑能力
Aider 依靠代码编辑基准来定量评估 LLM 对现有代码进行更改的程度。
GPT-4 Turbo with Vision 在这一基准上的得分仅为 62%,是现有任何 GPT-4 型号中得分最低的。
其他模型的得分为 63%-66%,因此这只代表了很微小的退步,与 gpt-4-0613 相比,在统计上可能微不足道。
懒惰编码
GPT-4 Turbo preview 版本因在编码时「懒惰」而广受吐槽。
经常省略所需的代码,而是在注释中留下「在此实现方法」之类的内容。
def some_complex_method (foo, bar):# ... implement method here ...
新的 GPT-4 Turbo with Vision 模型在 AIDER 的重构基准上只得了 34% 的分数,成为所有 GPT-4 Turbo 模型中最懒惰的一个。
不过,有网友表示,在对新模型进行了一天的测试后,发现其并不懒惰而是更愿意输出完整大量的代码,甚至推理能力变强了。
每 3 小时 40 条消息限制取消了?
与此同时,有外媒报道称,OpenAI 已经将 GPT-4 每 3 小时 40 条消息的使用限制,变成了根据供需情况动态调整的灵活配额」。
简单来说就是,OpenAI 会根据系统当前的繁忙程度,来增加或减少用户对 GPT-4 的请求次数。
然而,有不少 Reddit 网友表示,他们才刚发了 10 到 17 条消息,就被告知已经达到了上限。
但也有很「欧」的网友称,自己不管怎么用都没有触及限额。
不管是远低于 40 条的限制,还是近乎无限次的使用,OpenAI 最大的问题在于——不仅从来不会告诉你已经使用的次数,也不会告诉你上限到底是多少。
据推测,这一调整是为了应对 ChatGPT 在「免注册」之后,显著增加的使用量。
对于 OpenAI 而言,这种变化提供了更大的灵活性,可以更好地分配有限而昂贵的计算资源给 GPT-4。
但对于用户来说,尤其是在需求高峰期,可能用着用着突然就被取消了 GPT-4 的使用资格……
对此,有不少网友表示:还是 Claude 3 香!
至少,诸如 Anthropic 这样的平台,会提供更清晰的使用配额,或者允许按消息计费。
参考资料:
https://the-decoder.com/openai-introduces-flexible-message-limit-for-gpt-4-which-not-everyone-likes/