丰色明敏发自凹非寺
量子位公众号 QbitAI
一夜之间,国产大模型打起了长文本大战。
从昨晚到今天凌晨,各大厂排队官宣跟进长文本能力:
百度文心一言 下个月版本升级,开放 200 万-500 万长度 360 智脑 正在内测 500 万字,一完成就要入驻 360AI 浏览器 阿里通义千问 则一出手就是 1000 万字,且不用等,当场就开始。内卷启动,大卷特卷。
要知道,长文本能力的跟进,意味着是要更大力烧钱了……而厂商们做这一决定,似乎毫不犹豫。
为啥如此呢?
这一切,还得从最近火到宕机的 Kimi 说起。
爆火 Kimi,五次扩容仍然宕机
Kimi,全称 Kimi Chat,来自月之暗面(Moonshot AI)。
是 AI 天才杨植麟创业大模型后拿出的第一份成绩单。去年 10 月初首次亮相,参数上千亿,主力卖点就是长文本,支持 20 万汉字输入处理,一本《三体》、《马斯克传》随便读。再加上一直可免费使用,Kimi 迅速积累了一波粉丝。
它的爆火就发生在本周,一度冲进 App Store 免费版应用的第五名,超越微信。
有数据统计,目前 Kimi 模型的日活跃用户数已达 100 万人(60 万在小程序,34 万在网页端,还有 5 万在 App 端),且留存率持续上涨。
其 App 端的下载量(效率类应用免费榜)也已经从 2 月的百名开外,挤进前十,仅次于豆包(抖音 AI 智能助手)和文心一言。
为啥突然爆火?
就在本周一,Kimi 带来重大迭代,将长上下文窗口 x10 倍,扩展到 200 万字。让 Claude3、GPT-4 Turbo 都望尘莫及。
过去要 10000 小时才能成为专家的领域,现在只需要 10 分钟,Kimi 就能接近任何一个新领域的初级专家水平。
这下网友们就玩嗨了。
近 80 万字的《红楼梦》《三国演义》、150 万字的《诛仙》……统统往里扔,和喜欢的角色玩起了对话,而且还免费。
一波又一波围观用户的持续涌入,Kimi 很快“撑不住了”:
本周四下午,在发布新功能后不到 72 小时,其小程序、App、网页版突然均显示无法正常使用。
问它问题,无一例外告诉你“累趴了,晚点再来”。
官方解释:从昨天早上我们就检测到 Kimi 系统的流量持续异常增高,远超我们预期的资源规划。
我们已经进行了 5 次扩容。
为啥大家玩得这么上头?
一方面,Kimi 的底层模型能力确实强。
上个月,Kimi 就排进了大模型创业公司“AI ChatBots”第一名:
访问量较 1 月份上涨了 107.6%(达到 305 万,本月预计可增至 500 万)。
官方也相当自信,之前媒体沟通会现场,他们直接将一摞比一摞厚的《中医中医内科学》《中医诊断学》、英伟达 2023 年年度财报、《甄嬛传》剧本版重重放在桌面上,让大家体验。
另一方面,Kimi 从推出以来就是免费的,同时产品迭代快,“遥遥领先”的长文本已成差异化竞争点。
所以这次大更新,直接让 Kimi 火出了圈。
最近都出现了 Kimi 概念股。3 月 22 日收盘,华策影视、中广天择、华扬联众等多家A股公司涨停。其中,华策影视、中广天择实现三连板。
(目前名单中多家企业予以否认)
投资机构中信建投建议,对于 AI 应用板块,需要重点关注涉及长文本处理,如法律文本、合同文本、知识库学习、阅读、客服等需要文本知识输出的场景应用。
由此,也就不难理解友商为啥连夜跟进了。
而这一波集体大动作,更底层的原因还在于,今年已到了大模型商业化争夺刀锋相见的时刻。
大模型商业化争夺开战
2024 年的前三个月里,包括月之暗面、智谱 AI、百度等多家大模型厂商的最新动作,都更加聚焦商业化领域了。
首先来看月之暗面。
最近一个月内,它在技术、商业化、融资方面都公布诸多新消息。
在 Kimi 模型最新升级后 3 天,3 月 21 日,汉得信息透露关注到 Kimi 模型已经开启 AIGC 平台对接测试,目前正在找一些场景探索落地的可能性。
△月之暗面创始人杨植麟
紧接着月之暗面负责人回应,年内将有商业化初步方案:商业化现在诉求逐渐变得很强烈,也有用户会说在高峰时期 Kimi 会提示需要等待,询问我们能不能付费解决这些问题,所以这方面在今年也会有初步的方案出来,大家会看到。
多模态大模型方面,月之暗面被曝也在研发布局中、今年将会推出。
融资方面,今年 2 月,月之暗面被曝最新估值达到 25 亿美元。
知情人士透露,月之暗面拿下新一轮 10 亿美元融资,其中 8 亿美元来自新股东(阿里、小红书等),2 亿美元为老股东跟投(红杉中国、砺思资本等)。美团龙珠曾领投该公司上一轮融资。
与此同时,月之暗面正在进行大规模投放,外界已能明显感知到 Kimi。
B 站、抖音等平台上,以及机场、电梯里,都能看到 Kimi 的广告(所以 Kimi 这两个月的爆火也和这有一定关系)。
△截图自 up 主龙腾虎跃龙兽医视频
其次,同样是清华背景的智谱 AI,几乎复刻月之暗面的投放路线。在B站、电梯里打起了擂台。
而在本月,ChatGLM 千亿对话模型一周年之际,智谱 AI 也披露一系列商业化成果。
这是智谱 AI 在大模型趋势中,首次全面解读商业化落地进展和策略。
除了展示丰富的落地合作经验、标杆客户案例之外,智谱 AI 全面对外解读了面向不同客户的不同落地模式。
这种清晰明确的展示,一方面是展现自家实力,另一方面更是为了吸引更多企业更进一步推进商业化进程。
融资方面,北京市人工智能产业投资基金刚参与了智谱 AI 在今年年初完成的新一轮融资。此前,智谱 AI 表示已经在 2023 年年内(截至 10 月)累计获得超 25 亿元融资。
除了大模型初创企业,百度最近一次大模型动向,同样聚焦行业落地。
新发布的 5 个大模型不再单纯卷参数量,而是更加关注模型落地的性价比、领域契合度等,并且还进一步降价。
最新消息,苹果也被曝讨论使用百度 AI 技术。苹果正在寻找中国本土生成式 AI 提供方,与百度的对话仍处于初期阶段。
消息一出,百度美股盘前涨超6%。
不难看出,大模型应用落地元年里,厂商们不再是单纯秀技术肌肉,每次公开信息披露中,都会带有商业化方面的考量。
尤其产品应用体验方面,一直被视为国产市场的强项。有声音还认为,Kimi 或许就是一个转折点,接下来国内大模型市场的思路可能要从基础能力演变转向对产品本身、客户需求细节的理解。
△截图自@小熊跑的快公众号文章
多家厂商连夜官宣增强长文本处理能力,或许就是在推进新趋势发生了。
以上种种趋势都表明,大模型领域要进入更加疯狂的烧钱阶段了。
卷长文本处理能力、团队扩充、大规模广告投放……这些账,怎么算都是天文数字。
所以接下来,主打免费的国内大模型工具该怎么平衡收支——
是开启付费、靠 To B 带动 To C,还是烧融资?