作者|武静静
编辑|苏建勋
36 氪获悉,近日,面壁智能完成新一轮数亿元融资,由春华创投、华为哈勃领投,北京市人工智能产业投资基金等跟投,知乎作为战略股东持续跟投支持。本轮融资将用于人才引入,大模型底层算力与数据基础构建,和大模型落地三个方向。光源资本担任独家财务顾问。
面壁智能创立于 2022 年 8 月。面壁智能团队核心成员来自清华大学自然语言处理与社会人文计算实验室 (THUNLP),2020 年 12 月,团队发布国内首个中文大模型 CPM-1。
融资进展方面,2023 年 4 月,面壁智能完成由知乎领投的数千万元天使轮融资,同为清华系的智谱 AI 参与跟投。2023 年 6 月李大海加入面壁智能,担任联合创始人、CEO 一职。
过去一年,瞄准 AGI 这一方向,面壁选择围绕“高效大模型”这一方向,推进大模型技术发展和市场落地。
在 2024 年 2 月 1 日的发布会上,对标 Mistral,面壁智能发布了训练数据规模近 1T、参数规模仅 2B 的模型:聚焦于适配端侧硬件的端侧大模型 MiniCPM-2B。目前 MiniCPM-2B 在 CPU(比 GPU 计算吞吐量低)上就能跑起来,有效降低了推理成本。同时,即便将大小压缩 75%,MiniCPM 的性能也能做到基本无损耗。
提高研发效率,是面壁推进大模型技术演进和落地的指南针,“我们希望打造出更加高效的 ScalingLaw 增长曲线,实现同等参数性能更优、同等性能参数更小效果。以更快的速度、更低的成本,提供智能实现的最优解决方案。”李大海告诉 36 氪。
李大海提到,推动大模型在端侧的落地也是面壁目前的重点之一。目前,面壁的大模型已经在端云侧建立起大小模型之间的协同,一方面可以提升云侧大模型的服务速度,同时与面壁端侧模型相结合,进一步显著降低大模型使用成本。
Agent 是面壁推进大模型在企业端落地的另一个重要载体。
2023 年,面壁智能推出基于群体智能的“大模型 +Agent”应用——ChatDev 智能软件开发平台。ChatDev 就像一个虚拟软件公司,员工就是各种角色的 Agent,它们有的是产品经理,有的是后端工程师,有的是测试工程师,这些 Agent 协作运营,在接收到人类“用户”指定一个具体的任务需求后,开始交互式协同,像人一样,共同合作,来打造出一个包括源代码、环境依赖说明书、用户手册等信息在内的完整软件。
商业化层面,目前面壁更侧重企业端的产品验证,目前,面壁已携手招商银行、数科网维、知乎等合作伙伴,将大模型与 Agent 技术部署落地于金融、教育、政务、智能终端等应用场景。
本轮投资人春华创投负责人表示:“大模型技术带来了人工智能范式的进化,正在日新月异地解锁通用人工智能(AGI)的未来。从成立之初,春华创投持续关注人工智能领域,希望陪伴富有远见的创业者,通过支持技术变革,解决人类面临的难题。面壁智能是国内最早开始探索大模型和 AGI 的团队,拥有前瞻的视角、完整的技术栈,背靠优质的数据资源和密集的人才优势。面壁智能凭借自身在大模型高效训练和推理技术和 Agent 技术方面的差异化优势,高效服务各行各业。接下来,我们期待与面壁智能团队一起,以安全、普惠的通用人工智能为舟,帮助千家万户驶向智能科技的星辰大海。”