过去一年,李彦宏与创业者、开发者交流,感受到了“FOMO”状态的盛行,即“Fearof Missing Out”,既兴奋又担心错过。不过百度一直紧追大模型风潮,大模型和生成式 AI 也正在彻底改变开发者群体。
在今天的百度 AI 开发者大会上,李彦宏直言,过去,开发者用代码改变世界;未来,自然语言将成为新的通用编程语言,使每个人都有可能成为开发者,用创造力改变世界。这一天即将到来,因为强大的基础大模型和低门槛的开发工具,开发者的生产力得到了显著提高。
谈及百度的角色定位,作为技术公司,百度希望为大家提供所需的开发工具,不断提升整个社会的创造力。具体而言,百度提供了一系列强大的基础模型,如文心大模型系列,以及基于大模型开发各种应用的工具,如智能体开发工具 AgentBuilder、AI 原生应用开发工具 AppBuilder 和各种尺寸的模型定制工具 ModelBuilder。在今天的 AI 开发者大会上,李彦宏为大家一一演示了这三款“AI 神器”,并对文心一言过去一年的成绩进行回顾。
谈文心大模型进展:4.0 工具版支持代码解释器
文心一言发布一年来,用户数突破 2 亿,API 日均调用量超过 2 亿,服务客户数达 8.5 万,利用千帆平台开发的 AI 原生应用数超过 19 万。文心一言正在改变更多人的工作和生活,支撑文心一言的基座模型是文心大模型,经历了从 3.0 版本到 4.0 版本的进化,在理解、生成、逻辑、记忆四大能力方面达到了业界领先水平。
文心大模型 4.0 的工具版今日发布,支持代码解释器功能,通过自然语言交互实现对复杂数据和文件的处理与分析,能够生成图表或文件,洞察数据中的特点、分析变化趋势,为决策提供支持。
同时,相比一年前的文心大模型,其目前算法训练效率提升到了原来的 5.1 倍,推理性能上提升了 105 倍,推理的成本降到了原来的1%,也就是说客户过去一天调用 1 万次,今天在同样的成本之下一天可以调用 100 万次,这样对于企业和开发者十分有利,因为其最关注的就是成本和效果。
如果做到降本增效?这是因为百度在芯片框架模型和应用这 4 层架构有着全栈的布局,通过端到端的优化,不断的把成本打下来,让更多的人可以高效低价大模型来做 AI 应用。
李彦宏也强调,语言模型本身并不直接创造价值,基于大模型开发出来的 AI 应用,才是能够真正满足市场需求的东西。
谈 AI 原生应用:三大 AI 神器满足不同应用需求
百度高喊了一年的“要做 AI 原生应用”,目前成果如何呢?李彦宏也现场分享了基于大模型开发 AI 原生应用的具体思路和工具。主要包括 MoE 架构、小模型、智能体。百度提供了三大 AI 神器,包括 AgentBuilder、AppBuilder 和 ModelBuilder,以满足不同应用需求。
1、Agentbuilder:5 分钟开发一个智能体
智能体是未来大型 AI 应用的主流使用方式,基于强大的基础模型,智能体可批量生成,应用于各种场景。百度升级了文心智能体平台,已有 3 万多个智能体被创建,5 万多名开发者入驻。为实现让每个人、每个组织都成为智能体的开发者的目标,百度提供了零门槛的智能体开发工具 AgentBuilder。
举例来说,用户可借助百度平台创建名为“新加坡旅游局”的智能体,通过自然语言交互设置其提供旅游文案、解答问题、提供酒店门票等服务。这一创新性智能体开发方式为用户节省了大量时间和精力。
2、AppBuilder:自然语言三步就能开发一个应用
AppBuilder 是当前最好用的 AI 原生应用开发工具之一,其优势在于提前封装和预置了各种组件和框架,大幅降低了开发门槛。开发者只需三步,即可用自然语言开发出一个 AI 原生应用,并轻松发布、集成到各种业务环境中。
在一次 AI 原生应用开发挑战赛中,有选手利用 AppBuilder 开发了一款“游乐场排队规划助手”,帮助游客更好地了解游乐场排队情况,并设计个性化的游玩路线。令人惊讶的是,冠军选手没有写一行代码,却凭借基础模型和 AppBuilder 工具赢得了 10 万元大奖。
以“游乐场排队助手”为例,开发过程只需三步:首先在 AppBuilder 的开发界面中给应用命名;其次,在角色指令中描述具体需求,包括调用代码解释器、计算最佳组合等;最后,在工具组件中添加代码解释器,帮助进行运算。
AppBuilder 已经升级,引入了“AI 优化配置”功能,能够自动优化角色指令、组件配置等环节,进一步提高开发效率。
AppBuilder 还提供了跨模态能力,支持用户快速创建绘画类应用,如漫画、儿童画本等。用户只需输入文本描述,即可生成相应的图画。
总的来说,AppBuilder 的两大优势在于功能强大和简单易用。其丰富的组件工具和自然语言开发流程使得 AI 应用开发变得更加高效和便捷。
3、ModelBuilder:高效低价生产模型
ModelBuilder 是一款适合专业开发者使用的工具,它能够根据开发者的需求定制任意尺寸的模型,并通过对模型进行精细调整,使其在特定场景下达到更好的效果。这种定制化的模型开发对于提高模型的适用性和性能至关重要。
以教育行业的作文批改为例,模型定制工具 ModelBuilder 通过三个步骤实现了模型精调:首先是创建数据集,包括数据清洗、数据标注和数据增强;其次是选择基础模型并配置参数进行精调;最后是将模型部署在平台上。通过这些步骤,ModelBuilder 能够生成适用于特定场景的高质量模型。
通过使用 MoE(混合专家模型)模型路由,可以将不同大小和性能的模型组合起来,以达到最佳的性价比。以小度为例,它根据用户的不同问题调用不同大小的模型,从而在保证效果的同时降低了成本和响应时间。通过这种方式,可以实现模型的灵活调度和资源的最优利用。
ModelBuilder 预置了最全面最丰富的大模型,包括旗舰版的大模型(如 ERNIE3.5 和 ERNIE4.0)以及轻量级的大模型(如 ERNIESpeed、Lite、Tiny)。此外,还支持国内外第三方主流模型,总数达到 77 个,为开发者提供了丰富的选择。通过定制化模型开发,可以有效提高模型的性能和适用性,同时降低成本和开发门槛。
谈大模型商业模式:开源模型会越来越落后
“因为有了最强大的基础模型文心 4.0,我们可以根据需要,兼顾效果、响应速度,推理成本等各种考虑,裁剪出适合各种场景的更小尺寸模型,并且支持精调和 postpretrain。”
李彦宏提到,这样通过降维裁剪出来的模型,比直接拿开源模型调出来的模型,同等尺寸下效果明显更好,同等效果下,成本明显更低。
李彦宏还指出,大家以前用开源觉得开源便宜,其实在大模型场景下,开源是最贵的。所以开源模型会越来越落后。
在李彦宏看来,多模态大模型是通往 AGI 的必经之路,视觉大模型最大的应用场景是自动驾驶。
“面向未来,我认为多模态大模型,或者说文字、图片、语音、视频等多模态的融合,是基础模型非常重要的长期发展方向,是通往 AGI 的必经之路。百度在这些领域有着长期投入,并将及时更新大模型的最新进展。”
李彦宏提出了非常不一样的判断:视觉大模型最大的应用场景是自动驾驶。百度不只训练 AI 如何生成视频,更训练 AI 理解真实世界发生的事情并预测未来。
在开发者大会最后,李彦宏有感而发:
“今天的中国,有 10 亿互联网用户,有强大的基础大模型,有足够多的 AI 应用场景,有全球最完备的产业体系,国家也在大力鼓励和支持‘人工智能+’行动,每一个人,每一家企业,只需要充分利用这些工具,就可以释放无限的创造力和生产力。”
“人人都可以成为开发者,而未来,也必将是一个由开发者一起创造出来的未来!”李彦宏总结称。