新智元报道
编辑:编辑部
吴恩达认为,或许我们凭着 GPT-4 智能体,早已达到 GPT-5。今天,他的话果然言灵了。
最近,一大波智能体的应用诞生,让全行业看到了「新大陆」。
号称世界首个 AI 工程师 Devin,7×24 小时不限时打工,能够 debug、训模型、构建部署应用程序,胜任各种代码任务。
几天前的谷歌 Next 大会上,还发布了「智能体构建器」,可以让每个人能够用自然语言构建自己的 Agent。
不难看出,智能体不仅将会成为人人可触及的一项技术,而且各行各业都将被不断升级迭代的智能体重塑。
甚至,这场 AI 技术+场景的爆发,还会诞生出一些「前无古人」的东西。
用大模型+智能体,对抗汽车行业内卷
如今的汽车行业,已经卷到超乎想象的程度。
用户需求的多样化,愈发丰富的触点,都需要业内人士时时翻出创新的水花。
幸运的是,飞速发展的 LLM,让任何全新的视角都有了可能。
就拿一辆车的获客场景来说吧。
如今的新媒体,已经成为营销过程中的重要一环。
谁能拥有优质内容,就会拥有最大的曝光度,完成奇迹般的获客 KPI。
要知道,传统的 4S 店,并没有专业的创意内容生产团队,视频制作、账号运营,经常都是销售人员和市场经理兼职完成,效率非常低下。
而这时,就需要非常擅长输出高质量视频、图文、海报的 AI 登场了!
为此,易慧智能联合推出提出了一个全新的群体智能组织孪生方案。
人类主管来定目标、审结果,而其余的活儿,包括任务分解、任务执行、任务复盘,都可以通通交给智能体!
比如,现在我们要为一个账户定个 KPI:一周内涨粉 500 人。
目标输入系统后,智能体们就开始忙活了。
第一步,运营经理 Agent 会给自己的 AI「同事」们进行任务拆解——
1. 我们本周需要策划 2 场直播,把品牌信息传播出去,还要和用户好好互动。
2. 我们需要在抖音、快手、小红书发布 5 个短视频,提升品牌影响力。
3. 还要保持平台账号的活跃度,及时回复用户评论,增加他们的参与感。
「领命」后,文案策划师 Agent 和海报设计师 Agent,会基于品牌价值观,制作出吸引眼球的文案和海报,同时还会负责传递和交付。
随后,运营专员 Agent,就会把内容分发至各个平台了。
在这个过程中,唯一涉及人类的环节,就是市场部经理需要对内容进行人工确认,确保品牌形象的一致性和专业性。
活动结束后,运营经理 Agent 还会整体来个复盘。它会仔细分析数据,确保创意能带来实际的营销效果,为后续的内容和用户运营提供数据支持。
吴恩达看好的智能体,或许已实现 GPT-5
说到智能体,就不得不提到 AI 大牛吴恩达,最近可谓是多次公开表示非常看好它们的发展:AI Agent 工作流将在今年取得重大进步,甚至可能超越下一代「基础模型」。
他发现,基于 GPT-3.5 的智能体工作流在应用中,实力超越了 GPT-4。
也就是,可能我们早就提前到达了 GPT-5,因为在 GPT-4 之上构建的智能体可以实现性能跃阶。
能够取得碾压大模型惊艳效果的智能体,有四种常见的设计模式,即自我反思、工具使用、规划,以及多智能体协作。
智能体关键组件框架|来源:OpenAI 科学家 Lilian Wang
大模型群体智能
其中的多智能体协作,其实对我们来说并不陌生。
比如斯坦福西部小镇 SmallVille,就是基于层次规划的智能体社会小镇,来实现对人类社群行为的可信模拟。
除此之外,清华自然语言处理实验室和面壁智能共同提出的 ChatDev,则是基于语言交互的智能体软件开发,实现群体交互协作式任务完成。
对此,吴恩达表示:「让多个协作智能体辩论协作,要比单独使用一个智能体,可以取得更好的性能。」
不仅如此,大量的研究和实践也提到,多个智能体之间可以通过彼此交流、分享信息和策略,甚至进行「辩论」来找到更优、更有效的解决方案。
如今,一场大模型+智能体应用狂潮,即将在汽车这一垂直领域中率先爆发。
车企大模型落地新范式:组织孪生
2023 年,易慧智能在走访调研了大量汽车客户后,发现了诸多痛点。比如,行业竞争白热化,降本增效压力巨大;用户媒介触点多样化;购买周期长期化等等。
与此同时,想要在这一领域直接落地传统的大模型应用,则不得不面对信息孤岛、流程复杂、成本控制和市场响应速度等难题。
而前文提到的「群体智能」,恰恰可以利用自身强大的智能协作和信息共享能力,来解决这些问题。
如今,一种基于 AI Agent 和群体智能技术的全新范式——「组织孪生」正在诞生。
它以数字创新为核心技术框架,主要包含了三个部分:岗位孪生、架构孪生、业务孪生。
更直白地讲,智能体贯穿到了企业整个组织工作流中。
岗位孪生
其中,数字员工是岗位孪生最直接的表现形式。
数字员工可以直接应用到行业链中,比如常见的客户服务、电话销售等等。
利用 LLM 创建的数字员工,能够模拟真人的交流方式,不仅包括声音、表情,还具备了高情商的智能。
我们都知道,数字员工最大的亮点便是,「工作」不限地点时间,7×24 全天候提供及时、高效的服务。
凭借智能体技术,数字虚拟人可以持续学习和进化,能够具备执行任务深度反思的能力,实现在技术和服务水平上不断提升。
除此以外,数字员工可以根据企业需求,进行个性化高度定制。
架构孪生
如上,岗位孪生可以简单理解为,智能体个体在执行自己流程中的任务。
但是,如同人类协作一样,有些任务非一己之力所为,而是需要群体智能体去完成。
这时候,「架构孪生」就上场了。
它是指将真实世界中的组织架构映射到数字世界中,通过智能体网络技术定义智能体间的交流和逻辑。
举个简单例子,清华自然语言处理实验室和面壁智能联合开发的智能体平台 AgentVerse 中,就可以利用基础模型定制多智能体环境,以及创建刚刚提到的这些具有不同能力与身份的智能体。
其中,协同决策是最重要的一环,需要智能体之间密切交流。
AgentVerse 横向沟通模型侧重的是智能体之间相互理解和协作,而纵向沟通更侧重于职责分工。
而基于易慧智能的每个单独场景,智能体之间可以实现横向和纵向沟通。
业务孪生
此外,在汽车行业中,真实的业务流程非常复杂。
就拿出差任务来说,从申请、行程安排、车票酒店预订,到事后报销等等,都需要调配大量人力物力资源。
通过整合大模型、搜索增强(RAG)、智能体构建等技术,业务孪生可实现自动执行任务,优化执行效果。
举个例子,面壁智能的 AI 智能体框架 XAgent 创新性引入了「双循环机制」。
在外循环中,XAgent 对任务进行规划,在内循环,它便成为任务高效执行者。
另外,XAgent 在设计过程中,还引入了专为增强人机协作的交互机制。
可见,这一框架能够为复杂的行业场景,提供一个全新数字化工作和管理方式。
LLM 群体智能赋能汽车行业
有了组织孪生新范式,LLM 群体智能究竟如何在汽车行业应用中发挥最大效益?
不如就拿车企营销中五大核心场景来举例。
营销五大场景
作为消费领域超级大单品,汽车的营销有着其它消费品难以企及的销售难度和销售周期。
汽车销售中最具独特地方在于,高客单价、低成交率,以及长销售生命周期。
目前,为了应对营销场景中许多困难,提高销量,汽车营销场景也积累了一套标准化、全闭环的方法论。
针对汽车营销环节长久积累的应用实践痛点,以及结合对智能体应用落地的独到理解,易慧智能基于汽车营销的核心场景增长需求,联合推出了五大场景营销解决方案。
它们分别是数智研究院场景解决方案、新媒体运营场景解决方案、用户运营场景解决方案、集约 DDC 场景解决方案、與情运营场景解决方案。
并且,通过群体智能技术实现汽车营销业务的组织孪生,提高行业效能。
- 集约 DDC 场景解决方案
汽车营销中,常见的一种模式是 DCC,也就是外呼邀约客户。
它对外呼专员的工作繁琐程度、沟通能力要求多且繁杂,成为制约获客转化效率的痛点和难点。
通过对呼叫中心客服进行的组织孪生,利用 LLM 可以提供及时反馈能力,提升转化效率。
- 用户运营场景解决方案
同时,培育和孵化潜在客户也是一个复杂,但至关重要的环节。
利用群体智能体,可以极大地释放销售人员的客户培育的压力,提高了销售环节转换效率。
比如,在新客孵化过程中,客户分析智能体可以对客户信息的要素进行更加细致地筛选,最终产出值得孵化的客户名单。
- 数智研究院场景解决方案
消费者需求分析,竞品分析报告对于改善运营效率,优化销售和售后流程有着重要的意义。
这时据数智研究院,便可以代替人类去完成某些繁琐任务。
其间,智能体会自动收集全网数据,并对数据进行高效治理和分析,大幅缩短报告生成时间,提高了时效性和准确性。
- 舆情运营场景解决方案
除此以外,舆情对品牌形象和产品销售有着重要的影响。
有了群体智能体,一旦检测到潜在负面舆情,数字员工会直接拉群,立即通知其他员工,一起协作完成难题。
这样一来,群体智能体赋能了汽车行业中完整的营销场景,可以大大实现企业的降本增效。
智能体生态建设
但若要汽车行业实现智能最大化,仅靠一个企业是无法完成的,而需要多方团结协作。
也就是说,我们需要搭建一个「群体智能协作平台」。
这是汽车行业实现「组织孪生」的载体。
其将通用大模型、行业工具、行业解决方案、行业数据伙伴串联在一起,实现技术和能力互补。
那么,在这个群体智能体生态中,车企们如何去选择通用大模型,获取行业数据,如何应用行业工具?
当前,通用大模型遍地都是,难就难在该用哪个?哪个适合自己?
对于企业来说,选择大模型往往需要考虑以下一些因素,包括能否匹配特定需求,集成和兼容问题,成本效率,定制化和可扩展能力等等。
选好大模型,下一个问题便是数据处理和获取问题。
汽车行业中,制造商、供应商、维修服务商之间数据共享不足,导致无法形成完整的数据周期。
甚至,数据的准确性、合规性、隐私性都是亟待解决的问题。
此外,接入行业工具是群体智能技术最重要的一个环节。
汽车行业中的技术工具依然存在 API 开放性差、安全性差等问题。对此,急需建立一个完善的 API 开放机制,以及使用规范。
除了技术项的问题,还需要企业对汽车行业业务流程市场环境,以及客户需求有着深入分析。
若想攻克这些难题,实现汽车行业的组织孪生,需要全体生态伙伴不断进步与持续合作。
三巨头强强联合
有了以上对汽车行业的深刻洞察,清华自然语言处理实验室、易慧智能、面壁智能三方共同发布了《大模型驱动的汽车行业群体智能技术白皮书》,受到业内广泛关注。
有趣的是,不仅易慧智能总裁李伟毕业于清华大学自然语言处理实验室,在智能体技术领先的面壁智能也正是由清华孵化的 AI 公司。作为国内最早研究 NLP 和大模型的研究团队之一,它的影响力可见一斑。
与此同时,他们在理论和实践上也正巧能力互补。
清华自然语言处理实验室希望进行技术转化;面壁希望大模型和智能体的方案进入更多行业;易慧智能则希望技术与行业场景结合,产生更多客户价值。
于是,一拍即合,决定开启合作。
由此缔造的大模型驱动群体智能协同工作平台,无疑会将企业级 AI 应用和生态建设带到新的水平,帮企业智能化升级最后一公里。
在这个过程中,三方也是携手攻克了重重难关。
最显而易见的一个难题就是:大模型的幻觉问题,在智能体的应用实践中该怎样避免呢?
来自:「Siren’s Song in the AI Ocean: A Survey on Hallucination in Large Language Models」
攻克重重难关
这个问题难以避免,但还是有对应的解决之道。
在这方面,清华大学教授刘知远和面壁智能联创李大海都有着丰富的经验。
首先是从模型自身的层面:
比如可以通过预训练和微调,来给模型注入领域知识,从而进行控制。
其次是在 Agent 的设计上:
在调用工具时,如果发现 API 或 URL 是来自幻觉,就中断执行;
设计反思机制,让模型根据出错的信息自行修正结果;
借助外部知识,通过搜索引擎或知识库,引入正确的上下文。
当然,具体落地过程中,还会有其他问题。
如果智能体之间依赖自然语言交互,交互过程就容易失控,这时就需要设计协议或给定 workflow,通过 Function call 等方式指定输出形式。
多智能体系统成本太高,太耗费 token 怎么办呢?
这时,就需要综合比较 workflow 设计的灵活性、RAG 还是微调模型、各个环节采用什么模型,并且在工程和推理中有更多策略设计。
此外,由于目前的大模型还是黑箱,最终效果难以达到预期时,还需要从算法策略上来调优,而这,就到了考验团队能力和沉淀经验的时候。
业内首份白皮书重磅发布
如今白皮书的发布,对汽车产业的智能化进程,无疑具有重大的指导价值。
对学界而言,白皮书对「大语言模型」「单体智能」「群体智能」等关键技术专题进行了深入、系统的总结和梳理,并且做了案例分析,将对相关研究提供有益参考。
它总结和展望了大模型群体智能在汽车营销领域的应用,这将对汽车行业的智能化转型意义深远。
对于业界而言,它更是首次提出了汽车营销领域的 AgentVerse 群体智能协同框架。从此,大模型场景化落地便有了标杆。
而这种「人机协作」的新理念,也将人的创意与大模型结合了起来。
对此,三方也非常期待,通过白皮书与业界同仁共同探索和实践,将大模型群体智能的潜力转为现实。
清华大学刘知远教授认为,「我们正步入一个由大模型驱动的「Internet of Agents」智联网时代」。通过白皮书,LLM 群体智能的潜力将转化成现实,一同推动汽车行业迎接智能化的挑战和机遇。
面壁智能联创李大海同样看好三方的协力合作:「通过打造的智能体协同平台,为车企们提供群体智能与组织孪生的一站式解决方案」。
在易慧智能总裁李伟的畅想中,在 20 年后,自动驾驶一定已经走入我们的生活,我们的出行不再需要司机,而是虚拟个人助理和虚拟数字员工团队。
而 100 年后的某一天,我们大概已经进入「虚拟时代」。那时的人们不会再依赖于出行,而是「身未动,心已远」。
白皮书下载方式:关注「易慧智能」,并回复「白皮书」即可。