编辑部整理自 AIGC 峰会
量子位公众号 QbitAI
在 AIGC 时代,云计算是不可或缺的算力参与者。如何为企业大模型应用护航,帮助他们以更强的性能、更低的成本完成部署,是每个底层能力厂商都在思索的难题。
本次中国 AIGC 产业峰会上,亚马逊云科技大中华区产品部技术总监王晓野分享了企业如何抓住时代的机遇,以及应对生成式 AI 的关键步骤。
为了完整体现王晓野的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。
中国 AIGC 产业峰会是由量子位主办的行业峰会,20 位产业代表与会讨论。线下参会观众近千人,线上直播观众 300 万,获得了主流媒体的广泛关注与报道。
话题要点
80% 的企业 CEO 认为生成式 AI 将在 18 个月内颠覆所有行业 企业应对生成式 AI 需要遵循几大关键步骤,数据是核心竞争力 亚马逊云科技通过加速层、中间层、应用层三层能力帮助企业抓住生成式 AI 的机遇。 生成式 AI 最适用于客户服务、决策洞见、营销内容生成、运营自动化等 8 大场景以下为王晓野演讲全文:
生成式 AI 时代的机遇
我们今天离生成式 AI 这个时代已经开始了,并不是未来将发生的事情。根据麦肯锡的调研结果,全球生成式 AI 将带来 2.6-4.4 万亿美元的市场商机。对超过五千人的企业进行调查,结果显示,80% 的被调研 CEO 认为生成式 AI 将在 18 个月之内颠覆所有产业,同时也有 30% 的企业已经在今天部署生成式 AI 相关的投资。
所以说在各个行业,生成式 AI 是几乎所有人都认为会发生的,或者说正在发生的一件大事。
亚马逊云科技从电商起家,到云计算、云助手,一直在以技术和 AI 颠覆原有产业并不断创新。
随着生成式 AI 应用的发展,这里有八个场景介绍亚马逊云科技如何应用生成 AI。
首先,Alexa 语音助手背后的模型正在全面更新,将采用生成式 AI 新模式。
其次,在亚马逊云科技整个产品列表中,我们通过生成式 AI 为产品列表添加更有用的信息。
第三,在广告领域,亚马逊云科技为电商卖家提供了众多产品上架和展示工具,其中包括生成式 AI 一键式生成产品和营销素材的功能。
第四,亚马逊云科技在无人商铺中使用掌纹识别技术来识别顾客身份,该技术需要大量数据进行模型训练,而亚马逊通过生成数据集的方式来帮助提高掌纹识别的准确性。
第五,针对电商评论,我们的电商平台上有非常多的评论。如何通过这些评论快速了解一款产品是否符合自己的购买期望呢?我们可以通过生成式 AI 快速进行内容总结。
第六,亚马逊云科技也有视频平台,针对一些比赛我们通过生成式 AI 进行整个比赛的解说,增强用户体验。
第七无人商店人流预测上面,我们进行快速验证,包括亚马逊云科技在药店场景下帮助店员使用生成式 AI 快速的解释某一款药针对某一种类型是否更加适合。
最后一个也是最近的用例,我们在电商平台上推出了导购助手 Shopping Assistant。当你明确想买 iPhone17 Pro 时,可能会直接使用检索功能;而当你的购买目的不那么明确,或者只是想简单地进行户外郊游时,你可能希望 AI 助手能够推荐适合的产品,比如除了帐篷和烧烤炉,还需要什么东西。
AI 助手正在帮助电商颠覆传统的购物体验。
想通过这些给大家展示的是不仅仅是调研,亚马逊云科技作为全球领先的科技公司已经在全面的拥抱生成式 AI,每个地方都在进行尝试。
亚马逊云科技一直致力于通过科技为企业赋能,我们在生成式 AI 领域的定位是为云计算赋能产业提供未来的巨大机会。
通过三层能力,我们为客户提供抓住生成式 AI 浪潮的核心能力:
最下层是加速层,专注于模型训练到推理的加速,提供更好的框架,帮助模型优化的人员实现加速。
中间层是应用构建层,我们不直接投入模型或 AI 本身的能力,而是提供核心产品 Amazon Bedrock,让客户可以直接利用 AI 的能力构建自己的专属应用。除了模型能力外,还提供 Agent 和知识库等功能。
最上面一层是应用层,我们知道有些企业希望直接使用开箱即用的应用,因此我们会挑选亚马逊云科技最擅长的应用场景,包括 Amazon Q 和企业知识库,提供智能助力。此外,我们还提供 Amazon Quicksight,这是一款生成式 BI 产品;以及 Amazon Connect,它可以帮助训练客服人员快速总结客户电话沟通的需求;还有 Amazon CodeWhisperer,它通过智能生成代码助力的形式,提供开箱即用的应用。
亚马逊云科技希望通过这三层架构,为客户提供抓住生成式 AI 浪潮的核心能力。
企业应对生成式 AI 的关键步骤
亚马逊云科技在与客户沟通的过程中,帮助企业总结了抓住生成式 AI 关键的几个步骤:
选对场景:选择适合的应用场景,以充分发挥生成式 AI 的优势。
选对工具或提供工具的合作伙伴:选择合适的工具或与提供工具的合作伙伴合作,以支持生成式 AI 的应用。
数据的重要性:在生成式 AI 时代,如果所有人能够掌握的模型能力相同,那么数据将成为每个企业最核心的竞争力和差异化所在。因此,企业对数据的重视程度应该与以往有所不同。
人才培养和监管治理:在落地过程中,培养相关人才以及对生成式 AI 进行监管和治理至关重要。
对于第一点,如何找到合适的应用场景?我们根据客户经验,总结出当前生成式 AI 非常适合的六大场景。
首先,是和服务客户有关的场景。在中国企业大量出海的背景下,许多业务都是全球化的,因此在多国文化和语言之间建立桥梁,生成式 AI 可以发挥非常重要的作用。
其次,是商业决策和洞察场景。
再次,是智能服务和营销素材的生成场景。
第四,是整体运营效率方面,在办公工具和软件自动化方面,大模型生成式 AI 为我们提供了前所未有的能力。
最后两个专业知识的支持,以及刚才提到的产品侧,颠覆我们产品前所未有的体验,这都是正在发生的生成式 AI 比较适合应用的六大领域。
许多人都有这样的疑问:我应该在什么时候进行微调,什么时候使用 RAG,以及什么时候进行持续预训练?
今天的大模型存在几个无法回避的问题:首先,实时性支持在模型中无法实现;其次,用户隐私数据也不可能在模型中循环使用;最后,模型仍然会产生幻觉,很多回答正确的情况只是一种恰到好处的巧合。
如何真正完全避免幻觉,只有一个方式,就是用你绝对确定的答案去引导它,这些都是在中间做 RAG 应该做的事情。
什么时候进行微调呢?如果对角色的理解存在特殊的引导性,或者对格式的理解有特定需求,那么就可以进行微调。我们希望模型具备这样的能力。
关于持续预训练,对于产业术语和行业术语,我们建议在最原始的预训练阶段,将整个数据集中加入相应的资料。
我们认为,企业最重要的是构建自己的数据飞轮,实现从应用模型到数据的真正打通。应用产生的数据越来越多,有助于企业更好地定制自己的模型,从而充分发挥模型的作用。
亚马逊云科技提供端到端全栈的数据能力,希望客户关注我们用数据做什么,而不是我们用什么做数据这件事情。
生成式 AI 去年和今年有何不同?
首先回顾去年,大家对 AIGC 的概念还停留在文生图和文生视频,而如今提到的多模态输入、文本理解或者全模态、多模态输入输出等概念尚未普及。
在去年,最常见的应用场景包括:创意类内容生成,如文生图,以及企业内部的内容设计,如游戏公司的素材设计;ToB 的营销生成,如为品牌商提供营销素材;将生成式 AI 能力嵌入设计类软件,如 Adobe 将其嵌入工具中。
而中间这一类 APP 则仅局限于一些较小且有趣的场景,如妙鸭相机提供一些个性化的照片和头像等。至于聊天机器人,虽然在各个领域都有应用,但主要局限于企业内部知识库、售后客服、游戏 NPC 等相对简单的场景。
我们总结主要原因在于模型能力和成本这两个核心因素,只有真正了解产品目标客群以及大模型相应能力的产品经理,才能找到所谓的产品市场契合点(PMF),并在有限的场景中加以应用。
在这一阶段,我们也有一些优秀的案例。例如,易点天下是我们服务的一家广告行业的公司,他们抓住了这一波机遇,推出了 KreadoAI 营销素材生成平台。该平台在营销素材电商领域实现了 50% 的增效。
这一波如果重新定义的话,我想借着 Amazon Bedrock 中间平台层这款产品的更新跟大家做一个解读,为什么现在跟刚才我提的文生图、文生文那一波又不一样。
最核心首先介绍一下 Amazon Bedrock 作为工具,我们会提供不同的模型能力,同时以 API 的方式用云最安全的方式,隐私保护的机制来去保障用户使用到最好的一些大模型。不会有一个模型统治全天下,我们会在相对比较好的一些模型里,为大家提供模型的 API 的调用,事实也证明,我们现在看到模型能力是此消彼涨,大家互相竞争的状态,与 Anthropic 的 Claude 也是在近期吸引到了大家的眼球。
亚马逊云科技跟 Anthropic 是战略投资关系,Anthropic 在加速层会尝试使用亚马逊云科技的芯片,以及类似模型微调的功能也会优先在亚马逊云科技平台上提供。
首先是成本。今天调用一个大模型的成本,通过模型提供商以及云厂商的优化,能做到什么程度?
Haiku 是 Claude 3 系列最小的模型,速度非常快,在价格上也有一个质的飞跃,低到已经可以挑战传统机翻如 Google translate 的成本。
在这一基础上,语言翻译的场景将得到拓展。过去,大模型客户主要尝试批量翻译,而现在,许多人开始尝试实时翻译。这是因为新的方法已经达到了 SOTA,并且比原有的方法更经济实惠。
此外,Claude 模型的特点在于其出色的语义理解能力和对自身角色个性的识别能力。在今天的角色扮演场景中,它被置于首位。情感陪伴机器人、AI 男女友等提供情绪价值的 APP 大量涌现。首先,这些 APP 的拟人化交互效果出色。更重要的是,收费方面,许多公司已找到平衡点,可通过用户付费实现盈利。
多模态已经是未来的一个趋势,Claude 3 系列三个模型都是朝着多模态输入的方向发展。同时对语义的理解和对图和文字背后的意义的理解方面都有很好的基础。
多模态解锁了哪些不同的能力呢?例如,通过物体检测来判断是否有老人跌倒或婴儿从婴儿床里掉出来。同时,这种多模态能力也为新兴的短剧提供了支持。在短剧里,如何在适当的情节和最关键的地方进行识别,然后插入广告,直接实现盈利回报。
基于这个新的模型能力,游戏公司沐瞳科技正在使用新兴的 SOTA 多模态大模型替代传统的作战类游戏内容审核。这是因为在游戏过程中可能会出现一些脏话、辱骂和不正当言论。
这种变化悄然发生,表面上看起来没有变化,但背后的实现方式已经发生了改变。
最后,我们来谈谈人才以及如何在实践中用好 AI 并进行负责任的监管与治理。这一点非常重要。如果企业在推出产品时稍有疏忽,可能会对其声誉造成影响,甚至可能损害之前与客户建立的信任关系。在人才和相关方面,亚马逊云科技投入了大量资源,致力于帮助客户共同打造和谐的环境,推动负责任的 AI 应用。
每年,亚马逊云科技的创始人或 CEO 都会写一封致股东的信,信中会解释公司在过去一年中取得的成绩以及未来的投资方向。在今年的信中,“Primitives”这个词被使用了 41 次。
如果用一个比喻来解释这个词,它可以被直译为原子原件原力量。以机械设备为例,杠杆和滑轮就是原子的力量。在电商领域,支付能力和物流能力就是原子力量,它们帮助第三方买家接入亚马逊平台。
同样,对于云计算,从诞生的第一天起,它就是为企业提供原子能力,帮助他们构建大型分布式系统,实现更好的数据治理。在生成式 AI 的时代,我们正在构建或持续投入的下一个领域就是关于生成式 AI 的三层原子能力。我们希望与客户一起,共同赢得生成式 AI 的时代。
One More Thing
今天我们宣布,Meta Llama3 基础模型可以通过 Amazon SageMaker JumpStart 进行部署和推理运行。
Llama3 是预训练和精调的生成式文本模型,目前有 8B 和 70B 两种参数尺寸,上下文长度为 8K,适用于推理、代码生成和指令执行等多种使用场景。
它采用了仅解码器的 Transformer 架构和新的 tokenizer,提供了 128K 大小的改进模型性能。此外,Meta 改进了后训练程序,大幅降低了错误拒绝率,提高了对齐性,增加了模型响应的多样性。
通过 Amazon SageMaker 的功能(如 Amazon SageMaker Pipelines、SageMaker Debugger 或容器日志),您可以获得 Llama3 性能和 MLOps 控制的组合优势。该模型将在您的 VPC 控制下的亚马逊云科技安全环境中部署,有助于提供数据安全性。