开云(中国)Kaiyun·官方网站 登录入口
开yun体育网还会在第一季度推出一个语音到语音的模子-开云(中国)Kaiyun·官方网站 登录入口

欢迎访问

开云(中国)Kaiyun·官方网站 登录入口
你的位置:开云(中国)Kaiyun·官方网站 登录入口 > 新闻 > 开yun体育网还会在第一季度推出一个语音到语音的模子-开云(中国)Kaiyun·官方网站 登录入口

开yun体育网还会在第一季度推出一个语音到语音的模子-开云(中国)Kaiyun·官方网站 登录入口

时间:2025-05-25 09:14 点击:165 次

亚马逊的新模子来了开yun体育网。

当地期间周二的 re:invent 大会上,在上昼的 Keynote 递次,前亚马逊云科技(AWS)首席实施官、现任亚马逊公司 CEO 安迪 · 贾西(Andy Jassy)限时返场。在约莫 10 分钟的演讲里,贾西先容了亚马逊在生成式 AI 界限的应用进展,并发布了亚马逊的新一代基础模子—— Amazon Nova。

前年 4 月,亚马逊推出了第一代大模子 Titan,唯有讲话单一模态。如果说 Titan 仅仅小试牛刀,那今天的 Amazon Nova 系列模子,是亚马逊的真技艺和大动作。到底作念文生文、文生图,如故图生视频……对亚马逊来说,这个遴荐不存在的。因为,Nova 系列主打 Any to Any,自便模态输入、自便模态输出。况且在 Benchmark 评测上,也均为 SOTA 大模子,险些可以击败总共疏通量级和阛阓定位的基础模子。

你可能要问,刚追加了 40 亿好意思元投资 Anthropic 过头 Claude,就发了自研的王炸 Nova。亚马逊怎样想的?尤其是怎样看待我方与模子生态伙伴的关系?

前亚马逊云科技(AWS)首席实施官、现任亚马逊公司 CEO 安迪 · 贾西(Andy Jassy)发布 Nova 系列基础模子。|图片开端:亚马逊云科技

安迪 · 贾西(Andy Jassy)自问自答这一问题,他暗示,在亚马逊里面构建的 AI 应用中,使用模子的各样性令东谈主骇怪。开导者亦然这么,但愿有更低的延伸、更低的老本、具备微调才略、能更好地妥洽不同学问库以固定数据,还想要竣事许多自动化妥洽操作(也即是所谓的智能行为),或者想要取得更好的图像和视频效果等等。为了餍足开导者各样性的需求,亚马逊云科技的模子战略,即是予以开导者尽可能多的自主遴荐的权益。

「咱们一直皆在领受兼并个劝诫——弥远不会出现一种器具能在某个界限一统寰球的情况。就像数据库界限,10 年来,群众会使用各样各样的关系型数据库或者非关系型数据库。在分析界限亦然如斯,也曾群众认为 TensorFlow 会成为独一的 AI 框架,而一直强调会有许多不同框架出现,最终 PyTorch 成为了最受接待的阿谁,模子方面相似呈现这么的情况。」

闪开导者可以按照我方盼愿的自便熟谙、组合应用模子,这是大模子时间,亚马逊的谜底。

01 Amazon Nova:老本更低,才略更强

会上,安迪 · 贾西公布了 Nova 系列的六种大模子,其中包括四种生成文本的基础模子,以及生成图像和视频的两种视觉内容生成模子。

领先是体量最轻的 Micro 模子,其属于「仅文本模子」,只扶植输入文本然后输出文本,这亦然 Nova 系列中反应速率最快、性价比最高的模子。贾西称,在 Amazon 里面的开导者最心爱在许多浅易任务中使用它。

贾西暗示,在 11 个 Benchmark 测试中,Nova Mirco 的发达与 Meta LLaMa 3.1 8B 极端以致更优,在 12 个 Benchmark 测试中与 Google Gemini 1.5 Flash-8B 比拟发达更优。该模子的反应速率达到每秒 210 个 Tokens,相等合乎需要快速反应的应用。

接下来三种扶植多模态输入,并输出文本内容的多模态模子。

其中 Lite 模子相似是一种低老本的多模态模子,可以快速处理图像、视频和文本输入,并输出文本内容。

贾西暗示,在 19 项 Benchmark 测试中,Nova Lite 有 17 项发达优于或等于 OpenAI 的 GPT-4o Mini;在 21 项基准中,有 17 项优于或等于 Google 的 Gemini 1.5 Flash-8B;在 12 项基准中,有 10 项优于或等于 Anthropic 的 Claude Haiku 3.5。此模子在视频、图表和文档理奉命务上也有可以发达发达。

Pro 模子则是一种高性能多模态模子,可以针对多种任务提供最好的准确性、速率和老本组合。

在 20 项 Benchmark 测试中,Nova Pro 有 17 项优于或等于 OpenAI 的 GPT-4o;在 21 项 Benchmark 测试中,有 16 项优于或等于 Google 的 Gemini 1.5 Pro。

临了亦然最强的是,是 Nova Premier,该模子可以用于复杂推理任务,也可手脚定制模子蒸馏的最好「老师」。

贾西莫得给出 Premier 的跑分对比,但从先容中咱们不难估量:该模子对标的是 OpenAI 9 月发布的 Orion 系列模子。

凭证贾西,Amazon Nova Micro、Lite 和 Pro 面前也曾全面上市,而 Amazon Nova Premier 筹划在 2025 年第一季度推出。

除了性能除外,贾西暗示这些模子还有其他亮点,领先,它们的老本效益很高,相较于 Amazon Bedrock 中的其他优秀模子居品,能低廉约莫 75%。此外,它们的速率很快,在延伸方面发达优异,是所能见到的速率较快的模子。

也曾上市的模子不仅集成在 Amazon Bedrock 中,还与 Amazon Bedrock 里的总共功能进行了深度整合。这意味着开导者可以对模子进行微调,或利用 Bedrock 的学问库、RAG 等对模子增强,或者利用 Bedrock 的蒸馏功能来将大模子的智能「更动到」更小的模子,从而提高效益并贬低延伸。

除了四种生成文本的模子,贾西还预报了两个生成视觉内容的新模子。

领先是 Amazon Nova Canvas,这是一款泉源进的图像生成模子,可以凭证文本或图像辅导生成专科级的图像。它还提供了一些方便功能,举例使用文本输入剪辑图像,以及调度配色有筹划和布局的限制选项。该模子还内置了扶植安全和负包袱 AI 使用的功能,包括水印功能(可纪念图像开端)和内容审核功能(限制潜在无益内容的生成)等。

在第三方进行的东谈主类对比评估中,Amazon Nova Canvas 的发达优于 OpenAI DALL-E 3 和 Stable Diffusion。底下是由 Amazon Nova Canvas 生成的一系列图片:

然后是 Amazon Nova Reel,这是一款泉源进的视频生成模子,可通过文本和图像直率创建高质地视频,相等合乎告白、营销或培训内容创作。用户可以通过当然讲话辅导限制视觉作风和节律,包括镜头通顺、旋转和变焦。在第三方进行的东谈主类对比评估中,Amazon Nova Reel 生成的视频质地和一致性优于 Runway 的 Gen-3 Alpha。

与 Canvas 访佛,Nova Reel 也内置了安全和包袱 AI 功能,包括水印和内容审核。面前扶植生成 6 秒的视频,畴昔几个月将推广到最长 2 分钟的视频生成。

贾西还共享了 Nova 接下来的筹划,领先是在来岁开导出上述模子的第二代版块。此外,还会在第一季度推出一个语音到语音的模子,并在来岁年中推出一个自便(any)到自便(any)的模子。也即是多模态输入到多模态输出的模子,这意味着用户可以输入文本、语音、图像或视频等多种体式的内容,并相应地输出文本、语音、图像或视频。

从 Titan 到 Nova,连发两个大模子的 亚马逊云科技,不免会有东谈主操心与稠密大模子开导商配合的 亚马逊云科技 正在篡改其模子战略。

贾西昭着相识到了,他在会上自问自答证明了 亚马逊云科技 的态度:

「偶而群众会问,该如何看待亚马逊云科技的模子战略?毕竟咱们与稠密模子提供商有着深远的配合关系,同期我方也研发了一些模子。我想说的是,群众可以这么来看待:咱们一直以来的认识即是为群众提供遴荐,旨在呈现最等闲且最优质的功能,这势必意味着会有各样化的遴荐。」

亚马逊云科技首席实施官 Matt Garman 先容,在 Amazon Bedrock 上,开导者可以凭证本人需要遴荐亚马逊或者自便生态伙伴的模子。|图片开端:亚马逊云科技

02 全球最大的电商平台,用生成式 AI 干什么?

除了发布新的大模子,会上,安迪 · 贾西还详备先容了亚马逊里面的 AI 应用案例。

手脚全球最大的电商平台,也手脚亚马逊云科技的「第一客户」,亚马逊在畴前一年尝试为多项业务引入 AI 提效,措置用户濒临的问题。其中典型的场景如下:

零卖业务中取得更优质的保举以及个性化保举;

为践约中心的拣货员规划最好旅途,从而更快地把商品送到客户手上;

将其应用在咱们的 Prime Air 无东谈主机上,盼愿在畴昔几年内竣事不到一小时就能为你送货上门;

Amazon Go 商店的 Just Walk Out 技能、为 Alexa 提供技能扶植;

提供 25 种以上的亚马逊云科技 AI 服务,方便开导者构建 AI 应用圭臬。

从亚马逊不雅察到的 AI 用例中,安迪认为,措置问题的 AI 应用(「实用 AI」)有两种实用价值:降本增效,或者带来新体验。

「从全球范围来看,那些应用 AI 最为到手的公司,主要体面前老本障翳和坐褥力培植方面,而且许多公司在这两方面皆取得了进展。同期,你也启动看到一些统统再行构想、重塑的全新客户体验。」

在这两类 AI 应用上,安迪给了亚马逊里面的典型使用场景:

降本增效的   AI

1)智能客服

以客户服务为例,亚马逊的零卖业务有着数亿客户,畴前当他们需要议论客户服务时,可以议论聊天机器东谈主,畴前这一聊天机器东谈主选用的静态决策树的机器学习技能,客户得输入大量翰墨本领获取谜底。

但生成式 AI 对这个系统进行了重构后,面前客户领有了一个懂他 / 她的客服机器东谈主。

比如,假如你几天前订购了一件商品,参预新的聊天机器东谈主界面时,它知谈你是谁、几天前订购了什么、住在那边,而且它能通过模子预测到,如果在几天后议论客服,大要率是照顾退货议论问题。当你启动向它证明情况时,它可以速即见知你最近的 Whole Foods 或者其他可退货的实体店位置。况且这个模子很智能,当察觉到用户对它给出的回答感到颓废时,还能判断出用户可能需要议论东谈主工客服来措置问题。

在再行遐想之前,这个聊天机器东谈主的客户懒散度就也曾挺高了,但自从加入了生成式 AI 这个「灵敏大脑」后,客户懒散度培植了 500 个基点。

2)卖家工单填写

亚马逊在全球零卖店有约莫 200 万卖家,销售的商品中进步 60% 是由这群卖家提供的,但他们畴前在往网站上架居品时,需要填写一份很长的、包含许多字段的表单,从而让末端客户更方便地浏览并了解卖家的居品信息,这对卖家来说实在是个贫穷的任务。

面前,亚马逊利用生成式 AI 打造了一款全新的器具,卖家只需输入几个字,或者拍张像片,又或者提供一个 URL,这个器具就能襄理填写许多居品属性信息,这对卖家来说直率多了,面前也曾有进步 50 万卖家在使用这款生成式 AI 器具。

3)库存照料

亚马逊零卖业务中的库存照料亦然一个大场景,有进步 1000 个不同的建筑或节点,从而把合适的居品优化成立到距离最终客户最近的试验中心或者建筑里,以此勤俭运载期间,更快、更低老腹地把商品送到你手中。但这也就意味着,要明晰某个试验中心的库存情况,比如每个商品的库存水平是若干、哪些商品正在被订购、订购的速率如何、这个试验中心是否还有更多的仓储容量,以及是否需要将库存更动到其他试验中心来均衡通盘仓储相聚等问题。

为此,亚马逊应用 Transformer 模子来措置这些问题并进行预测,现时,一个对经久需求预测的 Transformer 模子也曾将预测准确性提高了 10%,区域预测准确性也提高了进步 20%,在亚马逊数百亿好意思金的零卖业务限制下,两位数的效用培植意味着数以十亿好意思元计较的老本勤俭。

4)机器东谈主

在机器东谈主场景上,亚马逊试验中心也曾部署了进步 75 万台机器东谈主,一系列 AI 技能匡助机器东谈主场景优化了时局容量和传送才略,镌汰处理期间以及为客户服务的老本。

以 Sparrow 为例,它是一款用于再行分类的机器东谈主手臂。它需要束缚从稠密漫步区域相聚物品,并将它们集聚到容器里。有了生成式 AI 的大脑,可以告诉 Sparrow 第一个箱子里装了什么物品、要它去拿哪个物品,同期 Sparrow 得分歧出每个物品具体是什么,还要明晰依据物品的大小、材质以及材质的柔韧性该如何抓取,况且知谈能把物品搁置在经受箱的哪个位置。

面前,亚马逊在路易斯安那州什里夫波特的践约中心推出了约莫五项全新的机器东谈主发明,也曾看到处理期间提高了 25%,畴昔,服务老本展望也会贬低 25%。

翻新客户体验的 AI

上述这些皆是亚马逊里面在老本障翳和坐褥力培植方面的实例,亚马逊也看到了生成式 AI 在创造全新购物体验方面的作用,贾西也列举了几个典型例子。

1)Rufus 购物智能体

第一个应用是,Rufus 购物智能体。

当客户不细目我方想要什么,正在纠结遴荐时,可能会浏览商品分类、稽查客户评价等,但面前 Rufus 购物智能体带来了「真东谈主导购」的体验。

就像走进实体店,不细目我方想要什么时,向销售东谈主员刻画一下想法,他们便会保举可能合乎你的商品,继续问「这个怎样样,阿谁怎样样」,他们也能快速回答你。面前,Rufus 带来了访佛的体验。

借助 Rufus,你可以参预任何居品的详备信息页面、提议任何问题,Rufus 皆会速即给出谜底。它能帮你对不同居品和类别进行比较,还会给出保举,你可以提议很浅薄的问题来获取保举,它也会进一步计议一些具体问题,以便更准确地把捏你的意图。比如,你对 Rufus 说:「嘿,我想要我之前一直买的那种高尔夫球杆,你能帮我找找吗?」Rufus 就能帮你找到。你如果说:「给我查查那些还没发货的商品订单景色。」它也能帮你查到。

Rufus 相对实体销售东谈主员有一个上风,那即是它不会跳槽去别的零卖商事业,也不会转行干别的,它会一直陪着你,更好地了解你的意图、风趣以及需求。

2)Alexa

亚马逊 2014 年推出的 Alexa 也迎来了新的大脑。

Alexa 的认识和职责是打造全球最优秀的个东谈主助理,跟着大型讲话模子和生成式 AI 的出现,这个认识正在越来越近。Alexa 在亚马逊销售的总共诞生之间,有着 5 亿个活跃节点,东谈主们用它来文娱、购物、获取信息以及限制智能家居。

面前亚马逊正在使用多个基础模子对 Alexa 进行重构,不仅能让 Alexa 更好地回答你的问题,还能作念到一些当下很少有生成式 AI 应用圭臬能竣事的事,那即是融会并预测你的需求,以致能替你选用行动。贾西剧透畴昔几个月可以看到议论效果。

3)Amazon Lens

亚马逊官网还上了一个新功能叫 Amazon Lens,假定你在一又友家看到一个很心爱的花盆,想知谈这个花盆是从哪儿买的,问一又友,一又友也不知谈。

偶而你可以在搜索引擎里输入像「亚马逊、花盆、吊挂、编织」之类的枢纽词,也许能得到可以的谜底,但也可能一无所获。

但面前,你可以使用 Amazon Lens,只消拍下这个物品的像片就行。Amazon Lens 会应用计较机视觉以及一个多模态模子,依据像片进行搜索查询,获胜指导你找到亚马逊上对应的正确搜索扫尾,方便你直率购买。

4)尺寸保举

亚马逊还构建了一个尺寸保举的大讲话模子,为网上购物带来了新体验。

比如买衬衫时,不细目这个品牌的尺码是偏大如故偏小,也不明晰我方该选中号如故大号。这时,尺寸保举的模子能分析稠密品牌之间的尺码关系,对比出哪些品牌尺码周边,哪些偏大或偏小,然后齐集你之前购买过的商品情况,自动为你保举合适的尺码。

5)防御警报

贾西还先容了在视频界限所作念的事,比如亚马逊和 NFL 配合的 Next Gen Stats 步地,每个赛季会相聚 5 亿个数据点,基于这些数据构建 AI 模子,打造了一个叫「防御警报」的功能。

它能披裸露哪个防御球员可能会冲向四分卫,还会在画面上圈出来,极地面篡改了不雅众的不雅看体验;还打造了「防御脆弱性」功能,能够为不雅众指出重要方应该重心挫折的防御薄弱区域,这些皆给球迷带来了不一样的不雅赛体验。

​朝着降本增效、带来新体验的标的,这些是亚马逊里面正在使用 AI 措置骨子问题的场景。安迪 · 贾西暗示开yun体育网,在亚马逊里面也曾构建或者正在构建近 1000 个生成式 AI 应用圭臬。

回到顶部
服务热线
官方网站:www.hzshlsy.com
工作时间:周一至周六(09:00-18:00)
联系我们
QQ:16568350533
邮箱:1ea62e34@outlook.com
地址:新闻科技园4537号
关注公众号

Powered by 开云(中国)Kaiyun·官方网站 登录入口 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024
开云(中国)Kaiyun·官方网站 登录入口-开yun体育网还会在第一季度推出一个语音到语音的模子-开云(中国)Kaiyun·官方网站 登录入口