亚马逊发力捍卫云地位,升级自研AI芯片,发布聊天机器人Q,抢先用英伟达新一代超级芯片

admin admin
11
2023-11-29
  来源:华尔街见闻  亚马逊发力捍卫在云计算领域的领先地位,一边升级自研的云芯片、推出亚马逊版的GPT——人工智能(AI)聊天机器人,一边深化同英伟达的合作,推出基于英伟达芯片的新服务、和英伟达共同研发超级计算机。  AWS的副总裁DaveBrown表示,通过将自研芯片的设计重点放在对客户重...

  来源:华尔街见闻

亚马逊发力捍卫云地位,升级自研AI芯片,发布聊天机器人Q,抢先用英伟达新一代超级芯片

  亚马逊发力捍卫在云计算领域的领先地位,一边升级自研的云芯片、推出亚马逊版的GPT——人工智能(AI)聊天机器人,一边深化同英伟达的合作,推出基于英伟达芯片的新服务、和英伟达共同研发超级计算机。

  AWS的副总裁Dave Brown表示,通过将自研芯片的设计重点放在对客户重要的实际工作负载上,AWS能为他们提供最先进的云基础设施。此次推出的Graviton4是五年内的第四代芯片产品,随着人们对生成式 AI 兴趣的高涨,第二代AI芯片Trainium2 将帮助客户以更低的成本和更高的能效更快地训练自己的机器学习模型。

  Graviton4计算性能较前代提高多达30%

  美东时间11月28日周二,亚马逊旗下云计算业务AWS宣布,推出新一代的AWS自研芯片。其中,通用芯片Graviton4的计算性能较前代Graviton3提高多达30%,内核增加50%,内存带宽提升75%,从而在亚马逊云服务器托管服务Amazon Elastic Compute Cloud(EC2)上提供最高性价比和能源利用效果。

  Graviton4还通过对所有高速物理硬件接口进行完全加密提高安全性。AWS称,Graviton4 将应用于内存优化的Amazon EC2 R8g 实例,让客户能改进高性能数据库、内存缓存和大数据分析工作负载的执行。R8g 实例提供更大的实例大小,比前代 R7g实例的 vCPU 高最多三倍的,内存高三倍。

  应用Graitons4的电脑将在未来数月内上市。AWS称,启动Garviton项目约五年来,已生产超过200万个Garviton处理器,AWS EC2的前100位用户都选择使用Graviton。

  Trainium2速度提高四倍 训练万亿参数级模型

亚马逊发力捍卫云地位,升级自研AI芯片,发布聊天机器人Q,抢先用英伟达新一代超级芯片

  AWS的另一款新品——新一代AI芯片Trainium2速度比前代Trainium1快四倍,将能在EC2 UltraCluster中部署多达10万个芯片,让用户能在很短的时间内训练数以万亿参数的基础模型(PM)和大语言模型 (LLM),同时能源利用率较前代提高多达两倍。

  Trainium2 将用于Amazon EC2 Trn2 实例,单个实例中包含16 个Trainium 芯片。Trn2 实例旨在帮助客户在下一代 EC2 UltraCluster中扩展芯片应用数量至多达10万个Trainium2 芯片,联通AWS Elastic Fabric Adapter (EFA) petabit级网络,提供高达 65 exaflops 的算力。

  AWS称,Trainium2将从明年开始用于支持新的服务。

  升级版Grace Hopper的首家大客户 DGX云采用GH200 NVL32  速度最快GPU驱动AI超算

  除了自研芯片,AWS周二还在年度大会re:Invent期间同英伟达共同宣布,扩大战略合作,提供最先进的基础设施、软件和服务,助力客户的生成式AI创新。

  AWS 将成为第一家在云上采用全新多节点NVLink技术英伟达H200 Grace Hopper超级芯片的云服务商,也就是说,AWS将是升级版Grace Hopper的第一个大客户。

  英伟达的H200 NVL32 多节点平台将 32 个 Grace Hopper芯片与 NVLink 和 NVSwitch 技术共同用于一个实例。该平台将用于与亚马逊网络EFA连接的Amazon EC2实例,并由高级虚拟化 (AWS Nitro System) 和超大规模集群 (Amazon EC2 UltraClusters) 提供支持,使亚马逊和英伟达共同的客户能够扩展部署数以千计的H200芯片。

亚马逊发力捍卫云地位,升级自研AI芯片,发布聊天机器人Q,抢先用英伟达新一代超级芯片

  英伟达和AWS将共同在AWS上托管英伟达的AI 训练即服务DGX Cloud,它将是第一个采用GH200 NVL32 的 DGX 云,能为开发人员提供单个实例中最大的共享内存。AWS 的DGX云将提高尖端生成式AI 和超过1万亿参数的大语言模型的训练。

  英伟达和AWS 正在共同研发名为Ceiba 的项目,设计世界上速度最快的GPU驱动AI 超级计算机,这是一个采用 GH200 NVL32 和 Amazon EFA 互连的大规模系统。它是搭载1.6384万块GH200超级芯片的超级计算机 ,AI处理能力达65 exaflops。英伟达将用它推动下一波生成式AI 创新。

  企业客户机器人亚马逊Q预览版上线 帮助在AWS上开发App

  除了芯片和云服务,AWS还推出了自己的AI聊天机器人预览版,名为亚马逊Q。它是生成式AI技术支持的新型数字助手,可根据企业客户的业务进行工作,帮助企业客户搜索信息、编写代码和审查业务指标。

  Q接受了AWS内部有关代码和文档的部分培训,可供AWS云的开发者使用。

  开发者可以用Q在AWS上创建App、研究最佳实践、改正错误、获得为App编写新功能的帮助。用户可以通过对话式的问答功能与Q进行交互,学习新知识、研究最佳实践以及了解如何在AWS上构建App,无需将注意力从 AWS 控制台上移开。

  Q还将被添加到亚马逊的企业智能软件、呼叫中心工作人员和物流管理的程序。 AWS表示,客户可以根据公司的数据或个人资料,对Q进行定制。

  Q 对话式问答功能目前在所有提供企业AWS的地区提供预览版。

其他相关 RELEVANT MATERIAL

亚马逊发力电商AI,推出第三方卖家助手Amelia

admin admin
1
2024-09-20
  来源:硬AI  去年12月,亚马逊云业务AWS推出了生成式人工智能(AI)助手AmazonQ,现在亚马逊又在电商领域发力,推出了服务电商平台第三方商家的AI助手Amelia。  美东时间9月19日周四,亚马逊宣布,从当天开始,上线beta版本的Amelia,最初面向部分美国的第三方卖家,未......

费城半导体指数涨超3% Arm、英伟达均涨超5%

admin admin
1
2024-09-19
格隆汇9月19日|半导体板块反弹,费城半导体指数涨超3%。个股方面,Arm、英伟达均涨超5%,博通、意法半导体、AMD、台积电、迈威尔科技、高通等多股均涨超3%。......

T-Mobile宣布与英伟达、爱立信、诺基亚建立技术合作伙伴关系

admin admin
2
2024-09-18
  电信运营商T-Mobile宣布与英伟达、爱立信、诺基亚建立技术合作伙伴关系,以人工智能为中心推进移动网络的未来发展。......

英伟达拟以约1.65亿美元收购软件初创公司OctoAI

admin admin
2
2024-09-18
  通过此次收购,英伟达有望整合OctoAI的技术,增强其产品在机器学习领域的竞争力。  英伟达(NVDA.US)宣布正就收购软件初创公司OctoAI展开深入谈判,拟以约1.65亿美元的价格收购该公司。OctoAI,最初名为OctoML,由开源项目ApacheTVM的创建者于2019年从华盛顿......

持续扩张AI版图!传英伟达拟收购软件初创公司OctoAI

admin admin
2
2024-09-18
据报道,英伟达(NVDA.US)正在讨论收购软件初创公司OctoAI。据报道援引OctoAI发给股东的一份文件称,英伟达已出价约1.65亿美元收购这家总部位于西雅图的初创公司。据了解,该公司出售软件供客户使用,并使他们的人工智能模型以更高效的方式运行。OctoAI的股东包括TigerGlobal......

贝莱德和微软拟筹集300亿美元用于人工智能投资 英伟达将提供支持

admin admin
3
2024-09-18
  贝莱德和微软正联手投资数据中心和其他支持人工智能的基础设施。  两家公司在声明中表示,这项名为“全球人工智能基础设施投资伙伴关系”(GlobalAIInfrastructureInvestmentPartnership)的战略旨在吸引300亿美元的私募股权投资,并利用这笔资金进行高达1......
年度爆文