英伟达CPU问世:ARM架构,对比x86实现十倍性能提升

机器之心报道机器之心编辑部
收购 Arm 还没有定论,但英伟达的 Arm 架构 CPU 已经出现了。英特尔现在可能正感受到不一样的压力。

「只需一张 GeForce 显卡,每个学生都可以拥有一台超级计算机,这正是 Alex Krizhevsky、Ilya 和 Hinton 当年训练 AI 模型 AlexNet 的方式。通过搭载在超级计算机中的 GPU,我们现在能让科学家们在 youxian 的一生之中追逐无尽的科学事业,」英伟达创始人兼首席执行官黄仁勋说道。
4 月 12 日晚,英伟达 GTC 2021 大会在线上开始了。或许是因为长期远程办公不用出门,人们惊讶地看到在自家厨房讲 Keynote 的黄老板居然留了一头摇滚范的长发:

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


如果你只是对他的黑色皮衣印象深刻,先对比一下 2019、2020 和 2021 的 GTC,老黄气质越来越摇滚。如此气质,黄仁勋今天推出的新产品肯定将会与众不同。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


「这是世界第一款为 terabyte 级别计算设计的 CPU,」在 GTC 大会上,黄仁勋祭出了英伟达的首款中央处理器 Grace,其面向超大型 AI 模型的和高性能计算。
英伟达也要做 CPU 了
Grace 使用相对能耗较低的 Arm 核心,但它又可以为训练超大 AI 模型的系统提供 10 倍左右的性能提升。英伟达表示,它是超过一万名工程人员历经几年的研发成果,旨在满足当前世界最先进应用程序的计算需求,其具备的计算性能和吞吐速率是以往任何架构所无法比拟的。
「结合 GPU 和 DPU,Grace 为我们提供了第三种基础计算能力,并具备重新定义数据中心架构,推进 AI 前进的能力,」黄仁勋说道。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


Grace 的名字来自于计算机科学家、世界最早一批的程序员,也是最早的女性程序员之一的格蕾丝 · 赫柏(Grace Hopper)。她创造了现代第一个编译器 A-0 系统,以及第一个高级商用计算机程序语言「COBOL」。计算机术语「Debug」(调试)便是她在受到从电脑中驱除蛾子的启发而开始使用的,于是她也被冠以「Debug 之母」的称号。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


英伟达的 Grace 芯片利用 Arm 架构的灵活性,是专为加速计算而设计的 CPU 和服务器架构,可用于训练具有超过 1 万亿参数的下一代深度学习预训练模型。在与英伟达的 GPU 结合使用时,整套系统可以提供相比当今基于 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。
目前英伟达自家的 DGX,使用的是 AMD 7 纳米制程的 Rome 架构 CPU。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


据介绍,Grace 采用了更为先进的 5nm 制程,在内部通信能力上,它使用了英伟达第四代 NVIDIA NVLink,在 CPU 和 GPU 之间提供高达 900 GB/s 的双向带宽,相比之前的产品提升了八倍。Grace 还是第一个通过错误校正代码(ECC)等机制利用 LPDDR5x 内存系统提供服务器级可靠性的 CPU,同时提供 2 倍的内存带宽和高达 10 倍的能源效率。在架构上,它使用下一代 Arm Neoverse 内核,以高能效的设计提供高性能。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


基于这款 CPU 和仍未发布的下一代 GPU,瑞士国家超级计算中心、苏黎世联邦理工大学将构建一台名为「阿尔卑斯」的超级计算机,算力 20Exaflops(目前全球第一超算「富岳」的算力约为 0.537Exaflops),将实现两天训练一次 GPT-3 模型的能力,比目前基于英伟达 GPU 打造的 Selene 超级计算机快 7 倍。
美国能源部下属的洛斯阿拉莫斯国家实验室也将在 2023 年推出一台基于 Grace 的超级计算机。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


Grace 可以说是英伟达在今年 GTC 上最引人关注的产品了,它高度特化的设计与通过 PCIe 链接的 x86 版 CPU-GPU 系统大为不同,进而可以实现更好的性能。
GPU+CPU+DPU,三管齐下
「简单说来,目前市场上每年交付的 3000 万台数据中心服务器中,有 1/3 用于运行软件定义的数据中心堆栈,其负载的增长速度远远快于摩尔定律。除非我们找到加速的办法,否则用于运行应用的算力将会越来越少,」黄仁勋说道。「新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具。」
除了造 CPU 的大新闻以外,英伟达还在一个半小时的 Keynote 里陆续发布了大量重要软硬件产品,覆盖了 AI、汽车、机器人、5G、实时图形、云端协作和数据中心等领域的最新进展。英伟达的技术,为我们描绘出了一幅令人神往的未来愿景。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


  • 首先是用于训练 Transformers 的框架—— NVIDIA Megatron。Transformers 已帮助开发者在自然语言处理领域取得了突破性进展。

  • 面向医药领域,英伟达发布了一些用于计算药物研发加速库 Clara Discovery 的新模型,并介绍了一个基于物理学和机器学习的顶尖药物研发与材料科学计算平台 Schrodinger。

  • 在量子计算领域中,英伟达发布了量子计算模拟环境 cuQUANTUM,其有助于加快有赖于量子位(或量子比特,能作为单个的 0 或 1 存在,也可以同时作为二者存在)的量子计算研究,为量子电路模拟器提供加速,从而助力研究人员设计出更完善的量子计算机。

  • 为了保障现代化数据中心的安全,英伟达发布了 Morpheus 数据中心安全平台,其基于 NVIDIA AI、NVIDIA BlueField、Net-Q 网络遥测软件和 EGX 而构建,能够对完整的数据包进行实时检测。

  • 为加快对话式 AI 的发展,英伟达发布了对话人工智能——NVIDIA Jarvis 的新版本,其能够实现语音识别、语言理解、翻译和表达性语音,同时也支持了更多种类的语言。

  • 推荐系统是用于搜索、广告、在线购物、音乐、书籍、电影、用户生成内容和新闻等领域的引擎,为加快推荐系统的速度,黄仁勋宣布 NVIDIA Merlin 现可通过 NGC(NVIDIA 的深度学习框架容器目录)获取。

  • 为帮助客户将自身专业知识应用于 AI 领域,同时保护数据隐私,英伟达发布了 NVIDIA TAO,其可以运用客户和合作伙伴的数据,对 NVIDIA 预训练模型进行微调和适配。

  • 推理服务器 NVIDIA Triton,它可以从进入客户 EGX 服务器或云实例的连续数据流中获取洞察。黄仁勋说:「这包括任何在 cuDNN 上运行的 AI 模型,也就是几乎所有的 AI ,包括来自 TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT 或自定义 C++/python 后台等的任何框架。」

  • 黄仁勋发布了 BlueField-3 DPU,其将为构建超大规模数据中心、工作站和超级计算机所需的基础设施提供进一步的加速。这款新一代数据处理器将提供最强大的软件定义网络、存储和网络安全加速功能。据介绍,一个 BlueField-2 能够实现相当于 30 块 CPU 核的工作负载,而 BlueField-3 在此基础上又实现了 10 倍的性能飞跃,能够替代 300 个 CPU 核,以 400Gbps 的速率,对网络流量进行保护、卸载和加速。


黄仁勋表示,英伟达全新的数据中心路线图已包括 CPU、GPU 和 DPU 三类芯片,而 Grace 和 BlueField 是其中必不可少的关键组成部分。投身 Arm 架构的 CPU,并不意味着英伟达会放弃原有的 x86、Power 等架构,黄仁勋将英伟达重新定义为「三芯片」公司,覆盖 CPU、GPU 和 DPU。
对于未来的发展节奏,黄仁勋表示:「我们的发展将覆盖三个产品线——CPU、GPU 和 DPU,以每两年一次更新的节奏进行,第一年更新 x86,第二年就更新 Arm。」

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


最后是自动驾驶。「对于汽车而言,更高的算力意味着更加智能化,开发者们也能让产品更快迭代。TOPS 就是新的马力,」黄仁勋说道。
英伟达将于 2022 年投产的 NVIDIA 自动驾驶汽车计算系统级芯片——NVIDIA DRIVE Orin,旨在成为覆盖自动驾驶和智能车机的汽车中央电脑。搭载 Orin 的量产车现在还没法买到,但英伟达已经在为下一代,超过 L5 驾驶能力的计算系统作出计划了。
Atlan 是这家公司为汽车行业设计的下一代 SoC,其将采用 Grace 下一代 CPU 和下一代安培架构 GPU,同时也集成数据处理单元 (DPU)。如此一来,Atlan 可以达到每秒超过 1000 万亿次(TOPS)运算次数。如果一切顺利的话,2025 年新生产的车型将会搭载 Atlan 芯片。
与此同时,英伟达还展示了 Hyperion 8 自动驾驶汽车平台,业内算力最强的自动驾驶汽车模板——搭载了 3 套 Orin 中心计算机。
不知这些更强的芯片和系统,能否应付未来几年里人们对于算力无穷无尽的需求。在 GTC 2021 上,英伟达对于深度学习模型的指数增长图又更新了。「三年间,大规模预训练模型的参数量增加了 3000 倍。我们估计在 2023 年会出现 100 万亿参数的模型。」黄仁勋说道。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


英伟达今天发布的一系列产品,让这家公司在几乎所有行业和领域都能为你提供最强大的机器学习算力。在黄仁勋的 Keynote 发表时,这家公司的股票一度突破了 600 美元大关。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


「20 年前,这一切都只是科幻小说的情节;10 年前,它们只是梦想;今天,我们正在实现这些愿景。
英伟达每年在 GTC 大会上发布的新产品,已经成为了行业发展的风向。不知在 Grace 推出之后,未来我们的服务器和电脑是否会快速进入 Arm 时代。

亚马逊云科技线上黑客松2021


这是一场志同道合的磨练,这是一场高手云集的组团竞技。秀脑洞、玩创意,3月26日至5月31日,实战的舞台为你开启,「亚马逊云科技线上黑客松2021」等你来战!

为了鼓励开发者的参与和创新,本次大赛为参赛者准备了丰厚的奖品,在一、二、三等奖之外,还特设prActIcal奖、creAtIve奖、锦鲤极客奖、阳光普照奖,成功提交作品的团队均可获赠奖品。

识别二维码,立即报名参赛。


英伟达CPU问世:ARM架构,对比x86实现十倍性能提升

©THE END

转载请联系本公众号获得授权

投稿或寻求报道:[email protected]

上一篇:华为为何不造车?徐直军回应华为云变局,今年目标还是活着
下一篇:SASE与零信任一个都不能少

相关推荐

英伟达发布史上最强自动驾驶芯片!单颗算力1000TOPS

5 车东西

一颗芯片的算力直接抵上一台L4无人车。作者|James编辑|晓寒车东西4月13日消息,北京时间昨晚11:30,英伟达正式拉开GTC2021大幕,英伟达创始人、CEO黄仁勋线上直播发表演讲,并发布了自动驾驶、AI领域的一系列重磅新品。此次直播还是在老黄家的厨房进行,他还穿着相同的皮衣。老黄头发花白,长发及肩,仍是十分潇洒。▲黄仁勋演讲现场在自动驾驶领域,老黄发

当云计算飞向深空

当云计算飞向深空

1180 硅谷洞察

热点追踪/深度探讨/实地探访/商务合作我们多次说起过,当下的“上云”浪潮,源自无数来自于扎实产业土地的真实需求:工厂需要AI,机器人需要算力,城市需要智慧,流媒体需要高清低时延的体验……照此逻辑,有着大量数据传输、智能计算、AI应用需求的空间站及太空产业,自然也应该是头部云厂商的必争之地。不过放眼整个云市场,真正将业务开展到了云层之上的,只有亚马逊、微软及谷

华为裁撤云与计算BG,意欲何为?

华为裁撤云与计算BG,意欲何为?

1594 飞象网

今日议题:华为云如此频繁的调整,意味着什么?继1月27日,华为云业务做出重大人事调整,任命余承东为Cloud&AIBG总裁(兼)、Cloud&AIBG行政管理团队主任之后,不到三个月的时间,华为云又迎来了新一轮的大变动。4月2日,有消息称,华为内部发文宣布组织架构调整,任命张平安为CloudBU总裁,撤销四大事业部之一的云与计算BG(Clou

宣布自研芯片后,字节跳动开始布局量子计算?

宣布自研芯片后,字节跳动开始布局量子计算?

139 中国电子报

最近有消息爆出字节跳动正布局量子计算,记者进入字节跳动官网查询,其社会招聘与校园招聘显示正在招收“量子计算方向研究员”“量子计算方向实习生”。上周,字节跳动被爆出正考虑在纽约或香港上市(IPO)。此前,字节跳动宣布已经聘请了小米前高管周受资担任首席财务官(CFO),周受资离职前任小米高级副总裁,负责国际业务并操刀了小米的IPO,此举被认为是字节跳动在为IPO

Arm 十年重磅发布 v9 架构,不受 EAR 约束,未来将覆盖 3000 亿颗芯片

Arm 十年重磅发布 v9 架构,不受 EAR 约束,未来将覆盖 3000 亿颗芯片

914 科技杂谈

【摘要】十年磨一剑。|科|技|杂|谈|中国通信行业第一自媒体本文作者:Carol本文来源:CSDN(ID:CSDNnews)杂谈投稿邮箱:[email protected]月31日,ARM发布了全新CPU架构ARMv9,这是ARM自2011年10月推出Armv8架构后,10年来首次对CPU架构的进行重大调整与变革。这个新的架构给平台带来了很多重大的变化,AR

本源量子与晶合集成共建量子计算芯片联合实验室

361 上海证券报

  邓向阳等出席签约仪式  4月2日,合肥本源量子计算科技有限责任公司和合肥晶合集成电路股份有限公司共建量子计算芯片联合实验室签约仪式在合肥举行。安徽省领导邓向阳、张红文出席签约仪式。  量子科技是新一轮科技革命和产业变革的前沿领域。省委、省政府高度重视量子科技产业发展,“十四五”将加快建设量子科技创新成果策源地和产业发展集聚区,形成

可供货华为!ARM 十年来首次发布最新架构 Armv9

可供货华为!ARM 十年来首次发布最新架构 Armv9

772 CSDN

整理|Carol出品|CSDN(ID:CSDNnews)3月31日,ARM发布了全新CPU架构ARMv9,这是ARM自2011年10月推出Armv8架构后,10年来首次对CPU架构的进行重大调整与变革。这个新的架构给平台带来了很多重大的变化,ARM表示,Armv9有两个核心侧重点:人工智能和安全,且将会装备在未来3000亿颗ARM芯片中。预计现有的发展速度,

买通员工卸磨杀驴,寰擎信息DM盗用素镜科技模型被立案侦查,创始人杨阳被刑拘

买通员工卸磨杀驴,寰擎信息DM盗用素镜科技模型被立案侦查,创始人杨阳被刑拘

1252 互联网金融电讯

蓝鲸财经旗下,专注互联网金融领域独家报道,大大集团、中晋、快鹿、链家金融、海通布局互金等独家线索均已10万+并引起大量媒体跟进。蓝鲸是重要财经资讯门户+财经记者工作平台,拥有150家媒体传播资源,每天有近万名记者在蓝鲸平台工作。近日,蓝鲸财经获悉,上海寰擎信息科技有限公司(下称“寰擎信息”)被公安机关立案侦查,创始人杨阳被依法刑事拘留,主要原因是买通上海素镜

宋丹丹:“我提的离婚,因为我出轨了,我当时太孤单”
私房话

宋丹丹:“我提的离婚,因为我出轨了,我当时太孤单”

1276 父母堂

最近宋丹丹参加《奇葩说7》,对于好几个辩题贡献了自己的见解。节目中,她回忆初恋,家庭,育儿往事。说起第一段婚姻是为了忘掉初恋,恋爱3个月就结婚了。坦诚得李诞都直呼:“经纪人要不要拦一下?”宋丹丹一向“敢言”。早些年她接受媒体采访时坦言自己离婚是有婚外情,舆论哗然。17年前的宋丹丹自传中,她就提起过这段始末。那时候我偶然地认识了一个人,迅速堕入"情网"。10年

被虐待的柴犬宝宝在哪里?志愿者独家回应…
萌宠

被虐待的柴犬宝宝在哪里?志愿者独家回应…

76 广视新闻

最近一段“理发店一男子手持铁钳拔柴犬牙齿”的视频,在网上引发高度关注。涉事男子随后被人肉搜索,理发店还一度被人淋红油。(点击图片回顾报道↓)警方:已介入调查广东省广州市公安局指挥中心今天(3月29日)表示,已注意到相关事情,海珠分局已介入调查,正在处理。涉事门店已暂停营业今天上午,记者来到涉事门店,发现门店已暂停营业,并有警察看守。记者询问周边商铺店主,对方

我追踪了1万例婚姻,发现男人最喜欢的老婆,不是小鸟依人型,也不是貌美如花型,而是……
私房话

我追踪了1万例婚姻,发现男人最喜欢的老婆,不是小鸟依人型,也不是貌美如花型,而是……

1059 情商夜读

(片尾曲:陶喆—爱我还是他)来源:倾我们所能去生活,ID:wanqingdepingtai昨天晚上,我带着小伙伴在上海做完团建后已经晚上9点多了,大家一起去大排档吃宵夜。虽然团建了一天很累,有的脚都已经走得跛了,但精神都很好,我们点了一堆龙虾烧烤等等,边吃边聊。除了聊工作,我们也聊生活和感情,不知道是谁起的话头:结婚后,一定要有自己的收入,你有没有收入,男人

国产手机厂商「硬核联盟」的铁幕摇摇欲坠 | 焦点分析
游戏

国产手机厂商「硬核联盟」的铁幕摇摇欲坠 | 焦点分析

1783 36氪

华为腾讯相争,利好TapTap。文|王毓婵封面来源|ICphoto2021开年第一个交易日,即便是一些游戏行业开发者也没注意到,在香港上市的心动公司股价直线上升,1月4日收盘报价58.3港元,涨幅24.44%,创历史新高。与《万国觉醒》开发商莉莉丝、《原神》开发商米哈游、《明日方舟》开发商鹰角网络等新兴游戏公司不同的是,除了自研游戏之外,心动拥有一张更有价值

两款Steam游戏免费领!《真三8》跳票!美末2将有大消息!《生化9》曝正在开发!
游戏

两款Steam游戏免费领!《真三8》跳票!美末2将有大消息!《生化9》曝正在开发!

270 Steam社区

导读1、这两款Steam游戏从收费转为免费!可免费永久入库!2、《最后生还者2》总监尼尔:马上大消息要公布3、爆料:《生化危机9》已在开发短时间内不会公开4、人大代表建议制定游戏分级制度禁止明星代言网游5、《NBA2K21》将加入XGP《巫师3》3月15日将离开阵容6、《真·三国无双8帝国》跳票!《生化危机8》游戏细节本作将鼓励玩家探索地图!01、这两款St

带狗回家过年?二哈把主人气哭,年度大戏又上演了
萌宠

带狗回家过年?二哈把主人气哭,年度大戏又上演了

1136 哈士奇搞笑视频

有些在外工作的铲屎官,收入有限,并没有买小汽车。出入的主要交通还是摩托车,虽说载不了多少人,但拉上自家的小狗还是没问题的。二哈:呀终于可以回老家了那里有母鸡、鸭子、大鹅,还有猪、羊、牛!美滋滋...带狗回到老家后,首先要面对父母,有些宠主连狗带人被父母赶出去。网友家的水牛总是去挑衅水牛!结果被绑在了路边。水牛:刚才你不是很威风?狗狗内心都住着一头小猪,它们最

拉布拉多犬在医院门口逗留,背影让人超揪心,得知真相令人感到!
萌宠

拉布拉多犬在医院门口逗留,背影让人超揪心,得知真相令人感到!

302 我和宠物的日常

网友TomokoOda分享,在一间医院外有只拉布拉多犬站在门口不停地走来走去,却不会随意闯入院内,背影让人超揪心!TomokoOda询问医护人员后,才得知这只毛孩并不是浪浪,而是陪伴主人一起来看诊的,洋葱真相感动一票网友。拉布拉多在医院外等主人看诊。透过画面可以看见,拉布拉多绕过人群走到门口前,时不时探头往医院内查看,似乎在寻找主人的身影,全程不吵也不闹,看

4年发行40余款产品,极光计划坚定创新品类发行赛道
游戏

4年发行40余款产品,极光计划坚定创新品类发行赛道

1514 GameRes游资网

今年腾讯游戏年度发布会以“超级数字场景”为主题,通过60余款游戏产品内容传递了腾讯对游戏认知、产业边界的建设性思考。其中,极光计划为玩家带来5款创新而独特的全新手游:像素风格roguelike手游《无序次元》、治愈系庭箱装扮手游《精灵之境》、赛博朋克题材探索解谜游戏《修普诺斯》、同名小说改编的民国谍战题材文字剧情类游戏《谍:惊蛰》以及刚刚在5.20上线的以A

天美隐藏福利,白嫖528皮肤优惠券!又一款传说皮肤优化即将爆料!
游戏

天美隐藏福利,白嫖528皮肤优惠券!又一款传说皮肤优化即将爆料!

1180 电竞怪客

hello大家好,这里是怪客君~今年自打元旦以来,王者荣耀已经出了将近去年一半数量的皮肤了,虽说数字可能有点夸张的成分,但确实今年王者出皮肤的速度有点太快了,而且动不动就是史诗传说品质,想必大家的钱包也已经快吃不消了。所以怪客今天给大家带来了一个白嫖皮肤优惠券的方法,通过这个方法最多可以获得528点券的优惠券,有没有很心动?那下面就一起看看到底是怎么个白嫖法