英伟达CPU问世:ARM架构,对比x86实现十倍性能提升

机器之心报道机器之心编辑部
收购 Arm 还没有定论,但英伟达的 Arm 架构 CPU 已经出现了。英特尔现在可能正感受到不一样的压力。

「只需一张 GeForce 显卡,每个学生都可以拥有一台超级计算机,这正是 Alex Krizhevsky、Ilya 和 Hinton 当年训练 AI 模型 AlexNet 的方式。通过搭载在超级计算机中的 GPU,我们现在能让科学家们在 youxian 的一生之中追逐无尽的科学事业,」英伟达创始人兼首席执行官黄仁勋说道。
4 月 12 日晚,英伟达 GTC 2021 大会在线上开始了。或许是因为长期远程办公不用出门,人们惊讶地看到在自家厨房讲 Keynote 的黄老板居然留了一头摇滚范的长发:

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


如果你只是对他的黑色皮衣印象深刻,先对比一下 2019、2020 和 2021 的 GTC,老黄气质越来越摇滚。如此气质,黄仁勋今天推出的新产品肯定将会与众不同。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


「这是世界第一款为 terabyte 级别计算设计的 CPU,」在 GTC 大会上,黄仁勋祭出了英伟达的首款中央处理器 Grace,其面向超大型 AI 模型的和高性能计算。
英伟达也要做 CPU 了
Grace 使用相对能耗较低的 Arm 核心,但它又可以为训练超大 AI 模型的系统提供 10 倍左右的性能提升。英伟达表示,它是超过一万名工程人员历经几年的研发成果,旨在满足当前世界最先进应用程序的计算需求,其具备的计算性能和吞吐速率是以往任何架构所无法比拟的。
「结合 GPU 和 DPU,Grace 为我们提供了第三种基础计算能力,并具备重新定义数据中心架构,推进 AI 前进的能力,」黄仁勋说道。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


Grace 的名字来自于计算机科学家、世界最早一批的程序员,也是最早的女性程序员之一的格蕾丝 · 赫柏(Grace Hopper)。她创造了现代第一个编译器 A-0 系统,以及第一个高级商用计算机程序语言「COBOL」。计算机术语「Debug」(调试)便是她在受到从电脑中驱除蛾子的启发而开始使用的,于是她也被冠以「Debug 之母」的称号。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


英伟达的 Grace 芯片利用 Arm 架构的灵活性,是专为加速计算而设计的 CPU 和服务器架构,可用于训练具有超过 1 万亿参数的下一代深度学习预训练模型。在与英伟达的 GPU 结合使用时,整套系统可以提供相比当今基于 x86 CPU 的最新 NVIDIA DGX 快 10 倍的性能。
目前英伟达自家的 DGX,使用的是 AMD 7 纳米制程的 Rome 架构 CPU。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


据介绍,Grace 采用了更为先进的 5nm 制程,在内部通信能力上,它使用了英伟达第四代 NVIDIA NVLink,在 CPU 和 GPU 之间提供高达 900 GB/s 的双向带宽,相比之前的产品提升了八倍。Grace 还是第一个通过错误校正代码(ECC)等机制利用 LPDDR5x 内存系统提供服务器级可靠性的 CPU,同时提供 2 倍的内存带宽和高达 10 倍的能源效率。在架构上,它使用下一代 Arm Neoverse 内核,以高能效的设计提供高性能。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


基于这款 CPU 和仍未发布的下一代 GPU,瑞士国家超级计算中心、苏黎世联邦理工大学将构建一台名为「阿尔卑斯」的超级计算机,算力 20Exaflops(目前全球第一超算「富岳」的算力约为 0.537Exaflops),将实现两天训练一次 GPT-3 模型的能力,比目前基于英伟达 GPU 打造的 Selene 超级计算机快 7 倍。
美国能源部下属的洛斯阿拉莫斯国家实验室也将在 2023 年推出一台基于 Grace 的超级计算机。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


Grace 可以说是英伟达在今年 GTC 上最引人关注的产品了,它高度特化的设计与通过 PCIe 链接的 x86 版 CPU-GPU 系统大为不同,进而可以实现更好的性能。
GPU+CPU+DPU,三管齐下
「简单说来,目前市场上每年交付的 3000 万台数据中心服务器中,有 1/3 用于运行软件定义的数据中心堆栈,其负载的增长速度远远快于摩尔定律。除非我们找到加速的办法,否则用于运行应用的算力将会越来越少,」黄仁勋说道。「新时代的计算机需要新的芯片、新的系统架构、新的网络、新的软件和工具。」
除了造 CPU 的大新闻以外,英伟达还在一个半小时的 Keynote 里陆续发布了大量重要软硬件产品,覆盖了 AI、汽车、机器人、5G、实时图形、云端协作和数据中心等领域的最新进展。英伟达的技术,为我们描绘出了一幅令人神往的未来愿景。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


  • 首先是用于训练 Transformers 的框架—— NVIDIA Megatron。Transformers 已帮助开发者在自然语言处理领域取得了突破性进展。

  • 面向医药领域,英伟达发布了一些用于计算药物研发加速库 Clara Discovery 的新模型,并介绍了一个基于物理学和机器学习的顶尖药物研发与材料科学计算平台 Schrodinger。

  • 在量子计算领域中,英伟达发布了量子计算模拟环境 cuQUANTUM,其有助于加快有赖于量子位(或量子比特,能作为单个的 0 或 1 存在,也可以同时作为二者存在)的量子计算研究,为量子电路模拟器提供加速,从而助力研究人员设计出更完善的量子计算机。

  • 为了保障现代化数据中心的安全,英伟达发布了 Morpheus 数据中心安全平台,其基于 NVIDIA AI、NVIDIA BlueField、Net-Q 网络遥测软件和 EGX 而构建,能够对完整的数据包进行实时检测。

  • 为加快对话式 AI 的发展,英伟达发布了对话人工智能——NVIDIA Jarvis 的新版本,其能够实现语音识别、语言理解、翻译和表达性语音,同时也支持了更多种类的语言。

  • 推荐系统是用于搜索、广告、在线购物、音乐、书籍、电影、用户生成内容和新闻等领域的引擎,为加快推荐系统的速度,黄仁勋宣布 NVIDIA Merlin 现可通过 NGC(NVIDIA 的深度学习框架容器目录)获取。

  • 为帮助客户将自身专业知识应用于 AI 领域,同时保护数据隐私,英伟达发布了 NVIDIA TAO,其可以运用客户和合作伙伴的数据,对 NVIDIA 预训练模型进行微调和适配。

  • 推理服务器 NVIDIA Triton,它可以从进入客户 EGX 服务器或云实例的连续数据流中获取洞察。黄仁勋说:「这包括任何在 cuDNN 上运行的 AI 模型,也就是几乎所有的 AI ,包括来自 TensorFlow、Pytorch、ONNX、OpenVINO、TensorRT 或自定义 C++/python 后台等的任何框架。」

  • 黄仁勋发布了 BlueField-3 DPU,其将为构建超大规模数据中心、工作站和超级计算机所需的基础设施提供进一步的加速。这款新一代数据处理器将提供最强大的软件定义网络、存储和网络安全加速功能。据介绍,一个 BlueField-2 能够实现相当于 30 块 CPU 核的工作负载,而 BlueField-3 在此基础上又实现了 10 倍的性能飞跃,能够替代 300 个 CPU 核,以 400Gbps 的速率,对网络流量进行保护、卸载和加速。


黄仁勋表示,英伟达全新的数据中心路线图已包括 CPU、GPU 和 DPU 三类芯片,而 Grace 和 BlueField 是其中必不可少的关键组成部分。投身 Arm 架构的 CPU,并不意味着英伟达会放弃原有的 x86、Power 等架构,黄仁勋将英伟达重新定义为「三芯片」公司,覆盖 CPU、GPU 和 DPU。
对于未来的发展节奏,黄仁勋表示:「我们的发展将覆盖三个产品线——CPU、GPU 和 DPU,以每两年一次更新的节奏进行,第一年更新 x86,第二年就更新 Arm。」

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


最后是自动驾驶。「对于汽车而言,更高的算力意味着更加智能化,开发者们也能让产品更快迭代。TOPS 就是新的马力,」黄仁勋说道。
英伟达将于 2022 年投产的 NVIDIA 自动驾驶汽车计算系统级芯片——NVIDIA DRIVE Orin,旨在成为覆盖自动驾驶和智能车机的汽车中央电脑。搭载 Orin 的量产车现在还没法买到,但英伟达已经在为下一代,超过 L5 驾驶能力的计算系统作出计划了。
Atlan 是这家公司为汽车行业设计的下一代 SoC,其将采用 Grace 下一代 CPU 和下一代安培架构 GPU,同时也集成数据处理单元 (DPU)。如此一来,Atlan 可以达到每秒超过 1000 万亿次(TOPS)运算次数。如果一切顺利的话,2025 年新生产的车型将会搭载 Atlan 芯片。
与此同时,英伟达还展示了 Hyperion 8 自动驾驶汽车平台,业内算力最强的自动驾驶汽车模板——搭载了 3 套 Orin 中心计算机。
不知这些更强的芯片和系统,能否应付未来几年里人们对于算力无穷无尽的需求。在 GTC 2021 上,英伟达对于深度学习模型的指数增长图又更新了。「三年间,大规模预训练模型的参数量增加了 3000 倍。我们估计在 2023 年会出现 100 万亿参数的模型。」黄仁勋说道。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


英伟达今天发布的一系列产品,让这家公司在几乎所有行业和领域都能为你提供最强大的机器学习算力。在黄仁勋的 Keynote 发表时,这家公司的股票一度突破了 600 美元大关。

英伟达CPU问世:ARM架构,对比x86实现十倍性能提升


「20 年前,这一切都只是科幻小说的情节;10 年前,它们只是梦想;今天,我们正在实现这些愿景。
英伟达每年在 GTC 大会上发布的新产品,已经成为了行业发展的风向。不知在 Grace 推出之后,未来我们的服务器和电脑是否会快速进入 Arm 时代。

亚马逊云科技线上黑客松2021


这是一场志同道合的磨练,这是一场高手云集的组团竞技。秀脑洞、玩创意,3月26日至5月31日,实战的舞台为你开启,「亚马逊云科技线上黑客松2021」等你来战!

为了鼓励开发者的参与和创新,本次大赛为参赛者准备了丰厚的奖品,在一、二、三等奖之外,还特设prActIcal奖、creAtIve奖、锦鲤极客奖、阳光普照奖,成功提交作品的团队均可获赠奖品。

识别二维码,立即报名参赛。


英伟达CPU问世:ARM架构,对比x86实现十倍性能提升

©THE END

转载请联系本公众号获得授权

投稿或寻求报道:content@jiqizhixin.com

上一篇:华为为何不造车?徐直军回应华为云变局,今年目标还是活着
下一篇:SASE与零信任一个都不能少

相关推荐

英伟达发布史上最强自动驾驶芯片!单颗算力1000TOPS

5 车东西

一颗芯片的算力直接抵上一台L4无人车。作者|James编辑|晓寒车东西4月13日消息,北京时间昨晚11:30,英伟达正式拉开GTC2021大幕,英伟达创始人、CEO黄仁勋线上直播发表演讲,并发布了自动驾驶、AI领域的一系列重磅新品。此次直播还是在老黄家的厨房进行,他还穿着相同的皮衣。老黄头发花白,长发及肩,仍是十分潇洒。▲黄仁勋演讲现场在自动驾驶领域,老黄发

当云计算飞向深空

当云计算飞向深空

1180 硅谷洞察

热点追踪/深度探讨/实地探访/商务合作我们多次说起过,当下的“上云”浪潮,源自无数来自于扎实产业土地的真实需求:工厂需要AI,机器人需要算力,城市需要智慧,流媒体需要高清低时延的体验……照此逻辑,有着大量数据传输、智能计算、AI应用需求的空间站及太空产业,自然也应该是头部云厂商的必争之地。不过放眼整个云市场,真正将业务开展到了云层之上的,只有亚马逊、微软及谷

华为裁撤云与计算BG,意欲何为?

华为裁撤云与计算BG,意欲何为?

1594 飞象网

今日议题:华为云如此频繁的调整,意味着什么?继1月27日,华为云业务做出重大人事调整,任命余承东为Cloud&AIBG总裁(兼)、Cloud&AIBG行政管理团队主任之后,不到三个月的时间,华为云又迎来了新一轮的大变动。4月2日,有消息称,华为内部发文宣布组织架构调整,任命张平安为CloudBU总裁,撤销四大事业部之一的云与计算BG(Clou

宣布自研芯片后,字节跳动开始布局量子计算?

宣布自研芯片后,字节跳动开始布局量子计算?

139 中国电子报

最近有消息爆出字节跳动正布局量子计算,记者进入字节跳动官网查询,其社会招聘与校园招聘显示正在招收“量子计算方向研究员”“量子计算方向实习生”。上周,字节跳动被爆出正考虑在纽约或香港上市(IPO)。此前,字节跳动宣布已经聘请了小米前高管周受资担任首席财务官(CFO),周受资离职前任小米高级副总裁,负责国际业务并操刀了小米的IPO,此举被认为是字节跳动在为IPO

Arm 十年重磅发布 v9 架构,不受 EAR 约束,未来将覆盖 3000 亿颗芯片

Arm 十年重磅发布 v9 架构,不受 EAR 约束,未来将覆盖 3000 亿颗芯片

914 科技杂谈

【摘要】十年磨一剑。|科|技|杂|谈|中国通信行业第一自媒体本文作者:Carol本文来源:CSDN(ID:CSDNnews)杂谈投稿邮箱:631255063@qq.com3月31日,ARM发布了全新CPU架构ARMv9,这是ARM自2011年10月推出Armv8架构后,10年来首次对CPU架构的进行重大调整与变革。这个新的架构给平台带来了很多重大的变化,AR

本源量子与晶合集成共建量子计算芯片联合实验室

361 上海证券报

  邓向阳等出席签约仪式  4月2日,合肥本源量子计算科技有限责任公司和合肥晶合集成电路股份有限公司共建量子计算芯片联合实验室签约仪式在合肥举行。安徽省领导邓向阳、张红文出席签约仪式。  量子科技是新一轮科技革命和产业变革的前沿领域。省委、省政府高度重视量子科技产业发展,“十四五”将加快建设量子科技创新成果策源地和产业发展集聚区,形成

可供货华为!ARM 十年来首次发布最新架构 Armv9

可供货华为!ARM 十年来首次发布最新架构 Armv9

772 CSDN

整理|Carol出品|CSDN(ID:CSDNnews)3月31日,ARM发布了全新CPU架构ARMv9,这是ARM自2011年10月推出Armv8架构后,10年来首次对CPU架构的进行重大调整与变革。这个新的架构给平台带来了很多重大的变化,ARM表示,Armv9有两个核心侧重点:人工智能和安全,且将会装备在未来3000亿颗ARM芯片中。预计现有的发展速度,

买通员工卸磨杀驴,寰擎信息DM盗用素镜科技模型被立案侦查,创始人杨阳被刑拘

买通员工卸磨杀驴,寰擎信息DM盗用素镜科技模型被立案侦查,创始人杨阳被刑拘

1252 互联网金融电讯

蓝鲸财经旗下,专注互联网金融领域独家报道,大大集团、中晋、快鹿、链家金融、海通布局互金等独家线索均已10万+并引起大量媒体跟进。蓝鲸是重要财经资讯门户+财经记者工作平台,拥有150家媒体传播资源,每天有近万名记者在蓝鲸平台工作。近日,蓝鲸财经获悉,上海寰擎信息科技有限公司(下称“寰擎信息”)被公安机关立案侦查,创始人杨阳被依法刑事拘留,主要原因是买通上海素镜

私房话

“他最近抑郁了?原来只是出轨了。”|恋爱里的小丑竟是我自己。

324 曲玮玮

我发现了一个规律,女生总是喜欢在爱情里自我感动。为什么很多女孩明明被渣却不自知,还沉浸于自己编造的甜蜜爱情里?就是因为她们的脑补能力太强,有着莫名其妙的同情心,和异常强大的同理心。男朋友犯了某个错误,正在想道歉理由时,女生已非常懂事的为他找好了借口。然后自我感动到:“唉,我真是太善解人意了,他一定会更爱我的吧?”女生啊,有时候一个人就可以完成一场恋爱,她们就

私房话

真的,谈恋爱哪有杀老公好看

1019 八卦电影

大雨,深夜,一个男人跌跌撞撞走在街头。他不断摔倒在地上,身上带着血,满身都是泥污。他喃喃自语,见人就说——帮帮我,帮我杀了我妻子吧!不管你要多少钱,我都愿意!旁边的人觉得这就是个疯子,都不予以理会。看到没人理会,这个男人疯狂地大声喊,“救救我!怎么才能杀了我妻子.....”什么样的深仇大恨,让他做出这么变态的选择?《出轨的话就死定了》2020年开头出现的这个

私房话

我的2020年终总结,全在这些表情包里了

1511 每日豆瓣

我的工作我的思绪我的想法收到工资前的我收到工资后的我从前面对傻缺甲方的我现在面对傻缺甲方的我我的副业我的生活我的学习我的考试我的年度计划完成情况我的周末我的运动我的身材我的脸皮我的头发我的运气我的性格我的友情我的爱情我的技能我的心态我的假期从前和别人吵架的我现在和别人吵架的我我的饭量网购前的我网购后的我从前爸妈叫我相亲现在爸妈叫我相亲我向往的生活我真实的生活

私房话

不管夫妻还是情人,关系再好,也不要伸手要这三样东西!

1811 商界管理圈子

阅读本文前,请您先点击本文标题下面的蓝色字体“商界管理圈子”再点击“关注”,这样你就可以继续免费收到文章了,每天早上7:00准时分享,请放心关注.............................................在感情的世界里,伸手要和主动给,完全是两回事。如果一个人真的爱你,无需你开口,对方就会主动给你。倘若你开口提了,伸手要了,意义

私房话

人到中年,遇上灵魂伴侣,是劫不是缘

1451 阅世悦人

来源|精彩女人(ID:jcnv365)文|十七朵呀草在结他的种子,风在摇他的叶子,我们站着,不说话,就很美好。我们来这世上走一遭,如果能遇到一个心意相通,相知相爱的伴侣相守一生,是一件非常幸福的事。关于灵魂伴侣,每个人在单身的时候都曾有过美好的幻想。然而,有太多人误解了灵魂伴侣的真正含义。多少人得陇望蜀,缘木求鱼,到最后也没有好好珍惜已经得到的,却一辈子都对

私房话

“不结婚就死给你看!”30岁女子遭母亲逼婚,生完孩子后她母亲后悔了……丨天亮说早安

1733 湖北经视

朱军今年37岁,妻子刘艳30岁两人在今年年初奉子成婚刘艳怀胎十月剖腹产生下了女儿女儿现在已经三个多月了然而两人从相识到现在一年多的时间真正在一起生活的日子不过两个多月更不正常的是有了婚礼,有了孩子妻子却不愿领证不愿回两人的家妻子刘艳说举行婚礼前恰逢他的生日正好可以领取结婚证成为结婚纪念日可是朱军却提出日子要有父母决定拒绝了刘艳的提议之后又因诸多巧合一直拖到了

私房话

爸,你早就不爱我妈了吧?

1785 青年文摘

点击上方蓝字“青年文摘”右上角“...”点选“设为星标”添加★标不再错过推送每天8点12点20点不见不散~作者:关山月来源:凯叔讲故事ID:kaishujianggushi我一直相信一句话:教育永远是从生活中习得的。最好的教育,是父母相爱;最好的家庭,是不断成长。爸,你早就不爱我妈了吧?如果孩子问你,你怎么回答?当然爱啊,要不然怎么会有你。小孩子懂什么,一边

私房话

够了,别再劝我“降低标准”了。

287 一个人Alone

很多事情凑合一下就行了你都三十岁了要求别那么高学会降低标准才是聪明人的做法......可是降低标准不就等于否定过去的自己吗?够了别再劝我降低标准了我发现,新世纪的“离谱”就是,亲戚给你介绍的对象,别说你不喜欢了,你甚至会产生世纪迷思——“在他们眼里,我真的就只配这样了吗?”比如说,我月薪好几万的朋友,被介绍了一个工作稳定薪资稳定的月入三千的男人,还被说你是打

私房话

晚安 | 感情的最高境界就是守候彼此的孤独

1263 深夜谈吃

晚安|第一千七百六十八夜来自佚名▲长按图片,保存你的晚安音乐选歌:Sake推荐理由:听听歌,早点睡。睡前谈心「感情的最高境界就是守候彼此的孤独」▼这一年就快要过去了这两天在规划着跨年的事情时想起有一年我去迷笛的音乐节一边对深夜的稿子一边摇头晃脑一晃眼时代变得面目全非,我也成长了好多能跟我分享一下你们2020年的感受么最深刻的感悟或者最难忘的记忆都可以说多长都