找回密码
 会员注册
查看: 1141|回复: 1

英伟达发布 ChatGPT 专用 GPU,推理速率提拔了 10 倍

[复制链接]

9

主题

1

回帖

30

积分

新手上路

积分
30
发表于 2023-3-23 01:25:37 | 显示全部楼层 |阅读模式
呆板之心报道
编辑:泽南、蛋酱
AI 的 iPhone 时候,要有一块好的芯片。
曾何几时,人工智能由于算力不敷进入了长达数十年的瓶颈,GPU 点燃了深度学习。在 ChatGPT 期间,AI 由于大模子再次面对算力不敷的题目,这一次英伟达另有办法吗?
3 月 22 日,GTC 大会正式召开,在刚刚举行的 Keynote 上,英伟达 CEO 黄仁勋搬出了为 ChatGPT 预备的芯片。
「加快盘算并非易事,2012 年,盘算机视觉模子 AlexNet 动用了 GeForce GTX 580,每秒可处置惩罚 262 PetaFLOPS。该模子引发了 AI 技能的爆炸,」黄仁勋说道。「十年之后,Transformer 出现了,GPT-3 动用了 323 ZettaFLOPS 的算力,是 AlexNet 的 100 万倍,创造了 ChatGPT 这个震动全天下的 AI。极新的盘算平台出现了,AI 的 iPhone 期间已经到临。」



AI 的繁荣推动英伟达股价在本年上涨了 77%,现在,英伟达的市值为 6400 亿美元,已是英特尔的近五倍。不外本日的发布告诉我们,英伟达的脚步还没有停。
为 AIGC 计划专用算力
天生式 AI(AIGC )的发展正在改变科技公司对于算力的需求,英伟达一次展示了四种针对 AI 使命的推理平台,它们都利用了同一的架构。



此中,NVIDIA L4 提供「比 CPU 高 120 倍的 AI 驱动视频性能,以及 99% 的能源服从」,可以用于视频流、编码息争码以及天生 AI 视频等工作;算力更强的 NVIDIA L40 则专门用于 2D/3D 图像天生。
针对算力需求巨大的 ChatGPT,英伟达发布了 NVIDIA H100 NVL,这是一种具有 94GB 内存和加快 Transformer Engine 的大语言模子(LLM)专用办理方案,配备了双 GPU NVLINK 的 PCIE H100 GPU。



「当前唯一可以现实处置惩罚 ChatGPT 的 GPU 是英伟达 HGX A100。与前者相比,如今一台搭载四对 H100 和双 NVLINK 的尺度服务器速率能快 10 倍,可以将大语言模子的处置惩罚本钱低落一个数目级,」黄仁勋说道。
末了另有 NVIDIA Grace Hopper for Recommendation Models,除了为保举使命优化之外,它还可以为图形神经网络和矢量数据库提供动力。
让芯片突破物理极限
当前,半导体的生产工艺已经迫近物理学所能到达的极限。2nm 制程之后,突破点又是什么?英伟达决定从芯片制造的最原始阶段 —— 光刻入手。
从根本上说,这是一个物理极限下的成像题目。在先辈制程下,芯片上的很多特性会小于打印过程中利用的光的波长,掩模的计划必须不停举行修改,这一步调称为光学相近校正。盘算光刻模仿了光通过原件与光刻胶相互作用时的举动,这些举动是根据麦克斯韦方程形貌的,这是芯片计划制造范畴中必要算力最多的使命。



黄仁勋在 GTC 上公布了一项名为 CuLitho 的新技能,用以加速半导体的计划和制造。该软件利用英伟达芯片来加快基于软件的芯片计划,并加快用于在芯片上打印该计划的光刻掩模的物理制造之间的步调。
CuLitho 在 GPU 上运行,其性能比现在的光刻技能进步了 40 倍,可以加快现在每年斲丧数百亿个 CPU 小时的大规模盘算工作负载。「造 H100 必要 89 块掩膜版,在 CPU 上运算时一块就得算两个星期,但假如用 H100 在 CuLitho 上运行就只必要 8 个小时,」黄仁勋说道。
这意味着 500 个英伟达 DGX H100 体系就可以或许替换 4 万个 CPU 体系的工作,并运行盘算光刻工艺的全部部门,资助淘汰电力需求和对情况的潜伏影响。
这一希望将使芯片的晶体管和电路比如今尺寸更小,同时加速了芯片的上市时间,并进步为推动制造过程而全天候运行的大规模数据中央的能源服从。
英伟达表现,它正在与 ASML、Synopsys 和台积电互助,将该技能推向市场。据先容,台积电将在 6 月开始预备该技能的试产。
「芯片行业是天下上险些全部其他行业的底子,」黄仁勋表现。「由于光刻技能已处于物理学的极限,通过 CuLitho 以及与我们的互助同伴台积电、ASML 和 Synopsys 的互助,晶圆厂可以或许进步产量,淘汰碳足迹,并为 2nm 及以后的发展奠基底子。」
首个 GPU 加快的量子盘算体系
在本日的运动中,英伟达还公布了一个利用 Quantum Machines 构建的新体系,该体系为从事高性能和低耽误量子经典盘算的研究职员提供了一种革命性的新架构。



作为环球首个 GPU 加快的量子盘算体系,NVIDIA DGX Quantum 将环球最强盛的加快盘算平台(由 NVIDIA Grace Hopper 超等芯片和 CUDA Quantum 开源编程模子实现)与环球最先辈的量子控制平台 OPX(由 Quantum Machines 提供)相联合。这种组合使研究职员可以或许创建空前强盛的应用,将量子盘算与最先辈的经典盘算相联合,实现校准、控制、量子纠错和混淆算法。
DGX Quantum 的焦点是一个由 PCIe 毗连到 Quantum Machines OPX + 的 NVIDIA Grace Hopper 体系,实现了 GPU 和量子处置惩罚单位(QPU)之间的亚微秒级耽误。
英伟达公司 HPC 和量子主管 Tim Costa 表现:「量子加快的超等盘算有大概重塑科学和工业,英伟达 DGX Quantum 将使研究职员可以或许突破量子 - 经典盘算的边界。」
对此,英伟达将高性能的 Hopper 架构 GPU 与该公司的新 Grace CPU 整合为「Grace Hopper」,为巨型 AI 和 HPC 应用提供了超强的动力。它为运行 TB 级数据的应用提供了高达 10 倍的性能,为量子 - 经典研究职员办理天下上最复杂的题目提供了更多动力。
DGX Quantum 还为开辟者配备了英伟达 CUDA Quantum,这是一个强盛的同一软件栈,如今已经开放了源代码了。CUDA Quantum 是一个混淆型量子 - 经典盘算平台,可以或许在一个体系中整合和编程 QPU、GPU 和 CPU。
每月 3.7 万美元,网页上练习本身的 ChatGPT
微软斥资数亿美元购买了数万块 A100 构建了 GPT 专用超算,你如今大概会想要租用 OpenAI 和微软练习 ChatGPT 和必应搜刮雷同的 GPU 来练习本身的大模子。
英伟达提出的 DGX Cloud 提供了专用的 NVIDIA DGX AI 超等盘算集群,搭配 NVIDIA AI 软件,该服务使每个企业都可以利用简朴的网络欣赏器访问 AI 超算,消除了获取、摆设和管理当地底子办法的复杂性。




据先容,每个 DGX Cloud 实例都具有八个 H100 或 A100 80GB Tensor Core GPU,每个节点共有 640GB GPU 内存。利用 NVIDIA Networking 构建的高性能、低耽误布局确保工作负载可以跨互结合统集群扩展,允很多个实例充当一个巨大的 GPU,以满意高级 AI 练习的性能要求。
如今,企业可以按月租用 DGX Cloud 集群,快速轻松地扩展大型多节点练习工作负载的开辟,而无需等候通常需求量很大的加快盘算资源。
而月租的代价,据黄仁勋先容,每个实例每月 36999 美元起。
「我们正处于人工智能的 iPhone 时候,」黄仁勋表现:「初创公司竞相打造出了颠覆性产物和贸易模式,而现有企业也在寻求回应。DGX Cloud 让客户可以或许即时访问环球规模的云中的 NVIDIA AI 超等盘算。」
为了资助企业欢迎天生式 AI 的海潮,英伟达同时公布了一系列云服务,让企业可以或许构建、改进定制的大型语言模子和天生式 AI 模子。
如今,人们可以利用 NVIDIA NeMo 语言服务和 NVIDIA Picasso 图像、视频和 3D 服务来构建专有的、特定范畴的天生式 AI 应用步伐,用于智能对话和客户支持、专业内容创建、数字模仿等。别的,英伟达还公布了 NVIDIA BioNeMo 生物学云服务的新模子。
「天生式 AI 是一种新型盘算机,可以用人类的天然语言举行编程。这种本领影响深远 —— 每个人都可以下令盘算机来办理题目,而此前不久,这照旧步伐员们的专利,」黄仁勋说道。
从本日的发布内容看来,英伟达不但正在针对科技公司的 AI 负载不停改进硬件计划,也在提出新的贸易模式。在一些人看来,英伟达是想做「AI 范畴的台积电」:像晶圆厂一样提供先辈生产力代工服务,资助其他公司在其之上练习各自特定场景的 AI 算法。
用英伟达的超算练习,直接省去中心商赚差价,会是将来 AI 发展的方向吗?
探寻隐私盘算最新行业技能,「首届隐语开源社区开放日」报名起程
春暖花开之际,诚邀广大技能开辟者 & 财产用户相聚运动现场,体验数智期间的隐私盘算生态建立之旅,一站构建隐私盘算财产体系知识:
隐私盘算范畴核心之性
分布式盘算体系的短板与升级计谋
隐私盘算跨平台互联互通
隐语开源框架金融行业实战履历
3 月 29 日,北京 · 798 机会空间,隐语开源社区开放日,等待线下面基。
点击阅读原文,立刻报名。
THE END
转载请接洽本公众号得到授权
投稿或寻求报道:content@jiqizhixin.com
回复

使用道具 举报

5

主题

4

回帖

31

积分

新手上路

积分
31
发表于 2023-3-23 01:40:34 | 显示全部楼层
惋惜这么好的芯片与中国无缘
回复

使用道具 举报

QQ|手机版|心飞设计-版权所有:微度网络信息技术服务中心 ( 鲁ICP备17032091号-12 )|网站地图

GMT+8, 2024-12-28 08:35 , Processed in 0.914435 second(s), 28 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表