文/VR陀螺 万里
今日,英伟达CEO黄仁勋结束了他在GTC 2023的Keynote演讲。本次主题演讲并没有像传言一样会发布消费级显卡RTX 4070,取而代之,里面涉及了AI、元宇宙、新的计算平台等内容,而AI又是其中最为核心的部分。
反映在演讲时长上,黄仁勋对于AI内容的介绍接近一小时,占比达到4/5。而他在演讲中,更是重申了三遍:AI的“iPhone 时刻” 已经到来。
加速计算打破摩尔定律,英伟达发布AI云服务
本次主题演讲并没有像以往一样设计大量高精度建模的过场动画,黄仁勋在开篇直接强调了AI的重要性:引导计算机发展数十年的摩尔定律已经迎来指数级增长的后期,如今在同样的成本和功耗的情况下,性能已经很难再有亮眼的突破。在这种情况下,以AI驱动的加速计算则是今后发展的未来。
而另一边,AI在各行各业已经开始发挥巨大的作用,如AI可应用于翻译、寻找新的治疗方案、天气预警、故事创作、图片转3D、数字人、编程、作曲等,AI已经深入了我们生活的方方面面。
本次主题演讲中,面向AI的内容主要包含以下三方面:加速库、计算中心解决方案、生成式AI SDK。
首先对于加速计算的核心加速库以及AI模型,英伟达更新了其中的100个,在演讲中重点提到了以下几个:
-
CFD求解器:适用于汽车、航空航天、电子行业等;
-
NVIDIA Quantum:适用于量子编程模型;
-
cuQuantum:电子电路仿真,IBM、谷歌、百度等企业的相关业务已经开始使用;
-
Spark-RAPIDS:加速云数据处理平台;
-
cu0pt:其进化算法和加速计算可用于解决业务实时调度、优化物流传输以及客户运营等领域;
-
CV-CUDA和VPF:分别用于计算机视觉和视频处理。黄仁勋提到,视频已经占据了80%的互联网流量,并且新的视频内容还在不断增长,借助加速库可以提高视频处理效率并且降低能源消耗;
-
cuLitho:计算光刻库,瞄准芯片制造,可将计算光刻加速40倍以上;
......
应用于基因组分析的加速库NVIDIA Parabricks,图源:英伟达
除了前面所提到的这些,英伟达还推出或更新了在医疗、云服务、基因测序等行业具有很大应用潜力的一系列加速库,这里不再一一列举。
硬件以及业务部分,黄仁勋介绍了适用于数据中心的CPU Grace Superchip、数据处理中心BlueField-3 DPU、AI超级计算机DGX H100以及DGX Cloud。
其中,Grace Superchip搭载两个Grace处理器,核心总数达到了144,带宽为1 TB/s。不过它的外观却很小巧,仅为5x8英寸。
在性能方面,英伟达称Grace的速度比最新一代采用x86架构的CPU的平均速度快1.3倍、数据处理快1.2倍,而整机功耗却能降低至原来的60%。目前Grace正在调试阶段。
图源:英伟达
BlueField-3于2021年发布,可为云计算平台提供加速服务,如今已经投入生产,并且已经被百度、京东等企业所采用。
对于DGX,黄仁勋透露已经有半数的《财富》100强企业安装使用了DGX AI超级计算机。而最新的DGX H100,它配备8个H100 GPU模组、并且配有用于支撑ChatGPT服务的Transformer引擎,目前该产品已经全面投入生产。
图源:英伟达
为了让更多初创型企业也能使用到AI服务,英伟达还发布了NVIDIA DGX Cloud,客户只需要借助浏览器接入,即可快速进行AI端到端开发和部署。
从ChatGPT的自然语言处理、到Debuild的语言部署Web应用、再到Insilico利用AI加速药物设计,我们可以看到越来越多生成式AI落地应用的例子。针对生成式AI,英伟达也相应推出了其生成式AI云服务NVIDIA AI Foundations。
图源:英伟达
其中,NVIDIA NeMo用于构建定制的自然语言生成模型,可实现类似于ChatGPT的体验;NVIDIA Picasso用于构建文本转图像、文本转视频或三维模型,此外这些构建的模型还可以导入到Omniverse以进行进一步的创作;NVIDIA BioNeMo则是面向药物研发的生成式AI模型。
NVIDIA Picasso演示,图源:英伟达
黄仁勋指出,AI 现在可以生成多种数据,从语音、文本、图像、视频和3D图形,到蛋白质和化学物质,不一而足。而设计一个云数据中心,来处理生成式AI是一项巨大挑战,因为我们无法仅凭一个加速器就能适应不同算法、模型、数据类型等多样性需求。
图源:英伟达
为此,黄仁勋再次梳理了其GPU加速器的产品线,其每种配置都能针对特定工作负载进行相关优化。
-
L4:针对AI视频工作负载,优化了视频解码和转码、视频内容审核等功能;
-
L40:针对Omniverse、 图形渲染以及文本转图像和文本转视频等生成式AI;
-
H100:适用于大型语言模型处理;
-
Grace Hopper:适合处理大型数据集,例如推荐系统和大型语言模型的AI数据库。
Omniverse连接应用更新,出现更多落地应用
相较于2021年、2022年的GTC大会而言,黄仁勋的Keynote演讲中,“元宇宙”的含量显然淡了许多。
不过,对于英伟达瞄准元宇宙赛道所推出的3D设计协作和仿真平台Omniverse而言,它已经取得了长足的发展进步。黄仁勋透露,目前已有近30万名创作者和设计师下载了Omniverse,并且出现了许多应用落地,如虚拟工厂以及汽车领域。
在真正的实体工厂建成之前,以数字方式整合工厂的所有机械设备,可有效减少各种因为订单变更、延期开工等意外情况导致的损失,虚拟工厂整合可以为全球工厂节省数亿美元。
如今亚马逊正在使用Omniverse配置和优化其自动仓库,其中NVIDIA Isaac Sim可用于创建逼真的具有真实物理效果的仿真模型;借助Omniverse Replicator,其机器人模型地图的标记检测成功率从88.6%提高到了98%。
宝马使用Omniverse规划了全球近30家工厂的运营,甚至抢先在匈牙利德布勒森工厂建成之前通过Omniverse提前构建了一个数字版工厂。借由数字孪生等技术,可有效提升管理以及协作效率。
基于Omniverse的虚拟工厂协作,图源:英伟达
演讲中透露的Omniverse更新并不多,除了前面所提到的AI生成工具NVIDIA Picasso外,它的Omniverse Connect库新增了对Bentley Systems LumenT、西门子系列应用(Teamcenter、NX、 Process Simulate)、Rockwell Automation Emulate 3D、FlexSim、Cesium、Blackshark.ai和Unity这一系列3D建模/工业设计应用的支持。
图源:英伟达
得益于生态连接的发展壮大,使得Omniverse的行业适用范围以及协作效率进一步提升,如通用汽车正在使用Alias、Siemens NX、Unreal、Maya和3ds Max将设计师、雕塑家和艺术家连接到一起。
针对Omniverse,英伟达已经发布了三款针对性产品:
-
新一代工作站:配备英伟达Adu RTX GPU和英特尔最新款CPU,三月份各大OEM厂商将发布; -
NVIDIA OVX服务器:由Ada RTX L40和BlueField-3组成; -
Omniverse Cloud:用户可通过浏览器实现对Omniverse核心功能的访问以及集成。
除此之外,黄仁勋还宣布将与微软展开更多相关合作,如把Omniverse Cloud服务托管到Azure、并且将Omniverse Cloud连接到Microsoft 365生产力套件。
6款专业显卡低调发布,最快本月出货
演讲以外,英伟达在其专业可视化以及元宇宙业务方面中也有多项重磅内容发布,比如一口气发布了6款专业显卡。Omniverse除Keynote所提到的信息外,还有一系列我们不容错过的亮点更新。
硬件方面,英伟达发布了6款面向专业消费者的新显卡:NVIDIA RTX 5000、RTX 4000、RTX 3500、RTX 3000、RTX 2000以及NVIDIA RTX 4000 SFF。其中前5款为笔记本显卡,最后一款为紧凑型桌面级显卡。
这六款新显卡均采用全新的Ada Lovelace架构,官网指出,新款笔记本显卡的性能与能效比上一代同类型产品提高了一倍。新显卡配备了英伟达最新的Max-Q、RTX等技术,可实现更好的能效和图形效果。这六款显卡均配备了采用Ada架构的最新技术,比如CUDA核、第三代RT Core、第四代RT Core、DLSS 3、更大的GPU显存以及更强的扩展现实能力。
笔记本显卡将于本月随着OEM厂商的产品一同推出,RTX 4000 SFF将于下个月开始销售。
图源:英伟达
Omniverse将迎来新一轮更新,进一步发力生成式AI
除主题演讲中提到的连接库外,Omniverse的更新还涉及以下两方面:
-
推出超过1000种新的SimReady 3D资产。SimReady是英伟达创建的一个能准确模拟物体的纹理、质量、材料等物理信息的高保真3D标准,它可有效简化AI和工业3D的工作流程; -
Omniverse Replicator。其合成数据生成能力已经被德勤和Synthesis AI等企业用于为客户提供合成数据生成服务以及训练创建生成数字人等领域。
图源:英伟达
不仅如此,Omniverse还将迎来下一个版本更新,它在用户体验、渲染、以及AI等方面还会有一系列重要更新推出。其中,Omniverse将提供对实时光线追踪以及次表面散射渲染的支持,简单来说就是可以模拟光线在真实环境中的反射、穿透、吸收等效果,可以打造更为真实逼真的3D模型。
此外,Omniverse还将进一步引入对生成式AI的支持,用户可以仅凭文本信息自动生成高质量的材料。这一特性在Omniverse的声音驱动面部表情的工具Audio2Face上面也有体现。
为了演示Omniverse的新特性, Adobe Substance 3D艺术和开发团队使用Omniverse USD Composer(以前称为 Create)合作创作了一个虚拟数字人形象。从视频可以看到,里面的虚拟角色视效逼真,并且皮肤呈现了真实的光线效果,而生成式AI,则提升了面部表情以及唇形同步的质量。
图源:英伟达
Omniverse开发平台副总裁Richard Kerris指出,短片背后反映的是计算机图形学所取得的巨大进步,放在5年前,它可能需要花费数天甚至数星期的时间进行渲染,而如今,数字孪生模型几乎可以呈现实时生成效果。
对于去年推出的用于交互式虚拟形象端到端开发的云原生微服务Omniverse Avatar Cloud Engine(ACE),如今它也迎来了一系列革新。
英伟达正在把众多AI能力集成到Omniverse ACE,如语音AI应用Riva、用于自然语言理解的NeMo服务、AI驱动动画工具Audio2Face以及Live Portrait等。此外,Omniverse ACE的最新功能改进还可以与Tokkio或者NVIDIA Maxine SDK工作流相结合,为网络会议以及客户服务部署更为高级的虚拟形象。
目前Omniverse ACE已经启动抢先体验计划,并已吸引了包括AT&T以及德勤在内的知名企业。据悉,目前AT&T正计划使用Omniverse ACE和Tokkio AI虚拟形象工作流来构建、定制和部署用于客户服务和员工服务台的虚拟助手;德勤已将包括Omniverse ACE在内的NVIDIA AI和NVIDIA Omniverse服务与平台加入其最新的混合云产品,该产品将被用于德勤AI计算中心。
Omniverse ACE驱动的萌版黄仁勋Toy Jensen,图源:网络
结语
面对目前AI与元宇宙的发展浪潮,黄仁勋表示,“全世界的大型公司正在竞相实现全方位的业务数字化,并把自己重塑成软件定义的技术公司。NVIDIA AI和Omniverse可大幅推动工业数字化的进程,我们通过构建在微软Azure中的NVIDIA Omniverse Cloud,为客户提供极其强大的综合能力。”
坚定押宝AI,相信英伟达在AI的“iPhone时刻”中将承担一个不可或缺的角色。
本文来自微信公众号“VR陀螺”作者:陀螺君(ID:vrtuoluo)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。