/Meta与英伟达打造AI超级计算机RSC;App Lab应用数飙升至近850个

Meta与英伟达打造AI超级计算机RSC;App Lab应用数飙升至近850个


看日报是个好习惯。

 商汤科技为冬奥村打造了智慧 AR 导航应用 

陀螺科技 1 月 26 日讯,商汤科技发文称,它已为张家口冬奥村打造了一款创新的智慧 AR 导航应用,可为数千名即将入驻张家口冬奥村的运动员和工作人员,提供便捷的 AR 导航导览服务。
 
据称,用户可以通过手机进入专属 APP,打开摄像头识别周边实景,锁定自己的位置,输入目的地后,跟随地面上的 AR 虚拟箭头,即可直达接待中心、健身中心、居住区等目的地。
 
相较传统导航方式,AR 导航将路线标识与真实场景融为一体,拥有更加沉浸、直观的视觉体验,可以帮助运动员们大大节省时间,省却问路烦恼。在 AR 导航界面里虚实融合的数字世界,还有空中遨游跃动的北京冬奥会吉祥物冰墩墩,以及随处可见的各冬奥场所介绍大屏。

 

不仅如此,该应用无需独立 APP,仅借助 web 浏览器即可轻松体验,同时广泛支持搭载 iOS、Android 及鸿蒙操作系统等移动终端。

 

图源:商汤科技

 

商汤科技介绍显示,该应用基于 SenseMARS 火星混合现实平台,通过 GPS 与视觉融合的数据关联方法和参数分块优化方法,实现了大尺度场景下厘米级的三维地图构建和部署,商汤还研发了云端结合架构实现云端全局定位和终端局部跟踪的协同,解决了动态复杂场景下实现精准定位跟踪等难题。

 

全局定位综合利用视觉、蓝牙、GPS等信号解决相似场景的问题,并针对冰雪场景,训练了不同天气条件下鲁棒的图像特征;移动终端借助云端地图信息和自身传感器在 web 低算力的条件下实现了稳定的跟踪,最终在如此复杂场景下,实现了实时、精准的 6 自由度空间定位。

 Meta宣布全新构建的AI超级计算机RSC 

开发下一代高级人工智能需要功能更强大,每秒运算可达50亿次的计算机。

 

1月24日,Meta宣布已设计并构建了新的AI超级计算机AI Research SuperCluster (RSC),Meta称他们相信这是当今运行速度最快的AI超级计算机之一,待2022年年中完全建成后,RSC还会成为世界上最快的AI超级计算机。


据了解,Meta的研究人员已经开始使用RSC来训练用于研究自然语言处理(NLP)和计算机视觉的大型模型,其目标是计划在一天内训练具有数万亿参数的模型。

 

RSC将帮助Meta的AI研究人员构建可以从数万亿个示例中学习的AI模型,它能跨数百种不同语言工作,无缝分析文本、图像和视频,开发新的AR工具等等。

 

研究人员将能够训练开发先进人工智能比如计算机视觉、自然语言处理、语音识别等所需的最大模型。借助RSC构建全新的AI系统,该系统将能够做到比如为一群人提供实时语音翻译,让每个人都说不同的语言,这样便可以在研究项目上无缝协作或一起玩AR游戏。

 

最终,使用RSC完成的工作为构建下一代主要计算平台——元宇宙所需的技术铺平道路。人工智能驱动的应用程序和产品将会在元宇宙中扮演重要角色。

(图源:ai.facebook)

 

Meta对建立RSC的原因及相关细节进行了解释说明。

 

1、我们为何需要如此大模型的超级计算机?

 

自2013年创建Facebook AI Research lab以来,Meta一直致力于人工智能的长期投资。近年来,我们基于多个领域的领先地位,在人工智能领域取得了长足的进步,包括自我监督学习,算法可以从大量未标记的示例中进行学习并进行转换,以允许AI模型通过专注其输入的某些领域来进行更有效的推断。

 

(图源:ai.facebook)

 

为了充分实现自我监督学习与基于转换器的模型的功用,无论是视觉、语音、语言,还是其他重要用途比如识别有害内容等等,都会需要更大型、更复杂,以及适应性更强的模型。

 

例如计算机视觉需要以更高的数据采样率处理更大、更长的视频,语音识别需要即使在背景噪音大的挑战性场景(比如派对或音乐会)也能很好的工作,NLP也需要理解更多的语言、方言和口音。除此之外,RSC在其他领域比如机器人技术、具身AI、多模式AI等,都能帮助人们在现实世界中完成有价值的任务。

 

高性能计算基础设施是训练此类大型模型的关键组成部分,Meta 的 AI 研究团队多年来一直在构建这些高性能系统。我们于2017年设计出第一代的基础设施,单个集群中拥有 22,000 个 NVIDIA V100 Tensor Core GPU,每天执行 35,000 个训练作业。现在,该基础设施在性能、可靠性和生产力方面为 Meta 的研究人员设定了标准。

 

2020年初,我们决定采用最佳方式,也就是从头开始设计新的计算基础架构,以利用新的 GPU 和网络结构技术。我们希望这个基础设施能够在 1 艾字节(exabyte)大的数据集上训练具有超过一万亿个参数的模型——从规模上看,这相当于 36,000 年的高质量视频。

 

尽管高性能计算社区几十年来一直在处理规模问题,但我们还必须确保拥有所有必要的安全和隐私控制措施,以保护我们使用的任何训练数据。与我们之前仅利用开源和其他公开可用数据集的 AI 研究基础设施不同,RSC 还通过允许我们在模型训练中包含来自 Meta 生产系统的真实示例,帮助我们确保我们的研究有效地转化为实践。

 

能够帮助推进以及执行下游任务,例如识别我们平台上的有害内容以及具身AI、多模式人工智能,以及帮助改善应用的用户体验。我们相信这是第一次在如此大的规模下解决性能、可靠性、安全性和隐私问题。

2、RSC的引擎

 

AI超级计算机是通过将多个GPU组合成计算节点构建,再通过高性能网络结构连接这些计算节点,以实现这些GPU之间的快速通信。

 

(图源:ai.facebook)

现在,RSC 共有 760 个 NVIDIA DGX A100 系统作为其计算节点,总共有 6,080 个 GPU — 每个 A100 GPU 都比我们之前系统中使用的 V100 更强大。每个 DGX 通过没有超额订阅的 NVIDIA Quantum 1600 Gb/s InfiniBand 两级 Clos 结构进行通信。RSC 的存储层具有 175 PB 的 Pure Storage FlashArray、46 PB 的 Penguin Computing Altus 系统中的缓存存储和 10 PB 的 Pure Storage FlashBlade。

 

与 Meta 的传统生产和研究基础设施相比,RSC 的早期基准测试表明,它运行计算机视觉工作流程的速度高达 20 倍,运行 NVIDIA 集体通信库 (NCCL) 的速度超过 9 倍,训练大规模 NLP 模型则快三倍。这意味着一个拥有数百亿参数的模型可以在三周内完成训练,而之前是九周。

(图源:ai.facebook)

 

3、构建一个AI超计算机......

设计和构建 RSC 不仅仅是性能问题,而是需要使用当今最先进的技术实现尽可能大的性能。RSC 完成后,InfiniBand 网络结构将连接 16,000 个 GPU 作为端点,使其成为迄今为止部署的最大此类网络之一。此外,我们设计了一个缓存和存储系统,可以提供 16 TB/s 的训练数据,我们计划将其扩展到 1 EB。

 

所有这些基础设施都必须非常可靠,我们估计一些实验可能会运行数周并需要数千个 GPU。最后,使用 RSC 的整个体验必须对研究人员友好,以便我们的团队可以轻松探索各种 AI 模型。

 

之所以能实现这一目标,很大程度上要归功于与许多长期合作伙伴的合作,他们都在 2017 年帮助设计了我们的第一代 AI 基础设施。SGH 公司 Penguin Computing 是我们的架构和托管服务合作伙伴,与我们的硬件集成运营团队部署集群并帮助设置控制平面的主要部分。Pure Storage 为我们提供了强大且可扩展的存储解决方案。NVIDIA 为我们提供了其 AI 计算技术,包括尖端系统、GPU 和 InfiniBand 结构,以及用于集群的 NCCL 等软件堆栈组件。

 

4、大流行所带来的工作挑战

 

RSC在开发过程中也出现了意想不到的挑战——新冠状病毒大流行。RSC 最初是一个完全远程的项目,团队在大约一年半的时间里从一个简单的共享文档变成了一个正常运行的集群。COVID-19 和全行业的晶圆供应限制也带来了供应链问题,这使得从芯片到光学元件和 GPU 等组件,甚至是建筑材料的所有东西都难以获得——所有这些都必须按照新的安全协议进行运输。

 

(图源:ai.facebook)

为了有效地构建这个集群,我们必须从头开始设计,创建许多全新的特定于Meta的公约,并在此过程中重新考虑以前的公约。我们必须围绕我们的数据中心设计制定新规则——包括冷却、电源、机架布局、布线和网络(包括全新的控制平面),以及其他重要考虑因素。我们必须确保所有团队,从建筑到硬件,再到软件和人工智能,都在与我们的合作伙伴协调一致地工作。

 

除了核心系统本身之外,还需要一种强大的存储解决方案,一种可以从 EB 级存储系统提供 TB 带宽的解决方案。为了满足 AI 培训不断增长的带宽和容量需求,我们从头开始开发了一项存储服务 AI Research Store (AIRStore)。

 

为了针对 AI 模型进行优化,AIRStore 使用了一个新的数据准备阶段,该阶段对要用于训练的数据集进行预处理。一旦进行一次准备,准备好的数据集就可以用于多次训练运行,直到过期。AIRStore 还优化了数据传输,从而最大限度地减少 Meta 数据中心间主干上的跨区域流量。

 

5、如何保护 RSC 中的数据

为了构建让使用我们服务的人们受益于新 AI 模型——无论是检测有害内容还是创造新的 AR 体验——我们需要使用来自我们生产系统的真实数据来教授模型。

 

RSC 的设计从一开始就考虑到了隐私和安全性,因此 Meta 的研究人员可以使用加密的用户生成数据安全地训练模型,这些数据直到训练前才被解密。例如,RSC 与更大的互联网隔离,没有直接的入站或出站连接,流量只能从 Meta 的生产数据中心流出。

 

为了满足我们的隐私和安全要求,从我们的存储系统到 GPU 的整个数据路径都经过端到端加密,并拥有必要的工具和流程来验证是否始终满足这些要求。

 

在将数据导入 RSC 之前,它必须经过隐私审查流程以确认已正确匿名化。然后数据在可用于训练 AI 模型之前被加密,并定期删除解密密钥以确保旧数据仍然无法访问。由于数据仅在内存中的一个端点进行解密,因此即使在不太可能发生设施物理破坏的情况下,也可以对其进行保护。

 

6、二阶段之后

RSC 于1月24日已经启动并运行,但它的开发仍在进行中。一旦我们完成构建 RSC 的第二阶段,我们相信它将成为世界上最快的 AI 超级计算机,其混合精度计算性能接近 5 exaflops。到 2022 年,我们会努力将 GPU 的数量从 6,080 个增加到 16,000 个,这将使 AI 训练性能提高 2.5 倍以上。InfiniBand 结构将扩展为支持 16,000 个端口,采用两层拓扑结构,不会出现超额订阅。该存储系统将具有 16 TB/s 的目标交付带宽和 EB 级容量,以满足不断增长的需求。

 

我们期望计算能力的这种阶跃函数变化不仅使我们能够为我们现有的服务创建更准确的 AI 模型,而且还能够实现全新的用户体验,尤其是在元宇宙中。我们在自我监督学习和使用 RSC 构建下一代 AI 基础设施方面的长期投资正在帮助我们创建基础技术,这些技术将为元宇宙提供动力并推动更广泛的 AI 社区发展。

 Quest App Lab 的应用数量飙升至近 850 个,超Quest平台2倍 

Oculus为Quest推出了App Lab,允许开发者在头显上发布他们的游戏,而无需经过Oculus的审核过程。

 

根据App Lab DB追踪统计的提交情况,2021年初至2022年1月25日,Quest在App Lab上线了837个应用程序。在短短不到一年的时间里,App Lab上的应用数量已经超过了Quest主商店上的应用数量的两倍,Quest主商店经过两年半的运营,目前有341个应用。

 

这种差异表明,有更多的开发者希望进入主商店。迄今为止,只有少数几个应用程序已经从应用实验室成功上线Quest主商店。

 

图源:App Lab

 

App Lab应用程序在功能上在Quest主商店中是"未列出"(不可搜索)的,但会收到一个正常的商店页面,可以通过URL直接访问,登录后就可以点击安装,就像主商店中任何Quest应用程序一样。不同的是,Oculus会根据一些定性标准来选择哪些应用程序被纳入Quest主商店,而App Lab应用程序除了在技术上符合要求外,不需要满足任何特定的标准。

 

自2021年2月3日推出以来,Oculus平均每天批准2.7个应用程序到App Lab。考虑到Quest主商店推出以来的时间,意味着平均每天有0.34个应用程序被添加到商店。

 

图源:roadtovr

 

Oculus PC应用程序的数量约为1400个,Oculus Go应用程序为1150个,SteamVR应用程序约为5000个。虽然这些平台都已经存在多年,但它们都没有受到Oculus对头显主商店中的Quest应用所施加的那种监管。

 苹果新专利:未来HMD或配备光学音频传输系统,可瞬时提供音频反馈 

今天,美国专利商标局正式授予苹果公司一项专利,该专利涉及一种音频源设备,该设备在将音频数据作为空中光学信号传输到耳机,和将音频数据作为空中射频(RF)信号传输之间进行转换。这项授权专利中的措辞似乎与早前苹果公司声学副总裁Gary Geaves所描述的可能会出现在下一代AirPods Pro(或其他无线耳机)中的内容相吻合。

 

该专利还说明,该技术可用于苹果未来的混合现实头显和/或智能眼镜。

 

苹果公司在其专利中指出,无线通信能力可用于广泛的附件设备,这些设备可被配置为与音源设备通信。例如,无线音频输出设备,如无线头显或一对无线耳机,可以通过无线个人区域网络(WPAN)连接到音频源设备,如智能电话,以接收音频流。

 

在一个方面,WPAN连接可以通过高级音频分配规范(A2DP)连接或BLUETOOTH通信协议的另一个音频规范连接。

 

为了流式传输高质量的音频数据,音频源设备根据A2DP配置文件将音频数据打包(例如,将音频数据分割成用于传输的单元),并将音频数据包存储在传输缓冲区。然后,数据包通过空中(或无线)无线电频率(RF)信号传输到无线音频输出设备。

 

收到的数据包被存储在输出设备的长缓冲区中,以便在未来数据包被丢弃的情况下(例如,在传输干扰期间)提供连续的音频播放。缓冲区内的音频数据被去掉数据包,并通过至少一个扬声器处理为音频输出。在音频设备需要音频输出的时候,这个过程会重复进行。

 

虽然方便,但无线通信协议有延迟的缺点。例如,通过BLUETOOTH的音频数据流可能需要几十毫秒的音频处理来生成一个编码的音频包,以及多达几百毫秒的缓冲,导致出现超过250毫秒的端到端延迟。

 

此外,任何用于检测数据包中错误的纠错方案(如前向纠错FEC代码)都可能增加额外的延迟。对于某些音频(如高延迟音频),如音乐作品,这种端到端的延迟可能不会被用户注意到,因为音频输出设备中的长缓冲区可以保持音频播放的连续性。例如,在启动音乐作品的回放时,音频输出设备可以延迟回放,以首先填充其缓冲区。一旦归档,音频数据就会从缓冲器中检索出来进行输出。

 

然而,一些音频(例如,低延迟音频)可能需要更短的延迟时间。例如,与音频源设备上的物理动作相关的音频(例如,在触摸屏上选择一个UI项目,在选择时提供声音反馈)可能需要较短的声音响应时间(例如,小于10毫秒)。这样,通过BLUETOOTH传输的对时间敏感的音频可能会出现延迟,导致选择UI项目和声音反馈之间产生不连续的情况,这种不连续可能会降低用户体验。

 

苹果公司的发明提供了一种低延迟光学音频传输的方法。例如,音频数据可以通过空中光学信号传输,该信号从一个音频源设备产生(或投射)到一个音频输出(接收器)设备。与可能需要对音频数据进行编码和打包的无线协议不同,通过光学信号的音频数据传输可以作为原始数字数据(例如,未压缩)进行传输。

 

这种类型的传输可以大大减少端到端的延迟,因为在源设备上没有由于音频处理(例如,音频源设备的压缩/编码)而产生的额外延迟,而在音频输出设备上也没有因为音频处理(例如,解压缩)而产生的延迟。

 

随着延迟的减少,输出设备几乎可以即时为用户与源设备的互动输出音频反馈。换句话说,本授权专利可以减少延迟,从而使音频反馈的输出被用户认为是瞬时的。

 

苹果公司的专利图3A和3B说明了音源设备的例子;图7显示了通过人体组织光学传输音频数据的系统示例。

 

图源:patentlyapple

 

苹果公司的专利图5说明了音频源设备从作为光学信号传输音频数据过渡到作为无线射频信号传输音频数据的阶段进展情况。

 

图源:patentlyapple

 

欲了解更多细节,请查阅苹果公司的授权专利11,234,078。

 HTC宣布即将推出NFTs市场Vive Bytes,于下个月开放 

HTC宣布即将推出Vive Bytes,这是一个以动画、卡通和游戏(ACG)为主题的NFTs新市场,将在其VR内容平台Viveport上发布。该市场将于下个月对外开放,参观者可以使用法定货币或加密货币购买独特的NFTs和NFT盲盒。

 

首次销售活动将包括从最近在Viveport中举办的Step into Cat Art的独家NFTs等。参观者将有机会认领由著名的日本艺术家Shu Yamamoto创作的2D、3D 猫咪Art,包括“The Hisstine Chapel”的天花板画等。

 

图源:Shu Yamamoto

这个特殊的 NFT 可以通过参与收集“收集-解锁”NFT盲盒活动来获得。任何人购买2D CAT猫咪艺术作品在接下来的几周将有机会获得限量版3D CAT猫咪艺术模型NFTs。

 

图源:Shu Yamamoto

 

Viveport 总经理 Joseph Lin表示: “ NFTs正在改变我们对身份和所有权的看法,VIVE BYTES 正处于释放创意作品潜力、让消费者和创作者更容易获得数字作品的前沿。”

 

“继去年与我们的合作伙伴推出全球首个猫咪艺术在线展览之后,我们正在推出新的猫咪艺术展,让参观者能够增加数字作品的收藏,并使其多样化。”

 

在发布时,访问者可以通过直接购买获得 NFT,通过配对他们的 MetaMask 钱包获得盲盒。据 HTC 透露,官方拍卖系统也正在建立之中。

 沃尔玛进军元宇宙,推出虚拟货币及一系列虚拟商品 

作为全球最大的大型零售商之一,沃尔玛推出了自己的加密货币,加入了不断壮大的Metaverse。沃尔玛还发布了一系列虚拟商品,包括电子产品、家居装饰品、游戏、玩具、体育用品,以及其他各种你可以在实体沃尔玛商店买到的产品。

 

在接受 CNBC 采访时,商标代理律师Josh Gerben表示,沃尔玛已经向美国专利和商标局(u.s. Patent and Trademark Office)提交了7份“Super Intense”的商标申请,其中详细说明了沃尔玛如何设想自己在虚拟世界的存在,以及沃尔玛虚拟货币的可能性。目前,有关商标的细节尚未公布。


本月初,一个关于2017年沃尔玛虚拟现实概念购物体验的搞笑视频在 Twitter 和 TikTok 上疯传,点击量超过1100万次。视频里,一个虚拟的沃尔玛员工走在虚拟过道上帮助用户购买葡萄酒、牛奶和其他各种商品。

 

这个概念是由沃尔玛旗下的8号商店(No.8)提出的,该商店致力于探索电子商务的未来将如何受到人工智能、虚拟现实、增强现实以及虚拟世界等技术的影响。

 

图源:沃尔玛

 

在一份官方声明中,沃尔玛表示:“我们一直在不断地探索如何让新兴科技改变未来的购物体验,我们在不断测试各种新的想法。有些想法变成了产品或者服务,最终呈现给客户,也有一些让我们在不断迭代中学习。”

 VR竞技帆船游戏《MarineVerse Cup》将于今年春季登陆Quest 2 

VR帆船游戏《VR Regatta》的墨尔本开发商NarineVerse宣布其新VR竞技帆船游戏《MarineVerse Cup》将于今年春季登陆Quest 2。这款游戏由专业水手和工程师研发,将提供多种独特的游戏模式,包括单人和多人游戏模式。

 

图源:MarineVerse

 

新玩家可通过详细的系统教程学习帆船和橡皮艇的基础知识,在掌握基础技能之后可在各种计时比赛和迷你游戏的竞争中测试技能,取得高分。

 

此外,购买“帆船通行证”的玩家还可以参加Pro和WASZP比赛。这些比赛将带你到世界各地,包括悉尼,旧金山,西雅图,纽约,里约热内卢和开普敦。

 

图源:MarineVerse

 

“我们想和全世界分享我们对帆船航行的热情,Meta Quest 2给予了我们这个机会!”,MarineVerse首席开发人员Greg Dziemidowicz说,“我们举办MarineVerse Cup的初衷是教人们如何驾驶帆船,然后挑战各种赛事。”

 

在正式发布之前,用户现在可以通过App Lab以19.99美元的价格在Quest 2上试玩这款游戏。

  第一时间了解XR资讯  

  关注VR陀螺官网(vrtuoluo.cn)


VR陀螺的联系方式:

商务合作 | 投稿 :

西瓜(微信号 18659030320)

六六 (微信号 13138755620)

交流分享 | 爆料:案山子 (微信 shimotsuki_jun)

投稿邮箱:tougao@youxituoluo.com


推荐阅读



本文来自微信公众号“VR陀螺”(ID:vrtuoluo)。大作社经授权转载,该文观点仅代表作者本人,大作社平台仅提供信息存储空间服务。