为元宇宙「打地基」,Meta 开发世界最快 AI 超级计算机
产品
01-25 19:44
1
评论
元宇宙「开局」以来,国内外公司纷纷入场,Facebook 改名 Meta 后,为了离元宇宙更近,已经进行了不少尝试。目前 Meta 的 AI 研究团队开发出了一个 AI 超级计算机,Meta 表示,等到 2022 年中期完全建成时,它将是世界上最快的 AI 超级计算机。
Meta 这台名为「AI Research SuperCluster」(RSC)的超级计算机是近两年工作的成果,该公司表示共有数百人参与了这个项目,包括来自合作伙伴 Nvidia 、 Penguin Computing 和 Pure Storage 的研究人员。
▲图片来自:Meta
要构建元宇宙,软件、硬件、应用等方面都是缺一不可。2021 年 11 月,AMD 宣布与 Meta 建立业务伙伴关系,未来 Meta 将会采购 AMD 的芯片来满足它从「社交媒体」转型为「元宇宙公司」后对于数据中心以及算力的庞大需求。
元宇宙要运行,自然离不开强大的运算能力。Meta 的 AI 超级计算机在已经启动并运行的第一阶段,共有 760 个 NVIDIA DGX A100 系统作为计算节点,包含 6,080 个 GPU,在世界上最快的超级计算机中排名第五。
▲图片来自:Meta
与 Meta 的传统生产和研究基础设施相比,它运行计算机视觉工作流程的速度高达 20 倍。在 2022 年底之前,AI 超级计算机(RSC)将完成第二阶段,完成后包含大约 16,000 个 GPU。它的混合精度计算性能会接近 5 exaflops。
说起超级计算机,就是拥有高速度和大容量,具有超强处理能力的计算机。人们最先想到的,是研究机构里用以处理太空、核物理和气候变化等数据的设备。
▲中国超级计算机:神威·太湖之光,图片来自:新浪
其实这种设备与 Meta 的 AI 超级计算机都可以称为高性能计算机或 HPC,比起单个计算机,两者在尺寸和外观上都更接近数据中心,且都是依赖大量互连的处理器,以极快的速度来交换数据。
不过,根据 Hyperion Research 的 HPC 分析师 Bob Sorensen 的解释:「基于 AI 的 HPC 生活在一个与传统 HPC 相比有些不同的世界。」说明这两者最大的区别在于准确性。
由于机器学习要求的准确性低于传统超级计算机的任务,因此 Meta 的 AI 超级计算机不一定能与经常在新闻中看到的超级计算机进行直接比较。
▲图片来自:环球网
超级计算机和 AI 超级计算机都使用所谓的浮点算法进行计算,大多数超级计算机的速度是使用所谓的每秒 64 位浮点运算或 FLOP 来计算的。但是,由于 AI 计算对精度的要求较低,因此 AI 超级计算机通常以 32 位甚至 16 位 FLOP 来计算。
Meta 提到 AI 超级计算机完成后混合精度计算性能会接近 5 exaflops(一个 EFLOPS(exaFLOPS)等于每秒一百京/一百亿亿(10 的 18 次方)次的浮点运算)。
▲图片来自:REUTERS
之所以要开发如此拥有如庞大计算力的 AI 超级计算机,Meta 表示,它将用于训练 Meta 业务中的一系列系统,可以帮助 Meta 的研究人员建立可以跨数百种语言工作的 AI 模型,用于分析文本、图像和视频;还可以更轻松地进行 Facebook 和 Instagram 等平台上的内容审核。
并且,这个 AI 超级计算机还能帮助开发在该公司未来的 AR 硬件中提供的增强现实功能。Meta 希望它能帮助研究人员开发像人脑一样思考的人工智能模型,支持 Metaverse 中丰富的多维体验。
▲图片来自:W&V
虽然完全建成后的具体运算能力还未可知,但不可否认的是, Meta 的 AI 超级计算机拥有不俗的数据处理能力。从机器学习到硬件开发再到设计虚拟世界的体验,将成为 Meta 构建元宇宙的基石。