最新超算冲刺世界 Top 5！OpenAI 的 10 亿 AGI 梦何时实现？

导语：微软和 OpenAI 合作的第一个成果展示在世人面前。

2019 年 7 月，微软宣布对总部位于旧金山的人工智能非营利组织 OpenAI 投资 10 亿美元，将与 OpenAI 长期合作构建新的 Azure AI 超级计算技术，进一步扩展大规模 AI 能力，兑现其通用人工智能（AGI）的承诺。

作为交换，OpenAI 同意将其部分知识产权授权给微软，微软随后将把这些知识产权商业化并出售给合作伙伴，并在 OpenAI 开发下一代计算硬件的过程中，在 Azure 上训练运行 AI 模型。

几个月后，二者合作的第一个成果展示在世人面前。

OpenAI 迄今最大的赌注

一直以来，OpenAI 都表示强大计算能力是迈向 AGI 的必经之路，也是 AI 能够学习人类所能完成的任何任务的必经之路。不过，这台超级计算机是否强大到足以实现任何接近 AGI 的功能，我们尚不清楚。

2018 年，OpenAI 发布的一项分析显示，从 2012 年到 2018 年，用于最大人工智能培训的电脑数量增长了逾 30 万倍，其中有 3 个半月翻了一番，远远超过摩尔定律的速度。

2019 年，Greg Brockman 曾在接受外媒 Financial Times 的采访时表示，2025 年前后，OpenAI 将把微软 10 亿美元的全部投资用于构建一个能够运行“人脑大小的 AI 模型”的系统。

虽然包括两位人工智能先驱 Yoshua Bengio 和 Yann LeCun 在内的行业知名人士认为 AGI 不可能存在，但 OpenAI 的联合创始人和支持者们——Greg Brockman、首席科学家 Ilya Sutskever、Elon Musk、Reid Hoffman 和前 Y Combinator 总裁 Sam Altman——认为，强大的计算机结合强化学习和其他技术，可以改变 AI 发展模式。

可以说，这台超级计算机的发布代表了 OpenAI 在这一愿景上迄今为止最大的赌注。

图灵模型与 AGI 相去甚远，但微软表示将通过超级计算机探索大型模型，这些模型可以在文本、图像和视频数据中以一般化的方式学习。

实际上 OpenAI 也是如此。

此前外媒曾报道，OpenAI 的 Foresight 团队进行了一项实验，旨在测试他们通过训练具有越来越大量数据和计算的算法能在多大程度上推进 AI 能力。

另外，OpenAI 正在开发一个以图像、文本等数据为基础的系统，该系统使用了大量计算资源，被公司领导层认为是极有希望实现 AGI 的。

事实上，Greg Brockman 和 Sam Altman 尤其相信 AGI 将比任何人类都掌握更多的领域，主要是能识别人类无法发现的复杂的跨学科联系。

同时，他们预测，AGI 与社会科学等相关领域的研究人员密切合作，可能有助于解决气候变化、医疗和教育方面的长期挑战。

与此同时，其他玩家发展势头不减。

前不久，IBM 详细介绍了一款“神经计算机”（Neural Computer），IBM 利用数百种定制设计的芯片，训练时间达到了每秒 120 万帧，创下了最新记录。

北京时间 2020 年 5 月 14 日，英伟达也发布了第八代安培 GPU A100，AI 算力提升 20 倍，号称史上最大的性能飞跃。

证据表明，效率的提高可能会抵消不断增长的计算需求。另一项最新的 OpenAI 调查发现，自 2012 年以来，将 AI 模型训练成与流行基准（ImageNet）中的图像分类性能相同所需的计算量每 16 个月减少两倍。但是与新的算法方法相比，计算对性能的贡献程度仍然是一个悬而未决的问题。

此外，值得一提的是，OpenAI 在游戏和媒体合成方面已经利用较少的资源取得了显著的 AI 收益：

在谷歌云平台上，为了自我提升，OpenAI Five 每天要在 256 张 Nvidia Tesla P100 显卡和 128000 个处理器内核上玩 180 年的游戏，以击败 Dota 2 的职业玩家（以及公开比赛中 99.4% 的玩家）。
OpenAI 在至少 64 个英伟达 V100 显卡和 920 个机器上训练了一个系统，每个机器有 32 个 CPU 内核，以便用机械手操纵魔方。
OpenAI 的点唱机模型在 896 个 V100 显卡上运行模拟，学习从零开始生成任何风格的音乐（包括歌词）。

微软迎来新的市场机遇

从另一个角度看，无论最新的超级计算机只是一个小小的垫脚石，还是向 AGI 的目标迈出了一大步，实际上都有可能为微软带来新的市场机遇。

雷锋网了解到，通过 AI at Scale 计划，微软正在提供资源，以优化的方式在 Azure AI 加速器和网络上训练大型模型。它将训练数据拆分成多个批次，用于跨集群训练模型的多个实例，并定期进行平均以产生单个模型。

此外，在 Build 开发者大会上，微软还发布了一个新版本 DeepSpeed，即一个 PyTorch 开源深度学习库，它减少了大型分布式模型训练所需的计算能力，可在相同的架构上训练超过大 15 倍以上、快 10 倍以上的模型，还支持 ONNX Runtime 分布式培训。

微软表示，当与 DeepSpeed 一起使用时，ONNX 上的分布式培训使跨硬件和操作系统的模型能够实现高达 17 倍的性能改进。

正如微软首席技术官 Kevin Scott 表示：

通过开发这种用于训练大型人工智能模型的前沿架构，我们正在让 Azure 变得更好。我们正在建设更好的计算机、更好的分布式系统、更好的网络、更好的数据中心。这些都会推动整个 Azure 的性能、成本和灵活性变得更好。

引用来源：

[1]https://venturebeat.com/2020/05/19/openai-microsoft-azure-supercomputer-ai-model-training/

[2]https://venturebeat.com/2020/05/14/ibm-claims-its-neural-computer-achieves-record-ai-model-training-time/

雷锋网(公众号：雷锋网)

雷锋网原创文章，未经授权禁止转载。详情见转载须知。

Click to rate this post!

[Total: 0 Average: 0]

最新超算冲刺世界 Top 5！OpenAI 的 10 亿 AGI 梦何时实现？

最新超算性能堪比世界 Top 5

OpenAI 迄今最大的赌注

微软迎来新的市场机遇

Leave a Reply