撬走端侧AI普及的最后一块「绊脚石」
导语:救出泥潭中的开发者,AI就能普及了?
作者 | 包永刚
编辑 | 王川
“现在听到AI时代要来了,就像是听到了‘狼来了’。”AI开发者小王对于AI普及的论调早已习以为常。
“AI产品开发不仅门槛高,还很难移植到不同产品中,AI何时才能普及?”
目前AI普及还有最后一块绊脚石。
早在两三年前,能够给AI普及提供底层动力的端侧AI芯片公司就意识到,鲜有公司能够把自家“新鲜出炉”的AI芯片真正投入使用。
经过几年的努力,AI已经变得越来越“聪明”,能够让摄像头理解镜头捕捉到的画面,让麦克风理解用户说话的内容,让音箱能够和用户进行多轮自然对话。
但AI要广泛落地,依然是一项艰深的工作。
由于用途和形态的不同,不同AI终端对性能、功耗、精度等各项指标需求各不相同。
开发者要想让AI形成“战斗力”,需要针对各个场景做单独优化,这就很难快速复制。不仅让开发者深陷开发泥潭,也让AI在更广阔的应用场景下陷入“有弹无枪”的窘境,难以做到真正普及。
而真正能够推动AI在终端爆发的,是“一次开发,多处运行”的统一开发平台。
统一开发平台不仅能够将AI开发者救出“泥潭”,还让AI冲进了元宇宙。
AI起跑,先赛出头「狼」
AI没能在过去几十年间被一遍又一遍喊AI来了,上演《狼来了》的故事,一个核心原因是技术还不够成熟。
AI的第三次浪潮得益于深度学习技术的兴起,随着深度学习算法的演进,很快遇到了算力不足的挑战。因此,想要推动AI的发展和普及,首先需要有足够强大的AI芯片,先赛出有足够硬实力的头狼。
2017年前后,掀起了研发AI芯片的热潮。
由于深度学习的算法还不够成熟,加之应用场景的不明确,想要快速定义出一款合适的AI芯片面临挑战,特别是面向应用场景丰富的端侧AI处理器。
场景和需求更加明确的智能手机拥有率先落地AI技术的先天优势,将AI应用于拍照,给手机用上智能语音助手,不仅能提升用户的使用体验,还能给手机增加新的卖点,于是,手机芯片处理器公司间燃起了一场AI竞速赛。
一时间,苏黎世联邦理工学院(ETH)的AI-Benchmark榜单成为了各大手机处理器厂商展现真正实力的阵地,上演着你方唱罢我方登场的激烈角逐。
历经几年的比拼,真正有实力的AI领导者留在了AI-Benchmark的显眼位置。
查看AI-Benchmark的最新排行榜,雷峰网(公众号:雷峰网)发现榜单排名前九的手机都搭载了高通的第一代骁龙8移动平台。
第一代骁龙8平台霸榜AI-Benchmark并不让人意外,这款最新的旗舰移动平台搭载的是高通最新的第七代AI引擎,推理速度是前代的4倍,能效提升70%。
其实,高通第六代AI引擎的AI性能已经高达26TOPS,远超同级别水平,在端侧AI处理器中属于顶尖水平。当然,集成高通第七代AI引擎的第一代骁龙8能够霸榜的关键不仅仅是高性能。
高通公司产品管理副总裁 Ziad Asghar在2022世界人工智能大会上说,“在既定功耗下完成更多的AI处理对边缘侧AI运行至关重要。从高通第六代AI引擎发展到高通第七代AI引擎,两年时间内,我们在既定功耗下将AI能力提升了一倍以上,这正是AI在终端侧发挥其能力的关键。”
霸榜AI-Benchmark,也是高通在AI领域耕耘十余年实力的体现。
经过几年的快速迭代,AI边缘芯片的性能已经足够满足应用需求,真正阻碍AI普及的其实是软件。
要普及AI,先拯救泥潭中的开发者
“我们设计出的AI芯片,大部分客户还没有能力用起来。”这是多家AI芯片公司两年前就遇到的困难,也是AI普及的难题所在。
没有完整软件栈,面对丰富多样的应用场景,无论是AI硬件和软件的提供者,还是AI应用的开发者,都面对着AI产品高门槛的难题,好不容易开发出一个应用,也很难部署到其他应用,开发者深陷泥潭。
“不同形态的AI终端产品,对AI性能、功耗、精度的需求大不相同。”Ziad Asghar说,“我们的解决方案需要支持从500毫瓦的性能水平扩展到15瓦特、甚至200瓦特的性能水平。不同形态产品所需的深度学习架构和算子也差异巨大,例如,面向移动领域需要使用生成模型,面向计算领域需要使用Transformer模型,面向汽车ADAS需要激光雷达模型。”
旷视科技联合创始人、CTO 唐文斌也在2022世界人工智能大会期间表示,“现阶段的AI,一个核心的挑战在于应用场景碎片化导致算法多样化。算法多样化,一方面意味着需要规模化生产大量算法,另一方面需要考虑如何低成本生产每个算法。”
高通第七代AI引擎中的Hexagon处理器可以调整加速器和内存组件,满足不同智能手机的需求。面向云端、汽车等对性能需求更高的场景,可以拼接多个Hexagon处理器满足瓦级性能需求。
硬件的灵活,结合完整易用的软件,才能真正解决AI的挑战。
“AI芯片软件栈的开发有两个核心挑战。”一位AI芯片行业资深从业者对雷峰网表示,“一方面,与设计一款新的CPU不同,AI芯片大都采用独特的指令集和架构,没有可以借鉴的编译器等软件。另一方面,AI的算法还在不断演进,软件想要适配难度也更大。”
谁能率先推出完整统一的AI软件栈,就能率先把AI开发者救出泥潭。今年6月推出的高通AI软件栈产品组合,实现了AI里程碑的跨越。
Ziad Asghar说:“完整的高通AI软件栈产品组合无疑是一项巨大突破,它将推动OEM厂商和开发者的AI开发。我们很高兴借助这一全新产品组合进一步扩展高通公司的统一技术路线图,并扩大在智能网联边缘的领先优势。”
高通AI软件栈支持包括TensorFlow、PyTorch和ONNX在内的不同AI框架与主流运行时(Runtimes),还有开发者库与服务、系统软件、工具和编译器,能够让任何面向单一终端开发的AI特性轻松部署到其它终端。
比如,借助高通AI软件栈,可以将一个原本面向手持设备的面部识别功能,迁移至汽车、PC或安防摄像头等其他终端。
完整的AI软件栈的构建难度十分巨大。从离硬件最近的编译器和库,到帮助开发者高效实现更多应用的Runtimes,再到上层的AI框架,每一层的软件构建都考验着提供商的能力以及资源的投入。
Ziad Asghar强调,“高通完整的AI软件栈对我们的客户而言是一个巨大的优势,他们可以根据实际需求进行模型开发和优化。”
完整的AI软件栈有两个层面的重要价值,首先要实现对开发者的适用性,这就需要支持所有框架,AI runtimes,提供开发者库、编译器,支持所有操作系统;还有就是易用性。
AI软件栈的易用也可以从两个维度去看,一个提升性能和开发效率,另一个是“一次开发,随处运行。”
高通AI软件栈产品组合中的一系列工具套件,包括高通AI模型增效工具包(AIMET)、AI开发图形用户界面(GUI)、用于增强量化与优化的模型分析器以及神经网络架构搜索(NAS)能够帮助开发者更快开发出更能满足实际应用需求的产品。
AI模型增效工具提供模型量化和压缩等技术,能够帮助开发者搭建体积更小、能效更高的模型。数据显示,借助AIMET工具,将MobileNet-v2、ResNet-50和Deeplabv3模型从FP32转化为INT8模型,精度损失不到1%,能效提升16倍。
另外,高通与谷歌合作的NAS也已经取得成果。Ziad Asghar介绍,“在移动端的自然语言处理方面,我们在不影响精度的情况下将时延降低了13%。在汽车的物体检测用例中,我们将模型的时延改善了13%,同时精度提升1.3%,对于特定的汽车用例这是巨大的优势。”
有了完整的AI软件栈,AI开发者已经被从泥潭中拯救出一半,真正好用的AI软件栈还能实现“一次开发,随处运行”,将开发者完全从泥潭中拯救出来,向无处不在的AI目标迈进。
高通AI软件栈支持诸多SDK,包括面向汽车ADAS解决方案的Snapdragon Ride SDK,面向物联网的高通智能多媒体SDK,以及Snapdragon Spaces XR开发者平台,这为建立统一SDK提供了基础,也为实现开发者“一次开发,随处运行”的梦想打下了基础。
Ziad Asghar 指出,“要实现任何面向单一终端开发的AI特性都可在其他终端上轻松部署,包括编译器、调度器、硬件调试,以及模型的准备和优化,软件能充分利用硬件资源等都非常重要,我们需要确保这些组成部分能够共同协作实现高效运行。”
AI已经成为元宇宙中的「基建」
高通AI软件栈能够让一次开发,就可以应用到手机、物联网、汽车、XR、移动PC等不同形态产品,这足以表明,终端和边缘AI的时代真要来了。
作为AI业界的领导者,高通不仅要在现实世界中实现AI无处不在的目标,还要让AI在元宇宙中也发挥作用。
高通公司总裁兼CEO安蒙在2022世界人工智能大会的演讲中指出,元宇宙是互联网的未来,即空间互联网。元宇宙需要学习和适应不断变化的环境及用户偏好,而AI对于塑造用户体验至关重要。
元宇宙将视觉体验从第三人称平面升级到第一人称3D视角,让人们获得更丰富的信息,并且扩宽了交互的边界,提供了触觉等新的交互方式。
例如,元宇宙中需要具备对手部、眼球和位置的追踪,以及情境理解和感知等功能。为了提高用户虚拟化身的精确度,提升用户本人和其他参与者的体验,AI将应用于扫描信息和图像的分析,从而打造高度逼真的虚拟化身。
另外,AI还将推动感知算法、3D渲染和重建技术的发展,以构建令人惊叹的逼真环境。
显然,元宇宙将产生海量数据,无法所有都在云端处理,这就需要AI处理拓展至边缘侧,情境丰富的数据在边缘侧产生,分布式智能应用应运而生。将5G与边缘AI的完美结合,能够支持边缘侧产生的情境丰富的数据近乎实时地分享给其它终端和云端,为元宇宙中的全新应用、服务、环境和体验提供支撑。
端侧AI也有显著的优势,包括安全性、保护隐私,能有与边缘和云端的AI,共同给使用者创造元宇宙的全新体验。
第三次的AI浪潮下,AI硬件的完备以及完整AI软件栈的推出,AI开发者已经具备“一次开发,随处运行”的基础,在可以预见的未来,AI将迅速在XR、PC、汽车等领域快速普及,让现有的产品拥有全新的体验。
有观点认为,2022年人工智能带动行业应用综合解决方案服务的市场规模将达到2万亿。信息技术研究和分析的公司Gartner一份报告指出,5G是推动边缘计算发展的重要原因之一。
作为AI和5G领导者的高通,正在将AI和5G作为元宇宙的基建,为我们打造一个更具科技感的未来,创造无限可能。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。