近日,国际权威研究机构Gartner公布了《云AI开发者服务关键能力报告》,该报告针对谷歌、亚马逊、微软、阿里巴巴等主要云AI服务商进行评估排名。在语言AI领域,阿里排名全球第二,创造了该报告诞生以来,中国企业在此领域的最好成绩。报告还提到,云计算能降低AI研发的门槛,因此,云服务商的优势越来越明显,正成为AI研究的主流。
对中国人工智能从业者来说,这是意义非凡的突破,意味着以阿里巴巴为代表的的中国科技公司进入了世界第一梯队;另一方面,该报告也释放了一个信号,未来云计算将成为AI发展的核心推力。
AI的第一个黄金十年,中国企业从落后到领跑
从1956年的达特茅斯会议开始算起,AI行业已拥有60多年历史,但过去几十年的发展极为缓慢,直到近十年,才正式步入正轨,IDC发布的数据显示,2022年,全球AI市场规模将达到4328亿美元,增幅近20%。
在此阶段,国外科技企率先布局,加大对人工智能领域的投入,2011年,谷歌启动Google Brain项目,在深度学习技术的布局上抢占了先机。2014年前后,BAT等互联网大厂相继建立AI研究院,国内明星AI创业公司也逐步登场,组成了一支阵容强大的研究阵容。这堪称AI行业的第一个黄金十年。
与此同时,人工智能也逐步上升到国家战略高度。2017年7月,国务院发布《新一代人工智能发展规划》,以推动中国AI技术的发展,并力争在2030年成为世界主要AI创新中心;美国在2018年成立“人工智能国家安全委员会”,提出要全面投资AI、机器学习技术以保持全球领先地位。
在政府、企业、研究机构等多方力量的合力推动下,行业取得了诸多突破性进展,这其中最具代表性的技术之一,以Bert、Transformer为代表的新技术范式诞生,推动了大模型的发展,并让AI的智能水平提升了一个台阶。2020年,OpenAI推出大模型GPT-3,拥有1750亿个参数,可实现机器编写计算机代码、诗歌等。中国企业在这场竞赛里并未掉队,2021年阿里达摩院发布全球最大AI预训练模型M6,参数规模达到10万亿,擅长设计、写作、问答等任务。
中国企业在失去先发优势的情况下,用短短十年的时间抹平了与欧美企业的技术代差,在部分AI算法细分领域,甚至已处于领先位置。此次Gartner发布的云AI报告,阿里巴巴获得了语音识别、自然语言生成/语音合成、语言理解/处理、文本分析四项评分的第一。根据阿里达摩院的官方信息显示,其深度语言大模型体系AliceMind已先后斩获35个竞赛冠军。
作为AI三要素之一,中国企业的算力也在领跑全球。根据IDC、清华大学等联合发布的《2021-2022全球计算力指数评估报告》,中国AI服务器支出规模首次超过美国位列全球第一。这一系列的成绩也意味着,在第一个黄金十年里,中国AI产业链的雏形已现。
下一个十年,云计算将成为AI的新变量
尽管AI技术在持续迭代升级,其市场前景也一直被看好。但近两年,各类研究的应用落地却遇了巨大的阻力,云计算对AI的价值也逐渐显现出来。
Gartner发布的一份报告中指出,只有53%的项目能够从AI原型转化为生产。核心问题在于AI模型开发、部署、管理等全链路生命周期管理等。而算力则是最关键的问题之一。
以上文提到的GPT-3为例,完成GPT-3的模型训练需要花费500万到2000万美金计算费用(AI训练中使用的计算力每3.5个月增长一倍,6年增长30万倍以上,而按照摩尔定律,每18个月芯片性能才能翻倍。)后续模型部署还需要持续的算力资源,绝大多数企业都难以支撑如此巨额成本。
今年2月,中国正式启动东数西算工程,人工智能被认为是最大的获益领域之一,但东数西算工程的算力背后,云计算充当了重要角色。中国工程院院士王恩东曾提到,算力基建化要以算力服务为核心,通过对智算中心计算、存储、网络等能力的统一调度和对外服务,把算力像水和电一样提供给千行百业,助力行业智慧应用高效开发,加速行业和产业AI化。
在大量的数据和算力之上,只有做好高效的资源调度和资源调配才能锻造出优质AI大模型、才能承载一个体验尚佳的AI应用。这确实是云计算的天然优势,在云平台之上,用户可以更便捷地购买算力资源,同时能按需扩容。
在全球范围内,顶级科技企业大多拥有云计算业务,其中阿里云是国内最早自研云计算的公司,如今在全球27个地域运营着84个可用区,拥有亚洲规模最大的基础设施。这样的规模也为AI行业所需的算力打下了坚实的基础。
据报道,阿里达摩院旗下中文预训练语言模型PLUG和多模态预训练模型M6的训练都是在阿里云EFLOPS高性能AI计算集群之上完成。此外,智己汽车、毫末智行近期也已透露在阿里云上进行模型训练,效率最高提升70%,整体成本降低约20%。
云计算推动了移动互联网行业的发展,现在这一段历史正在被AI复制,在云平台之上,AI研究团队能有效缩短技术研发到应用落地的周期,实现降本增效。也许,云计算会再一次成为AI未来十年的最大变量。