我们认为,Nvidia、Mellanox和Titan IC的套娃式收购将大大提升云端人工智能芯片产品的门槛。该收购案完成后,或将对云端AI芯片市场产生很大的长远影响。
首先,我们看到,Nvidia对Mellanox的收购有些类似上下游式整合——Nvidia代表了云端人工智能的生态,而Mellanox则代表了云端人工智能的核心技术,收购后意味着该核心技术与Nvidia的生态牢牢地绑定了在一起。
众所周知,Nvidia的GPU在目前是云端人工智能加速的主流解决方案。虽然也有一些其它AI芯片公司提供云端人工智能训练的加速,但是谈到与Nvidia的比较都显得缺乏竞争力,最多只能算是Nvidia之外的一个候补供货方案。为什么?究其根本,并不是这些AI芯片公司的峰值算力不够,而是在生态上难以与Nvidia的CUDA生态做竞争,在软件方案上缺乏Nvidia CUDA这样的完整编程和工具链,而这些完整的工具链需要很长的时间积累,目前也正是Nvidia最高的壁垒。
如果说以上只是Nvidia生态在单机训练上的竞争门槛的话,那么在目前广为应用的分布式训练上,Nvidia则构筑了更高的门槛。分布式训练中,需要将数据分布到多台服务器上去做单步训练,同时在完成单步训练之后,需要将分布在多台服务器上的权重和梯度信息做一次同步,才能继续训练,而该同步过程对于多台服务器之间的数据交换则形成了很大的考验。一方面,在硬件上会需要高速的数据交换互联,另一方面,在底层软件方面,也需要高效的接口,防止数据交换的软件层成为性能的瓶颈。也正是因为分布式训练对于数据交互的高需求,在2016年之前都没有特别好的解决方案,直到Mellanox的InfiniBand出现成为了高性能互联解决方案。后来随着技术的迭代,目前以太网+RDMA的方案(同样是Mellanox的强项)成为了常规的解决方案,而Nvidia的NCCL则成为了底层软件接口的标准。换句话说,在Nvidia收购Mellanox之前,Mellanox的数据互联方案+Nvidia的GPU底层接口经过多年迭代已经形成了一个非常完善的工程解决方案,而其它AI芯片公司想要复制Nvidia GPU的分布式训练则势必要重复一遍这样的迭代过程。
一旦Nvidia GPU+Mellanox网络技术的上下游生态绑定,那么在整合完之后就会诞生一个巨头,并大大提升竞争门槛。在收购完成之后,Nvidia GPU和Mellanox的以太网+RDMA就成为了一家人,其它AI芯片公司要加入竞争,则必然会在分布式计算方面遇到来自Nvidia更大的压力,这也意味着竞争门槛大大提高——例如,为了能真正进入分布式训练是一个必选项的云端AI芯片市场,则必须能自主掌握RDMA等分布式训练需要的数据交换技术,而能做到这一点的公司寥寥无几——一个例子就是Habana,其一大亮点就是其AI训练芯片中包含RDMA,这或许也是Intel之前高价收购Habana的重要考虑因素。
而在Mellanox收购了Titan IC之后,这三者的结合则更是提供了包含人工智能+高速数据互联解决方案+网络安全加速的横跨多个领域的完整方案,也让其产品在数据中心竞争中占据了极为有利的位置。
更重要的是,Nvidia的野心并不仅仅在人工智能,而是想要扩展到更广的数据中心高性能计算领域。例如,在未来十年内,我们认为除了人工智能之外,还有许多有很大潜力的计算会需要在云端完成。举例来说,与健康相关的基因计算就是一个重要方向,而Nvidia也在之前收购了从事基因计算并行化领域的初创公司ParaBricks,显示了它在该方向的布局。而对于云端分布式计算来说,事实上Nvidia GPU+Mellanox RDMA+Nvidia CUDA都将形成难以撼动的整体解决方案,这样的黄金组合或许将统治云端高性能计算加速市场很久。
Nvidia是今天全球公认的GPU技术和市场双冠王。除此之外,Nvidia也在积极布局云端服务器市场,其中的一项重要举措就是收购Mellanox。
Mellanox是一家以色列高性能网络芯片和解决方案提供商,其产品包括Smart NIC,网络交换机芯片和高速数据互联等。Mellanox是一家以色列公司,它在人工智能兴起的时候推出了其独特的超高性能InfiniBand数据互联产品,大大提升了数据中心人工智能训练的速度和效率,此后就牢牢占据了人工智能相关云端服务器数据互联产品的高地。在Nvidia收购Mellanox之前,Mellanox的RDMA等重要技术已经和Nvidia GPU一起出现在了许多云端高性能服务器中。
Nvidia从去年开始收购Mellanox的流程,各国政府审批的时间接近一年。由于之前高通收购NXP的交易没有及时通过中国的审批而最终失败,因此Nvidia收购Mellanox是否能过中国的审批也成了之前各方关注的一个不确定因素。随着上周中国的审批终于获得批准,Nvidia收购Mellanox的政府审批流程已经完成,预计将于4月底完成交易。
全球100家最有前景的AI初创公司中,有11家“独角兽”公司,其中5家为中国公司。由此可见中国AI科技公司获得了广泛的认可和支持,未来这一趋势将继续扩大。
一方面,我们需要肯定中国在人工智能算法研究上取得的优异成绩。2019年,中国人工智能论文数量、专利申请量都已经高居全球第一。以中科院、清华大学、中国科技大学和西安交通大学等为代表的科研院所,在机器学习和深度学习算法研究上贡献了大量高质量论文。以百度、阿里巴巴和腾讯为代表的科技巨头和以商汤、科大讯飞和深兰为代表的独角兽企业,在语音识别、自然语言处理、计算机视觉和智能驾驶等AI算法开发中取得了不俗成绩。毫无疑问,中国在人工智能算法上的进步速度十分显著,投入和产出效率非常高。但另一方面,我们也需要审视中国在核心算法、底层技术上的不足。2019年“徐匡迪之问”引发了业界的广泛共鸣,中国人工智能领域真正搞算法的科学家凤毛麟角,基础核心算法的缺失未来或将成为中国人工智能发展的“瓶颈”所在。比较来看,美、欧、日的数学基础更加扎实,在人工智能算法研究时更能从基础理论上实现“突破”。举个不太恰当的例子,谷歌公司软件有TensorFlow,硬件有TPU,算法有AlphaGo、AlphaZero,其对人工智能技术的理解、对人工智能基础算法的投入,是当前任意一家中国企业所不能比拟的。总体而言,中国人工智能强在数据规模、产业应用,而弱在核心算法、基础算力。
当前人工智能的爆发,离不开大数据处理和机器学习技术的快速发展,而这两者的根基正是概率论和统计学,因此很多人认为人工智能就是统计学+概率论。
人们对于人工智能改变生活的预期与AI现实能力不匹配。以自动驾驶为例,汽车生产商对全自动驾驶(Level 4)的实现时间盲目乐观。Delphi和MobileEye承诺于2019年实现Level 4自动驾驶系统,Nutonomy公司计划于2019年在新加坡街头部署无人驾驶出租车,特斯拉CEO马斯克在2020年1月声称,特斯拉车型的“完全自动驾驶”功能即将到来。但加里·马库斯等专家认为,实现完全自动驾驶可能需要数年甚至数十年,届时才能实现可以避免事故的自动驾驶系统。
2020年4月,埃森哲正式发布《技术展望2020》报告中文版,本年度报告着重阐述了新数字时代中,企业如何让用户、员工、合作伙伴以及社会大众一起参与进来构建新的技术协作模式。通过对用户掌握个性化主权、人机协作重塑业务模式、交付长期体验、机器人突破行业壁垒以及培育创新基因等五大趋势的解读,报告指出,企业应当对业务和技术模式进行再思考和再设计,开辟未来发展之路。
根据Omdia的数据,2025年全球智能城市人工智能软件市场的规模将从2019年的6.738亿美元增长到49亿美元。无线数据通信标准使智能城市应用能够进入在线领域,在那里它们可以利用最新的人工智能创新。人工智能可以监控和分析通过物联网收集的数据和洞察,并采取行动。