(原标题:新创新时代:摩尔定律还没死,人工智能准备爆发)
摩尔定律已经死了,对吧?不妨再想想。
没错,中央处理器性能过去每年增加40%,现在放缓了,但将中央处理器和其他处理器的合在一起,其性能则以每年超过100%的速度增加。这种处理性能上大规模的改进是前所未有的,再与数据及人工智能相结合在一起,势必完全改变我们考虑硬件设计、软件编写及技术如何应用于企业的方式。
每个行业都会被颠覆。经常听到这个说法吧。是的,绝对是真的。我们在下面就来看看为什么是这样以及这一切意味着什么。
在本文的突破性分析里,我们将会公布一些数据,这些数据表明我们正在进入一个新的创新时代,廉价的处理能力必将推动机器智能应用的爆炸性发展。我们会提到将会出现的新瓶颈以及这对于未来十年的系统架构和行业转型意味着什么。
摩尔定律真的死了吗?
这个问题我们在过去的十年里听过不下几百次。EE Times的文章讨论过,MIT Technology Review(麻省理工科技评论)、CNET、SiliconANGLE的文章讨论过,甚至一些跟随摩尔定律节奏前进的行业协会都讨论过。笔者的朋友和同事Patrick Moorhead说得很对:
> 严格意义上的摩尔定律是说芯片密度每两年翻一番,那么可以说摩尔定律确实不再有效。
确实是这样。他完全正确。不过,他在前面加了"严格意义上的 "是有原因的……原因是他是个明白人,知道芯片行业是变招高手。
过去的性能曲线被瓦解
下面的图说明,严格意义上的摩尔定律的死亡是无关紧要的。
摩尔定律过去的结果实际上还在加速增加,而且增加还相当引人注目。这张图显示了苹果公司的片上系统发展的进程,起于A9,至A14五纳米仿生片上系统达到高峰。
纵轴显示的是每秒操作次数,横轴显示了三种处理器类型的时间点:CPU以万亿赫兹(1012赫兹)为单位(最下面几乎看不到的蓝线);图形处理单元或GPU,以每秒万亿(1012)次浮点运算为单位(橙色);神经处理单元或NPU,以每秒万亿次运算为单位(爆炸性的灰色区域)。
许多人应该都还记得,曾几何时,我们忙着购买最新和最强劲的个人电脑,因为新的型号时钟周期更快,即是说多一些千兆赫兹。根据摩尔定律,性能每24个月翻一番,或者说每年增加40%左右。而现在,CPU性能升已经放缓到每年大约30%,所以从技术上讲,摩尔定律已经死了。
苹果的片上系统性能打破常规
综合各方面来看,苹果片上系统(SoC)的改进速度自2015年以来已经高于每年118%。实际还更高些,因为118%是上面显示三种处理器类型的实际数字。我们在上图里甚至还没有计算系统中的数字信号处理器和加速器组件的影响,算上这些因素这个数字又可以更高些。
上图右侧所显示的苹果A14可是相当厉害,A14用了64位架构、多核以及另类处理器类型。而重要的要拿所有这些处理能力在iPhone里做什么呢?人工智能应用类型在不断发展,从面部识别到语音和自然语言处理、到渲染视频、到帮助听障人士等等,最终还可以将增强现实送到你的手掌上。
相当地不可思议。
处理功能走向边缘——网络和存储成瓶颈
我们最近报道过微软公司首席执行官萨提亚-纳德拉(Satya Nadella)史诗般的说法:吾辈攀到了中心化的顶峰。下图描绘了一个很有说服力的画面。我们在上面说了处理能力正在以前所未有的速度快速发展。而成本却在排山倒海般地下降。苹果公司的A14芯片单位成本为50美元。Arm公司在旗下V9公告里说,即将发布的芯片可置于冰箱内,可以优化能源使用,每年可节省10%的电力消耗。人家说这种芯片只需花1美元,花1美元就可以节省冰箱电费的10%。
处理功能各式各样而且廉价。看看昂贵的瓶颈在哪里:网络和存储。那么这意味着什么呢?
这意味着,处理功能将被推至边缘——即数据诞生的地方。存储和网络必将越来越呈现分布式和去中心化,定制芯片和处理功能可以将嵌入人工智能置于整个系统里,可以优化工作负载的延迟、性能、带宽、安全和价值的其他方面。
要记住,大部分的数据(99%)都留在边缘。我们就拿特斯拉公司作为一个例子。特斯拉汽车创造的绝大多数数据都不会返回云端。这些数据甚至都不会被持久化。特斯拉也许就保存5分钟的数据。而有些数据会偶尔连接回云端,用于训练人工智能模型。我们下文里还会回来讨论这个问题。
上面这张图在说,如果阁下是一家硬件公司,那阁下最好开始考虑如何利用那条蓝线,即处理能力的爆炸。在我们看来,戴尔科技公司、惠普企业公司、Pure Storage公司、NetApp公司以及之类的公司有两条路,要么开始设计定制芯片,要么就是被颠覆。亚马逊网络服务公司、谷歌公司和微软公司都在这样做是有其道理的,思科系统公司和IBM公司在这样做。正如云计算顾问Sarbjeet Johal所言,"已经不是爷爷的半导体业务了。"。
如果阁下是一名软件工程师,阁下就要去编写应用程序利用收集的所有数据,去发挥这种巨大的处理功能,去创造我们以前从未见过的新功能。
人工智能无处不在
处理能力的大幅提高和廉价芯片必将为下一波人工智能、机器智能、机器学习和深度学习提供强大动力。
我们有时会将人工智能和机器智能交换使用。机器智能这个概念源于我们与作家David Moschella的合作。有趣的是,他在自己的书《看见数字》里说机器智能 "并没有人工因素"可言:
> 机器智能没有任何人工因素,拖拉机的强大也没有任何人工因素,一样的。
只是细微的差别,不过精确的语言往往可以令事情变得清晰。我们经常听人说到机器学习和深度学习,认为二者是人工智能的子集。机器学习将算法和代码用于数据,可以变得 "更聪明",例如,建立更好的模型,获得人类或机器的增强智能及更好的决策。这些模型会在获得更多的数据以及在不断迭代中得到改进。
深度学习则是基于更复杂的数学,是更高级的机器学习。
上图右侧列出来人工智能两个广泛的要素。我们在这里想说的是,时下人工智能的大部分活动都集中在建立和训练模型上。这些活动大多发生在云端。而我们认为人工智能推理则会在未来几年里带来最令人兴奋的创新。
人工智能推理释放巨大的价值
人工智能推理是指模型的部署,就是从传感器获取实时数据,在本地处理数据,利用在云端开发好的训练,实时进行微调。
我们举个例子。我们喜欢汽车的例子,观察一下特斯拉有一定的启发性,也是一个能说明边缘可能会演变的好模型。那就设想一下,汽车在转弯时需要一个优化性能和安全性的算法。该模型的输入是摩擦力、道路状况、轮胎角度、轮胎磨损、轮胎压力等数据。模型建立者不断地测试和添加数据、迭代模型,最后一切就绪可以部署了。
然后,这个模型的智能进入推理引擎,推理引擎是个运行软件的芯片,被置于汽车内,从传感器获得数据以及对转向和制动等进行实时微调。好了到这里,正如我们之前说过的,特斯拉只保存很短一段时间内的数据,因为数据太多。但如果有需要的话,可以选存储某些特别的数据送回云端进行进一步的模型训练。例如,如果一个动物跑到滑溜的路面上,特斯拉也许可以保存该数据快照,将其发回云端,再与其他数据相结合进一步完善模型,进而提高安全性。
这个例子只是成千上万个人工智能推理用例里的一个,这种用例在未来十年将得到进一步发展。
人工智能的价值:从建模转向推理
下面的概念图显示了建模与推理的花费百分比随时间的演变。从图中可以看到时下受关注的一些应用,可以看到,这些应用随着推理成为主流将逐渐成熟。人工智能推理在边缘和物联网领域的机会是巨大的。
建模的重要性将持续。时下的建模工作负载出现在欺诈检测、广告技术、天气、定价、推荐引擎等无所不包的领域,建模工作负载将不断得到改善。但是,我们认为,推理是重中之重,前面的例子也很好地说明了这一点。
在图形的中间,我们标出了一些行业,这些趋势将改变所有这些行业。
说起来另外还有一点。Moschella在他的书中对于为什么过去的垂直行业大多相互隔绝做了解释。这些垂直行业都有自己的产品、供应、物流、销售、营销、服务、履行等各方面的 "堆栈"。专业知识倾向于驻留在行业内,而一众公司在大多数情况下都待在各自的泳道上。
而现在我们可以看到许多科技巨头进入其他行业的例子。亚马逊进入杂货、媒体和医疗保健,苹果进入金融和电动车领域,特斯拉盯上了保险。很多科技巨头跨越传统行业界限,有很多例子,推动者就是数据。例如,汽车制造商渐渐地将比保险公司拥有更好的数据。DeFi(去中心化的金融的英文缩写)或使用区块链的平台将不断利用人工智能得到改善并颠覆传统的支付系统,等等等等。
因此,我们相信近乎陈词滥调那句话:每一个行业都可以被颠覆。
企业人工智能快照
我们上周向读者展示过企业技术研究(ETR)公司的以下图表。
图里数据的纵轴显示的是净得分或支出势头。横轴是市场份额或在ETR数据集中的普遍性。40%的红线是我们的主观定位锚点;在我们看来,处于40%红线上下的东西都非常好。
一段时间以来机器学习和人工智能是支出速度的第一大领域,因此四颗星。机器人流程自动化渐渐移向人工智能附近,可以说云是时下所有机器学习活动的发生地,也在移向人工智能附近,尽管我们认为人工智能将渐渐离开云,我们刚刚描述过原因。
企业人工智能专家上位
下图显示了该领域中一些具有势头的供应商。显示的是公司首席信息官和信息技术买家以及他们的AI/ML相关支出。
上图用了与前面相同的Y/X坐标:纵轴是支出速度,横轴是市场份额,相同的40%红线。
大型云计算公司(如微软、AWS和谷歌)在人工智能和ML方面占主导地位,地位最突出。他们拥有工具和数据。正如我们所说的,很多建模是在云中进行,但将被推送到远程人工智能推理引擎里,这些引擎作为一个整体将拥有大规模的处理能力。我们正在离中心化高峰而去,这将为创造价值和将人工智能应用于工业提供巨大的机会。
Databricks公司可被视为人工智能的领导者并且因其强大的净得分和突出的市场份额脱颖而出。SparkCognition 公司在左上角以极高的净得分,可以说是一枝独秀,尽管样本很少。该公司将机器学习应用于大规模数据集。DataRobot公司做的是自动化人工智能,公司在Y轴上的位置超高。Dataiku公司主打帮助创建基于机器学习的应用程序。C3.ai 公司则是一家企业人工智能公司,由Tom Siebel创立和经营。可以看到SAP SE、Salesforce.com公司和IBM Watson正好在40%的线上下。甲骨文公司拥有自主数据库能力,也出现在图里,还有Adobe公司也在那。
我想说的是,这些软件公司都在他们的产品里嵌入了人工智能。而那些试图不被颠覆的现有公司可以从软件公司购买人工智能。他们不需要自己去建立人工智能。难的地方是如何以及在哪里应用人工智能。简单的答案是:跟着数据走。
要点
这个主题还有很多内容,但现在不说了,总结一下。
我们过去曾努力地探讨过后x86时代以及降低半导体生产成本对于产量的重要性,而今天我们就对一些我们还没有真正看到的东西进行了量化,也就是量化我们今天在处理方面看到的实际性能改进。忘掉摩尔定律已死,摩尔定律已死无关紧要。原始的命题在近十年里被片上系统以及即将出现的包上系统(System on package)设计不成比例地夸大了。说到计算性能的提升,现在还有量子计算呢,谁知道未来会有什么样子。
这些趋势是人工智能应用的基本推动力,和在大多数情况下一样,创新源于消费者使用案例;苹果继续引领潮流。苹果将硬件和软件集成的方法将更多地浸入到企业思维方式中。显然,云计算供应商正在朝着这个方向发展。在甲骨文公司也可以看到这一点。将硬件和软件放在一起优化是有其道理的,也将成为趋势,我们上周讨论过Arm宣布的消息,芯片定制的商机非常多,就是这个原因。新任首席执行官Pat Gelsinger带领的英特尔公司也会朝这个方向发展。
题外话,Gelsinger在英特尔可能会面临巨大的挑战,但他说的半导体的需求正在增加而且看不到尽头是对的。
如果阁下是个企业,阁下不应该将重点放在发明人工智能上。相反,阁下的重点应该是去了解什么数据会给你带来竞争优势以及如何利用机器智能和人工智能赢得胜利。你将购买人工智能,而不是建造人工智能。
正如John Furrier多次说过的,数据正在成为新的开发工具。这话他10年前说的,现在更是这样了:
数据就是新的开发工具
如果阁下是个企业硬件玩家,阁下就要设计自己的芯片及编写更多的软件去开拓人工智能。你要在你的产品组合中嵌入定制芯片和人工智能,要越来越多地把计算带到数据里。数据大多经停留在其创建地。系统、存储和网络堆栈都在被颠覆。
如果阁下是软件开发者,现在手掌里的处理能力难以置信地强大,要在编写新的应用程序时利用这一点,要使用人工智能去改变世界。你必须搞清楚如何获得最相关的数据,确保你的平台的安全及进行创新。
最后,如果阁下是一家服务公司,你的机会是帮助其他公司不被颠覆。这种机会很多。你拥有深厚的行业专业知识和横向技术能力,这些都可以帮助客户生存和发展。
隐私?人工智能为善?这些都可以各自成为独立话题,记者们也在广泛地报道。我们认为,目前谨慎的做法是,首先要更好地了解人工智能可以走多远,再去确定人工智应该走多远以及应该如何被监管。我们最关心的事情应该是保护我们的个人数据和隐私,但一般来说,在这个时候我们还不那么想去扼杀创新。