“人工智能”初创公司所面临的问题
Andreessen-Horowitz 一直是当前主要风投公司中头脑最冷静的人。当其他公司在“cleantech”和违反物理学定律的荒谬的生物技术初创公司上加杠杆时,他们悄悄地继续的投资理智的公司(也包括像 soylent 这样的垃圾清理产品)。我认为他们实际上是在倾听前线的人们,而不是他们的风投伙伴告诉他们什么。也许他们只是比其他人更聪明,更具独立的思想。他们最近对“人工智能”与软件公司投资的不同之处进行了评估,结果相当残酷。我很确定大多数人没有理解这一点,所以我引用它来强调重要的部分。
https://a16z.com/2020/02/16/the-new-business-of-ai-and-how-its-different-from-traditional-software/
他们使用所有流行词汇(“人工智能”这个词在他们的意思中是“机器学习”),但他们终于公开注意到某些事情,这些事情对任何在这个领域工作的人来说都是非常明显的。例如,使用“云”计算的深度学习初创企业的毛利率很低。主要是因为他们使用云计算。
毛利率,第 1 部分:云基础设施是一个实质性的—有时对于 AI 公司是隐形成本
在以前的预购软件时代,交付产品意味着淘汰和交付物理媒介 —— 运行软件的成本,无论是在服务器上还是在台式机上,都由买方承担。如今,随着 SaaS 的主导地位,这一成本被推给了供应商。大多数软件公司每个月都要支付大量的 AWS 或 Azure 账单 —— 软件要求越高,账单就越高。
事实证明,AI 的要求相当高:
- 训练 单个AI模型可能需要在计算资源上花费数十万美元(或更多)。虽然人们很容易将其视为一次性成本,但重训练正日益被视为一种持续成本,因为提供人AI模型的数据往往会随着时间而变化(这种现象被称为“数据漂移”)。
- 模型推断 (在生产中生成预测的过程)在计算上也比操作传统软件更加复杂。执行一长串的矩阵乘法比只从数据库中读取需要更多的数学运算。
- 人工智能应用程序比传统软件更有可能在图像、音频或视频等富媒体上运行。这些类型的数据消耗比通常的存储资源更高的资源,处理起来很昂贵,而且经常会遇到感兴趣的区域问题 —— 应用程序可能需要处理一个大文件才能找到一个小的、相关的代码片段。
- 已经有人工智能公司告诉我们,云操作可能比传统方法更加复杂和昂贵,特别是因为没有好的工具来在全球范围内扩展人工智能模型。因此,一些人工智能公司不得不经常在云计算区域之间移动训练过的模型 —— 这将增加进入和退出的成本 —— 以提高可靠性、延迟和可塑性。
这些东西加在一起,贡献了 AI 公司通常花费在云资源上的 25% 或更多的收入。在极端情况下,处理特别复杂任务的初创公司实际上发现,手工数据处理比执行训练有素的模型更便宜。
这对于所有需要大量计算的数据问题的机器学习都是适用的。“云”的定价结构旨在从数据量大或计算需求大的人身上榨取最大的血量。云计算公司更愿意将硬件上的时间卖给 5 到 10 个客户。如果你足够幸运,拥有一个运行数百万行数据和 GBM 或随机森林的初创公司,这可能一点都不现实,但很少有初创公司是如此幸运的。除非购买自己的硬件,否则那些使用最新的深度学习算法来处理他们需要的庞大数据集的人将会有巨大的计算开销。出于一些对我来说毫无意义的原因,他们大多数人不买硬件。
在许多问题领域,需要指数级的处理能力和数据以获得更高的精度。这意味着 — 正如我们之前所注意到的 — 模型的复杂性正在以令人难以置信的速度增长,处理器也不太可能跟上。摩尔定律是不够的。(例如,自 2012 年以来,训练最先进的人工智能模型所需的计算资源已经增长了 30 万倍,而 NVIDIA GPU 的晶体管数量只增长了~4 倍!)分布式计算是解决这个问题的一个引人注目的解决方案,但它主要解决的是速度,而不是成本。
除了他们所说的深度学习模型的大小(这对于有趣的新结果来说无疑是正确的),承认 GPU 芯片的计算能力并没有真正快速增长是很少听到的事情(尽管最近经常听到)。大家都认为摩尔定律会拯救我们。实际上,NVIDIA 确实有明显的性能改进可以做,但事情的规模是如此之大,增长更大的模型的唯一方法是使用更多的 GPU。在你从利用“云”来赚钱的公司里租来的算力上这么做是财务自杀。
毛利率,第 2 部分:许多人工智能应用依赖于“humans in the loop”以保持一个高水平的准确性
人工智能系统有两种形式,它们都有助于降低许多人工智能初创公司的毛利率。首先:训练当今最先进的人工智能模型涉及到对大型数据集的人工清洗和标记。这一过程既费力又昂贵,而且是人工智能得到更广泛应用的最大障碍之一。另外,正如我们前面所讨论的,一旦部署了模型,训练就不会结束。为了保持准确性,新的训练数据需要不断地被捕获、标记并反馈到系统中。虽然像漂移检测和主动学习这样的技术可以减轻这种负担,但有趣的数据显示,许多公司在这个过程中花费了高达 10-15% 的收入 — 通常不包括核心工程资源 — 并且认为正在进行的开发工作要超过一般性的修复 bug 和添加产品特性。
第二:对于许多任务,尤其是那些需要更强认知推理能力的任务,人类经常实时地接入人工智能系统。例如,社交媒体公司雇佣数千名人工审核人员来增强基于人工智能的审核系统。许多自动驾驶汽车系统包括远程操作人员,大多数基于人工智能的医疗设备与医生作为联合决策者进行交互。随着现代人工智能系统的能力越来越被人们所理解,越来越多的初创公司开始采用这种方法。许多计划销售纯软件产品的人工智能公司,正越来越多地在内部引入服务功能,并预订相关成本。
这个行业的每个人都知道。如果你使用有趣的模型,即使假设存在无限精确标记的训练数据,“human in the loop”问题也不会完全消失。机器学习模型通常是“人工放大”。如果你需要某人(或者更有可能是几个人)每年赚 50 万美元来维持你的神经网络产生合理的结果,你可能会重新考虑你的选择。如果它每年能做出几百次人类层面的决定,那么对人类来说,使用更好的用户界面,手工做出这些决定可能会更容易,成本也更低。更好的用户界面被严重低估了。看看 Labview、Delphi 或 Palantir 提供的高效用户界面示例。
由于可能的输入值范围非常大,每个新客户的部署都可能生成以前从未见过的数据。即使是看起来相似的客户 —— 例如两家做缺陷检测的汽车制造商 —— 也可能需要本质上不同的训练数据,因为一些简单的事情,比如在他们的装配线上放置摄像机。
解决业务问题的软件通常可以扩展到新客户。你执行一些数据库后端繁重的工作,然后将其插入,就完成了。有时你必须调整过程以适应软件的可接受用途,或者花费大量的劳动调整软件以适应你的业务流程:SAP 在这方面臭名昭著。这样的周期耗费大量时间和人力。显然,他们至少在某些时候是值得的。虽然 SAP 臭名昭著,大多数人还没有发现面向机器学习的过程几乎不能像一个简单的应用那样进行扩展。你将面临与使用 SAP 相同的问题,前面有大量的工作要做,一切都是定制的。我将大胆断言,大多数前置的数据管道和组织更改可能比实际的机器学习部分更有价值。
在人工智能的世界里,技术上的差异化更难实现。新的模型架构主要是在开放的学术环境中开发的。参考实现(预训练的模型)可以从开源库中获得,模型参数可以自动优化。数据是人工智能系统的核心,但它通常属于客户,属于公共领域,或者随着时间的推移成为一种商品。
这是正确的,这就是为什么像我这样的“独狼”,或者一个“小团队”可以比一些拥有 100 倍员工和 1 亿风投支持的公司做得更好。我知道最新的深度学习算法有什么优点和缺点。更糟糕的是:我知道,从商业的角度来看,一些愚蠢的东西,如朴素的贝叶斯或线性模型,可能会解决客户的问题,就像最新的残暴的十亿瓦特的神经网络一样。这家风投支持的初创公司可能把赌注押在了他们的“特殊工具”上,即 moaty IP。如果数据是手工生成的,没有正确的标记,ROC 曲线上的几个百分点的差异并不重要,这描述了你在实际中遇到的大多数数据。毋庸置疑,机器学习是有用的,但很少有初创公司有“特别的佐料”,比你提交的 Git repo 好 10 倍或 100 倍。除非它代表了真正改变游戏规则的结果,否则人们不会对它比内部的特别的数据科学解决方案支付更高的费用。这项技术可以让所有人大吃一惊,但如果它只比 MAPE 好 5%(或者其他什么),这是无关紧要的。很多“人工智能”并不比通过“分组”查询的直方图更好。向它添加复杂性不会使它变得更好:有时数据中没有数据。
对于“人工智能”技术人员来说,一些好的要点是:
尽可能消除模型的复杂性。我们已经看到,在为每个客户训练单独模型的初创公司与能够在所有客户之间共享单一模型(或一组模型)的初创公司之间,存在着巨大的差异……
能这样做很好,但非常罕见。如果你发现了这样的问题,你最好希望你有一个特殊的解决方案,或一个独一无二的数据集,使它成为可能。
仔细地选择问题域——通常是狭义地——以减少数据的复杂性。使人类劳动自动化是一件非常困难的事情。许多公司发现,人工智能模型的最小可行任务比它们预期的要窄。例如,一些团队发现,在电子邮件或招聘信息中提供简短的建议是成功的,而不是提供一般性的文本建议。在 CRM 领域工作的公司已经发现了非常有价值的人工智能利用场景,这些场景仅仅围绕更新记录。有很多类似这样的问题,对人类来说很难解决,但对人工智能来说相对容易。它们往往涉及大规模、低复杂度的任务,如审核、数据输入/编码、转录等。
这是对“人工智能”失败的巨大承认。所有关于“人工智能取代就业岗位”的甜言蜜语,都像往常一样,在小精灵的烟雾中蒸发了。真的,他们说的是廉价的海外劳动力,有人反反复复地说“人工智能会替代你的工作”,是的,它们确实提供了在一些有限的领域中使用 ML 的可能性,我同意,但是风险资本支持所需要的是曲棍球棒,以及让它运作所需要的大批博士,并不能很好地与那些有有限市场的有限领域相结合。
拥抱服务。在它所处的市场有巨大的机会。这可能意味着提供全栈翻译服务而不是翻译软件,或者运营出租车服务而不是销售自动驾驶汽车。
换句话说,你可能无法把一个能解决各种问题的大脑装进一个罐子里:你可能会成为一家咨询和服务公司。如果你不熟悉估值中的数学:服务公司的年营收约为 2 倍,在这里,软件和“技术”公司的收入是 10-20 倍。这就是为什么 WeWork 一直试图把他的金字塔计划定位为一个软件公司。这里的含意是巨大的:A16z 的“人工智能”提升了股价,而与他们想法相似的人的估值会低得多。如果现在还不清楚的话,他们又说了一遍:
总结一下:今天的大多数人工智能系统都不是传统意义上的软件。因此,人工智能业务看上去与软件业务并不完全一样。它们涉及持续的人力支持和物质上的可变成本。它们通常不像我们想的那样容易扩展。具有强大的防御能力 —— 对“一次构建/多次销售”的软件模型至关重要 —— 似乎不是免费的。这些特点让人工智能在某种程度上感觉像是一个服务行业。换句话说:你可以取代服务公司,但你不能(完全)取代服务。
既然他们这么做了,我还要再说一遍:服务公司的价值不像软件公司那么高。风投热爱软件业务,提前努力解决问题,永远印钞票。这就是他们获得 10-20 倍收入估值的原因。服务公司?你为什么要投资一家服务公司?它们的增长受到劳动力成本和奇怪的可解决市场问题的内在制约。
这并不是一个新的“人工智能冬天”的公告,但现在是秋天了,对于那些声称提供世界领先的“人工智能”解决方案的创业公司来说,冬天就要来了。“人工智能”的承诺一直是取代人类的劳动,增加人类对自然的力量。实际上认为 ML 是“人工智能”的人认为机器会以某种方式自动学习,不需要人类。然而,这并不是经济或物质上的现实。事实上,有一些有趣的模型可以通过训练有素的 dba、数据工程师、统计人员和技术人员应用到业务问题中。这类事情最好在现有的大公司里进行,以提高生产率。如果公司是僵化的,它可以聘请外部顾问,就像他们一直做的那样。A16z 的投资组合反映了这一点。撇开他们的自动驾驶汽车的投资(这看起来没有一个大的“人工智能”组件),和一些健康科技投资至少有线性回归层数据的科学,我只能只识别出 2 个他们投资的数据科学相关的初创公司。启动资助他们。尽管有不同的说法,但他们的资金表明,“人工智能”公司看上去不那么抢手。
我 TLDR 要点:
- 为了获得边际收益,深度学习的计算成本很高
- 机器学习初创公司通常没有护城河或有意义的特殊资源
- 机器学习初创企业大多是服务企业,而不是软件企业
- 在数据和流程效率低下的大型组织中,机器学习的效率最高