来源:数乾坤编译 时间:2024-04-10 14:48:31 作者:
近日,美国知名风险投资机构FirstMark发布了2024MAD(Machine learning, AI & Data) 生态系统全景图(《机器学习、人工智能与数据全景》)。全景显示,2024年机器学习、人工智能与数据行业生态中,共有2011家企业上榜,这一数字比去年的1416家有所上升,其中,有578家企业是新加入者。FirstMark指出,当前数据已被大量数字化,可以使用现代化工具快速且廉价地存储、处理和分析,最重要的是,它可以被输入到性能更高的 ML/AI 模型中,这些模型可以理解、识别、分析,并基于它进行预测推算,甚至生成文本、代码、图像、声音和视频。
一、机器学习、人工智能与数据全景
FirstMark的分析文章指出,之所以有这么多企业涌入机器学习、人工智能与数据等赛道,是由于连续两波大规模的公司创立和融资所致。
第一波是持续约10年的数据Infra周期,从大数据开始——以现代数据栈结束。人们期待已久的领域整合尚未真正发生,大多数的公司仍然存在。
第二波是ML/AI周期,这一周期是以GenAI的出现为标志开始的。我们正处于这一周期的早期阶段,大多数公司都非常年轻,因此在全景中包含了许多年轻的初创公司(相当多的公司仍处于种子阶段)。
两次大浪潮+有限的整合=大量公司出现。
二、2024年值得深思的24个问题
FirstMark表示,人工智能领域的发展速度瞬息万变,覆盖面前所未有,带来了24个值得关注和深思的问题。
1.结构化数据与非结构化数据
这部分既是一个主题,也是 FirstMark 在对话中经常提及的,以帮助解释当前的趋势。简而言之,不是所有数据都是相同的。大致而言,有两大类数据,围绕每个家族,都出现了一套工具和用例。
结构化数据管道:即可以适应行和列的数据。
为了分析目的,数据从交易数据库和 SaaS 工具中提取,存储在云数据仓库(如 Snowflake)中,进行转换,并使用商业智能(BI)工具进行分析和可视化,主要用于理解现在和过去(所谓的“描述性分析”)。这一流程通常由下面讨论的现代数据栈启用,分析是核心用例。
此外,结构化数据也可以“传统”ML/AI 模型用于预测未来(预测性分析)——例如,哪些客户最有可能流失。
非结构化数据管道:即通常不适合行和列的数据世界,如文本、图像、音频和视频。非结构化数据主要是在 GenAI 模型(LLMs 等)中得到训练和使用(推理)。
这两类数据(及相关工具和公司)目前的运气和关注度大不相同。非结构化数据(ML/AI)很热门;结构化数据(现代数据栈等)则不然。
2.现代数据堆栈已死?
大约在2019-2021年,软件世界中没有什么比现代数据栈(MDS)更吸引人的东西了。与“大数据”一样,它是少数几个从数据工程师跨越到更广泛受众(高管、记者、银行家)的Infra概念之一。现代数据栈基本上涵盖了上面提到的那种结构化数据管道。它围绕着快速增长的云数据仓库,与之相关的供应商位于其上游(如Fivetran和Airbyte)、其顶部(DBT)和下游(Looker、Mode)。随着 Snowflake 成为有史以来最大的软件 IPO,对 MDS 的兴趣爆炸性增长,伴随着疯狂的、ZIRP(零利率政策)驱动的公司创立和 VC 融资。
在一两年内,整个类别变得过于拥挤——数据目录、数据可观察性、ETL、反向 ETL,仅举几例。现代数据栈不仅是解决实际问题的真正解决方案,也是一个营销概念和一系列创业公司在数据价值链中形成的事实联盟。
快进到今天,情况大为不同。2023 年,FirstMark 预览了 MDS“压力山大”,这种压力在 2024 年只会继续加剧。
MDS 面临两个关键问题:
组建现代数据栈需要将多个独立供应商的各种最佳解决方案拼凑在一起。结果是,从金钱、时间和资源的角度来看,这是一项昂贵的工作。在后 ZIRP 预算削减时代,财务官办公室不会看好这一点。
MDS 不再是街区上的酷孩子。GenAI抢走了高管、VC和媒体的所有注意力——它需要上面提到的那种非结构化数据管道。
3.数据基础设施整合,规模不断扩大
鉴于上述情况,2024年数据基础设施和分析领域接下来会发生什么?它可能看起来像这样:
现代数据堆栈及其周围的许多初创公司将积极地重新定位为“人工智能基础设施初创公司”,并试图在现代人工智能堆栈中找到一席之地。这在某些情况下可行,但在大多数情况下,从结构化数据到非结构化数据可能需要根本性的产品演变。
数据基础设施行业最终将出现一些整合。迄今为止,并购活动相当有限,但2023年确实发生了一些收购,无论是插手还是中型收购,包括Stemma(被Teradata收购)、Manta(被IBM收购)、Mode(被Thoughtspot收购)等,将会有更多的创业失败——随着风险投资资金的枯竭,事情会变得艰难。许多初创公司大幅削减了成本,但迟早他们的现金流将结束。不要指望看到华而不实的头条新闻,不幸的是这将会发生。
该领域的较大公司,无论是规模扩大的公司还是上市公司,将加倍下注于其平台战略,并努力覆盖更多功能。其中一部分将通过收购(因此整合)实现,但很多也将通过自主开发实现。
4.检查Databricks与Snowflake
说到该领域的大公司,让我们来看看Snowflake 和 Databricks 这两个关键数据基础设施参与者之间的 “巨兽之争”。
Snowflake(历史上来自结构化数据管道领域)仍然是一家令人难以置信的公司,也是估值最高的上市科技股之一(截至发稿时,EV/NTM 收入为 14.8 倍)。 然而,与许多软件行业一样,该公司的增长速度已大幅放缓--截至撰写本文时,该公司 2024 财年的产品收入同比增长 38%,总计 26.7 亿美元,预计 NTM rev 增长 22%)。 也许最重要的是,Snowflake 给人的印象是一家在产品方面面临压力的公司--它在拥抱人工智能方面一直比较缓慢,收购能力也相对较弱。最近有些突然的首席执行官更迭是另一个有趣的数据点。
Databricks(历史上来自非结构化数据管道和机器学习领域)正经历着全面强劲的发展势头,据报道(因为它仍然是一家私营公司),24 财年的营收达到 16 亿美元,增长率超过 50%。 重要的是,Databricks正在通过收购(最引人注目的是以 13 亿美元收购了MosaicML)和自主产品开发,成为生成式人工智能领域的重要参与者--首先是作为非结构化数据的重要存储库,为LLMs提供数据,同时也是模型的创建者,从Dolly到DBRX,这是公司在撰写本文时刚刚宣布的一种新的生成式人工智能模型。
在Snowflake与 Databricks的竞争中,新的重大演变是 Microsoft Fabric的推出。它于2023年5月发布,是一个端到端、基于云的数据和分析SaaS平台。它集成了大量微软产品,包括OneLake(开放式湖泊库)、PowerBI和Synapse Data Science,基本上涵盖了从数据集成、工程到数据科学的所有数据和分析工作流。按照惯例,大公司发布产品时,宣布与实际产品之间会有一定的差距,但结合再加上微软在生成式人工智能领域的大力推动,这可能会成为一个可怕的威胁(作为故事的另一个转折点,Databricks很大程度上位于 Azure之上)。
5.2024年商业智能以及生成式人工智能是否能改变数据分析?
在现代数据栈和结构化数据管道世界的所有部分中,商业智能是重塑时机最成熟的类别。我们在2019年的MAD中强调了商业智能行业是如何几乎完全整合的,并在2021年的MAD中谈到了度量存储的出现。
商业智能/分析的转型速度比我们预期的要慢。 该行业在很大程度上仍由微软的PowerBI、Salesforce的Tableau和谷歌的Looker等老产品主导,这些产品有时会在更广泛的销售合同中免费捆绑销售。一些公司进行了整合(Thoughtspot 收购了Mode,Sisu被Snowflake悄然收购)。 一些年轻的公司正在采用创新的方法,无论是规模企业还是初创企业,但它们一般都处于发展初期。
除了可能在数据提取和转换方面发挥强大作用外,生成式人工智能还可能在数据分析的超级化和民主化方面产生深远影响。
这方面的活动确实很多。OpenAI 推出了 "代码解释器"(Code Interpreter),后来更名为 "高级数据分析"(Advanced Data Analysis)。微软为 Excel 中的财务人员推出了 Copilot AI 聊天机器人。在云计算供应商、Databricks、Snowflake、开源软件和大量初创公司中,很多人正在开发或已经发布了 "文本到 SQL "产品,以帮助使用自然语言在数据库中运行查询。
这种前景既令人兴奋,又具有潜在的颠覆性。 数据分析的圣杯一直是它的民主化。 如果自然语言能够成为笔记本、数据库和商业智能工具的界面,那么将有更多的人能够进行分析。
然而,商业智能行业的许多人对此持怀疑态度。 SQL 的精确性和理解查询背后业务背景的细微差别被认为是自动化的巨大障碍。
6.现代人工智能堆栈的崛起
到目前为止,我们讨论的很多内容都与结构化数据管道世界有关。
如前所述,非结构化数据基础架构的世界正在经历一个截然不同的时刻。 非结构化数据为LLM提供了源源不断的动力,而且对它的需求也非常旺盛。 每家正在试验或部署生成式人工智能的公司都在重新发现一个老生常谈的话题:"数据是新的石油"。 每个人都希望获得LLM的能力,但要在自己的(企业)数据上进行训练。
大大小小的公司纷纷抓住机会,为生成式人工智能提供基础设施。
从Databricks到Scale AI(该公司将最初为自动驾驶汽车市场开发的标签基础架构发展为与OpenAI和其他公司合作的企业数据管道),再到Dataiku(该公司推出了LLM Mesh,使全球2000强企业能够在多个LLM供应商和模型之间无缝协作),几家人工智能扩展公司都在积极发展自己的产品,以利用市场的发展势头。
与此同时,新一代人工智能基础架构初创企业也在多个领域崭露头角,其中包括:
矢量数据库,以生成式人工智能模型可以使用的格式(矢量嵌入)存储数据。 专业厂商(Pinecone、Weaviate、Chroma、Qudrant 等)在今年取得了丰硕成果,但一些现有数据库厂商(MongoDB)也迅速做出反应,增加了矢量搜索功能。关于更长的上下文窗口是否会完全消除对矢量数据库的需求,争论也一直在进行,双方都有自己的观点。
框架(LlamaIndex、Langchain 等),用于连接和协调所有移动部件
护栏(Guardrails),位于 LLM 和用户之间,确保模型提供的输出符合组织规则。
评估器,帮助测试、分析和监控生成式人工智能模型的性能,这是一个难题,对公共基准的普遍不信任就证明了这一点。
路由器,帮助在不同模型之间实时引导用户查询,以优化性能、成本和用户体验。
成本保护器,帮助监控使用 LLM 的成本。
端点,有效的应用程序接口,可抽象出底层基础设施(如模型)的复杂性。
鉴于现代数据堆栈的历史,我们一直在抵制使用“现代人工智能堆栈”这一术语。
但这一表述捕捉到了许多相似之处:许多初创公司都是当时的“热门公司”,就像之前的 MDS 公司一样,它们往往成群结队,结成营销联盟和产品合作关系。
而新一代的人工智能基础架构初创企业也将面临一些与之前的MDS公司相同的挑战:这些类别中的任何一个都足以建立一家价值数十亿美元的公司吗?大公司(主要是云提供商,也包括 Databricks 和 Snowflake)最终会自己构建哪一部分?
7.我们身处AI炒作周期的什么阶段?
数十年间,人工智能就经历了寒冬和热季。过去的10到12年间,是我们经历的第三个人工智能炒作周期:2013—2015年,深度学习在ImageNet 2012之后进入人们的视线;2017—2018年,聊天机器人热潮和TensorFlow兴起时,又经历了一个炒作周期;自 2022年11月以来,又经历了生成式人工智能(Generative AI)。
这一轮炒作尤为激烈,甚至让人感觉像是人工智能泡沫,原因有很多:这项技术令人印象深刻;它非常有内涵,能吸引科技圈以外的广大受众;对于手握大量干粉的风险投资人来说,它是城里唯一的游戏,因为几乎所有其他科技领域都不景气。
炒作带来了所有常见的好处——“没有非理性的繁荣,就没有伟大的成就”、“百花齐放”、“雄心勃勃的项目可以获得大量资金”,当然了也会出现其他不和谐的声音——一夜之间人人都成了人工智能专家,每家初创公司都是人工智能初创公司,太多的人工智能会议/播客/新闻通讯......
所以,任何炒作周期的主要问题都会不可避免地反弹。
在这一市场阶段,存在着相当多的“怪异性”和风险性:这一领域的标杆公司有着非常不寻常的法律和治理结构;有很多“计算换股权”交易没有得到充分理解或披露;很多顶级初创公司都是由人工智能研究人员团队运营的;很多风险投资交易让人联想到 ZIRP 时代: 对于非常年轻的公司而言,"土地掠夺"、大额融资和令人瞠目的估值都是如此。
当然,人工智能的炒作已经出现了裂痕,但我们仍然处在每周都有新鲜事物让人大开眼界的阶段。据报道,沙特阿拉伯的400亿美元人工智能基金等消息似乎表明,流入该领域的资金不会很快停止。
8.实验与现实:2023年是虚假的一年吗?
与上述相关——鉴于炒作,到目前为止有多少是真实的,而不仅仅是实验性的?2023 年是充满行动的一年:每个技术供应商都急于将GenAI纳入他们的产品供应;每个全球2000强公司的董事会都要求他们的团队“攻坚AI”,并且一些企业的AI部署以创纪录的速度发生,包括在Morgan Stanley和Citibank等受监管行业的公司;当然,消费者对 GenAI应用也表现出极大的兴趣。
因此,2023年是一个重大的胜利的一年:OpenAI 达到了20亿美元的年收入率;Anthropic 以允许其预测2024年收入为8.5亿美元的速度增长;团队规模仅为40人的Midjourney在没有投资的情况下收入增长到2亿美元;Perplexity AI从0增长到每月1000万活跃用户……等等。我们应该持怀疑态度吗?
我们不禁担忧:
在企业中,很多支出都用在了概念验证或容易获胜的项目上,通常都是从创新预算中支出的。
与解决实际业务问题相比,有多少是出于高管们不想显得束手无策的考虑?
在消费领域,人工智能应用的流失率很高。有多少是出于好奇?
无论是在个人生活还是职业生活中,许多人都表示不能完全确定如何使用新一代人工智能应用程序和产品。
并非所有的人工智能产品,即使是那些由最优秀的人工智能人才打造的产品,都会有神奇的效果:我们是否应该把 Inflection AI在融资13亿美元后迅速倒闭的决定视为一种承认,即世界不需要另一个人工智能聊天机器人,甚至不需要 LLM提供商?
9.LLM公司:也许并非如此商品化?
数十亿的风险投资和公司资金正在投资于基础模型公司。因此,过去18个月中大家最关心的问题:我们是否正在目睹资本投入到最终商品化产品中的惊人烧钱?或者这些 LLM 提供商是新的 AWS、Azure和GCP?
一个令人不安的事实是,似乎没有LLM正在构建持久的性能优势。截至发稿,Claude 3 Sonnet 和 Gemini Pro 1.5 的性能优于GPT-4,GPT-4的性能又优于 Gemini 1.0 Ultra,如此等等——但这似乎每几周就会改变。性能也可能波动——在某个时点,ChatGPT“失去理智”并“变得懒惰”,暂时地。
此外,开源模型(Llama 3、Mistra等以及DBRX等)在性能方面正在迅速追赶。另一方面,市场上的LLM提供商比最初看起来的要多。几年前,普遍的说法是只能有一两家 LLM公司,存在着赢者通吃的动态,部分原因是全球只有少数人具备扩大Transformers的必要专业知识。
事实证明,能力超出最初预期的团队更多。除了OpenAI 和Anthropic,还有一些初创公司在进行基础 AI 工作——Mistral、Cohere、Adept、AI21、Imbue、01.AI 等。然后当然还有 Google、Meta 等团队。话虽如此,到目前为止LLM 提供商似乎做得很好。
OpenAI和Anthropic 的收入以惊人的速度增长,也许 LLM模型确实会变得商品化,LLM公司仍然面临着巨大的商业机会。他们已经成为“全栈”公司,为多个受众(消费者、企业、开发者)提供应用程序和工具,除了底层模型外。或许与云供应商的类比确实相当恰当。AWS、Azure 和 GCP 通过应用程序/工具层吸引并留住客户,并通过大体上无差别的计算/存储层进行货币化。
10.LLMs、SLMs 和混合未来
对于所有关于大型语言模型的兴奋,过去几个月的一个明确趋势是小型语言模型(SLMs)的加速,例如 Meta 的 Llama-2-13b、Mistral的Mistral-7b 和 Mixtral 8x7b、Microsoft 的 Phi-2和Orca-2。
虽然LLMs正在变得越来越大(据报道 GPT-3 有 1750 亿个参数,GPT-4 有 1.7 万亿个参数,世界正在等待更加庞大的 GPT-5),SLMs 成为许多用例的强大替代品,因为它们运营成本更低,更易于微调,且通常提供强大的性能。
专门化模型的兴起,针对特定任务(如编码的 Code-Llama、Poolside AI)或行业(例如 Bloomberg 的财经模型,或为材料科学建模的初创公司 Orbital Materials 等)的专用模型,也是加速的另一个趋势。
正如我们在许多企业部署中已经看到的,世界正在快速演变为结合多个模型的混合架构。
尽管价格已经下降,但大型专有 LLMs 仍然非常昂贵,经历延迟问题,因此用户/客户将越来越多地部署模型的组合,大型和小型,商业和开源,通用和专用,以满足他们的特定需求和成本约束。
11.传统 AI 是否已消失?
随着 ChatGPT 的推出,有趣的事情发生了:到目前为止部署的大部分AI一夜之间被标记为“传统 AI”,与“生成式AI”形成对比。这对许多到目前为止被认为是从事前沿工作的AI从业者和公司来说有点震惊,因为“传统”一词明显暗示了所有形式的AI都将被新事物彻底替代。实际情况要复杂得多。
传统AI和GenAI最终非常互补,因为它们处理不同类型的数据和用例。现在被标记为“传统 AI”的东西,或偶尔被称为“预测性AI”或“表格 AI”,也是现代AI(基于深度学习)的一部分。然而,它通常专注于结构化数据,和诸如推荐、流失预测、价格优化、库存管理等问题。
"传统 AI" 在过去十年中经历了巨大的采用,并且已经在全球成千上万的公司中大规模生产部署。相比之下,GenAI主要操作非结构化数据(文本、图像、视频等)。它在不同类别的问题(代码生成、图像生成、搜索等)上表现出色。
这里也是,未来是混合的:公司将使用LLMs处理某些任务,预测模型处理其他任务。最重要的是,他们经常将它们结合起来 LLMs可能不擅长提供精确的预测,比如流失预测,但你可以使用一个LLM调用另一个模型的输出,后者专注于提供那个预测,反之亦然。
12.套壳和成为全栈的竞争
2023年,大家都喜欢使用“Thin Wrappers”这个贬义词。如果你的核心能力是由别人的技术提供的,那么很难构建持久的价值和差异化,这是争论的要点。而且几个月前有报告说,像Jasper这样的初创公司在经历了流星般的收入上升后遇到了困难,似乎证实了这种思考方式。
有趣的问题是,随着时间的推移,年轻初创公司构建更多功能会发生什么?“ Thin Wrappers”是否会变成“Thick Wrappers”?2024年,似乎厚包装有通过以下方式实现差异化的路径:
专注于特定问题,通常是垂直的——因为任何太横向的东西都有成为大科技“杀戮区”的风险。
构建针对该问题的工作流程、协作和深度集成。
在AI模型层面做大量工作——无论是用特定数据集微调模型还是创建针对其特定业务的混合系统(LLMs、SLMs 等)。换句话说,它们需要既狭窄又“全栈”(应用程序和Infra)。
13.2024 年值得关注的有趣领域:AI 代理、边缘 AI
过去一年围绕 AI 代理概念的兴奋颇多——基本上是智能系统的最后一英里,可以执行任务,通常以协作方式。这可以是从帮助预订旅行(消费者用例)到自动运行完整的 SDR 活动(生产力用例)到 RPA 风格的自动化(企业用例)等任何事情。AI 代理是自动化的圣杯 - 一个“文本到行动”的范例,其中 AI 为我们完成任务。每隔几个月,AI 世界就会为类似代理的产品疯狂,从去年的 BabyAGI 到最近的 Devin AI(一个“AI 软件工程师”)。然而,总的来说,到目前为止,这种兴奋大多是为时过早的。在涉及几个模型的复杂系统可以一起工作并代表我们采取实际行动之前,还有很多工作要做,以使 GenAI 变得不那么脆弱且更可预测。还有一些缺失的组件——比如需要将更多记忆构建进 AI 系统中。然而,预计在接下来的一两年内,AI 代理将是一个特别令人兴奋的领域。
另一个有趣的领域是边缘 AI。尽管存在对大规模运行并作为端点提供的 LLMs 的巨大市场需求,但 AI 的一个圣杯是能够在本地设备上运行的模型,不需要 GPUs,特别是手机,以及智能的 IoT 类设备。这个领域非常活跃:Mixtral、Ollama、Llama.cpp、Llamafile、GPT4ALL(Nomic)。谷歌和苹果也可能越来越活跃。
14.GenAI 是否正朝着 AGI 发展,还是走向平台?
鉴于所有对 AI 的狂热讨论,以及似乎每周都有令人难以置信的新产品出现——但是否存在一个世界,在这个世界中,GenAI的进步放缓而不是一直加速到AGI?这意味着什么?
论点有两方面:一是基础模型是一项蛮力练习,我们将耗尽资源(计算、数据)来“喂养”它们。二是即使我们不耗尽,最终通往AGI的路径是推理,而LLMs不具备这种能力。有趣的是,这与6年前行业的讨论大致相同。
自 2018 年以来似乎发生的最大变化是投入到(日益能干的)模型中的大量数据和计算。在 AI 推理方面取得了多少进展,总体上来说还不太清楚——尽管 DeepMind 的 AlphaGeometry 程序似乎是一个重要的里程碑,因为它结合了语言模型和符号引擎,利用逻辑规则进行推理。距离任何形式的“耗尽计算或数据”有多近,是很难评估的。“耗尽计算”的前沿似乎每天都在被进一步推迟。
NVIDIA 最近宣布的 Blackwell GPU 系统,公司表示它可以部署一个 27 万亿参数模型(相对于 GPT-4 的 1.7 万亿)。数据部分更为复杂——有一个更为战术的问题,关于耗尽合法授权数据,以及一个更广泛的问题,关于总体上耗尽文本数据。
当然,正在进行很多关于合成数据的工作。Yann LeCun 讨论了如何将模型带入下一个层次,可能需要它们能够吸收更丰富的视频输入,这目前还不可能。对 GPT-5 的期待非常高。它比 GPT-4 好多少将被广泛视为 AI 整体进步速度的风向标。从创业生态系统参与者(创始人、投资者)的狭窄视角来看,问题可能不那么重要,至少在中期内——如果 GenAI 的进展明天达到渐近线,仍然有多年的商业机会,将当前拥有的技术部署到各个垂直行业和用例中。
15.GPU战争
我们是否处于一个大周期的早期,计算成为世界上最宝贵的商品,还是在大规模生产GPU的过程中过度建设,肯定会导致大崩溃?作为 GenAI 准备的GPU的唯一游戏,NVIDIA 当然正在享受它的时刻,股价五倍增长至 2.2 万亿美元估值,自 2022 年底以来总销售额增长了三倍,围绕其收益的巨大兴奋以及 Jensen Huang 在GTC的活动可与 Taylor Swift 争夺 2024 年最大事件。?
也许这部分也是因为它是风险投资在 AI 中投资的数十亿美元的最终受益者?不管怎样,对于它作为公司的无可否认的能力,NVIDIA的命运将与当前淘金热的可持续性有多大联系。
硬件是困难的,准确预测台积电在台湾需要生产多少 GPU 是一门艰难的艺术。此外,竞争对手正在尽力反应,从 AMD 到 Intel 到 Samsung;初创公司(如 Groq 或 Cerebras)正在加速,新的初创公司可能会形成,如 Sam Altman 传闻中的 7 万亿美元芯片公司。一个包括谷歌、英特尔和高通在内的科技公司联盟正试图攻击 NVIDIA 的秘密武器:其 CUDA 软件,该软件使开发者绑定到 Nvidia 芯片。?
FirstMark 的看法:随着 GPU 短缺的缓解,NVIDIA 可能会在短到中期内面临下行压力,但长期来看,AI 芯片制造商的前景依然非常光明。
16.开源 AI:太多好东西了吗?
大力支持开源 AI,显然这在过去一年或者更长时间里一直是一个大趋势。Meta 大力推动其 Llama 模型,法国的 Mistral 从争议的焦点变成了 GenAI 的新星,谷歌发布了 Gemma,HuggingFace 继续作为开源 AI 的活跃家园,托管了大量模型。GenAI 中一些最具创新性的工作已在开源社区完成。
然而,也存在一种普遍感觉,即开源社区正经历膨胀。现在有数以千计的开源 AI 模型可用。许多是玩具或周末项目。模型在排名中上升或下降,一些在短短几天内按 Github 星标标准(虽然是一个有缺陷的指标,但仍然有用)经历了流星般的上升,但从未转化为特别可用的东西。
市场将自我纠正,一小部分成功的开源项目将获得云提供商和其他大科技公司的不成比例支持。但与此同时,当前的爆炸性增长让许多人感到眩晕。
17.AI 的实际成本是多少?
GenAI的经济学是一个快速发展的话题。不出所料,很多空间的未来都围绕着它——例如,如果提供 AI 驱动的答案的成本显著高于提供十个蓝色链接的成本,能否真正挑战谷歌在搜索方面?如果软件公司真的由 AI 驱动,推理成本是否会侵蚀他们的毛利率??
好消息是,如果您是 AI 模型的客户/用户:似乎正处于价格方面的竞争到底阶段的早期,这比人们可能预测的要快。一个关键驱动因素是开源 AI(如 Mistral 等)的并行兴起和商业推理供应商(如 Together AI、Anyscale、Replit)采用这些开放模型并将它们作为端点提供。
客户几乎没有切换成本(除了处理不同模型产生不同结果的复杂性),这给 OpenAI 和 Anthropic 带来了压力。嵌入式模型成本显著下降的一个例子是,多个供应商(如 OpenAI、Together AI 等)同时降低了价格。从供应商的角度来看,构建和服务 AI 的成本仍然非常高。
据报道,Anthropic 花费了其产生的收入的一半以上支付给像 AWS 和 GCP 这样的云提供商来运行其 LLMs。还有与出版商签订许可协议的成本。另一方面,也许所有人作为生成性技术的用户应该享受由风险投资资助的免费服务的爆炸。
18.大公司和 AI 的政治经济学变化:微软是否已经赢了?
这是每个人在 2022 年底首先问的问题之一,到了 2024 年这个问题更加突出:大科技公司会捕获 GenAI 中的大部分价值吗?AI 奖励规模——更多的数据、更多的计算、更多的 AI 研究人员往往会产生更大的力量。大科技公司对此非常清楚。与以往平台转换中的老牌公司不同,它们也对潜在的颠覆非常反应敏捷。在大科技公司中,微软似乎一直在玩 4D 国际象棋。
显然有与 OpenAI 的关系,微软最早在 2019 年对其进行了投资,并已经向其投资了 130 亿美元。但微软也与开源竞争对手 Mistral 合作。它对 ChatGPT 的竞争对手 Inflection AI(Pi)进行了投资,只是最近以引人注目的方式将其收购。最终,所有这些合作似乎只会增加对微软的云计算需求——Azure 的收入同比增长 24% 至 330 亿美元,在 2024 年第二季度,Azure 云增长了 6 个百分点,归功于 AI 服务。与此同时,谷歌和亚马逊已经与 OpenAI 的竞争对手 Anthropic 合作并投资(在撰写本文时,亚马逊刚刚承诺为该公司再投资 27.5 亿美元,作为其计划中的 40 亿美元投资的第二部分)。
亚马逊还与开源平台 Hugging Face 合作。据报道,谷歌和苹果正在讨论在苹果产品中整合 Gemini AI。Meta 可能通过全面推进开源 AI,正在以低成本打击所有人。然后是中国发生的一切。显而易见的问题是,初创公司有多少空间可以成长并成功。一批初创公司(主要是 OpenAI 和 Anthropic,可能很快就会加入 Mistral)似乎已经通过正确的合作关系达到了脱离速度。对于许多其他初创公司,包括一些资金充足的公司,评判仍然在进行中。
是否应该将 Inflection AI 让自己被收购,以及 Stability AI 首席执行官的问题,视为一群“二线” GenAI 初创公司在商业上取得成功更加困难的承认?
19.对 OpenAI 的狂热
OpenAI 继续引起极大的兴趣——860 亿美元的估值,收入增长,宫廷阴谋,以及 Sam Altman 成为这一代的 Steve Jobs:一些有趣的问题:OpenAI 是否尝试做太多了?在所有 11 月的戏剧之前,就有 OpenAI 开发日,在那里 OpenAI 明确表示它将在 AI 中做所有事情,无论是垂直(全栈)还是水平(跨用例):模型 + ?Infra ?+ 消费者搜索 + 企业 + 分析 + 开发工具 + 市场等。
当一家初创公司是大范式转变中的早期领导者,并且事实上拥有无限的资本访问权时,这并非前所未有的策略(Coinbase 在加密货币中有点这样做)。但观察这一点将会很有趣:虽然这肯定会简化 MAD 风景,但这将是一个巨大的执行挑战,尤其是在竞争加剧的背景下。从 ChatGPT 的懒惰问题到其市场努力的表现不佳,表明 OpenAI 不受商业重力法则的免疫。?
OpenAI 和微软会分手吗?与微软的关系令人着迷——显然,微软的支持对 OpenAI 在资源(包括计算)和分销(企业中的 Azure)方面是巨大的助力,此举在 GenAI 浪潮的早期被广泛视为微软的大师级举动。同时,如上所述,微软已经明确表示它不依赖 OpenAI(拥有所有代码、权重、数据),它已经与竞争对手(例如 Mistral)合作,并且通过 Inflection AI 的收购增强了其 AI 研究团队。?
与此同时,OpenAI 是否会继续希望与微软保持单一线程的合作关系,而不是部署在其他云上?鉴于 OpenAI 的巨大野心,和微软对全球统治的目标,双方何时会得出结论,他们更多是竞争对手而不是合作伙伴?
20.2024 年将是企业中 AI 的一年吗?
如上所述,2023 年对企业来说感觉像是那些关键年份,每个人都急于拥抱新趋势,但除了一些概念验证之外,实际上并没有太多事情发生。也许 GenAI 在 2023 年的最大赢家是像 Accenture 这样的公司,据报道,它们通过 AI 咨询产生了 20 亿美元的费用。?
无论如何,人们希望 2024 年将成为企业中 AI 的大年——或者至少对 GenAI 来说,因为传统 AI 已经在那里占有显著的份额。但仍处于回答全球 2000 强公司面临的一些关键问题的早期阶段:
用例是什么?到目前为止,容易实现的用例主要是:一是为开发团队的代码生成副驾驶;二是企业知识管理(搜索、文本摘要、翻译等);三是AI 客户服务聊天机器人(一个先于 GenAI 的用例)。当然还有其他(营销、自动化 SDR 等),但还有很多需要弄清楚(副驾驶模式与全自动化等)。
应该选择哪些工具?如上所述,未来似乎是混合的,结合了商业供应商和开源,大型和小型模型,横向和垂直的 GenAI 工具。但从哪里开始?
谁将部署和维护这些工具?全球 2000 强公司中存在明显的技能短缺。如果你认为招聘软件开发人员很难,那就试着招聘机器学习工程师吧。
如何确保它们不会产生幻觉?是的,正在进行大量的工作,围绕 RAG 和防护栏以及评估等,但 GenAI 工具可能完全错误的可能性,以及实际上不了解 GenAI 模型如何工作的更广泛问题,是企业中的大问题。
ROI 是什么?大型科技公司已经在利用 GenAI 满足自己的需求,并且它们展示了有趣的早期数据。在其财报电话会议中,Palo Alto Networks 提到大约减半了其 T&E 服务的成本,ServiceNow 提到增加了开发创新速度的 52%,但我们还处于理解企业中 GenAI 的成本/回报方程的早期阶段。对于 GenAI 供应商来说,好消息是企业客户有足够的兴趣分配预算(重要的是,不再是“创新”预算,而是实际的 OpEx 预算,可能从其他地方重新分配)和资源来弄清楚。但可能谈论的是一个 3-5 年的部署周期,而不是一年。
21.AI 是否会终结 SaaS?
这是过去 12 个月的流行观点之一。问题的一个版本是:AI 使编码速度提高了 10 倍,因此,即使只有几个普通开发人员,你也能够创建一个定制的 SaaS 产品版本,满足你的需求。当你可以自己构建时,为什么要支付大量资金给 SaaS 提供商呢?
另一个版本的问题是:未来是由一个 AI 智能(可能由几个模型组成)运行你的整个公司,通过一系列代理。你不再购买 HR 软件、财务软件或销售软件,因为 AI 智能以完全自动化和无缝的方式完成了一切。
我们似乎还相距甚远,这两种趋势实际上以任何成熟的方式发生,但正如我们都知道的,AI 的变化非常快。
与此同时,未来的一个可能版本是 SaaS 产品将变得更加强大,因为 AI 将被构建进每一个产品中。
22.AI 是否会终结 VC?
AI 是否可以自动化风险资本,无论是在公司选择还是投资后增值方面,围绕 AI 平台转变是否正确定位资产类别,存在一系列有趣的问题:
风险资本是否太小?世界上的 OpenAIs 需要筹集数十亿美元,并且可能需要筹集更多亿美元。这些资金中的大部分是由大公司提供的,如微软——很可能在很大程度上以计算换股权的形式。当然,许多风投已经投资于大型基础模型公司,但至少这些投资与传统的 VC 软件投资模式明显不同。也许 AI 投资将需要超大型 VC 基金——在撰写本文时,沙特阿拉伯似乎即将与美国 VC 公司合作启动一个 400 亿美元的 AI 基金。
风险资本是否太大?如果你相信 AI 将提高我们的生产力 10 倍,包括超级编码者和自动化的 SDR 代理以及自动化的营销创造,那么我们即将见证一个由骨干团队(或许只是一个独行侠)运行的全自动化公司的诞生,理论上这些公司可以达到数亿美元的收入并上市。
一个年收入达到 1 亿美元的由独行侠运营的公司在其旅程的任何时点是否需要风险资本?
23.AI 是否会重振消费者市场?
自社交媒体和移动日子以来,消费者市场一直在寻找下一个动力。生成性 AI 很可能就是它。
一些有趣的领域(其中还有许多其他):
搜索:几十年来第一次,谷歌的搜索垄断出现了一些早期但可信的竞争者。少数初创公司如 Perplexity AI 和 You.com 正在引领从搜索引擎到答案引擎的演变。
AI 伴侣:超越反乌托邦的方面,如果每个人都拥有一个无限耐心且有帮助的伴侣,专注于满足某人的特定需求,无论是知识、娱乐还是治疗。
AI 硬件:Humane、Rabbit、VisionPro 是消费者硬件中令人兴奋的新产品。
超个性化娱乐:随着生成性 AI 工具变得更好(且更便宜),我们将发明什么新形式的娱乐和艺术?
24.AI 和区块链:胡说八道还是令人兴奋?
AI 和加密的交集看起来像是 X/Twitter 笑话的完美素材。然而,不可否认的是,AI 正在变得集中在少数公司手中,这些公司拥有最多的计算能力、数据和 AI 人才——从大科技公司到著名的非开放 OpenAI。与此同时,区块链的核心提议是启用创建去中心化网络,允许参与者共享资源和资产。这里有丰富的探索空间,这是我们多年前开始探索的一个话题(演示)。
一些与 AI 相关的加密项目经历了显著加速,包括 Bittensor*(去中心化机器智能平台)、Render(去中心化 GPU 渲染平台)、Arweave(去中心化数据平台)。
虽然我们没有在今年的 MAD 景观中包括加密部分,但这是一个值得关注的有趣领域。
现在,像往常一样,问题是加密行业是否能够自助,而不是退化为数以百计的与 AI 相关的模因币、抽水泵和倾销计划及骗局。
额外:我们在这里没有讨论的其他话题:
AI 会杀死我们所有人吗?AI 末日论者与 AI 加速论者
监管、隐私、伦理、深度伪造
AI 只能在旧金山“制造”吗?
三:融资、并购和 IPO
融资
当前的融资环境是“两个市场的故事”情况,其中 AI 和其他所有东西是分开的。
整体融资持续下滑,2023 年下降了 42% 至 2484 亿美元。2024 年的前几个月显示了一些可能的新生迹象,但到目前为止趋势基本上保持不变。
由于上述原因,数据 Infra 几乎没有看到太多的融资活动,Sigma Computing 和 Databricks 是罕见的例外。
显然,AI 的情况完全不同。
AI 融资市场不可避免的特征包括:
大量资本集中在少数几家初创公司,特别是 OpenAI、Anthropic、Inflection AI、Mistral 等。
企业投资者的活动水平异常高。2023 年最活跃的三个 AI 投资者是微软、谷歌和英伟达。
上述企业交易中有些金额实际是现金,与“计算换股权”相比有些模糊不清。
自 2023 年 MAD 以来的一些值得注意的交易(按大致时间顺序,非详尽列表!):
OpenAI,一家(或者是?)基础模型开发商,跨两轮融资 103 亿美元,现估值为 860 亿美元;
Adept,另一家基础模型开发商,融资 3.5 亿美元,估值为 10 亿美元;
AlphaSense,金融服务市场研究平台,跨两轮融资 4.75 亿美元,现估值为 25 亿美元;
Anthropic,又一家基础模型开发商,跨三轮融资 64.5 亿美元,估值为 184 亿美元;
Pinecone,向量数据库平台,融资 1 亿美元,估值为 7.5 亿美元;
Celestial AI,光互连技术平台,用于内存和计算,跨两轮融资 2.75 亿美元;
CoreWeave,GPU 云提供商,融资 4.21 亿美元,估值为 25 亿美元;
Lightmatter,开发光驱动芯片的公司,跨两轮融资 3.08 亿美元,现估值为 12 亿美元;
Sigma Computing,云托管数据分析平台,融资 3.4 亿美元,估值为 11 亿美元;
Inflection,另一家基础模型开发商,融资 13 亿美元,估值为 40 亿美元;
Mistral,一家基础模型开发商,跨两轮融资 5.28 亿美元,现估值为 20 亿美元;
Cohere,(惊喜)一家基础模型开发商,融资 2.7 亿美元,估值为 20 亿美元;
Runway,生成视频模型开发商,融资 1.91 亿美元,估值为 15 亿美元;
Synthesia*,企业视频生成平台,融资 9000 万美元,估值为 10 亿美元;
Hugging Face,机器学习和数据科学平台,用于开源模型的工作,融资 2.35 亿美元,估值为 45 亿美元;
Poolside,专注于代码生成和软件开发的基础模型开发商,融资 1.26 亿美元;
Modular,AI 开发平台,融资 1 亿美元,估值为 6 亿美元;
Imbue,AI 代理开发商,融资 2.12 亿美元;
Databricks,数据、分析和 AI 解决方案提供商,融资 6.84 亿美元,估值为 432 亿美元;
Aleph Alpha,另一家基础模型开发商,融资 4.86 亿美元;
AI21 Labs,基础模型开发商,融资 2.08 亿美元,估值为 14 亿美元;
Together, GenAI 开发的云平台,跨两轮融资 2.085 亿美元,现估值为 12.5 亿美元;
VAST Data,深度学习数据平台,融资 1.18 亿美元,估值为 91 亿美元;
Shield AI,为航空航天和国防工业开发 AI 驾驶员的公司,融资 5 亿美元,估值为 28 亿美元;
01.ai,基础模型开发商,融资 2 亿美元,估值为 10 亿美元;
Hadrian,为航空航天和国防制造精密组件工厂的公司,融资 1.17 亿美元;
Sierra AI,客户服务/体验的 AI 聊天机器人开发商,跨两轮融资 1.1 亿美元;
Glean,AI 驱动的企业搜索平台,融资 2 亿美元,估值为 22 亿美元;
Lambda Labs,GPU 云提供商,融资 3.2 亿美元,估值为 15 亿美元;
Magic,代码生成和软件开发的基础模型开发商,融资 1.17 亿美元,估值为 5 亿美元。
并购 & 私有化
自 2023 年 MAD 以来,并购市场一直相当安静。许多传统软件收购者专注于自己的股价和整体业务,而不是积极寻找收购机会。
特别严格的反垄断环境使潜在收购者的情况变得更加棘手。私募股权公司在更加艰难的市场中相当活跃,寻求低价机会。
一些涉及多年来出现在 MAD 全景中的公司的值得注意的交易(按规模顺序):
半导体制造商博通收购了云计算公司 VMWare,交易金额为 690 亿美元;
网络和安全 Infra 公司 Cisco 收购了监控和可观测平台 Splunk,交易金额为 280 亿美元;
客户体验管理公司 Qualtrics 被 Silver Lake 和 CPP 投资私有化,交易金额为 125 亿美元;
支出管理平台 Coupa 被 Thoma Bravo 私有化,交易金额为 80 亿美元;
监控和可观测平台 New Relic 被 Francisco Partners 和 TPG 收购,交易金额为 65 亿美元;
数据分析平台 Alteryx 被 Clearlake Capital 和 Insight Partners 私有化,交易金额为 44 亿美元;
收入编排平台 Salesloft 被 Vista Equity 收购,交易金额为 23 亿美元,随后也收购了客户体验 AI 聊天机器人开发商 Drift;
数据湖屋提供商 Databricks 收购了 AI 开发平台 MosaicML,交易金额为 13 亿美元(以及其他公司,金额较低,如 Arcion 和 Okera);
数据分析平台 Thoughtspot 收购了商业智能初创公司 Mode Analytics,交易金额为 2 亿美元;
数据仓库提供商 Snowflake 收购了消费者 AI 搜索引擎 Neeva,交易金额为 1.5 亿美元;
云托管提供商 DigitalOcean 收购了云计算和 AI 开发初创公司 Paperspace,交易金额为 1.11 亿美元;
为云计算提供芯片的制造商 NVIDIA 收购了边缘的 AI/ML 优化平台 OmniML。
当然,还有微软对 Inflection AI 的“非收购收购”。
2024 年会是 AI 并购的一年吗?很多取决于市场动力的持续。
在市场的低端,过去 12-18 个月里,许多拥有强大团队的年轻 AI 初创公司获得了资金。在过去十年的最后几个 AI 炒作周期中,许多收购发生在初始融资周期之后——通常价格似乎与这些公司实际吸引力不成比例,但 AI 人才一直很稀缺,今天也不例外。
在市场的高端,领先的数据平台和领先的 AI 平台之间进一步融合有强烈的商业理由。然而,这些交易可能会更加昂贵。
IPO
在公开市场上,AI 一直是一个热门趋势。“七大巨头”股票(Nvidia、Meta、Amazon、Microsoft、Alphabet、Apple 和 Tesla)在 2023 年至少增长了 49%,推动了整个股市的上涨。
总体而言,公开市场上纯粹的 AI 股票仍然非常稀缺。可用的少数几个受到了丰厚的回报——Palantir 股价在 2023 年跳升了 167%。
这对一大批与 AI 相关的准 IPO 初创公司应该是一个好兆头。在 MAD 空间有很多公司达到了相当的规模——首先是 Databricks,但还有其他一些公司,包括 Celonis、Scale AI、Dataiku* 或 Fivetran。
然后是 OpenAI 和 Anthropic 如何看待公开市场的有趣问题。
与此同时,2023 年在 IPO 方面是非常糟糕的一年。只有少数与 MAD 相关的公司上市:营销自动化平台 Klaviyo 于 2023 年 9 月以 92 亿美元的估值上市;论坛式社交网络平台 Reddit(为 AI 玩家许可其内容)于 2024 年 3 月以 64 亿美元的估值上市;为 AI 和云 Infra 提供智能连接的半导体公司 Astera Labs 于 2024 年 3 月以 55 亿美元的估值上市。
以下为2024MAD拆分图: