风暴中的人工智能

一年前,AI还只是个好奇;现在,它是一场五级飓风,撕开了商业、政治和现实本身的屋顶。

风暴中的人工智能

一年前,AI还只是个好奇;现在,它是一场五级飓风,撕开了商业、政治和现实本身的屋顶。

最初的冲击来自ChatGPT和NVIDIA的万亿美元浪潮,但那只是外围风圈。

头条新闻安静了下来——就像旗帜突然垂下一样,我们进入了风暴的中心——一种令人毛骨悚然的平静,因为扩展基础模型的巨大成本阻碍了重大突破。然而,在表面之下,激烈的竞争仍在继续,实验室陷入了一场残酷的游戏,就像在曼谷市中心再开一家泰国餐厅一样艰难,被迫一滴一滴地提供部分更新——一次又一次地泄露他们的食谱和商业计划,每个人都拼命抓住在AI无情的排行榜上的相关性。

开始一个新的基础模型有点像在泰国开一家新的泰国餐厅

这种虚假的平静掩盖了不断增强的计算风力,企业们疯狂地将AI嵌入到一切事物中。节奏混乱,规模全球,没有公司、政府或工作能免受这场风暴的影响。

现在来了致命的后墙——应用革命。

未来18个月不会是温和的进化。它们将是基于过时假设构建的商业模式的灭绝级事件,即机器能做什么和不能做什么。我们正在见证技术、经济和地缘政治的根本重塑。

我们站在AI飓风的中心。

1、五级模型登陆

仅仅一年前,GPT-4还是AI的巅峰之作。现在,新一代的模型像风暴潮一样席卷而来。Anthropic的Claude 3.7号称是第一个“混合推理”AI,可以随时切换从即时答案到深度逐步逻辑的能力。它甚至可以通过一个名为Claude Code的工具链编写生产就绪的代码,本质上是从命令行自动化软件工程的某些部分。软件工程的“Midjourney时刻”即将到来。

与此同时,埃隆·马斯克的xAI将Grok升级到了版本3,这是一个带有讽刺意味且具备多模态能力的模型,并且Google的DeepMind/Brain团队推出了Gemini 2.0,旨在在多语言、图像和音频任务上超越所有人

然后中国进入了房间。

2、OpenAI的商业模式陷入动荡

不久之前,OpenAI看起来坚不可摧——人类集体智慧高速公路上的收费站操作员,完美地定位为成为所有智能的API。

付几美分就能从盒子里得到魔法。这个故事曾经很美好。今天,这个故事已经死了。大型语言模型(LLMs)的商品化摧毁了OpenAI曾经坚不可摧的护城河。正如我早先预测的那样,仅仅通过API提供通用AI模型从来不是一个可持续的竞争优势。核心技术太可移植了,而且根本没有切换成本。事实上,只要有一个更好的模型出现,人们就会成群结队地转移——除了可能的聊天记录之外,没有什么能把你锁住。

选定AI模型的训练成本和计算量

我们清楚地看到了这一点,当Anthropic的Claude出现时。前一天,我用GPT-4做所有事情;第二天,Claude 2降临,突然它在写我需要的东西时变得显著更好。我一夜之间抛弃了ChatGPT。现实世界中没有人关心OpenAI花了1亿美元的计算成本来训练他们的模型——如果竞争对手的输出更好或更便宜,我们就走了。这个基本事实一次又一次地得到了验证:从GPT-3到GPT-3.5再到Claude,再到GPT-4,现在又有一群新模型(Claude 3.5、3.7、GPT-4.5及更多)。每次新对手带来增量改进或专业技能时,用户毫不犹豫地迁移。单一主导AI API的时代几乎和它开始一样快地结束了。

很快,用户厌倦了每月支付20美元购买那些在更聪明的东西出现时立刻过时的模型。毕竟,谁愿意为昨天的劣质助手付费,而今天更敏锐、更快、更强大的版本已经在这里?这不是订阅疲劳——这是冗余疲劳。

看着OpenAI四处挣扎寻找商业模式,真是让人觉得似曾相识。首先是有ChatGPT Plus每月20美元,然后抛出了每月200美元的“企业级”诱饵,最近又提出了令人瞠目结舌的每月2000美元甚至20,000美元的“代理架构”。还记得他们尝试的那个市场吗?那些所谓的“GPTs”,微型AI机器人承诺处理一切,结果却一事无成,默默地消失在伟大的数字彼岸?嗯,据说他们又回来了,正在为另一个市场重启预热。

在这种情况下,也许他们应该直接叫它“Slopify”。

来源:The Information

OpenAI的领导层通过这种方式学到了教训。他们试图建立生态系统锁定——应用商店、插件平台、专有工具——以巩固他们的垄断地位。这不起作用。为什么要在使用限制、内容过滤器和延迟问题上使用僵化的API,而不是下载开源模型自己免费运行?

到2024年底,一些公司开始悄悄转向:不再完全依赖OpenAI的API,许多人开始内部实验较小的专业模型,或者越来越多地转向充满活力、快速发展的开源社区。

OpenAI削减了其API价格,但即使免费也可能不够便宜,如果竞争对手稍微好一点的话。商品化陷阱已经关闭,OpenAI被困其中。

正如我在MacroVoices去年说过的那样,每次API调用收费几美分从来不是一个可防御的商业模式——“最终的现实是,这些基础模型这里没有任何实际的商业模式”。这个现实现在无法忽视。

3、开源主导和护城河的崩溃

如果说2023年是专有模型震惊世界的年份,那么2024年就是开源夺魁的年份。大型语言模型和工具的激增彻底摧毁了Big Tech和资金充足的初创公司认为拥有的“护城河”。去年泄露的一封谷歌备忘录【来源:The Verge】说得最好:“我们没有护城河,OpenAI也没有,”因为“第三方”——开源社区——比科技巨头“更快、更可定制、更私密,而且进攻能力更强”。那份预言性的备忘录已经被充分证实。

Facebook(Meta)试图带头通过发布其LLaMA模型,故意将至少一部分皇冠宝石释放到野外,以踢掉OpenAI的椅子——尽管称之为“开源”始终是一个牵强的说法。这是一种企业神风突击队式的行动,即使有这些限制,它也奏效了。在几周内,LLaMA的权重不可避免地泄露了,爱好者们迅速微调出与GPT-3相媲美的版本。当Meta在争议性的、不完全开放的许可下推出LLaMA 2时(这让许多开源纯主义者感到愤怒),社区已经比许多资金充足的研究室迭代得更快。突然间,一群不受NDAs、利润目标或严格许可约束的研究人员和黑客成功复制了多年秘密的企业研发成果。社区驱动模型的进步速度竟然比封闭式商店快得多。OpenAI和Google最可怕的噩梦实现了:AI创新的前沿不再属于他们独家所有;它现在发生在野外,不管什么许可。

Llama和ChatGPT不是开源的。来源:IEEE

看看2024年末发生的事情:一家名为DeepSeek的中国初创公司突然引发了整个行业的震动。DeepSeek团队利用有限的资源训练了一个推理模型(“R1”),其表现优于许多西方模型,这些西方模型的建造成本是它的100倍

中国企业崛起的速度和影响力让西方巨头措手不及。如何做到的?通过利用所有可用的开源见解,优化效率,并且显然对硅谷正统观念持健康怀疑态度。

他们的R1模型在相对较弱的硬件上运行,却提供了具有竞争力的结果——这证明了人工智能的核心资产现在是知识、技术和执行能力,而不是访问无限GPU农场的能力。当DeepSeek的低成本模型与巨头们匹敌的消息传出时,这一消息让恐惧的投资人抹去了超过一万亿的市值。我是说,杭州160名未知工程师从事的副项目 进入了与OpenAI的GPT-4相同的水平——市场正确地对西方AI投入的数万亿美元感到恐慌。

来源 @hxiao / X

其影响深远。首先,它验证了开源方法:DeepSeek并没有受益于秘密专有数据集或无法被他人获取的魔法算法。他们站在开源的肩膀上并推动了新的优化(我们稍后会谈到他们的硬件技巧)。别忘了,OpenAI的联合创始人兼前首席科学家Ilya Sutskever曾说过,90%的人工智能可以通过公开的40篇论文来解释

其次,它彻底摧毁了任何关于现有企业“规模优势”能够保护它们的论点。如果有什么不同的话,那就是——变得庞大已经成为一种负担。当OpenAI、微软和谷歌拖着庞大的成本结构和官僚机构时,较小的参与者正在以超高速度前进。正如一位谷歌工程师所感叹的那样,开放源代码模型比大型实验室更快、更私密地迭代,创新的洪流现在来自边缘。

即使OpenAI最新的产品GPT-4.5,在使用Deep Research时确实令人印象深刻,就像随时待命的中级研究助理。但对于OpenAI来说,问题在于我的使用经验中,当“Deep Research”没有开启时,它写代码的能力相当差。领先优势窗口正在迅速关闭。

来源:Gary Marcus

DeepSeek即将推出的R2模型,据说在专门设计用于衡量AI是否达到人类水平智能的ARC-AGI测试中得分约为90%。如果属实,那么OpenAI的渐进式改进不仅会显得微不足道,而且会显得无关紧要。GPT-4.5的成本非常高,每百万输入token收费75美元,每百万输出token收费150美元,而且这还不包括当前未通过API提供的“Deep Research”。R2的代码很可能免费提供,并且在自己的硬件上运行,尤其是中国硬件上,成本低廉。

来源:Twitter (仍然无法习惯说X)

我们已经到了这样一个阶段:任何新颖的模型架构或训练方法都会在几个月,甚至几周内被社区中的开源版本复制。

来源:ARC-AGI

很难夸大这意味着什么:护城河不仅在排水;它正在蒸发。构建一个有能力的AI模型的公式已成为公开知识。是的,它仍然需要技能(以及一些资本),但不需要人们在2022年认为的那种十亿美元的战争基金和多年的努力。我们已经看到大学团队、独立研究人员和小型初创公司生产出不久之前被认为是尖端技术的模型。

在这场AI风暴的中心是OpenAI——曾经无可争议的先驱,现在正在努力应对汹涌而来的挑战。它的旗舰产品ChatGPT依然令人惊叹,但该公司正在大量亏损。据报道,OpenAI仅在2024年就烧掉了70亿至80亿美元,并且预测到2027年的烧钱率将达到200亿美元,追逐越来越大的模型。正如AI投资者Kai-Fu Lee 直言不讳地指出,“问题不在于谁的模型比别人的高出1%,问题在于:OpenAI的商业模式是否可持续?”

残酷的事实是,基础模型已经成为商品。当一个像DeepSeek这样的中国开源项目能够在2%-10%的成本下复制GPT-4的90%性能时,它从根本上动摇了整个OpenAI的高价API访问模式。很难对一种由资金充足的竞争者几乎免费提供的产品收取溢价。

当然,中国在训练AI模型方面也拥有不可动摇的竞争优势。

我最近与一位Anthropic工程师讨论过这个问题。他漫不经心地说:“你以为我们为什么在日本和韩国开设办公室?”。

我从来不喜欢先发优势——先发者必须燃烧巨大的能量去改变消费者行为。而后发者则可以在滑流中轻松前行,舒适地依附在领先者的衣尾。

我不会惊讶如果下个月的头条新闻将是一群五十名不知姓名的班加罗尔地下室工程师推出一个开源模型,使ChatGPT看起来像一台袖珍计算器——这是对Sam Altman 轻蔑地否定印度在AI领域的雄心为“完全无望”的一个美味的回击

还记得他的访问吗? 当被问及印度在AI未来中的角色时,他基本上拍拍这个国家的头,建议它继续做一个好消费者而不是创造者。

来源:Mashable India

谈论一个像拉贾斯坦邦太阳下的牛奶一样变质的声明。

我们已经看到突破性模型不需要数十亿美元的预算或斯坦福大学的博士学位——只需要创造力、决心,或许还有一点正义感。下一个AI“泰式餐厅”很容易从意想不到的角落出现,带着配方,准备重新定义菜单。

开源主导地位不仅限于文本生成。图像模型(如Stable Diffusion等)在2022年率先证明了这一点。到现在,我们已经有了开源的编码辅助、语音合成,甚至是多模态视觉语言任务的模型。AI前沿已经碎片化成无数社区驱动的项目。难怪OpenAI在挣扎——Altman一年前还称开源模型“愚蠢”,现在却称DeepSeek“令人印象深刻"

现实来得很快。

尽管OpenAI大谈利他主义的AI,David Sacks的批评一针见血:他们已经从非营利慈善机构变成了“食人鱼,盈利公司”。仅仅几年时间,Sam Altman的团队就从理想主义的研究实验室转变为进行幕后交易,给予微软巨额财务和知识产权权益——想想独家许可OpenAI核心技术(微软单独获得了GPT-3底层代码的独家访问权)、通过Azure优先集成(微软是OpenAI的专属云领地),以及在微软收回投资之前获得高达75%的利润。微软押注100倍回报(意味着10亿美元的股份可能价值1000亿美元)。

OpenAI剩余的创始人(来源:Perplexity)

如果OpenAI有不可动摇的优势,这些优惠条件或许可以接受,但它并没有。

与此同时,Altman的领导地位正受到来自四面八方的攻击:他与埃隆闹翻了,结果发现埃隆买下了世界上最具影响力的武器——Twitter,并利用它通过DOGE成为了美国的“支出部长”。更糟糕的是,埃隆的朋友David Sacks(那个说鲨鱼的评论者)现在成了AI沙皇,埃隆·马斯克正在起诉OpenAI因转向盈利模式而偏离使命,甚至OpenAI自己的董事会去年也以“对他领导力缺乏信心”为由短暂罢免了Altman,但在投资者的反对下被迫恢复了他的职位。此外,11位创始合伙人中已有8位离开。

真是混乱不堪。

如果我是赌徒,我会认为Sam可能接近跳槽,开始一家新的AI公司,摆脱这个泥潭,以免他的《从零到一》创始人故事弧线不可避免地从英雄变为反派。

如果发生这种情况,微软会做它一贯做的事,‘拥抱并扩展’自身超越这具尸体。

4、硬件战争

当模型和制裁齐降时,中国倾盆而出的替代方案。

Nvidia今天坐在AI飓风的中心——仍然是训练大型模型的无可争议的硅王,印钞速度比台积电蚀刻晶体管还要快。其最新的GPU(想想售价如跑车的H100)迅速售罄,其股票图表似乎只认识一个方向。但即使黄仁勋在创纪录的利润阳光下享受着,风暴云已经在聚集。Nvidia垄断的裂缝虽然微妙但正在增多:每一代硬件的快速过时、最大客户垂直整合的威胁以及全球芯片供应链的地缘政治分裂。Nvidia仍然处于领先地位,但其脚下的地面已经开始变化。

来源:雅虎财经

让我们先谈谈硬件的跑步机。在AI领域,今天的尖端芯片很快就会变成昨天的新闻。Nvidia的商业模式喜欢这样——说服每个人你需要最新的GPU否则你会落后。但这种过时的速度是一把双刃剑。每一新代产品都会让上一代的数十亿美元硬件变得有些多余,给最富有的超大规模用户预算带来压力。这就像一场永无止境的军备竞赛,你升级或灭亡。结果?即使是Nvidia最好的朋友(谷歌、亚马逊、微软等)也开始感到疲劳,寻找出口。Nvidia的收入中有46%来自仅四家公司来源。垂直整合是他们的出路。为什么每年要花100亿美元买GPU,如果你能投资一小部分来设计自己的AI芯片定制到你的需求?

Nvidia H100(来源:Nvidia)

谷歌多年来一直在悄悄这样做,使用其Tensor Processing Units (TPUs)——处理从搜索到YouTube再到DeepMind工作负载的张量处理器,完全没有一块Nvidia芯片。亚马逊AWS不甘示弱,推出了Trainium用于训练,Inferentia用于推理,这些芯片都是内部设计的,以控制AWS账单。据报道,微软正在开发自己的AI加速器(Project Athena)以减少对Nvidia的长期依赖。简而言之,最大的Nvidia硬件买家正在开发自己的替代品。

Google Cloud TPU V6e Trillium 2(来源:Servethehome)

这是Nvidia主导地位的一道细缝,可能会迅速扩大:当你最大的客户成为竞争对手时,雨点制造者很快会发现自己也在雨中。

然后是地缘政治的暴风雨。美国决定扮演天气预报员,对向中国出口顶级AI芯片实施严厉制裁,旨在减缓中国的AI进步。Nvidia反应迅速,通过创建“中国友好型”版本的GPU(即稍作阉割的H100s,如H800和新H20,限制了互连)来遵守规则,同时仍能在近期占其收入近20%的市场中销售一些产品。

来源:Nvidia A100 vs H100 GPUnet

2019年,华为发布了其顶级Ascend 910芯片,采用台积电的7nm工艺节点制造。作为回应,美国政府于2020年将华为列入实体名单进行制裁。但华盛顿的这一举动也有一个意想不到的效果:它激励了中国加倍努力于自己的半导体事业。

当模型和制裁齐降时,中国倾盆而出替代方案。

进入华为的Ascend硅片。

来源:Kurnalsalts/X

几年前,华为的AI芯片被视为奇观——爱国头条新闻的好材料,但不是对Nvidia的严重威胁。

不再是了。华为公开表示要成为“中国的Nvidia”,并且随着最近的进步,他们已经不远了。

华为正在加大其Ascend 910系列的生产,即使在制裁下也是如此。这些不是像Apple Intelligence那样的纸老虎;它们是大规模部署的真实硬件。

为了避开那些制裁,华为不得不重新设计其Virtuvian芯片组,使用SMIC的N+1技术(第一代7nm级工艺)重新设计了910B。

第二代Ascend 910B芯片具有更高的最大性能,将运行在320TFLOPS的910提升到910B的400TFLOPS。它具有更高的时钟速度,但每个AI核心的活跃AI核心数量较少,每个AI核心增加了一个矢量单元,以及一种新型内存,具有更高的带宽和容量。华为减少了910和910B系列之间的活跃AI核心数量——可能是由于不良的产量或SMIC 7nm制造工艺的有限容量。

50%的性能提升归功于时钟速度的提高。另外25%可以归因于每个AI核心增加的矢量单元。两代芯片之间剩余的25%性能提升似乎来自于华为计算峰值性能的方式变化。

Ascend性能(来源:乔治敦大学)

Ascend 910C简单来说就是两个910B在一个芯片上,运行速度达到800TFLOPS。它基于中国的7nm工艺(SMIC的N+2节点)在制裁阴影下建造——没有极紫外光刻技术,许多怀疑论者——但它在推理任务中的性能约为Nvidia H100的60%。没错:一个被制裁的2019年设计,升级和重新包装后,现在在运行大型AI模型的领域中站稳脚跟。

由于制裁迫使他们使用较不先进的工厂和较少的工程师来管理和维护芯片工具,产量低且代价高昂,但他们正在迅速取得进展。据报道,910C的产量已经从20%提高到约40%,并且产量的提高使Ascend获利。简而言之:中国正在投入蛮力、金钱和顶尖工程人才来打破Nvidia瓶颈。他们一定会做到的。如果不是这一代,那么下一代。美国在AI硬件方面曾有过一段毫无争议的主导时期——那段窗口正在迅速关闭。

华为至少需要两年时间重新设计并在国内制造第二代Ascend 910B芯片,只有微小的改进。

2024年,华为生产了200,000个Ascend 910B处理器,没有910C

今年,他们计划开发100,000个910C和300,000个910B

除此之外,据报道,台积电制造了超过200万个Ascend 910B逻辑芯片并通过壳公司非法出售,所有这些芯片现在都在华为手中。/www.tomshardware.com/科技产业/人工智能/据报道,华为去年通过壳公司从台积电获得了两百万颗Ascend 910 AI芯片),足以制造100万台910C。

在训练大型模型方面,Nvidia仍然拥有舒适的优势(软件生态系统、成熟度、可靠性——几十年的领先优势不会一夜之间消失)。但在推理方面——这是AI部署的工作马——华为已经有效地缩小了差距。更令人震惊的是:华为正在大量生产这些芯片。尽管预计会有一些初期问题(在尖端工艺上的产量问题、超过500亿个晶体管的芯片封装复杂性等),他们却像没有明天一样增加产量。

这种影响已经在定价上显现出来。在中国政府的温和推动下,中国的云服务提供商“购买本地”的压力下,他们采用了Ascend芯片来支持其AI服务。结果是:西方公司目前无法匹敌的推理成本。

想象一下,叫一辆优步的费用只有5美分,因为这就是中国AI推理的收费情况。

DeepSeek R1在云平台如SiliconFlow上提供服务,价格为每百万输入令牌¥1——大约$0.15。对于输出令牌,大约是每百万¥4(~$0.60)。即使两者加起来,也远低于一美元每百万令牌处理。

相比之下,OpenAI备受推崇的GPT-4,凭借微软Azure支持的基础设施,在总计提示和完成定价后,每百万令牌收费约为$30或更多。我们说的是200倍的价格差异。当然,模型的能力并不完全相同,但像OpenAI/微软这样的公司所享有的经济护城河——即只有他们有能力服务于数百万用户——正在被打破。

当一个中国云可以以几分之一的成本提供一个GPT-4级别的模型时,“AI非常昂贵,因此需要高价”的整个叙事开始崩塌。OpenAI发现自己陷入了一场它从未想要的价格战,而对手(中国AI生态系统)并不遵循华尔街的高利润率规则。很难以每1,000个令牌API调用$0.03的价格出售,而竞争对手却可以通过补贴或纯粹的成本优势以$0.00015的价格提供。短短几个月内,AI服务的价格底线已经跌至地下室,而Nvidia的硬件霸权部分原因——或者说其裂痕——就在于此。

现在,关于DeepSeek R1模型以及为什么每个AI投资者在1月底都差点把咖啡喷出来。如果华为硬件的崛起是一个战场,那么对蛮力思维的攻击则是另一个。

Deepseek R1(来源:Deepseek

多年来,AI领域的剧本很简单:想训练更大的模型?那就多用些GPU(当然是Nvidia的最好)。规模、规模、再规模——效率什么的就别管了。DeepSeek向这个方法扔了一颗令人愉快的螺丝钉。面对仅有的“廉价版”H800 GPU(Nvidia可以合法运往中国的H100减配版本),DeepSeek的工程师决定榨干每一分潜力。他们深入到了CUDA以下的层面——直接进入Nvidia的PTX汇编指令。如果你想深入了解它是如何工作的,可以查看这篇文章:@nandinilreddy的深度解读

这是大多数团队甚至不敢尝试的硬核优化工作,因为它极其困难,并且以一种不可移植的方式将你的软件绑定到特定的硬件上。但在中国,绝望的时代呼唤着绝望的措施。而且它奏效了——非常出色。通过重新配置代码在H800核心上的运行方式,优化内存访问模式,并将某些任务卸载到通常闲置的GPU部分,DeepSeek实现了惊人的10倍训练效率提升。这意味着不是10%,而是十倍!他们有效地将每个H800变成了类似H100的“性能增强版”。仅仅使用2,048个GPU和一个临时团队,DeepSeek在大约两个月的时间内训练了一个6710亿参数的混合专家模型(DeepSeek R1)。

相比之下,Meta需要大约2,000个顶级Nvidia A100 GPU来训练其650亿参数的LLaMA模型。DeepSeek在硬件使用效率上比Meta高出一个数量级,而模型规模却是Meta的10倍。这是电影中音乐停止、众人低声议论“这真的可能吗?”的时刻。原本不应该如此,但他们做到了。

DeepSeek的成就对Nvidia造成了冲击:其市值。当投资者意识到一家饥饿的初创公司实际上用更少的Nvidia芯片完成了巨大的AI任务时,无尽的GPU需求叙述受到了打击。Nvidia的股票,此前在每次AI炒作的低语声中都在以抛物线速度上升,突然感受到了重力。在几天之内,Nvidia 损失了866亿美元

当然,股价波动往往是过度反应,但从象征意义上来看,靠最原始的计算能力取胜的时代即将结束。优化成为新的扩展方式。当一个巧妙的技巧或算法改进可以节省你90%的计算预算时,你会注意到。如果你忽视它,你的竞争对手不会。即使是适度的2倍效率提升——甚至是20%——在全球AI部署的规模上也是游戏规则的改变者。这就是需要五个数据中心而不是四个,或者花费1亿美元GPU而不是8千万美元之间的区别。这些数字决定了季度财报的成败。DeepSeek证明了蛮力可以被智取,同时也削弱了Nvidia的不可或缺性光环。

把这些都加在一起,我们看到了什么?一场即将到来的AI硬件格局碎片化风暴。仅仅一年前,人们可能会原谅认为Nvidia赢得了这场战争——他们的GPU几乎出现在每一个AI实验室和数据中心,他们的CUDA软件栈是AI的通用语言,挑战者被视为学术注脚或边缘玩家。当赌注如此之高时,事情变化得多么迅速。我们现在正朝着去中心化的、多极化的AI硬件时代迈进。在一个角落里,Nvidia的GPU不会消失——它们将继续成为许多任务的黄金标准,黄仁勋无疑会带着更强大的硅片(Blackwell及以后)和改进的软件卷土重来。

但垄断时刻正在消退。在另一个角落,由华为领导的中国企业集团开辟了一条独立的道路——一条优先考虑充足性和规模而非尖端优势的道路。虽然他们在绝对性能上可能稍有落后,但他们将以数量和成本弥补这一点,并且不受西方封锁的影响。在另一个角落,云计算超大规模企业和一批初创企业正在构建一个诺亚方舟式的新型芯片:TPU、IPU、NPU、模拟芯片、光子芯片——应有尽有,每种都针对特定的工作负载或效率目标进行了优化。

仿佛AI计算宇宙分裂成了多个平行时间线,所有的一切都在“一切、到处、同时”展开。

Nvidia与中国AI芯片对比(来源:KB Securities, Jukanlosreve

这种碎片化并不是创新放缓的标志;而是商品化和民主化的标志。计算正在成为一种商品,意味着每个人都能以某种方式获得强大的AI动力。当多个国家和公司都能各自大量生产“足够好”的芯片时,没有任何单一玩家能垄断市场。价格会下降;利润空间会收紧。(Nvidia不会永远以每块$40,000的价格出售板卡——竞争会让这一点发生改变。)与此同时,真正的差异化因素将从原始计算能力转移到如何聪明地利用计算能力。这就是优化作为新范式的原因所在。DeepSeek的经验教训将会回响:与其只是砸钱和硅片,不如砸脑子。让算法变得更精简,软件更紧凑,硬件更专业化。在某种程度上,这回到了早期计算的日子——当时效率很重要是因为硬件有限。现在硬件虽然丰富但规模化仍昂贵,所以效率再次成为王者。

这场风暴般的十年结束时,全球AI硬件格局将与开始时的单一格局完全不同。它将是地缘政治碎片化的——美国主导的阵营、中国主导的阵营,以及其他参与者加入混战(欧洲、印度、任何有主张的国家)。它将是技术多样化的——GPU将与ASICs、FPGAs以及其他来自左翼的新架构共享舞台。并且它将更加分散。更加强韧——没有单一的故障点或控制点,也没有可以被利用来阻碍进展的单一点。Nvidia的GPU仍然会非常重要(完全押注它们失败是愚蠢的),但它们将只是众多选项之一,而不是唯一的解决方案。一统天下的通用GPU主导时代正在让位于全球范围内分布的专门化、优化的计算拼图。

最终分析下来,AI领域的硬件战争不会产生一个单独的赢家。相反,它打破了曾经统一的格局,催生出一片丰富多彩且略显混乱的替代品雨林。每个生态系统——Nvidia、华为、谷歌、开源项目等——就像不同物种进化以填补各自的生态位。讽刺的是,这种多样性比单一玩家垄断更能推动AI向前发展。风暴已经来临,并且正在不断冲刷掉各种假设。

对于那些在场外观察的人(投资者、研究人员、政策制定者)来说,有一件事很清楚:AI的未来将建立在全球分布的硅基网络上,而最聪明的做法不是仅仅拥有最大的芯片,而是如何有效地运用它,这将决定谁引领下一章的故事。

AI模型训练成本比较(来源:Dogesator / Reddit)

DeepSeek实现了10倍的训练效率提升,其中一款包含6710亿参数的模型仅使用了2048块NVIDIA H800 GPU就只用了两个月的时间完成训练,这与Meta或Google通常需要投入20,000块GPU相比简直是天壤之别。

DeepSeek通过智慧而非蛮力成功抵消了NVIDIA在硬件上的优势。并且通过这种方式,他们证明了全球GPU短缺和美国出口禁令可以通过创造力和努力部分绕过。

如果一家初创公司能做到这一点,其他公司也会效仿。我们将看到一波“PTX级别”的优化浪潮,所有主要的中国AI玩家(很可能还有俄罗斯,甚至西方饥饿的初创企业)都将尝试在他们所能获得的任何硬件上最大化性能。这进一步削弱了NVIDIA实际上的垄断地位,并加速了AI计算去中心化的趋势。

目前,替代性AI芯片创业公司(从美国的Cerebras到中国的Biren)已经在嗅到机会的味道。到2026年,AI领域的硬件格局可能会大不相同——混合了NVIDIA、国内的中国AI加速器以及针对本地运行模型优化的新颖架构。无论如何,NVIDIA在繁荣顶峰时拥有的那种扼制力将不复存在。硬件战争正在将世界划分为不同的阵营——并且讽刺的是,这也促使所有人朝着效率而非蛮力的方向迈进。

Cerebras晶圆级工程与最大GPU的对比(来源:Cerebras)

最后的一个转折点:尽管对推理计算的需求无疑会爆炸式增长——由尚未大规模部署的大量AI应用驱动——关键问题是这些计算将在哪里进行。随着推理从集中式的云端堡垒迁移到边缘(比如智能手机、车辆、工厂和遍布各处的传感器),许多当前巨大的数据中心建设可能突然显得不够战略意义。我们目前正在见证典型的繁荣与萧条周期:超大规模运营商竞相用满整个足球场的GPU机架,但如果重心转向边缘的分散推理,需求可能会过度饱和。

不过,还是值得记住我所说的Scroggie定律:无论你建造多少数据中心,计算能力总会扩展以填满它们。

5、AI代理的崛起:嵌入式智能走向边缘

尽管人们普遍关注云中的大型AI模型,也许更深刻的转变正在发生,那就是智能向外迁移——进入实时代理、设备和边缘。我们正从一个AI意味着“调用API获取答案”的时代过渡到一个AI无处不在的时代,通常是本地运行、自主操作并持续工作的。这对行业有着重大影响:颠覆了AI集中于云的主导地位,改变了软件构建方式,并承诺在无数细分市场中提高生产力,而这些领域的大模型在云端永远无法高效服务。

在2023年,所有的注意力都集中在“浏览器中的ChatGPT”上。而在2025年,所有人的焦点将是每样东西中的AI副驾驶:你的文字处理器、你的汽车、你的冰箱、你公司的客户服务工作流程。这些都是AI代理——专业化、任务导向的AI,不仅被动响应提示,还能主动采取行动、观察、计划并在实时中执行目标。

早期的实验如AutoGPT和BabyAGI虽然笨拙,但点燃了火花。现在我们有了在生产环境中部署的进阶版本。

在我自己的公司Freelancer,我们构建了一个AI代理框架来处理一级客户支持和销售查询。这些代理能够以自然语言与客户互动,回答问题,解决问题,甚至推销我们的服务——所有这一切都不需要人工干预直到某个特定点。我们也为其他人这样做——在未来两年内,世界上每一个小企业都会有人工智能接听电话、预约、刷卡并处理订单——访问freelancer.com/ai查看一些演示。

来源:Freelancer.com/ai

一个有趣的发现是,这些代理不仅仅是取代人类,而是增强了我们的团队,在遇到限制并需要升级时创造了新的任务给人类,从而实际上增加了净就业。

这听起来反直觉但合乎逻辑——AI处理了1000个原本对人类来说不经济处理的简单工单,但在这样做的过程中发现了100个需要更高层次人类干预的案例(因此产生了原本不存在的工作)。我们实际上雇佣了一支不知疲倦、超快的初级员工队伍,当需要时他们会升级到(人类)经理。这只是客户服务中的一个例子。

除此之外,我们现在还有一支额外的产品团队致力于开发这个框架本身——所以至少在我们这里,像过去的所有技术一样,它们创造了更多的工作岗位而不是摧毁了它们。

现在将这种模式扩展到各个行业。涉及例行沟通或数据处理的每一个业务流程都适合AI代理自动化。我们说的是销售电话、技术支持、人力资源入职、内部帮助台、研究分析、个人助理——应有尽有。在房地产方面,正如我在之前的Macrovoices采访中提到的那样,想象一下AI代理处理所有烦人的租赁物业管理工作——租户打电话报告水龙头坏了、安排维修、更新房东。

Freelancer.com/ai上体验AI开发服务的演示!

一个AI可以筛选并回应所有这些情况,仅在实际物理维修时才介入人类。或者考虑医学领域:AI“转录代理”已经监听患者访问并起草临床笔记;下一步是AI代理能够进行初步患者接待、询问症状并可能甚至建议初步诊断供医生审查。这不是科幻小说——它的组成部分现在已经存在。如果政府允许ChatGPT编写脚本,它可能会释放全国一半的全科医生去做更有价值的工作。

至关重要的是,许多这些代理应用需要实时或现场AI。如果你不想让云服务器处理敏感业务电话,而本地AI可以做到零延迟和完全隐私,那该怎么办?另外,正如我在《AI知道你去年夏天做了什么》中提到的那样,随着AI功能变得更好(也更令人毛骨悚然),我认为SaaS即将迎来它的“皇帝没有衣服”时刻。

我认为你会越来越多地看到消费者和公司说:“我不想我的数据在互联网上,我不想AI下载它,我不想AI了解我的用户群,我不想它们知道我的商业模式,我不想我的研究立即商业化。”

你可能会看到互联网以一种非常大的方式变暗。

我的意思是,去看看你现在收件箱里的Gmail,然后自己想想……

谷歌的AI已经知道了里面的一切……一切。

他们在撒谎说他们不看这些数据,而是根据这些数据为你提供上下文广告。

嘿,谷歌,请告诉我最好的方法来对抗我的公司?

嵌入式推理的需求——在本地设备(手机、笔记本电脑、本地服务器、汽车)上运行AI模型——已经进入了高速发展阶段。就像个人计算机革命的第一阶段将计算从中央主机转移到个人桌面一样,我们现在正在将AI从中央数据中心转移到个人和边缘设备。

在2024年,高通展示了在智能手机上运行大型语言模型的能力;到2025年,这将成为常态。常见于消费设备上搭载的本地人工智能功能,而这些功能在以前可能需要互联网连接才能实现。苹果的神经引擎、谷歌的Tensor芯片——它们都被用来直接在你的设备上运行模型。这一切都得益于开源技术:由于模型压缩技术(量化、蒸馏),人们可以将2022年拥有130亿参数的模型压缩到今天可以在一台价值1000美元的笔记本电脑上运行的东西。

这种云AI主导地位的终结对某些大型科技公司的商业模式来说是一场噩梦。如果重心从云端转移到边缘端,云AI提供商可能会发现其增长受到限制。为什么还要按每次调用或每月支付API费用,如果你可以拥有一个本地运行且无需持续成本的模型?

边缘AI与云AI(来源:Murata

我们已经看到了早期迹象:聪明的公司正在使用开源模型如Llama 2,在其专有数据上进行微调,并在内部运行它们——不需要OpenAI或Azure。这样做成本已经大幅下降。现在对于中型企业来说,在内部拥有一款类似于GPT的模型是可行的,而且可以根据其需求定制(并且泄露给外部秘密的可能性也大大降低)。这严重削弱了“AI即服务”(AIaaS)的模式。我想问一下,有多少人曾经在输入内容到ChatGPT之前有过犹豫?

我甚至有一些朋友每次输入内容到ChatGPT时都会特别友善,以便在天网变得自主意识时记住他们。

边缘AI还预示着软件开发的复兴。开发者不再将“AI”视为独立的事物,而是开始将其视为应用程序中包含的另一个库或运行时。下一代应用将在核心中内置AI。想象一下打开Excel,不仅看到静态公式,还能看到一个AI代理在表格中分析你的数据、构建透视表、生成预测,甚至突出异常——所有这些都在你的CPU或GPU上运行。微软已经在通过Office 365 Copilot推动这一点,但目前它会调用云服务。再过一两年,你的PC很可能会自己处理很多这些推理任务,特别是对于较小规模的任务。

这里的一个有趣影响是垂直AI代理的兴起。随着通用模型的商品化,价值转向如何在上下文中使用它们。例如,专注于供应链物流、医疗账单或法律合同分析的AI代理——这些都是基于可能的商品化模型但增强了领域数据和流程集成的垂直解决方案。赚钱的地方在于部署AI来解决特定痛点,而不仅仅在于拥有最时髦的模型。我之前说过:真正的钱是在每个行业中应用AI,就像在dotcom时代,把每个业务都放到网上一样。我们正在看到这种情况发生。每个行业都会有其专属的AI助手和代理,互联网将因为数据集的新颖性和公共性而变暗(你不能再随意抓取ArtStation作为训练数据了吧?)。

许多这些垂直代理将在本地服务器或专用设备上运行,原因包括可靠性、延迟和保密性。

一些AI代理的选择(来源:Reddit

还要考虑自主性方面。这些代理不仅仅是问答机器人;它们可以行动。我们实际上正在赋予软件一定程度的决策自主权,而过去这些总是由人类编写的脚本决定。这很强大,但你最好确保代理所做的正是你所期望的。如果我要提醒大家注意的地方,那就是不要在没有护栏的情况下释放自主代理。我们从第一波浪潮中学到了教训(一些AutoGPT用户发现代理会无限循环或做愚蠢的事情)。希望在下一次浪潮中,我们会以更强大的目标和安全检查来构建它们,防止出现愚蠢的行为(比如AI旅行代理给出过度折扣,或者应要求为人们做数学作业)。

自主AI代理可以执行交易、发送电子邮件、与数据库交互、控制物联网设备。这带来了一系列新的机会和风险。一家交易公司可能有一个AI代理监控市场状况并执行比任何人类更快的战略。一家工厂可能有一个AI控制系统,能够动态调整操作。一个安全摄像头将了解场景的一切,并根据人脸、步态和其他特征对每个人的身份进行反向查找。

尽管如此,魔瓶已经被打开。自主AI代理将会存在,并且只会变得更加强大。现实世界的效果器(如机器人或软件权限)与AI大脑相结合形成了一个反馈回路:AI可以尝试某事,观察结果,然后学习——这是一种初步的目标迭代形式。这不是自我意识的天网,但它不需要这样就能彻底改变工作流程。一个设计良好的客户服务代理,如果能从成功和失败的互动中不断学习,可能在一年内就能胜过整个外包呼叫中心部门。

总结:我们在去中心化和专业化AI。那个能做一切但效果一般的巨型云模型正在被一群更小、更专注的代理取代,这些代理生活在离行动更近的地方。这种转变类似于从主机到个人电脑,或者从单一应用到微服务的转变。它改变了谁捕获价值(预计边缘设备制造商和精明的集成商将受益,而云使用增长可能会放缓)。它也挑战了“AI = 大数据中心”的观念。几年后,这听起来可能就像“互联网 = AOL”一样过时。

6、监管GPT:政府恐慌剧场

如果你认为扩展神经网络和硬件战争是混乱的,那么等你看到各国政府在做什么吧。美国禁止向中国出口芯片;中国禁止出口某些AI软件;欧盟正在讨论强制“GAI”模型获得政府许可;等等。欢迎来到全球马戏团:AI民族主义遇到官僚笨拙。

AI民族主义(来源:TheNextWeb

欧洲走在前面,正以巨大的欧盟AI法案加速推进,这是基于他们一贯的“预防原则”——基本上意味着先监管,再创新。典型的欧盟风格:对某些用途的全面禁令和对“高风险”系统的严格合规要求​,高昂的合规成本,广泛的限制,无尽的文书工作,以及罚款数额之大足以让小国破产(最高可达3500万欧元或全球收入的7%)。欧洲可能会通过过度监管失去相关性,将其大陆变成一个数字主题公园,而世界其他地方则在构建实际的AI未来。

相比之下,美国坚持“快速行动,打破事物”的信条,通过行政命令、指南和自愿框架发布AI规则。这是轻量级的美国式监管——依赖硅谷的自我监管,同时紧张地想要一个杀毒开关,或者至少一个关闭开关,但对于如何安装而不破坏经济,他们还没有想出办法。拜登的行政命令基本上是礼貌地请求科技巨头公平竞争,分享他们的作业,并给深度伪造标记水印。与此同时,国会关于AI监管的辩论有着冰川般的紧迫感——希望在他们的任期内不会发生什么灾难性的事件。

中国的策略再清楚不过了:快速创新,快速审查。每一条AI生成的内容都会被监控、过滤,并乖乖地打上“中国制造”的标签。如果用户设法诱使AI生成禁令内容,提供者必须立即停止生成,删除输出,并向当局报告该事件。这不是简单的监管,这是带有中国特色的AI——高效、创新,而且绝对在掌控之中。

这场三方拉锯战——欧洲的谨慎保姆国家、美国的自由放任创新、中国的权威对齐——正在撕裂AI生态系统。公司现在必须在其产品中设置地理围栏。模型们,维护仅在中国市场销售的版本,并内置审查机制,还要应对美国对硬件或甚至其模型的出口管制(想象一下需要商务部许可才能分享权重文件的情况)!

AI初创公司面临着合规性的噩梦,而全球平台则变得分裂,根据你的护照改变个性和功能。我们正朝着一个碎片化的AI景观发展,分为欧盟的围墙花园、美国的开放但风险较高的游乐场以及中国的国家控制数字堡垒。

正如《经济学人》在2024年初调侃的那样,“欢迎来到人工智能民族主义的时代”,各国都在竞相掌控自己的技术命运。

这里有一个变数:开源AI叛军。他们已经民主化了基础模型,打破了大型科技公司的专有护城河,让监管机构感到困惑。欧洲曾试图将其纳入监管范围,后来意识到这就像驯服数字猫一样困难。美国赞扬他们的创造力(私下却担心误用),而中国大多忽视他们,自信其防火墙能过滤掉任何麻烦的创新。

与此同时,政府正在努力应对深度伪造、虚假信息和数字身份问题。一些政府正在危险地尝试强制性的数字身份验证(“互联网上的客户尽职调查”),威胁要摧毁网络匿名性。

我不久前曾推测过(MacroVoices 1230 - MacroVoices 390 Matt Barrie:人工智能的强大力量与风险),如果坏人掌握了被破解或恶意的ChatGPT,政府可能会加强对互联网的监控——更多的监视、言论限制等。这一前景已不再是假设。看看西方政府如何对选举和COVID期间的虚假信息做出反应——通常过于激烈,有时践踏公民自由。现在再加上AI带来的恐惧(“想想恐怖分子使用失控的GPT!”),你就明白了。

一个特别严厉的想法正在获得支持——作为一种“解决”AI信任问题的方法——即“互联网的身份识别”。简单来说,这是一种“上网许可证”,要求每位互联网用户在发布或访问某些内容之前验证其真实身份(可能使用政府签发的身份证),以遏制AI机器人和深度伪造者的攻击。

澳大利亚的政治阶层——无论是左翼执政的工党还是右翼的自由党-国家党联盟——都可耻地联合起来实施了一种实际上相当于“互联网的身份识别”的措施,狡猾地将其合理化为“保护孩子”的手段。特别令人反感的是,自由党长期以来声称言论自由是基本原则(自由党网站),却热衷于支持这项立法。丑陋的现实是,这项法律与儿童安全关系不大,而与政客想要压制在网上使用假账户说难听话的澳大利亚人有关(YouTube视频)。

这个概念,以前只存在于威权主义的剧本中,现在正渗入主流西方辩论。支持者认为,这是区分Twitter上那个胡言乱语的账号是人还是AI的唯一方法,也是有效追究恶意部署生成模型责任的唯一方法。我能理解这种诱惑——互联网已经充斥着假账户、机器人和AI生成的虚假信息,而且情况只会变得更糟。但是,让我们现在就直言不讳地说:牺牲匿名性和隐私并不是解决AI滥用的有效方法。要求每个用户用护照或指纹登录不会解决AI问题——它只会作为附带损害杀死免费互联网。

然而,我担心这就是我们正在走向的方向,如果其他方法都不奏效的话。坦率地说,技术对策正在失败。我们尝试了CAPTCHA(“点击交通灯以证明你不是机器人”)——现在AI可以解决这些验证码。我们尝试通过让用户手持身份证拍照来验证身份——现在AI可以伪造这样的视频。我们很快就会达到这样一个点:任何数字认证都可以被足够先进的AI欺骗。

正如我在早前的一次演讲中悲观地指出的那样(MacroVoices 1347 - MacroVoices 446 Matt Barrie),我们可能很快就没有可靠的方式来在线验证人类身份。这是一个社会危机的开端。政府的回应将是加倍验证:也许是对所有内容进行某种加密签名,或者要求AI生成的内容加水印(好运气吧)。或者确实要求每个用户在其行为上附加经过验证的身份令牌。每项措施都有巨大的公民自由影响和实际难题。

在互联网上,没人知道你是生成式AI(来源:Jon Dron)

所有这些监管也有一个致命缺陷:AI以光速发展,而官僚机构却步履蹒跚。等到法律赶上时,模型已经面目全非。这种“速度差距”意味着我们一直在监管昨天的技术。例如,欧盟的《AI法案》是在GPT-3还处于最先进技术时构思的,直到GPT-6出现在屏幕上才全面生效。这就像在汽车发明后才试图监管马匹。

所以,我们在这里:站在一个互联网的边缘,在这里什么都不能仅仅凭表面信任——文本、图像,甚至一个人说话的视频都不能。我们的领导人的最佳想法是有效地要求每个人都携带证件才能上网。监管剧场遇到了技术流行病。

说实话,我并没有完美的答案。这是一个前所未有的挑战。但我可以说:由恐惧驱动的严厉监管往往过度反应,造成的损害比问题本身更大。全球范围内迅速涌现的AI规则很可能会产生许多意想不到的后果和不一致的结果,至少在短期内如此。有些司法管辖区会过度监管(抑制创新),另一些则会监管不足(助长滥用)。在这两者之间,企业和用户在试图遵守时感到头晕目眩。未来两年的监管环境将极其混乱。预计会有法庭挑战、贸易争端(“你们的AI法给了你们公司对我们公司的优势!”),以及公司偶尔干脆选择开源或将业务转移到国外以避免规则。

未来几年将是这些竞争性监管理念正面碰撞的过山车之旅。AI民族主义已经到来,规则正在分裂,创新却在不受约束地飞速前进。最终,那些找到最明智平衡的国家——拥抱创新而不破坏隐私和自由的国家——将塑造下一个十年。目前,是一片混乱、困惑和无尽的合规。

欢迎来到AI监管时代。

7、合成互联网:信任的崩溃

假新闻(来源:维基百科)

2023年,一张由AI生成的图像在网络上迅速传播,展示了标志性的好莱坞标志被野火吞噬。这张完全伪造的图片看起来非常逼真,愚弄了数百万人,直到被揭穿。欢迎来到合成互联网——在这里,现实与虚构无缝融合。

在AI的辉煌奇迹之下,一场更深层的风暴正在酝酿:我们的整个信息生态系统正在崩溃。网络世界正迅速被合成内容淹没——由AI生成的文章、图像、视频,甚至是无法与真实创作区分开来的数字人物。2024年,涓涓细流变成了洪水。到2025年,我敢打赌,大多数在线内容将是机器制造的。我之前讨论过“死亡互联网理论”——即大量互联网内容已经是假的或由机器人生成的观点——我们现在正在实时见证这一点。

举个简单的例子:社交媒体。浏览你的Facebook动态,你可能会注意到有些东西……不对劲。奇怪的账户发布奇怪的图片,比如一张稍微“诡异”的房间内部设计照片,看起来几乎真实但又不太对。在下面,有数百个来自带有AI生成头像的通用账户的评论。

来源:Facebook和很多机器人

或者突然出现的高度特定兴趣小组,活跃的讨论感觉像是算法精准投放的。这不是科幻故事——它正在发生。大量的社交网络活动是由机器人驱动的,通常是用于广告欺诈或垃圾互动。AI已经极大地增强了这一点。这些机器人现在可以无限期地发表看似合理的言论,并分享无数虚假图片。它们可以凭空捏造出整个社区。这就好像向我们的信息水源中倾倒了一种数字致幻剂。

来源:WasitAI.com

但问题远不止是垃圾邮件和骚扰。

我们正进入信任危机。

你看到一篇看起来像CNN的新闻文章——但它完全是AI撰写的,由内容农场批量生产以获取广告点击。你看到一段世界领导人发表惊人言论的视频——但它是一个深度伪造。你接到一个电话,是你女儿打来的,说她被绑架了需要钱——但其实不是你的女儿,只是一个克隆她声音的AI,骗子用它来欺骗你

所有这些例子在过去一年中都已经发生。现在将它们放大。生成错误信息或欺诈内容的成本正趋于零,而其质量和真实性却在飙升。这是认知危机的完美风暴。

查看一些在 Freelancer.com/ai 上的演示,你会发现与AI代理进行通话可以有多好。

当我们面对数字内容时,我们不能再信任自己的眼睛和耳朵了。如果所有信息都变得可疑,会发生什么?我们将面临一种集体精神分裂症的风险,公众话语会恶化,因为没有人知道什么是真实的。我们已经看到,骗子和宣传者正在利用这种不确定性(“除非我们说它是真的,否则不要相信任何事情”)。我们看到独裁者利用真实证据作为“深度伪造”来逃避责任,而相反,活动人士试图揭露真正的深度伪造以防止虚假恐慌。

信息战已经急剧升级。

就像那个喊狼的孩子,但有无数只狼和无数个孩子。最终村民只会耸耸肩,不再对任何事情做出反应,无论是真实的还是虚构的。或者更糟的是,他们会相信他们想要相信的事情,不管事实如何,因为客观真相变得模糊不清。我们已经深陷于主观现实的时代;AI生成的内容可能是共识真相的最后一击。

科技公司正在尝试一些措施。OpenAI建立了一个(基本上无效的)分类器来检测AI撰写的文本——它基本上不起作用,他们已经停止了这个项目。

2022年的谷歌。(来源:Nick Saraev

即使谷歌也无法阻止AI内容用于网页内容,最初告诉所有人如果使用AI生成的内容将会受到惩罚,但在放弃后——“如果无法打败他们,那就加入他们”——提供AI内容生成工具。

2023年的谷歌。(来源:Will Scott

研究人员正在研究为AI图像和视频添加水印的方法——但任何这样的水印都有可能被移除或伪造,特别是当存在多种模型架构时(一个恶意行为者只需使用不应用水印的模型)。像由Adobe领导的内容真实性倡议这样的努力旨在创建新内容时对其进行加密签名(例如,您的相机在您拍照时签署照片,证明其来源)。也许这可以解决未来的新内容问题,但它无法解决可以重新利用的数十亿张遗留图像和视频,也无法强迫不良行为者使用签署其伪造品的硬件。

内容真实性倡议(来源:Adobe

我不得不这样说,但目前唯一理性的立场是假设所有数字内容都是伪造的,除非被证明是真的。这是一种可怕的生活方式。想象一下将这种标准应用于日常生活——每封电子邮件、每次视频通话、每条新闻都被视为有罪,直到被证明无罪。这令人疲惫且腐蚀人心。

在我MacroVoices讨论中,我强调了这种早期迹象已经显现。博客垃圾邮件和SEO内容工厂在2022年跳上了GPT-3,批量生产低质量的文章。到2024年,整个AI生成的垃圾网站涌现出来,吸引点击的标题也是AI撰写的。即使是经验丰富的分析师有时也会被看起来真实的AI生成的研究报告或假采访所愚弄。合成互联网悄然而至;除非你主动寻找,否则你可能不会注意到你读过的某些Medium文章是由GPT-4编写的,只是经过了一些人工调整。

最可怕的部分是当合成内容被故意部署以造成伤害时。我们已经看到国家支持的虚假信息活动利用AI扩大其影响力并定制信息。不再是成千上万的网络喷子,而是一个人带着GPT-4自动化控制成千上万个虚假角色。

8、未来走向——2025-2026年的AI预测

模型商品化与专有优势的终结

开源模型的数量增长得比兔子还快,掏空了封闭系统(如GPT-4)曾经享有的溢价。很快,没有哪家严肃企业会支付高额租金来获取通用模型访问权——专业化和应用才是关键。OpenAI将面临非常严峻的挑战。我怀疑Altman可能会因沮丧而退出,并在仍有街边信誉时创办一家新公司,而剩下的OpenAI可能会被微软吞并。

大型科技公司深入嵌入AI,无论你喜欢与否

预计微软、谷歌和亚马逊会将AI强行嵌入你使用的每一款软件中——强制性的Copilot集成、AI优先的Salesforce界面等。AI不再是附加组件;它将成为你的新默认设置。做好准备迎接来自匆忙将AI添加到软件中的公司令人尴尬的失败,这可能会导致“皇帝没有衣服”的时刻,并促使人们从云端转向本地运行的边缘AI——“这不是我的AI,也不是我的数据!”

GPU短缺转为过剩;硬件碎片化开始

今天的Nvidia短缺将成为明天的供过于求,随着训练需求趋于平稳,边缘计算爆炸式增长。同时,中国的国产硅崛起,打破了Nvidia的近乎垄断地位。

监管混乱与“验证人类”互联网的黎明

准备好迎接更多混乱的AI立法——很可能首先来自欧盟——这将对违规行为处以巨额罚款,并使合规部门手忙脚乱。观察对数字身份和内容认证的严厉尝试以及公众对此的巨大反弹。“验证人类”徽章可能紧随其后,因为你的Instagram推送中失业模特的比基尼照会被成群的AI生成的诱惑陷阱取代,这些陷阱与真人难以区分。

AI代理改变工作——人类向上移动

忘记静态聊天机器人;AI代理将成为你的新同事,削减客户服务和销售等例行工作的两位数百分比。人类不会消失;相反,他们会监督AI或处理升级。欢迎进入“AI工作流程设计师”或“AI审计师”的时代。Alexa等个人助理终于有了大脑,可以完成值得你时间的任务。

Netflix和无限AI内容泛滥

Netflix即将发现维基百科在ChatGPT出现那天的感受——一位曾经伟大的内容之王突然淹没在无尽的AI生成复制品、放飞的粉丝小说和零边际成本生产的合成衍生作品的海洋中。当一夜之间出现上千个AI生成的衍生作品时,很难再收取订阅费用。我们终于能得到修复后的《权力的游戏》第八季,但也会有第九季、第十季、第十一季,甚至是在太空中的西部片,你将成为主角,你的所有朋友都将扮演角色。

真实性危机:互联网的现实检查

随着AI在网络上充斥着令人信服的伪造品,信任跌至谷底。真实性成为奢侈品——预计提供“验证真实”内容的初创企业和平台将爆炸式增长。地方调查性新闻已经在复兴,因为媒体机构难以生成原创内容。留意一场由重大深度伪造事件引发的危机,这可能会推动政府将某些欺骗性AI内容定为犯罪,并以此为借口获得更多对选民的控制权。

经济赢家、输家和生产力提升

适度的生产力增长终于出现在宏观经济数据中,这让经济学家感到困惑,尽管工资上涨,通货膨胀仍然保持低位。外包给大规模低成本劳动力中心的趋势缩小,因为像呼叫中心这样的大型就业地点受到颠覆。与此同时,医疗保健和教育等以前技术抗拒的行业由于实际AI整合而开始蓬勃发展。

AI驱动的自由职业者大爆炸

AI点燃了全球自由职业市场的火焰,一夜之间提升了技能,并释放了来自世界各地的人才。配备了先进的工具——实时AI副驾驶、多语言翻译器和专家级写作和编码助手——新兴经济体的自由职业者现在以闪电般的速度交付顶级工作,往往与纽约或伦敦的专业人士难以区分。

西方工人的地理溢价迅速蒸发;企业现在可以接触到一个更聪明、更快、价格低廉得多的全球人才库。这是边境消失、高度竞争的市场时代的黎明——快速适应,否则准备好被超越。

所有工作都向上移动,AI引起的破坏既推动又促进了微创业的爆炸式增长。

社会反弹与政治AI斗争

就像有机食品变得时髦一样,预计会出现文化反弹:“由人类制造”标签将在到处可见。政治上,AI成为一个分裂议题——“AI偷走了你的工作”演讲即将到来。年轻人轻松适应;老一代人则反对,争论什么是可接受的AI使用。如果允许GPT开处方,一半的家庭医生的工作会在一夜之间消失,心理治疗师的工作可能减少70%,并且结果更好。

黑箱问题:AI不断让我们惊讶

新兴能力能力继续让甚至创造者都感到困惑。AI的黑箱行为促使对透明度和监管的研究加剧。“它自己学会了做什么?”这样的时刻还会更多,推动更严格的监督。我使用Claude Sonnet 3.5撰写营销文案,以及GPT 4.5配合Deep Research进行研究时,肯定又感受到了这种时刻。

公众叙事落后于现实——这是聪明人的机会

普通人会低估AI已经深深嵌入日常生活中的程度,这将为精明的投资者和技术人员提供优势。AI不会从头条新闻中消失——它只会悄然成为基础设施,就像电力一样。

AI风暴仍在肆虐,从地缘政治到日常流程都在被重塑。是时候扎根、快速适应并迎接接下来的一切了。

疯狂小镇

如果有一件事我可以确定的话,那就是世界即将一头扎进疯狂小镇。

我是说,等尼日利亚419骗局犯人完全掌握了最新的GenAI工具后——实时、高保真视频通话流媒体,后台由GPT-4.5/Claude Sonnet 3.7驱动。

人们再也不会接听未知来电者的电话。当他们联系你时,你需要预先共享的一次性密码(密钥)来判断是否真的是他们。

OnlyFans将会变成OnlyBots。游戏不仅会让人上瘾;它会演变为沉浸式、增强现实的世界,在这个世界里,数百万人会心甘情愿地用他们平凡的日常生活换取他们曾经只能梦想的生活。

当你主流媒体在大规模传播国家支持的宣传,而所谓的“开放”社交媒体平台却被成群的AI生成的人格淹没,真相会被合成噪音淹没时,你会信任谁?

在这种情况下,我不惊讶有人会用AI大规模伪造耶稣基督的第二次降临

有一件事我可以确定的——Siri仍然会很糟糕


原文链接:AI of the Storm

汇智网翻译整理,转载请标明出处