AI时代的心智模型
我们能从浏览器大战中学到什么来理解人工智能模型?

我们能从浏览器大战中学到什么来理解人工智能模型?
表面之下是什么?
在我们的技术景观的核心,存在着一个人类问题:基本计算能力的可预测进步与界面复杂且常常混乱的演变之间的矛盾。底层架构——处理器、内存、操作系统——遵循几乎数学上的确定性,受摩尔定律和类似指数增长原则的支配。我们已经习惯了这种稳步的进步,甚至可能认为随着处理能力翻倍而成本下降,计算可能性的基础也在不断扩展。
然而,这种可预测的机制导致了一个误解的鸿沟。人类意图与技术能力交汇的层面。在这里,我们发现自己在更复杂的领域中导航。大多数人很少或根本不注意计算机的能力,也不了解它们如何以及为什么运作。自从远离命令行和手册以来,我们期望这些工具能够按照它们所说的去做。如何或做得有多好可以是次要的。我认为网络浏览器是一个引人注目的例子,它必须在原始技术能力和人类期望与习惯之间取得平衡。与强制用户接受其范式的大型软件套件(如MS Office)不同,浏览器作为调解者,解释并呈现网页创作者的集体愿望,同时适应人类寻求与信息互动的不同方式。例如,工作世界由工具如Slack、Teams或Zoom的界面决策微妙地控制,每个用户群都独立存在,并且利益被锁定在该技术选择中。
我回想起在埃森哲工作时,在2010年代中期向我们的团队引入Slack。我们立即看到了好处,因为不同的团队现在可以轻松聊天、更快地分享想法,并避免冗长的会议。然而,当权者却关闭了它,转而支持微软的新竞争产品Teams。由于Slack拒绝被收购,Teams不得不匆忙拼凑起来。Salesforce后来收购了他们,可能是出于对雷德蒙德巨头长期的竞争厌恶。尽管Slack开创了许多关于人们喜欢协作的引人注目的理念,但这并不是成功的配方。Teams至今似乎仍在追赶,但当我们团队不得不转换时,我了解到我们在Slack中创建的习惯一直在延续。我们对它应该如何工作的认知超越了笨拙之处,因此即使工具并不总是奖励这种行为,我们仍然保持良好的习惯。
本周的讨论中,我和Jack探讨了AI公司是否像我们想象的那样运作。
这个在线聊天室模式相对较新,如果我们回顾过去,浏览器的发明在实现风格上非常相似。在早期,人们对网络没有一个明确的概念。它是被动的,由于带宽限制,图形非常原始,并且总是为电视视口设计。它还依赖于Flash等扩展插件进行动态交互,或者使用插件进行更重的处理。学习如何开发其功能与潜力之间的差异是一场战斗,每种浏览器选择如何解释和交付我们的设计目标。终端用户从Netscape的早期主导地位开始,它设定了免费的标准。微软通过Explorer进入市场,苹果则推出了基于Webkit的Safari。加上Firefox和其他参与者,大多数用户选择了默认设置,但每种浏览器都有自己的HTML语言解释方式。此外,新的标准和想法由W3C的最佳和最聪明的人制定,随着IE专有性质被Chrome克服,这一文档交付系统的理念在数十年间得到了极大的改进。撇开市场主导地位不谈,希望看到的是一个合作、协作的工具,尊重新想法并提供一个骨干系统,使创作者能够在不依赖黑客的情况下与用户互动。
快进到现在,仍然需要做出让步,因为像react这样的运行时引擎被构建来处理用户倾向于偏好的无尽滚动,以及诸如“点赞”之类的微交互可以排队处理而不中断。视频内容传递也受益于出色的压缩算法,但更重要的是带宽增加,更多即是更好。
浏览器的历史背景为我们审视当前的技术转折点提供了有力的视角:人工智能的兴起以及我们用来理解它的竞争心智模型。最近与同事Jack的一次对话中,我们发现了这些非常相似的平行线,探索我们对以前技术演化的理解如何可能影响——或误导——我们对AI系统的理解。
就像浏览器代表了用户与庞大的联网信息景观之间的无形但至关重要的界面一样,今天的AI模型也充当着人类意图与计算可能性之间的调解者。过去的浏览器大战提供了一个警示故事,说明竞争的企业利益如何可以分裂和复杂化本应是普遍访问和理解的工具。
然而,这种类比以有趣的方式瓦解。浏览器大战围绕结构化标记语言(HTML、CSS、JavaScript)的解释而战,而今天的AI系统则在自然语言和非结构化数据的领域中运作。这种根本性的转变不仅代表了技术上的进化,而且代表了我们如何概念化人机交互的根本变化。
OpenAI在这个进化过程中提出了一个特别有趣的案例研究。就像开放网络标准的早期承诺一样,它的名字暗示了透明性和可访问性。然而,正如微软的Internet Explorer在浏览器大战期间一样,我们现在正在导航公共利益与私人利益的复杂交叉点。关键的区别在于技术本身——虽然浏览器主要解释和渲染内容,但AI系统生成、推理和创造。
在我们的讨论中,“AI引擎”的概念作为一个有用但不完美的隐喻浮现出来。就像驱动从割草机到火箭的各种设备的引擎一样,AI模型在不同规模上服务于不同的目的。有些优化用于特定任务,如运行Roomba,而其他则旨在获得更广泛的认知能力。这种应用范围提出了重要问题:我们如何框定和理解这些工具——它们仅仅是更复杂的算法,还是代表了技术进化中的根本变化?
让我担忧的是,也是我们讨论中的核心主题之一,是对质量评估和基准测试的问题。在浏览器大战中,兼容性和标准合规性提供了明确的指标。但是我们如何衡量AI输出的质量?虽然有针对特定任务的基准,但AI的创造性和生成方面提出了一个更复杂的挑战。正如Jack指出的那样,我们正从简单的问答进入真正的创新和发现领域。
效率与效果的问题显得尤为重要。我们讨论了AI如何优化各种过程——从人力资源职能到数据库管理——但更深层次的问题依然存在:我们是在利用这些工具增强人类能力,还是仅仅为了消除人类参与?自动化消防机器人的例子以鲜明的术语提出了这一困境:虽然它们可以在危险条件下救人,但也挑战了传统的就业结构和人类角色。
当我们结束讨论时,我在思考进步的本质。就像节日聚会上未洗的餐具留在水槽里一样,问题不会因为有了更好的工具就自行解决。拖延、不确定性和决策制定的人类因素仍然是核心挑战,即使我们的技术能力在进步。
也许最有价值的见解是,我们不仅仅是在建造工具——我们正在创造人类与机器协作的新环境。真正的挑战不在于完善技术,而在于理解如何有意义地将其融入我们的工作、创造力和决策的人类系统中。
前进的道路并不清晰,但有一件事是肯定的:就像早期的互联网一样,我们对AI的心智模型需要像技术本身一样迅速进化。问题不在于AI是否会改变我们的世界,而在于我们如何通过理解和实施这些强大的新工具来塑造这种变革。
原文链接:Mental Models in the Age of AI
汇智网翻译整理,转载请标明出处
