模型上下文协议 (MCP)
我一直在尝试一种新技术,通过Anthropic提出的一种新兴的开放标准——模型上下文协议(MCP),将知识和功能插入到像聊天这样的AI应用程序中。现在还处于早期阶段,但它已经具有一定的势头。

我一直在尝试一种新技术,通过Anthropic提出的一种新兴的开放标准——模型上下文协议(MCP),将知识和功能插入到像聊天这样的AI应用程序中。现在还处于早期阶段,但它已经具有一定的势头。
因此,我认为现在是组织开始通过构建进行学习的最佳时机——让我解释一下我是如何得出这个结论的,我构建了什么,以及我学到了什么(还有:我能提供哪些帮助)。
这是一篇长文!在底部我会放一些原型的屏幕截图,所以请继续阅读……
1、回顾:AI聊天的问题所在
有许多可能的AI应用(我绘制了全景图),但让我们聚焦于聊天,因为你几乎肯定使用过ChatGPT或Claude。
在聊天时你会迅速遇到两个问题:
- 工具。 你可以让AI写信或总结文档。但如果你希望它:加一些数字;预订Airbnb;或使用你内网上的应用程序,那么AI需要访问额外的工具。
- 知识。 大型语言模型半记得它们的训练数据然后产生幻觉。因此你需要真实的数据源:AI能够搜索你的笔记、维基百科或客户服务Notion,并实时构造其答案的能力。(事实证明,搜索数据源只是工具的一种特殊形式。)
工具!即,如果AI聊天要“跨越鸿沟”,该如何使其可扩展?
好的,目标是我们的聊天应用将成为可扩展的工具使用代理。代理就是能够自行选择使用哪些工具并持续运行直到完成任务的AI。我之前谈过关于代理及其如何找到工具(2024年)。
但在工具发现之前,谁来构建这些工具?
这里有一个瓶颈:OpenAI、Anthropic和其他公司无法为每个数据库和每个网络服务开发工具。我们需要一个生态系统,就像生态系统创造了应用程序(不仅仅是苹果)和网站(不仅仅是AOL或现在的Automattic)一样。
所以我们现在面临一个多方协调的问题。

剧透:这就是开放标准模型上下文协议出现的地方,这也是本文的主题。但首先……你应该关心吗?是的。
2、协议听起来很技术化。我为什么要关心?
当然,拥有新的技术支持(许多人都采用同一标准会使构建客户服务平台变得更便宜)是很方便的,但实际上MCP和类似的协议对所有在线业务的组织都非常重要。
协议采用的重要性在于用户接下来会做什么。
所以,让我们进入一个关于搜索及其用途的小插曲……
让我们假设Anthropic的MCP愿望实现了,AI聊天确实变得通用且有用。
会发生什么呢?ChatGPT、Claude、Perplexity或DeepSeek将取代谷歌成为用户的第一意图点。 我知道这是一个很大的习惯转变。但谷歌是脆弱的。
不是因为谷歌做了什么,而是因为搜索本身。
你看,“搜索”从来不只是“搜索”。搜索一直是一种认识论之旅。你在构建知识,而不仅仅是一个查询就完成了。你最初用模糊的意图去谷歌搜索,然后学习一些词汇。你来回搜索,逐渐掌握了术语和权衡——你想要的是酒店还是Airbnb,或者哪位牙医在你的公交线路上,或者你最初的提问并不是你真正想问的。最后,你知道如何用熟悉的术语来构建你的实际查询,执行你的实际交易(预订酒店、撰写报告,经过弹窗和垃圾结果),然后你就完成了。
*顺便说一句,我在2022年的会议上做过关于这个主题的演讲(YouTube),并且也写了一些关于认识论代理的背景材料[(/home/2022/05/24/epistemic)]。
搜索引擎不适合这种认识论之旅。这是一个混乱的过程。但这实际上发生了。
进入聊天。
聊天非常适合“搜索”的工作。
我每天都会用Claude搜索几十次,最近几周我
- 探索在冷空气中跑步以及如何缓解肺部压力
- 调试我正在构建的网站的会话cookie问题
- 为一个X岁小孩寻找生日礼物的想法,从一般到具体
- 检查猴面包树是否出现在二叠纪-三叠纪边界(没有)
- 查找数据平面和控制平面以及它们何时失效
- 整理汉诺威王位继承的时间线,然后深入现代议会民主制度的兴起
- 设计家庭游泳池比赛的格式。
我敢打赌你也是这样。
问题是,当我输入周末在伦敦带孩子能做些什么,下雨了怎么办?你的商业前景是什么?
这不仅仅是SEO。谷歌几乎影响了每一个用户的旅程和每一次客户互动,我认为我们低估了“谷歌是互联网的前门”这一概念在数字时代20年后对公司的嵌入程度。
人们的晋升基于他们是否提高了特定页面的点击率;团队被培训编写可以被搜索引擎找到的支持文章,有人必须提供这些培训材料;下一季度的优先事项基于网站流量分析;新计划的最小可行产品以“我们发布了新的着陆页”结束;你签订了一份长达十年的内容管理系统合同,该系统围绕网络工作流构建。这些都将不再成立。
因此,组织将处于一种不仅不在AI聊天中出现和展示自己(因此人们永远不会参观他们的公园或购买他们的自行车),而且由于团队和技术原因无法适应的境地。
对于许多人来说,这将是一个生存问题。
这不是一个不可能解决的问题。它可以分解成实际挑战,一旦揭示出来,是可以应对的。比如:最佳方式存储内容以供AI聊天使用?如何将用户账户连接到ChatGPT或其他平台?如何衡量成功或优先考虑项目?如何自动化持续的竞争对手意识?等等。
难点在于,如何揭示这些问题?
答案:你构建并学习。创建原型,找出集成障碍。(大事情,没错,但也有一些小而棘手的事情,比如你可能不应该在客户支持知识库中使用HTML标签,现在你需要一个清理项目。)
直到现在,原型设计的门槛太高了。为了探索业务的未来,建立一个ChatGPT克隆是不成比例的。
但如果有一个协议和预构建技术的生态系统……那么……MCP意味着你现在就可以进行原型设计。
而且这件事有紧迫性!
我猜测我们将在大约6个月后看到搜索问题的加速。我稍后再详细说明。
现在这是关于聊天与搜索的区别。但与AI代理的不同之处在于,整个交易可以在聊天中完成(可能是文本或语音或其他)。你不会在搜索引擎中预订假期。技术后果更加深远,这就是Stripe押注AI代理支付基础设施的原因(Stripe博客)。但让我们先从简单的事情开始吧。
3、什么是模型上下文协议,它在哪里适用?
回顾:AI聊天已经很流行,要更受欢迎,就需要插件。这意味着开发者需要与AI聊天应用创建者合作,这意味着每个人都需要同意一个标准。
这就是模型上下文协议的用武之地。由Anthropic在2024年12月提出:
MCP是一种开放协议,标准化了应用程序向大型语言模型(LLMs)提供上下文的方式。你可以把MCP想象成AI应用程序的USB-C端口。就像USB-C提供了一种标准化的方式来连接各种外设和配件一样,MCP提供了一种标准化的方式来连接AI模型到不同的数据源和工具。
警告:这很复杂。有大量用例需要考虑,因此这个标准远非简单。它是一种具有替代传输层的协议,这种复杂性达到了那个程度。
看看,提议的标准比比皆是。这个标准特别值得关注吗?是的。
4、MCP表现如何?结果还不错
以下是主要信息:Anthropic做得很好!是的,协议很复杂。但它必须如此。人们已经使用它来构建插件(称为“服务器”),用于从搜索Google Drive到查询Snowflake BI数据库再到使用Ticketmaster的各种用途。
不仅如此,MCP显示出良好的势头:
你可以根据社区的多样性和活跃度来判断一个协议的力量。
查看MCP项目的GitHub:非常繁忙,有广泛使用的SDK,包括Typescript、Python和Kotlin。
使工具和知识可供AI应用程序使用的插件称为“MCP服务器”。我提到了提供访问Google Drive的服务。你还可以运行一个MCP服务器来连接到HubSpot等业务平台,或者个人用于控制智能家居。已经有多个目录列出了人们分享的已构建服务器:
这些服务器是真实的。这是真正的活动。
使用这些服务器的AI应用程序称为“客户端”。对于一个真正的标准,你需要多个客户端。
这里是现有客户端的矩阵。突出两个:
- 如果你使用Claude,那么Claude for Desktop将允许你添加MCP服务器——目前还不支持网页版。
- 还有block的codename goose。如果你想直接与MCP服务器交互,获得开发人员友好的体验,请使用这个。
项目活动:大大的勾号。
不过,另一个警告:MCP目前仍处于“开发者预览”阶段。
例如,你甚至不能为其他人创建服务器。你必须下载它,确保安装了任何技术要求,然后在自己的机器上运行它,等等,而且这相当繁琐。你将编辑JSON配置文件并查阅技术文档。
它会变得更容易吗?是的。今年就会。为了向AI提供远程工具访问,首先你需要解决诸如坚如磐石的身份验证等问题。这是一项艰巨的工作。因此远程访问已被列入2025年上半年的路线图。
我的意思是,注意这个项目。这里有活力,方向是正确的。
5、MCP会是唯一的标准吗?
不会。
绝对不是。现在单一标准还太早。
正如我所说,MCP必然很复杂。灵活、领先一步以及以Anthropic规模做事的缺点是增加了复杂性,这将阻碍开发者的采用。
至少,我预计“企业”和“其他一切”会采用不同的标准。我们需要像Open Graph那样易于使用的标准,如果你熟悉SEO领域的话。
我个人在关注Unternet。他们的Web Applets规范覆盖了重叠的领域,但具有web的简洁性和分布式特性。(他们还与Mozilla合作。)
(一个小插曲:我非常喜欢这种回归互操作性和协议思维的趋势。这健康且充满活力。早期互联网的感觉。)
6、那么我应该跳过MCP等待下一个吗?
不。
MCP是我第一次可以说:有一种(相对)简单的方法可以将组织的工具和知识连接到AI聊天应用程序,并从中学习。
无论我们将来是否都在构建MCP服务器,这些经验都是适用的。
因为这很快就会发生。
还记得我说已经有数千个MCP服务器,远程访问将在2025年中期到来吗?很快会有托管的MCP服务器为你喜欢的所有web应用程序提供服务,Anthropic会在Claude网页版中提供这些服务,你觉得OpenAI会坐视ChatGPT不动,或者谷歌会吗?
我猜到年底我们会看到传统搜索受到显著冲击。
(迟早苹果会加入这个游戏,因为Apple Intelligence架构也为第三方工具提供了支持(2024年),但我认为这需要更长时间。)
7、嗨,所以我构建了自己的MCP服务器
我不想让你以为我没有实际构建东西就有这些观点。
我用来测试“无聊的AI”(最好的AI)的试验场总是我未正式发布的BBC《在我们的时代》档案Braggoscope。(12月我添加了一个视觉探索器[(/home/2024/11/11/in-our-time)]。)
有一系列超过1,000集的播客节目,涵盖从希腊神话到牙齿进化的方方面面。
所以我希望用AI聊天来找到接下来要听的节目。
现在,我完全投入Cloudflare 2025年的工作,所以我使用了Cloudflare Workers和一个新的Cloudflare提供的库workers-mcp来启动一个MCP服务器,用于搜索Braggoscope。这里是Cloudflare的指南,教你如何在他们的平台上构建MCP服务器。
我已经将所有节目的描述存储在一个向量数据库中,用于语义搜索,所以我能够重复使用这个数据库。
这个服务器远程运行,所以我为将来可能的远程访问做好了准备,但现在它仍然需要一个本地网关。
抱歉,你暂时还不能使用它。但我可以给你看一张屏幕截图。

以下是它在Claude中的使用情况。
有趣的是,Claude将我的Braggoscope MCP服务器视为侧加载的知识,有点像是《黑客帝国》中的Neo,它知道功夫。数据源中没有任何内容表明“这是优秀的”——最上面的节目只是一个很好的匹配,然后它从那里开始构建。

尽管MCP是由Anthropic发起的项目,但Claude并不是唯一一个客户端。我之前提到了codename goose,这里就是它。
Goose更技术化——你必须粘贴自己的LLM API密钥——并且是一个实验MCP服务器的好工作台。
在这里,我使用了OpenAI的gpt-4o模型,没有使用Claude/ChatGPT系统提示。它减少了字符限制;节目列表更像搜索结果页面。我仍然可以通过节目描述与GPT聊天,所以认识论之旅依然存在。但初始感觉非常不同。
我学到了什么?
从实用技术角度来看,我需要找到方法保持Braggoscope节目的数据库与语义搜索数据库同步。
更重要的是,我现在可以提供一个用户界面永远无法实现的复杂度的分面搜索:作为一个用户,我想说我记得大概是在2014年左右,Edith Hall是嘉宾,那是什么节目?人类不会有耐心填写搜索表单。AI可以。我有了一个新的工具可以构建!
从用户体验/品牌角度来看,我希望Claude不要代表Braggoscope发言。所以我需要找到一种方式来引导它的声音。
如果我是BBC,拥有大量的节目和播客,我需要找到一种连接用户账户的方式:节目搜索真的需要个性化——AI应该记住我之前听过的节目。它需要信号来进行排名。
此外,我还想增加一点惊喜元素。也许“搜索”工具也应该在结果集的末尾提供一些截然不同的东西。这就像广播公司在热门节目结束后推广完全不同类型的节目一样。共享观众对他们很重要!对我来说也是如此——即使在这个简单的集成中,作为用户,我感到需要更多的多样性。
总之,这不仅仅是一个技术练习。
8、让我们一起构建AI聊天插件
借助模型上下文协议,你的收获应该是,这是第一次你可以(相对)容易地使用真实系统进行原型设计,同时发现和迭代
- 用户体验
- 技术影响
- 组织影响
……所有这一切同时进行。
作为一个组织,你应该同时使用MCP和其他规格(如Web Applets)进行构建,以避免过于偏向单一实现。使用多个兼容的AI聊天客户端进行非正式的用户测试。
我不会称之为原型设计。原型是为了进行路径规划。你可能会跟进一个分享和潜在影响的会议,诸如此类。
总之。
我想在这里建立一些知识,这意味着我要亲自动手。我希望在少数合作伙伴内部发现实际问题,并找出共同点。
所以如果你想使用MCP构建原型,我可以帮忙。
让我们看看是否有需求:这可以通过我的微型工作室Acts Not Facts作为一个项目包,因为它应该涉及一些事情。我们将找到一种简单的时间+材料方式来合作。联系我们。
原文链接:Extending AI chat with Model Context Protocol (and why it matters)
汇智网翻译整理,转载请标明出处