Skip to content

吃透MCP的七问

发表: at 20:00

导读

MCP这两天太火了,出来解释一下。想象一下,你有一位非常聪明的朋友。这位朋友知识渊博,能回答各种问题,但却被限制在一个封闭的房间里,无法直接使用外界的工具和服务。每当你需要他帮忙预订餐厅、查询实时天气或分析最新数据时,你必须充当”中间人”——把外部信息带给他,然后再把他的指示带到外面执行。这样的交流过程既繁琐又低效。

在AI领域,大型语言模型(LLM)就像这位聪明的朋友。它们拥有强大的理解和生成能力,但本身无法直接与外部工具和服务交互。

而Anthropic公司2024年11月份推出的模型上下文协议(Model Context Protocol,简称MCP)正是为解决这一问题而生的创新解决方案。虽然去年就推出了,但年后才火,证明好东西也需要发酵时间啊

一. 什么是MCP?

模型上下文协议(MCP)是一个标准化的协议框架,旨在让AI模型能够更低成本、更通用地接入外部工具和服务。简单来说,MCP就像是AI与外部世界之间的”通用翻译器”和”智能连接器”。

如果用日常生活中的例子来解释,MCP就像是:

  1. 一个通用电源适配器:无论你在世界哪个国家,都能用同一个适配器连接各种电器

  2. 一位精通多国语言的翻译:能够实时翻译不同系统之间的”语言”,确保沟通顺畅

  3. 一个智能控制中心:帮助AI向外部发送正确格式的请求,并将外部结果转化为AI能理解的形式

二. MCP是如何工作的?

MCP的架构主要包括三个核心组件,简单画了一张工作原理图,仅供参考。

图片

1. MCP客户端

想象你正在使用一个遥控器操控家中的各种智能设备。MCP客户端就像这个遥控器,它嵌入在AI模型内部或其接口层,负责:

2. MCP服务端

继续使用智能家居的比喻,MCP服务端就像是连接各种家电的智能中枢。它负责:

3. 工具和服务适配器

这些适配器就像是各种智能家电上的接收器,它们能够:

三. 讲一个MCP使用的例子?

让我们通过一个实际例子来理解MCP的工作流程:假设你要求AI助手查询今天的天气,并根据天气情况推荐穿衣建议。

  1. 用户发出请求:你向AI助手询问”今天的天气如何?我该穿什么?”

  2. AI理解并生成意图:AI模型理解你需要天气信息和穿衣建议

  3. MCP客户端处理:

    • 将AI的意图转换为标准化请求:“需要查询{当前地点}的{当天}天气数据”
    • 发送这个标准化请求给MCP服务端
  4. MCP服务端处理:

    • 接收请求并识别需要调用天气API
    • 将标准化请求转换为特定天气API需要的格式
    • 调用天气API获取数
  5. 工具执行并返回

    • 天气API返回当天温度、湿度、降水概率等数据
    • 数据通过MCP服务端转换为标准格式
  6. AI接收并处理信息:

    • MCP客户端将标准格式的天气数据返回给AI
    • AI基于这些实时数据生成穿衣建
  7. 用户获得响应:你收到准确的天气信息和个性化的穿衣建议

整个过程无缝连接,用户感受不到背后复杂的交互流程。

等等,这不就是现在都能体验到的大模型联网实时查询信息的功能吗?

你说的没错。所以接下来我们要解释。

四. 为什么MCP如此重要?

这里有三个东西要讲清楚区别:模型联网查询 vs 模型对接API vs 模型对接MCP协议

**模型联网查询:**可以查到所有的信息,但只是信息获取,并不能给对应的业务提供方下发指令。目前技术已经很成熟通用;

**模型接入单个具体的业务API:**既可以通过API查询,也可以通过API给业务下发指令。单个API对接的成本和定制化很高;

**而模型对接MCP协议:**就有三个真正意义上的优势。

1. 大幅降低集成成本

在没有MCP之前,每当开发者想让AI使用一个新工具或服务,都需要进行定制化开发,为每个工具创建专门的接口和处理逻辑。

有了MCP后,开发者只需按照统一标准开发一次适配器,AI就能接入这个工具。就像USB接口的普及让我们不再需要为每种设备准备不同的线缆一样,MCP让AI与工具的连接变得简单高效。

2. 实现真正的通用性

传统方法下,不同AI模型可能使用不同的接口标准,导致工具开发者需要为每个AI平台定制解决方案。

MCP提供了一个统一的标准,让同一个工具可以被不同的AI模型使用,同时让一个AI模型可以使用各种符合MCP标准的工具。这极大地提高了生态系统的兼容性和开放性。

3. 增强AI功能而无需重新训练

想象一下升级手机——你不需要重新学习如何使用它,只需安装新应用即可获得新功能。

MCP让AI模型能够类似地”安装”新工具,从而获得新能力,而无需对AI本身进行重新训练或微调。这意味着AI可以持续升级其功能,跟上快速变化的需求。

五. 那为什么生态愿意接入MCP协议?

这是从生态角度可能会产生的疑问。

相当于一家公司经营的面向用户的主要数据和服务资产(如淘宝的商品查询或美团的外卖商品),他们为什么愿意接入MCP协议呢?接入后可就不仅仅再是自家的业务场景可以使用到这些工具和资产了。

工具服务提供方接入MCP确实涉及核心资产,他们这样做有几个关键动机:

1. 扩大用户触达渠道

2. 提升用户体验

3. 获取新的商业机会

4. 避免被边缘化

5. 可控的资产开放

6. 数据洞察

对于核心资产保护的担忧,服务提供方通常会采取精细的API设计策略,只开放必要功能,同时通过合同和技术手段限制数据的过度使用。这是一种在开放与保护之间的平衡。

六. MCP的行业价值与应用场景如何?

一个新概念刚开始火爆,不意味着能持续的走下去。尤其是涉及到构建了一套新的标准,且需要大量的生态兼容的事情。但假设这个能成,未来可期。

**1. 企业内部系统集成:**对于拥有复杂内部系统的企业,MCP可以让AI助手轻松连接到各种企业资源,这使企业可以快速构建强大的定制化AI助手,无需大量工程资源。

**2. 开发者生态系统繁荣:**MCP为开发者创造了新的机会,这使企业可以快速构建强大的定制化AI助手,无需大量工程资源。

**3. 垂直行业定制化解决方案:**不同行业有特定的工具和服务需求。MCP使得为这些行业定制AI解决方案变得更加简单,也让消费级AI助手可以通过MCP连接到各种日常服务。典型如以下三个行业。

**4. 市面上所有个人AI助理的能力扩展:**这让AI助手能真正成为日常生活的得力助手,而不仅仅是一个对话机器人。

七. 那中国有没有MCP这样东西?

国内目前确实有多家公司已经在开发类似MCP的协议标准和平台,但最大的差异在于:

国内商场还是封闭生态自我使用为主,以生态接入到自家平台;但鲜有构建中间层能力,因为这需要“取之生态,还与生态”的设计思路。

这类业务主要分布在AI大模型厂商和手机硬件厂商两大阵营:

AI大模型厂商:

手机硬件厂商:

这些平台之间的主要区别在于:

各家平台的接口规范和能力也在不断更新完善,但未来想要做到和MCP对标,其整体趋势要向更标准化和开放的方向发展。

总结一下:

MCP代表了AI与外部世界互联互通的重要突破。它不仅是一种技术框架,更是连接AI能力与实际应用场景的桥梁,让AI从”理解世界的大脑”变成”能够操作世界的双手”。

随着MCP的标准化和成熟,我们可以期待AI应用生态系统的繁荣发展,带来前所未有的便利和价值。这不仅将提升AI的实用性,还将为各行各业创造新的机遇和可能性。

图片

文章来源:微信公众号-林夕槽语,原始发表时间:2025年03月16日。


上篇文章
MCP、RAG、Agent之间的概念和关系,被我和AI协作的12张图总结了
下篇文章
Transformer与混合专家(MoE):大型语言模型的架构对比