自 2022 年以来,大语言模型逐步进入大众视野,并迅速成为 AI 领域最热门的话题。
我们习惯了在对话框中输入问题,等待模型生成一段看似智能的回复。但你是否发现,当你想让 AI 帮你预订机票时,它只会教你"打开某 App 搜索航班",而不是直接帮你完成操作,这种"纸上谈兵"的尴尬,暴露了当前 LLM 的致命短板——它缺乏与现实世界的交互能力。
而这一切,正在被一个名为 MCP 的协议改变。
MCP 最早出现在 2024 年 11 月 25 日 Anthropic 发布的文章:Introducing the Model Context Protocol。
MCP 全称是 Model Context Protocol(模型上下文协议),它定义了应用程序和 AI LLM 之间的交换上下文信息的标准,使得开发者可以以一致的方式将各种数据、工具提供给 AI 去使用, 你可以将它理解为 AI 的 "USB-C 接口"。
就像 USB-C 接口能连接手机、电脑、耳机等设备一样,MCP 提供了一种标准化方式,MCP 让 LLM(如 Claude、GPT)能够安全、灵活地调用外部工具和数据源,从"回答问题"进化为"执行任务"。

在没有 MCP 的时候,我们使用 AI 往往需要将所有信息集中发送给 AI,然后等待 AI 给出答案。
这个过程可能需要人工查询数据库或搜索网页,然后将信息复制给 AI。
但随着需求日益复杂,要求不断提高,这样的方式无法满足我们所有的要求。我们在书写 prompt 时可能会想要提供更加具体的信息给到 AI,比如:文件、数据库、实时信息等,这样 AI 才能更好地为我们解决问题。
为了突破这个限制,很多 LLM 平台引入了 Function Calling 的方式,让 AI 可以调用外部工具。Function Calling 允许 AI 在需要获取数据或者执行操作时来调用预定义的函数,显著提升了自动化的水平。
但 Function Calling 本身也有局限性,虽然都叫 Function Calling,但是每个 LLM 平台对于 Function Calling 的实现方式都不一样。
比如,OpenAI 的 Function Calling 和 Google 的不能相互兼容,开发者需要对不同平台分别开发和适配,成本很高。
MCP 正是基于这个痛点诞生的。MCP 统一了 AI 和外部工具之间的标准,充当了 AI 模型的万能插头,让 AI 可以灵活地调用外部工具。
MCP 相比 Function Calling 的优势:
MCP 的核心遵循 客户端-服务器架构,其中主机应用程序可以连接到多个服务器:

当你向 AI 提出问题时,流程是这样的:
这样的架构设计可以让 LLM 更灵活的调用各种数据和工具,开发者只需要专注开发 MCP Server,用户也不需要额外的学习成本。
初次接触 MCP 时,我对 LLM 如何决定调用哪个 MCP Server 以及调用时机产生了浓厚的兴趣。
在官网已经给到了解释:
也就是说,是 LLM 主动选择并调用的,那么具体是如何实现的呢?
一起看一下官方提供的一个 Client Demo ,代码做了简化。
tool 的描述和代码中的 input_schema 是从哪里来的呢?再来看一段 Server Demo 的代码,这是一段注册浏览器工具的代码,可以可以发现是在开发者开发 MCP Server 时直接描述清楚这个 Tool 的作用以及每个参数的作用。
TIP
总结:LLM 通过 prompt engineering 来了解有哪些工具可以使用以及工具的具体作用的,即提供所有工具的描述和 few-shot 的 example 来确定使用哪些工具。
*该部分转载自: zhuanlan.zhihu.com/p/29001189476
以 Cursor + Github 为例,体验让AI直接操作代码仓库:
步骤1:创建Github个人访问令牌
repo 和 workflow 权限ghp_ 开头的令牌字符串步骤2:配置MCP Server
在 Cursor 按一下步骤打开 MCP 配置文件

输入以下代码,并将 <YOUR_GITHUB_PERSONAL_ACCESS_TOKEN> 替换为你的 Github 的 Personal Access Token:
步骤3:验证连接
当状态指示灯变绿后,尝试自然语言指令:


目前推荐的 MCP Server 来源:
| 平台 | 特点 | 描述 |
|---|---|---|
| 官方仓库 | 经过安全审计 | 官方认证 |
| Awesome-MCP | 社区精选 | 精选的优秀模型上下文协议 (MCP) 服务器列表 |
| mcp.so | MCP 搜索 | 号称"最大的 MCP 服务器集合" |
TIP
在下一篇博文,我会详细记录这个资产价格查询的 MCP 是如何实现的。

自 2022 年以来,大语言模型逐步进入大众视野,并迅速成为 AI 领域最热门的话题。
我们习惯了在对话框中输入问题,等待模型生成一段看似智能的回复。但你是否发现,当你想让 AI 帮你预订机票时,它只会教你"打开某 App 搜索航班",而不是直接帮你完成操作,这种"纸上谈兵"的尴尬,暴露了当前 LLM 的致命短板——它缺乏与现实世界的交互能力。
而这一切,正在被一个名为 MCP 的协议改变。
MCP 最早出现在 2024 年 11 月 25 日 Anthropic 发布的文章:Introducing the Model Context Protocol。
MCP 全称是 Model Context Protocol(模型上下文协议),它定义了应用程序和 AI LLM 之间的交换上下文信息的标准,使得开发者可以以一致的方式将各种数据、工具提供给 AI 去使用, 你可以将它理解为 AI 的 "USB-C 接口"。
就像 USB-C 接口能连接手机、电脑、耳机等设备一样,MCP 提供了一种标准化方式,MCP 让 LLM(如 Claude、GPT)能够安全、灵活地调用外部工具和数据源,从"回答问题"进化为"执行任务"。

在没有 MCP 的时候,我们使用 AI 往往需要将所有信息集中发送给 AI,然后等待 AI 给出答案。
这个过程可能需要人工查询数据库或搜索网页,然后将信息复制给 AI。
但随着需求日益复杂,要求不断提高,这样的方式无法满足我们所有的要求。我们在书写 prompt 时可能会想要提供更加具体的信息给到 AI,比如:文件、数据库、实时信息等,这样 AI 才能更好地为我们解决问题。
为了突破这个限制,很多 LLM 平台引入了 Function Calling 的方式,让 AI 可以调用外部工具。Function Calling 允许 AI 在需要获取数据或者执行操作时来调用预定义的函数,显著提升了自动化的水平。
但 Function Calling 本身也有局限性,虽然都叫 Function Calling,但是每个 LLM 平台对于 Function Calling 的实现方式都不一样。
比如,OpenAI 的 Function Calling 和 Google 的不能相互兼容,开发者需要对不同平台分别开发和适配,成本很高。
MCP 正是基于这个痛点诞生的。MCP 统一了 AI 和外部工具之间的标准,充当了 AI 模型的万能插头,让 AI 可以灵活地调用外部工具。
MCP 相比 Function Calling 的优势:
MCP 的核心遵循 客户端-服务器架构,其中主机应用程序可以连接到多个服务器:

当你向 AI 提出问题时,流程是这样的:
这样的架构设计可以让 LLM 更灵活的调用各种数据和工具,开发者只需要专注开发 MCP Server,用户也不需要额外的学习成本。
初次接触 MCP 时,我对 LLM 如何决定调用哪个 MCP Server 以及调用时机产生了浓厚的兴趣。
在官网已经给到了解释:
也就是说,是 LLM 主动选择并调用的,那么具体是如何实现的呢?
一起看一下官方提供的一个 Client Demo ,代码做了简化。
tool 的描述和代码中的 input_schema 是从哪里来的呢?再来看一段 Server Demo 的代码,这是一段注册浏览器工具的代码,可以可以发现是在开发者开发 MCP Server 时直接描述清楚这个 Tool 的作用以及每个参数的作用。
TIP
总结:LLM 通过 prompt engineering 来了解有哪些工具可以使用以及工具的具体作用的,即提供所有工具的描述和 few-shot 的 example 来确定使用哪些工具。
*该部分转载自: zhuanlan.zhihu.com/p/29001189476
以 Cursor + Github 为例,体验让AI直接操作代码仓库:
步骤1:创建Github个人访问令牌
repo 和 workflow 权限ghp_ 开头的令牌字符串步骤2:配置MCP Server
在 Cursor 按一下步骤打开 MCP 配置文件

输入以下代码,并将 <YOUR_GITHUB_PERSONAL_ACCESS_TOKEN> 替换为你的 Github 的 Personal Access Token:
步骤3:验证连接
当状态指示灯变绿后,尝试自然语言指令:


目前推荐的 MCP Server 来源:
| 平台 | 特点 | 描述 |
|---|---|---|
| 官方仓库 | 经过安全审计 | 官方认证 |
| Awesome-MCP | 社区精选 | 精选的优秀模型上下文协议 (MCP) 服务器列表 |
| mcp.so | MCP 搜索 | 号称"最大的 MCP 服务器集合" |
TIP
在下一篇博文,我会详细记录这个资产价格查询的 MCP 是如何实现的。
