Alliance DAO研究员:深入浅出了解DARK爆火背后的MCP概念

对于AI应用程序来说,MCP就像硬件中的USB-C。

原文作者:Mohamed ElSeidy

原文编译:深潮 TechFlow

原文作者:Mohamed ElSeidy

原文编译:深潮 TechFlow

导读

昨日,Solana 上的 AI 相关代币 $Dark 上线 Binance Alpha,截止目前市值已经来到 4000 万美元左右。

在最新的加密 AI 叙事中,$Dark 与「MCP」(模型上下文协议)密切相关,而这也是近期谷歌等 Web2 科技公司正在关注和探索的领域。

但在目前,能够清晰讲清楚 MCP 这个概念和叙事影响的文章并不多。

下文是 Alliance DAO 研究员Mohamed ElSeidy的一篇关于 MCP 协议深入浅出的文章,以非常通俗的语言讲述了 MCP 的原理和定位,或许对我们快速了解最新的叙事有所帮助。

深潮 TechFlow 对全文进行了编译。

在我于 Alliance 的这些年里,我见证了无数创始人构建了他们自己的专用工具和数据集成,这些都被嵌入到他们的 AI 代理和工作流程中。然而,这些算法、形式化和独特的数据集被锁在定制的集成背后,极少有人会使用。

随着模型上下文协议(Model Context Protocol, MCP)的出现,这种情况正在迅速改变。MCP 被定义为一种开放协议,它标准化了应用程序如何与大型语言模型(LLM)进行通信并提供上下文。我非常喜欢的一个比喻是:「对于 AI 应用程序来说,MCP 就像硬件中的 USB-C」;它是标准化的、即插即用的、多功能的,并且具有变革性。

为什么选择 MCP?

大型语言模型(如 Claude、OpenAI、LLAMA 等)非常强大,但它们受限于当前可以访问的信息。这意味着它们通常存在知识截止点,不能独立浏览网络,也无法直接访问你的个人文件或专用工具,除非进行某种形式的集成。

特别是,在此之前,开发者在将 LLM 连接到外部数据和工具时面临三个主要挑战:

  • 集成复杂性:为每个平台(如 Claude、ChatGPT 等)构建单独的集成需要重复努力并维护多个代码库。

  • 工具碎片化:每种工具功能(例如,文件访问、API 连接等)都需要自己的专用集成代码和权限模型。

  • 分发受限:专用工具被限制在特定平台,限制了它们的覆盖面和影响力。

  • MCP 通过提供一种标准化的方法,使任何 LLM 都能通过通用协议安全地访问外部工具和数据源,从而解决了这些问题。现在我们了解了 MCP 的作用,让我们看看人们正在用它构建什么。

  • 人们正在用 MCP 构建什么?

  • MCP 生态系统目前正处于创新爆发期。以下是我在 Twitter 上发现的一些开发者展示其作品的最新示例:

  • AI 驱动的故事板:一种 MCP 集成,使 Claude 能够控制 ChatGPT-4o,自动生成吉卜力风格的完整故事板,无需任何人工干预。

  • ElevenLabs 语音集成:一个 MCP 服务器,通过简单的文本提示,让 Claude 和 Cursor 访问整个 AI 音频平台。该集成强大到足以创建可以进行外拨电话的语音代理。这展示了 MCP 如何将当前 AI 工具扩展到音频领域。

  • 使用 Playwright 进行浏览器自动化:一个 MCP 服务器,使 AI 代理能够控制网页浏览器,而无需截图或视觉模型。这通过标准化方式使 LLM 直接控制浏览器交互,创造了网页自动化的新可能性。

  • 个人 WhatsApp 集成:一个连接个人 WhatsApp 账户的服务器,使 Claude 能够搜索消息和联系人,并发送新消息。

  • Airbnb 搜索工具:一个 Airbnb 公寓搜索工具,展示了 MCP 的简便性和创建与网络服务交互的实用应用的能力。

  • 机器人控制系统:一个用于机器人的 MCP 控制器。该示例弥合了 LLM 与物理硬件之间的差距,展示了 MCP 在物联网应用和机器人领域的潜力。

  • Google Maps 和本地搜索:将 Claude 连接到 Google Maps 数据,创建一个可以查找和推荐本地企业(如咖啡店)的系统。这一扩展使 AI 助手能够提供基于位置的服务。

  • 区块链集成:Lyra MCP 项目将 MCP 功能带到 StoryProtocol 和其他 web3 平台。这允许与区块链数据和智能合约进行交互,为通过 AI 增强的去中心化应用打开了新的可能性。

这些示例尤其引人注目之处在于其多样性。自 MCP 推出以来的短短时间内,开发者已经创建了涵盖创意媒体制作、通信平台、硬件控制、位置服务和区块链技术的集成。这些各种不同的应用遵循同一标准化协议,展示了 MCP 的多功能性及其成为 AI 工具集成通用标准的潜力。

如果想要查看全面的 MCP 服务器集合,可以访问 GitHub 上的官方 MCP 服务器库。在使用任何 MCP 服务器之前,请仔细阅读免责声明,并谨慎对待运行和授权的内容。

承诺与炒作

面对任何新技术,值得问的是:MCP 是否真正具有变革性,还是仅仅是另一个过度炒作、最终会消退的工具?

在观察过众多初创企业后,我相信 MCP 代表了 AI 发展的一次真正的转折点。与许多承诺革命但仅带来渐进变化的趋势不同,MCP 是一种生产力提升,解决了阻碍整个生态系统发展的基础设施问题。

它的特别之处在于,它并不试图替代现有的 AI 模型或与之竞争,而是通过将它们连接到所需的外部工具和数据,使它们更加有用。

尽管如此,关于安全性和标准化的合理担忧仍然存在。正如任何协议在初期阶段一样,随着社区在审计、权限、认证和服务器验证方面摸索最佳实践,我们可能会看到成长的烦恼。开发者需要信任这些 MCP 服务器的功能,不能盲目信任它们,尤其是在它们变得丰富时。本文讨论了一些因盲目使用未经仔细审查的 MCP 服务器而暴露的最近漏洞,即使是在本地运行时。

AI 的未来在于情境化

最强大的 AI 应用将不再是独立的模型,而是通过像 MCP 这样的标准化协议连接起来的专业能力生态系统。对于初创公司来说,MCP 代表了一个构建适合这些不断增长的生态系统的专业组件的机会。这是一个利用您独特知识和能力的机会,同时从基础模型的大量投资中获益。

展望未来,我们可以预期 MCP 将成为 AI 基础设施的基本组成部分,就像 HTTP 之于网络一样。随着协议的成熟和采用的增长,我们很可能会看到专门的 MCP 服务器市场的出现,使 AI 系统能够利用几乎任何想象得到的能力或数据源。

您的初创公司是否尝试过实施 MCP?我很想在评论中听到您的经验。如果您在这个领域构建了有趣的东西,请通过@alliancedao 与我们联系并申请。

附录

对于那些有兴趣了解 MCP 实际工作原理的人,以下附录提供了其架构、工作流程和实施的技术细分。

MCP 的幕后

类似于 HTTP 标准化了网络访问外部数据源和信息的方式,MCP 为 AI 框架做到了这一点,创造了一种通用语言,使不同的 AI 系统能够无缝沟通。让我们来探索它是如何做到的。

MCP 架构和流程

Alliance DAO研究员:深入浅出了解DARK爆火背后的MCP概念

主要架构遵循客户端 – 服务器模型,由四个关键组件协同工作:

  • MCP 主机:包括桌面 AI 应用如 Claude 或 ChatGPT,IDE 如 cursorAI 或 VSCode,或其他需要访问外部数据和功能的 AI 工具。

  • MCP 客户端:嵌入在主机中的协议处理器,维护与 MCP 服务器的一对一连接。

  • MCP 服务器:通过标准化协议暴露特定功能的轻量级程序。

  • 数据源:包括文件、数据库、API 和服务,MCP 服务器可以安全访问这些数据。

现在我们已经讨论了这些组件,来看一下它们在典型工作流程中的交互:

  • 用户交互:用户在 MCP 主机(例如 Claude Desktop)中提问或发出请求。

  • LLM 分析:LLM 分析请求并确定需要外部信息或工具来提供完整的响应。

  • 工具发现:MCP 客户端查询连接的 MCP 服务器以发现可用的工具。

  • 工具选择:LLM 根据请求和可用功能决定使用哪些工具。

  • 权限请求:主机向用户请求执行所选工具的权限,以确保透明性和安全性。

  • 工具执行:在获得批准后,MCP 客户端将请求发送到适当的 MCP 服务器,服务器利用其对数据源的专业访问来执行操作。

  • 结果处理:服务器将结果返回给客户端,客户端将其格式化以供 LLM 使用。

  • 响应生成:LLM 将外部信息整合成全面的响应。

  • 用户展示:最终,响应呈现给终端用户。

这种架构的强大之处在于,每个 MCP 服务器专注于特定领域,但使用标准化的通信协议。这样,开发者无需为每个平台重建集成,只需一次性开发工具即可服务于整个 AI 生态系统。

如何构建您的第一个 MCP 服务器

现在让我们看看如何使用 MCP SDK 在几行代码中实现一个简单的 MCP 服务器。

在这个简单的例子中,我们希望扩展 Claude Desktop 的能力,让它能够回答诸如「中央公园附近有哪些咖啡店?」这样的问题,信息来源于谷歌地图。您可以轻松扩展此功能以获取评论或评分。但现在,我们专注于 MCP 工具 find_nearby_places,它将允许 Claude 直接从谷歌地图获取这些信息,并以对话的方式呈现结果。

Alliance DAO研究员:深入浅出了解DARK爆火背后的MCP概念

正如您所见,代码非常简单。首先,它将查询转换为谷歌地图 API 搜索,然后返回结构化格式的顶级结果。这样,信息被传递回 LLM 以便进一步决策。

现在我们需要让 Claude Desktop 知道这个工具,因此我们在其配置文件中注册它,如下所示:

macOS 路径:~/Library/Application Support/Claude/claude_desktop_config.jsonWindows 路径:%APPDATA%\Claude\claude_desktop_config.json

就这样,你完成了!现在你已经成功扩展了 Claude 的功能,可以实时从谷歌地图中查找位置。

文章链接:http://coinseek.idea2003.cn/news/2844.html





发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注