你是否曾经希望自己的AI助手能够像ChatGPT那样,实时搜索网络并获取最新信息?今天要介绍的开源项目RAG网络浏览器,正是为了实现这个目标而设计的。它是一个MCP服务器,为Apify平台的RAG网络浏览器Actor提供了接口,让你的AI能够搜索Google、抓取网页内容,并将清理后的信息作为上下文提供给大语言模型。

需要特别说明的是,这个项目目前已经弃用,官方推荐使用更强大的替代方案。不过了解它的设计思路和迁移路径,对于开发者仍然有参考价值。

项目基本信息

信息项详情
项目名称RAG网络浏览器
GitHub地址https://github.com/apify/mcp-server-rag-web-browser
项目描述为RAG网络浏览器Actor实现一个MCP服务器。该Actor充当大型语言模型(LLMs)和RAG管道的网络浏览器,类似于ChatGPT中的网络搜索功能。
作者apify
开源协议Unknown
开源状态公开状态(已弃用)
LanguagesTypeScript, JavaScript
支持平台Windows / macOS / Linux
最后更新2026-04-23

一、项目介绍

RAG网络浏览器是一个MCP服务器,它连接了AI客户端与Apify平台上的RAG网络浏览器Actor。这个Actor本质上是一个网页抓取工具,能够搜索Google、抓取搜索结果页面,并将内容转换为干净的Markdown格式,供AI作为上下文使用。

这个项目的设计目标是让AI代理能够快速响应网络查询。它在本地运行,与Apify云端Actor通信,发送搜索查询并接收提取的网页内容。主要功能包括:

  • 网页搜索:查询Google搜索,抓取前N个URL,返回清理后的内容
  • 单URL获取:获取特定URL并返回其Markdown内容
  • 本地MCP集成:通过标准输入输出与AI客户端通信

重要提示:官方已宣布此MCP服务器弃用,建议使用mcp.apify.com作为替代方案。

二、核心优势(基于原始设计)

Apify平台集成

直接利用Apify的RAG网络浏览器Actor,无需自己开发网页抓取逻辑。

灵活的抓取选项

支持两种抓取工具:

  • raw-http:快速抓取,适用于静态页面
  • browser-playwright:使用真实浏览器,处理JavaScript密集型网站

多种输出格式

支持返回text、markdown、html三种格式,满足不同场景需求。

简单易用

通过npx命令即可运行,配置简单。

三、适用场景(历史参考)

开发者学习和参考

如果你想了解如何将Apify Actor封装成MCP服务器,这个项目作为参考。但请注意它已弃用,建议直接研究mcp.apify.com

个人项目临时使用

如果你需要快速实现网络搜索功能,且不介意使用已弃用的方案,可以短期使用。

理解迁移路径

如果你正在使用这个旧版服务器,本教程将帮助你迁移到官方推荐的新方案。

四、安装教程(旧版,仅供参考)

系统要求

工具用途下载/安装方式
Node.jsJavaScript运行环境[https://nodejs.org/] (版本要求:18.0 或以上)
Apify账户获取API令牌[https://apify.com]
Git下载项目代码[https://git-scm.com/]

旧版安装步骤

第一步:获取Apify API令牌

注册Apify账户,在集成页面获取你的API令牌(APIFY_TOKEN)。

第二步:配置MCP客户端

对于Claude Desktop,在配置文件中添加:

{
  "mcpServers": {
    "rag-web-browser": {
      "command": "npx",
      "args": ["@apify/mcp-server-rag-web-browser"],
      "env": {
        "APIFY_TOKEN": "你的Apify令牌"
      }
    }
  }
}

对于其他MCP客户端,类似配置。

第三步:使用工具

配置完成后,AI客户端会获得一个search工具,可以用于网页搜索和内容抓取。

五、使用示例(旧版)

示例1:搜索Google

用户指令:“搜索‘2025年人工智能发展趋势’,并返回前3个结果的内容。”

AI会调用search工具,参数如下:

{
  "query": "2025年人工智能发展趋势",
  "maxResults": 3,
  "scrapingTool": "raw-http",
  "outputFormats": ["markdown"]
}

示例2:获取单个URL内容

用户指令:“获取这篇文章的内容:https://example.com/article

AI会调用search工具,将完整URL作为query参数传入:

{
  "query": "https://example.com/article",
  "outputFormats": ["markdown"]
}

示例3:处理JavaScript密集型网站

用户指令:“抓取这个React应用的页面内容:https://react-example.com/app

AI会使用browser-playwright工具:

{
  "query": "https://react-example.com/app",
  "scrapingTool": "browser-playwright",
  "outputFormats": ["html", "markdown"]
}

六、迁移指南:从弃用版本到推荐方案

既然官方已宣布此MCP服务器弃用,以下是迁移到推荐方案的详细步骤。

方案一:使用mcp.apify.com(最推荐)

这是最简单、最强大的替代方案。

第一步:访问mcp.apify.com

打开浏览器,访问 https://mcp.apify.com

第二步:授权客户端

根据你的客户端类型(Claude Desktop、VS Code等),按照网站指引完成OAuth授权。

第三步:获取配置

授权后,网站会生成MCP服务器配置。对于Claude Desktop,配置如下:

{
  "mcpServers": {
    "apify": {
      "command": "npx",
      "args": ["@apify/actors-mcp-server"],
      "env": {
        "APIFY_TOKEN": "你的Apify令牌"
      }
    }
  }
}

第四步:享受更多功能

使用mcp.apify.com后,你将获得:

  • 访问6000+个Apify Actor的能力(而不仅仅是RAG网络浏览器)
  • 动态工具发现
  • 自动更新
  • 无需本地配置

方案二:直接集成RAG网络浏览器Actor

如果你不想通过mcp.apify.com,可以直接通过HTTP/SSE接口调用RAG网络浏览器Actor。

优势:

  • 直接集成,无额外依赖
  • 通过服务器发送事件实现实时流传输
  • 完全控制集成过程

具体实现方式请参考Apify官方文档。

迁移前后对比

对比项旧版(已弃用)新版(推荐)
安装方式本地npx运行托管服务或统一MCP服务器
功能范围仅网页搜索6000+个Actor
更新维护已停止持续更新
配置复杂度需要本地环境零配置或简单OAuth
访问方式stdiostdio或HTTP/SSE

七、总结

RAG网络浏览器MCP服务器曾经是一个实用的工具,让AI能够通过Apify平台进行网页搜索和内容抓取。然而,技术永远在进步,Apify官方已经推出了更强大、更便捷的mcp.apify.com方案。

如果你正在使用或考虑使用这个已弃用的项目,强烈建议立即迁移到mcp.apify.com 你不仅会获得相同的网页浏览能力,还能访问Apify平台上6000多个其他Actor,而且无需担心本地环境配置和维护问题。

对于开发者来说,这个项目的价值更多在于学习MCP服务器的基本结构以及理解如何将外部API封装成MCP工具。但请记住,对于实际项目,请使用官方推荐的最新方案。

标签: 浏览器自动化

已有 34 条评论

    1. PaulaPull PaulaPull

      Apify的这个MCP服务器是托管在云端吗?会不会有延迟?

    2. QuinnQuick QuinnQuick

      是托管在Apify云端的,延迟主要取决于网页抓取速度,一般可接受。

    3. RitaRun RitaRun

      我对比了直接调用API和通过MCP调用,后者对AI更友好。

    4. SamSearch SamSearch

      项目已弃用但GitHub还在,作为学习材料还是有价值的。

    5. TinaTool TinaTool

      建议初学者直接学mcp.apify.com,不要走弯路。