RAG网络浏览器

你是否曾经希望自己的AI助手能够像ChatGPT那样，实时搜索网络并获取最新信息？今天要介绍的开源项目RAG网络浏览器，正是为了实现这个目标而设计的。它是一个MCP服务器，为Apify平台的RAG网络浏览器Actor提供了接口，让你的AI能够搜索Google、抓取网页内容，并将清理后的信息作为上下文提供给大语言模型。

需要特别说明的是，这个项目目前已经弃用，官方推荐使用更强大的替代方案。不过了解它的设计思路和迁移路径，对于开发者仍然有参考价值。

项目基本信息

信息项	详情
项目名称	RAG网络浏览器
GitHub地址	https://github.com/apify/mcp-server-rag-web-browser
项目描述	为RAG网络浏览器Actor实现一个MCP服务器。该Actor充当大型语言模型（LLMs）和RAG管道的网络浏览器，类似于ChatGPT中的网络搜索功能。
作者	apify
开源协议	Unknown
开源状态	公开状态（已弃用）
Languages	TypeScript, JavaScript
支持平台	Windows / macOS / Linux
最后更新	2026-04-23

一、项目介绍

RAG网络浏览器是一个MCP服务器，它连接了AI客户端与Apify平台上的RAG网络浏览器Actor。这个Actor本质上是一个网页抓取工具，能够搜索Google、抓取搜索结果页面，并将内容转换为干净的Markdown格式，供AI作为上下文使用。

这个项目的设计目标是让AI代理能够快速响应网络查询。它在本地运行，与Apify云端Actor通信，发送搜索查询并接收提取的网页内容。主要功能包括：

网页搜索：查询Google搜索，抓取前N个URL，返回清理后的内容
单URL获取：获取特定URL并返回其Markdown内容
本地MCP集成：通过标准输入输出与AI客户端通信

重要提示：官方已宣布此MCP服务器弃用，建议使用mcp.apify.com作为替代方案。

二、核心优势（基于原始设计）

Apify平台集成

直接利用Apify的RAG网络浏览器Actor，无需自己开发网页抓取逻辑。

灵活的抓取选项

支持两种抓取工具：

raw-http：快速抓取，适用于静态页面
browser-playwright：使用真实浏览器，处理JavaScript密集型网站

多种输出格式

支持返回text、markdown、html三种格式，满足不同场景需求。

简单易用

通过npx命令即可运行，配置简单。

三、适用场景（历史参考）

开发者学习和参考

如果你想了解如何将Apify Actor封装成MCP服务器，这个项目作为参考。但请注意它已弃用，建议直接研究mcp.apify.com。

个人项目临时使用

如果你需要快速实现网络搜索功能，且不介意使用已弃用的方案，可以短期使用。

理解迁移路径

如果你正在使用这个旧版服务器，本教程将帮助你迁移到官方推荐的新方案。

四、安装教程（旧版，仅供参考）

系统要求

工具	用途	下载/安装方式
Node.js	JavaScript运行环境	[https://nodejs.org/] （版本要求：18.0 或以上）
Apify账户	获取API令牌	[https://apify.com]
Git	下载项目代码	[https://git-scm.com/]

旧版安装步骤

第一步：获取Apify API令牌

注册Apify账户，在集成页面获取你的API令牌（APIFY_TOKEN）。

第二步：配置MCP客户端

对于Claude Desktop，在配置文件中添加：

{
  "mcpServers": {
    "rag-web-browser": {
      "command": "npx",
      "args": ["@apify/mcp-server-rag-web-browser"],
      "env": {
        "APIFY_TOKEN": "你的Apify令牌"
      }
    }
  }
}

对于其他MCP客户端，类似配置。

第三步：使用工具

配置完成后，AI客户端会获得一个search工具，可以用于网页搜索和内容抓取。

五、使用示例（旧版）

示例1：搜索Google

用户指令：“搜索‘2025年人工智能发展趋势’，并返回前3个结果的内容。”

AI会调用search工具，参数如下：

{
  "query": "2025年人工智能发展趋势",
  "maxResults": 3,
  "scrapingTool": "raw-http",
  "outputFormats": ["markdown"]
}

示例2：获取单个URL内容

用户指令：“获取这篇文章的内容：https://example.com/article”

AI会调用search工具，将完整URL作为query参数传入：

{
  "query": "https://example.com/article",
  "outputFormats": ["markdown"]
}

示例3：处理JavaScript密集型网站

用户指令：“抓取这个React应用的页面内容：https://react-example.com/app”

AI会使用browser-playwright工具：

{
  "query": "https://react-example.com/app",
  "scrapingTool": "browser-playwright",
  "outputFormats": ["html", "markdown"]
}

六、迁移指南：从弃用版本到推荐方案

既然官方已宣布此MCP服务器弃用，以下是迁移到推荐方案的详细步骤。

方案一：使用mcp.apify.com（最推荐）

这是最简单、最强大的替代方案。

第一步：访问mcp.apify.com

打开浏览器，访问 https://mcp.apify.com

第二步：授权客户端

根据你的客户端类型（Claude Desktop、VS Code等），按照网站指引完成OAuth授权。

第三步：获取配置

授权后，网站会生成MCP服务器配置。对于Claude Desktop，配置如下：

{
  "mcpServers": {
    "apify": {
      "command": "npx",
      "args": ["@apify/actors-mcp-server"],
      "env": {
        "APIFY_TOKEN": "你的Apify令牌"
      }
    }
  }
}

第四步：享受更多功能

使用mcp.apify.com后，你将获得：

访问6000+个Apify Actor的能力（而不仅仅是RAG网络浏览器）
动态工具发现
自动更新
无需本地配置

方案二：直接集成RAG网络浏览器Actor

如果你不想通过mcp.apify.com，可以直接通过HTTP/SSE接口调用RAG网络浏览器Actor。

优势：

直接集成，无额外依赖
通过服务器发送事件实现实时流传输
完全控制集成过程

具体实现方式请参考Apify官方文档。

迁移前后对比

对比项	旧版（已弃用）	新版（推荐）
安装方式	本地npx运行	托管服务或统一MCP服务器
功能范围	仅网页搜索	6000+个Actor
更新维护	已停止	持续更新
配置复杂度	需要本地环境	零配置或简单OAuth
访问方式	stdio	stdio或HTTP/SSE

七、总结

RAG网络浏览器MCP服务器曾经是一个实用的工具，让AI能够通过Apify平台进行网页搜索和内容抓取。然而，技术永远在进步，Apify官方已经推出了更强大、更便捷的mcp.apify.com方案。

如果你正在使用或考虑使用这个已弃用的项目，强烈建议立即迁移到mcp.apify.com。 你不仅会获得相同的网页浏览能力，还能访问Apify平台上6000多个其他Actor，而且无需担心本地环境配置和维护问题。

对于开发者来说，这个项目的价值更多在于学习MCP服务器的基本结构以及理解如何将外部API封装成MCP工具。但请记住，对于实际项目，请使用官方推荐的最新方案。

登录

注册账号