你是否曾经希望自己的AI助手能够像ChatGPT那样,实时搜索网络并获取最新信息?今天要介绍的开源项目RAG网络浏览器,正是为了实现这个目标而设计的。它是一个MCP服务器,为Apify平台的RAG网络浏览器Actor提供了接口,让你的AI能够搜索Google、抓取网页内容,并将清理后的信息作为上下文提供给大语言模型。
需要特别说明的是,这个项目目前已经弃用,官方推荐使用更强大的替代方案。不过了解它的设计思路和迁移路径,对于开发者仍然有参考价值。
项目基本信息
| 信息项 | 详情 |
|---|---|
| 项目名称 | RAG网络浏览器 |
| GitHub地址 | https://github.com/apify/mcp-server-rag-web-browser |
| 项目描述 | 为RAG网络浏览器Actor实现一个MCP服务器。该Actor充当大型语言模型(LLMs)和RAG管道的网络浏览器,类似于ChatGPT中的网络搜索功能。 |
| 作者 | apify |
| 开源协议 | Unknown |
| 开源状态 | 公开状态(已弃用) |
| Languages | TypeScript, JavaScript |
| 支持平台 | Windows / macOS / Linux |
| 最后更新 | 2026-04-23 |
一、项目介绍
RAG网络浏览器是一个MCP服务器,它连接了AI客户端与Apify平台上的RAG网络浏览器Actor。这个Actor本质上是一个网页抓取工具,能够搜索Google、抓取搜索结果页面,并将内容转换为干净的Markdown格式,供AI作为上下文使用。
这个项目的设计目标是让AI代理能够快速响应网络查询。它在本地运行,与Apify云端Actor通信,发送搜索查询并接收提取的网页内容。主要功能包括:
- 网页搜索:查询Google搜索,抓取前N个URL,返回清理后的内容
- 单URL获取:获取特定URL并返回其Markdown内容
- 本地MCP集成:通过标准输入输出与AI客户端通信
重要提示:官方已宣布此MCP服务器弃用,建议使用mcp.apify.com作为替代方案。
二、核心优势(基于原始设计)
Apify平台集成
直接利用Apify的RAG网络浏览器Actor,无需自己开发网页抓取逻辑。
灵活的抓取选项
支持两种抓取工具:
raw-http:快速抓取,适用于静态页面browser-playwright:使用真实浏览器,处理JavaScript密集型网站
多种输出格式
支持返回text、markdown、html三种格式,满足不同场景需求。
简单易用
通过npx命令即可运行,配置简单。
三、适用场景(历史参考)
开发者学习和参考
如果你想了解如何将Apify Actor封装成MCP服务器,这个项目作为参考。但请注意它已弃用,建议直接研究mcp.apify.com。
个人项目临时使用
如果你需要快速实现网络搜索功能,且不介意使用已弃用的方案,可以短期使用。
理解迁移路径
如果你正在使用这个旧版服务器,本教程将帮助你迁移到官方推荐的新方案。
四、安装教程(旧版,仅供参考)
系统要求
| 工具 | 用途 | 下载/安装方式 |
|---|---|---|
| Node.js | JavaScript运行环境 | [https://nodejs.org/] (版本要求:18.0 或以上) |
| Apify账户 | 获取API令牌 | [https://apify.com] |
| Git | 下载项目代码 | [https://git-scm.com/] |
旧版安装步骤
第一步:获取Apify API令牌
注册Apify账户,在集成页面获取你的API令牌(APIFY_TOKEN)。
第二步:配置MCP客户端
对于Claude Desktop,在配置文件中添加:
{
"mcpServers": {
"rag-web-browser": {
"command": "npx",
"args": ["@apify/mcp-server-rag-web-browser"],
"env": {
"APIFY_TOKEN": "你的Apify令牌"
}
}
}
}对于其他MCP客户端,类似配置。
第三步:使用工具
配置完成后,AI客户端会获得一个search工具,可以用于网页搜索和内容抓取。
五、使用示例(旧版)
示例1:搜索Google
用户指令:“搜索‘2025年人工智能发展趋势’,并返回前3个结果的内容。”
AI会调用search工具,参数如下:
{
"query": "2025年人工智能发展趋势",
"maxResults": 3,
"scrapingTool": "raw-http",
"outputFormats": ["markdown"]
}示例2:获取单个URL内容
用户指令:“获取这篇文章的内容:https://example.com/article”
AI会调用search工具,将完整URL作为query参数传入:
{
"query": "https://example.com/article",
"outputFormats": ["markdown"]
}示例3:处理JavaScript密集型网站
用户指令:“抓取这个React应用的页面内容:https://react-example.com/app”
AI会使用browser-playwright工具:
{
"query": "https://react-example.com/app",
"scrapingTool": "browser-playwright",
"outputFormats": ["html", "markdown"]
}六、迁移指南:从弃用版本到推荐方案
既然官方已宣布此MCP服务器弃用,以下是迁移到推荐方案的详细步骤。
方案一:使用mcp.apify.com(最推荐)
这是最简单、最强大的替代方案。
第一步:访问mcp.apify.com
打开浏览器,访问 https://mcp.apify.com
第二步:授权客户端
根据你的客户端类型(Claude Desktop、VS Code等),按照网站指引完成OAuth授权。
第三步:获取配置
授权后,网站会生成MCP服务器配置。对于Claude Desktop,配置如下:
{
"mcpServers": {
"apify": {
"command": "npx",
"args": ["@apify/actors-mcp-server"],
"env": {
"APIFY_TOKEN": "你的Apify令牌"
}
}
}
}第四步:享受更多功能
使用mcp.apify.com后,你将获得:
- 访问6000+个Apify Actor的能力(而不仅仅是RAG网络浏览器)
- 动态工具发现
- 自动更新
- 无需本地配置
方案二:直接集成RAG网络浏览器Actor
如果你不想通过mcp.apify.com,可以直接通过HTTP/SSE接口调用RAG网络浏览器Actor。
优势:
- 直接集成,无额外依赖
- 通过服务器发送事件实现实时流传输
- 完全控制集成过程
具体实现方式请参考Apify官方文档。
迁移前后对比
| 对比项 | 旧版(已弃用) | 新版(推荐) |
|---|---|---|
| 安装方式 | 本地npx运行 | 托管服务或统一MCP服务器 |
| 功能范围 | 仅网页搜索 | 6000+个Actor |
| 更新维护 | 已停止 | 持续更新 |
| 配置复杂度 | 需要本地环境 | 零配置或简单OAuth |
| 访问方式 | stdio | stdio或HTTP/SSE |
七、总结
RAG网络浏览器MCP服务器曾经是一个实用的工具,让AI能够通过Apify平台进行网页搜索和内容抓取。然而,技术永远在进步,Apify官方已经推出了更强大、更便捷的mcp.apify.com方案。
如果你正在使用或考虑使用这个已弃用的项目,强烈建议立即迁移到mcp.apify.com。 你不仅会获得相同的网页浏览能力,还能访问Apify平台上6000多个其他Actor,而且无需担心本地环境配置和维护问题。
对于开发者来说,这个项目的价值更多在于学习MCP服务器的基本结构以及理解如何将外部API封装成MCP工具。但请记住,对于实际项目,请使用官方推荐的最新方案。
Apify的这个方案比OpenAI的联网搜索还灵活,可以自定义抓取深度。
能不能只使用网页浏览功能,不用其他Actor?
可以,配置好后只调用RAG网络浏览器Actor就行,其他Actor不会自动启用。
HTTP/SSE直接集成的方式适合高级用户,可以做更精细的控制。
我试了browser-playwright模式,抓取SPA应用很完美。