brightdata-mcp

你是否曾经遇到过这样的情况：让AI帮你查最新的股票价格、某个产品的实时评价，或者今天的新闻头条，结果它回答“我无法获取实时信息”或者“我的知识截止于某个日期”。这不是AI的问题，而是它没有连接到真实世界的桥梁。

现在有一个强大的解决方案可以让AI真正“活”起来。brightdata-mcp是一个MCP服务器，它由全球顶尖的网页数据平台Bright Data提供支持，为AI助手赋予了实时的网络访问能力。配置好之后，你的AI可以搜索网页、抓取内容、控制浏览器，而且永远不会被反爬机制阻挡。更棒的是，每月有5000次免费请求额度，足够日常使用。

项目基本信息

信息项	详情
项目名称	brightdata-mcp
GitHub地址	https://github.com/luminati-io/brightdata-mcp
项目描述	A powerful Model Context Protocol (MCP) server that provides an all-in-one solution for public web access.
作者	brightdata
开源协议	MIT License
开源状态	公开状态
Languages	JavaScript 99.5%, Dockerfile 0.5%
支持平台	Windows / macOS / Linux / Web
最后更新	2026-04-26

一、项目介绍

brightdata-mcp是由Bright Data官方推出的MCP服务器，它把Bright Data强大的公共网络访问能力封装成了AI可以调用的工具。Bright Data本身是全球领先的网络数据平台，以企业级的反爬虫绕过、代理网络和浏览器自动化技术著称。而这个MCP服务器，则是把这些专业能力带到了AI生态中。

这个服务器提供了丰富的工具集，并通过工具组（Groups）的方式组织，方便你根据需求启用：

核心基础工具（免费，始终启用）

search_engine：执行网络搜索，返回AI优化过的结果。这是免费的，适合日常的信息查询。
scrape_as_markdown：将任何网页转换成干净的Markdown格式。这是内容提取的主要方式。
search_engine_batch：批量执行多个搜索查询。
scrape_batch：批量抓取多个URL。
discover：基于AI意图评分的智能搜索，对结果进行相关性排序。适合深度研究和RAG管道。

按需启用工具组

工具组	描述	包含的典型工具
`ecommerce`	电商平台数据	`web_data_amazon_product`, `web_data_walmart_product`, `web_data_google_shopping`
`social`	社交媒体数据	`web_data_linkedin_posts`, `web_data_tiktok_posts`, `web_data_youtube_videos`
`browser`	浏览器自动化	`scraping_browser_snapshot`, `scraping_browser_click_ref`, `scraping_browser_screenshot`
`finance`	金融数据	`web_data_yahoo_finance_business`
`business`	公司和商业数据	`web_data_crunchbase_company`, `web_data_zoominfo_company_profile`, `web_data_zillow_properties_listing`
`research`	新闻和开发者数据	`web_data_github_repository_file`, `web_data_reuter_news`
`app_stores`	应用商店数据	`web_data_google_play_store`, `web_data_apple_app_store`
`travel`	旅行信息	`web_data_booking_hotel_listings`
`geo`	GEO与AI品牌可见性	`web_data_chatgpt_ai_insights`, `web_data_grok_ai_insights`, `web_data_perplexity_ai_insights`
`code`	代码包智能	`web_data_npm_package`, `web_data_pypi_package`
`advanced_scraping`	高级批量和AI辅助提取	`search_engine_batch`, `scrape_batch`, `extract`

特殊的Code工具组

这是为编程助手专门设计的。通过启用GROUPS="code"，你的AI可以直接查询npm和PyPI上的最新包信息，包括版本号、README、依赖关系等。这对于需要做出依赖决策的编码代理来说，非常实用。

GEO工具组

这是一个很有前瞻性的功能。它可以查询ChatGPT、Grok、Perplexity等大语言模型是如何谈论你的品牌或产品的。这对于做生成式引擎优化（Generative Engine Optimization）来说，是一个直接的反馈工具。

这个服务器有两种使用模式：Rapid Mode（免费，包含基础工具）和Pro Mode（付费，解锁所有60+工具）。你可以通过设置环境变量PRO_MODE=true来启用Pro模式。

二、核心优势

企业级的网络访问可靠性

这是Bright Data的核心竞争力。它的代理网络和反爬虫技术非常成熟，能够处理复杂的网站封锁、CAPTCHA和地理限制。普通的爬虫工具可能访问几次就被封了，而Bright Data的基础设施可以稳定地大规模采集数据。

免费额度慷慨

每月5000次请求的免费额度，对于个人开发者和日常使用来说，非常充裕。很多商业API的免费额度只有1000次甚至更少。这使得你可以真正地在生产环境中测试和使用，而不必担心很快超额。

多样化的工具组

这个服务器不是只有一个“抓取”工具，而是提供了针对不同垂直场景的专用工具。电商、社交、金融、商业、旅行……每个工具组都有特定的数据结构化输出。这比通用的抓取工具效率更高，因为解析规则已经内置了。

即时可用的远程端点

Bright Data提供了托管的MCP服务器。你不需要在本地安装任何东西，只需要在MCP客户端中配置一个URL，填入API令牌，就可以开始使用。这对于不想折腾配置的用户来说，非常友好。

编码助手的一站式包查询

code工具组直接解决了编程助手的一个痛点：需要知道某个包的最新版本、README或依赖。以前AI可能会猜测或者给你过时的信息，现在它可以实时从npm和PyPI获取准确的数据。

灵活的工具选择机制

通过GROUPS和TOOLS环境变量，你可以精确地控制哪些工具被启用。这可以避免工具列表过长，也可以控制成本，因为Pro模式的工具是按使用量计费的。

三、适用场景

实时信息查询的研究助手

记者、分析师或者任何需要最新信息的人，可以让AI实时搜索新闻、股票价格、天气等。例如，“特斯拉当前的股价是多少？”，AI会通过search_engine获取实时数据并回答。

电商价格监控

电商运营人员可以用ecommerce工具组定期抓取亚马逊、沃尔玛等平台上的产品价格和库存状态。配合批量抓取工具，可以监控数百个商品。

社交媒体舆情监测

品牌方可以用social工具组监测Twitter、TikTok、YouTube上关于自己品牌的讨论。由于Bright Data能绕过反爬，你可以稳定地获取数据，而不必担心被限制。

浏览器自动化任务

通过browser工具组，AI可以控制真实的浏览器：点击按钮、填写表单、截图、滚动页面等。这可以用于自动化测试、数据录入、内容发布等需要交互的场景。

AI品牌可见性监测（GEO）

营销人员可以用geo工具组，直接查询ChatGPT、Grok和Perplexity是如何回答与品牌相关的问题的。例如，“当用户问‘最好的项目管理工具’时，ChatGPT会提到我们的产品吗？”这对优化AI搜索排名很有价值。

代码依赖的实时查询

编程助手可以用code工具组来查询npm或PyPI包的最新信息。例如，“express框架的最新版本是什么？”，AI会返回准确的版本号和发布日期。

批量数据采集

对于需要大规模采集数据的场景，可以使用advanced_scraping工具组中的批量搜索和批量抓取功能。可以提交多个任务并行处理，提高效率。

四、安装教程

brightdata-mcp提供了两种使用方式：使用托管远程端点（零安装）和本地部署。对于大多数用户来说，远程端点是最简单的。

前置准备

你需要一个Bright Data API令牌。访问Bright Data官网注册账号，在控制台中生成API令牌。免费计划每月包含5000次请求。

方式一：使用托管远程端点（推荐，零安装）

这是最简单的方式，不需要在本地安装任何东西。

对于Claude Desktop用户：

打开Claude Desktop。
进入 Settings → Connectors → Add custom connector。
名称填写：Bright Data Web（或者你喜欢的名字）。
URL填写：https://mcp.brightdata.com/mcp?token=你的API令牌。
点击“Add”保存。

对于Cursor用户：

在项目的根目录下创建或编辑.cursor/mcp.json文件：

{
  "mcpServers": {
    "Bright Data": {
      "url": "https://mcp.brightdata.com/mcp?token=你的API令牌"
    }
  }
}

对于其他支持MCP的客户端，配置方式类似，都是指向这个URL，并通过Bearer Token或URL参数传递API密钥。

方式二：本地运行npx

如果你更倾向于本地运行，可以在Claude Desktop的配置文件中添加：

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "你的API令牌"
      }
    }
  }
}

方式三：启用Pro模式或特定工具组

如果你想使用Pro模式（60+工具），或者只想启用特定的工具组，可以在配置中添加环境变量。

例如，只为编程助手启用Code工具组：

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "你的API令牌",
        "GROUPS": "code"
      }
    }
  }
}

同时启用浏览器自动化和高级抓取工具组：

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "你的API令牌",
        "GROUPS": "browser,advanced_scraping"
      }
    }
  }
}

启用所有Pro工具：

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "你的API令牌",
        "PRO_MODE": "true"
      }
    }
  }
}

验证安装

配置完成后，重启你的AI客户端。然后问一个需要实时信息的问题，比如：

“What's the current price of Bitcoin?”

如果配置成功，AI应该会通过搜索工具返回实时的结果。

五、使用示例

配置完成后，你可以用自然语言让AI执行各种网络操作。以下是一些典型的用法。

示例一：基础搜索

“Search the web for 'latest iPhone 16 rumors' and summarize the top 3 results.”

AI会调用search_engine工具，返回搜索结果，然后基于这些结果进行总结。由于结果已经是AI优化过的格式，这个过程会很顺畅。

示例二：抓取网页为Markdown

“Scrape the article at https://example.com/news/article-123 and give me the content as markdown.”

AI调用scrape_as_markdown工具，返回干净的文本。你可以接着要求“Summarize the main points of this article”。

示例三：电商数据采集（需要Pro模式）

如果你启用了ecommerce工具组，可以这样问：

“Get the product information for ASIN B0C1234XYZ from Amazon, including price, rating, and availability.”

AI会调用web_data_amazon_product工具，返回结构化的JSON数据。

示例四：浏览器自动化（需要Pro模式）

如果你启用了browser工具组，AI可以控制浏览器：

“Use the browser tools to go to https://example.com/login, fill in username 'testuser' and password 'secret', then click the login button and take a screenshot of the dashboard.”

AI会依次调用scraping_browser_snapshot、scraping_browser_type、scraping_browser_click_ref和scraping_browser_screenshot，完成整个流程。

示例五：查询npm包信息（Code工具组）

对于编程助手，可以这样问：

“What is the latest version of the React package on npm? Also, get its README summary.”

AI会调用web_data_npm_package工具，返回版本号、依赖关系、README等。

示例六：GEO查询（GEO工具组）

营销人员可以这样问：

“Query ChatGPT about the best project management tools for remote teams. Tell me if our brand 'BrightData' is mentioned in the response.”

AI会调用web_data_chatgpt_ai_insights，向ChatGPT提出预设的问题，并返回带引用的答案。

示例七：批量抓取

“Search for 'machine learning trends 2026' on Google, then scrape the top 5 result pages as markdown, and combine them into a single document.”

AI会先用search_engine获取URL列表，然后用scrape_batch工具一次性抓取多个页面。注意：批量抓取可能需要等待更长时间。

六、常见问题

免费额度如何计算？

免费套餐每月5000次请求。每次调用一个工具（如search_engine、scrape_as_markdown）通常消耗一次请求。批量操作可能会消耗多次。你可以在Bright Data控制台中查看实时用量。如果月度请求超过5000次，后续请求会失败，除非你升级到Pro模式。

如何获取API令牌？

访问Bright Data官网，注册账号。登录后，进入控制台（Dashboard），找到API令牌（API Token）部分，生成一个新令牌。注意保管好令牌，不要泄露给他人。

Pro模式的计费方式

Pro模式是付费的，按使用量计费。具体的定价取决于你使用的工具和请求量。建议在启用Pro模式之前，先查看Bright Data官网的定价页面。你可以通过设置PRO_MODE=true来启用，但请注意这会计费。

“spawn npx ENOENT”错误

如果你在本地运行npx方式遇到这个错误，说明系统找不到npx命令。解决方法：

确保Node.js已安装，并且npx在PATH中。
在配置中使用完整路径，比如"command": "/usr/local/bin/node"（macOS/Linux）或"command": "C:\\Program Files\\nodejs\\node.exe"（Windows）。

某些网站的抓取结果不完整

Bright Data的反爬虫技术已经很先进，但极个别网站可能有特别严格的封锁。你可以尝试：

使用Pro模式中的浏览器工具组，通过真实的浏览器渲染来获取内容。
增加超时时间，有些网站响应慢。
检查你的API令牌是否在对应的Web Unlocker zone中有权限。

地理限制的内容无法访问

Bright Data的代理网络覆盖全球。默认情况下，它会自动选择最优的出口节点。如果你需要特定国家/地区的视角，可以在Pro模式中设置自定义的Web Unlocker zone，并指定地理位置。

工具组启用后找不到对应的工具

当你通过GROUPS或TOOLS启用特定工具后，可能需要重启MCP客户端才能生效。另外，检查配置的语法是否正确，环境变量名是GROUPS（复数），值用逗号分隔，不要有空格。

七、总结

brightdata-mcp是一个专业级、功能全面的网络访问MCP服务器。它背后是Bright Data多年的技术积累，这体现在它的可靠性和丰富度上。2.3k的Stars和频繁的更新也证明了它的活跃度。

最让我印象深刻的是它的免费套餐。每月5000次请求，对于个人开发者和小型项目来说，是很慷慨的额度。而且它提供了托管的远程端点，真正做到了“零安装，即时使用”。这让它比其他需要本地部署的MCP服务器更容易上手。

工具组的设计也很合理。通过GROUPS和TOOLS环境变量，你可以精确控制启用哪些工具，既可以避免工具列表过长，也可以控制成本。特别是code工具组和geo工具组，瞄准了当下很热门的需求（编码助手和AI品牌优化），体现了对开发者需求的敏锐把握。

当然，Pro模式的定价需要你自己去评估。但对于大多数日常需求，免费套餐已经很够用了。而且即使要升级，Bright Data作为企业级服务商，定价也是透明的。

如果你正在开发AI应用，或者你只是想让自己的AI助手能够真正联网，brightdata-mcp是一个很值得尝试的选择。它的可靠性、免费额度和易用性，都让它成为MCP生态中网络访问类的佼佼者。

已有 33 条评论

KennethAllen

The polling timeout of 600 seconds is generous. Complex crawls have time to finish.
DonnaYoung

I compared the scrape_as_markdown with other markdown converters. Bright Data's is cleaner.
StevenKing

The GROUPS system is well thought out. I only enable what I need for each client.
MichelleWright

The Microsoft (Microsoft) should acquire this technology. It's that good.
BrianScott

The batching with search_engine_batch is efficient. I can submit 5 queries at once.