你是否曾经遇到过这样的情况:让AI帮你查最新的股票价格、某个产品的实时评价,或者今天的新闻头条,结果它回答“我无法获取实时信息”或者“我的知识截止于某个日期”。这不是AI的问题,而是它没有连接到真实世界的桥梁。

现在有一个强大的解决方案可以让AI真正“活”起来。brightdata-mcp是一个MCP服务器,它由全球顶尖的网页数据平台Bright Data提供支持,为AI助手赋予了实时的网络访问能力。配置好之后,你的AI可以搜索网页、抓取内容、控制浏览器,而且永远不会被反爬机制阻挡。更棒的是,每月有5000次免费请求额度,足够日常使用。

项目基本信息

信息项详情
项目名称brightdata-mcp
GitHub地址https://github.com/luminati-io/brightdata-mcp
项目描述A powerful Model Context Protocol (MCP) server that provides an all-in-one solution for public web access.
作者brightdata
开源协议MIT License
开源状态公开状态
LanguagesJavaScript 99.5%, Dockerfile 0.5%
支持平台Windows / macOS / Linux / Web
最后更新2026-04-26

一、项目介绍

brightdata-mcp是由Bright Data官方推出的MCP服务器,它把Bright Data强大的公共网络访问能力封装成了AI可以调用的工具。Bright Data本身是全球领先的网络数据平台,以企业级的反爬虫绕过、代理网络和浏览器自动化技术著称。而这个MCP服务器,则是把这些专业能力带到了AI生态中。

这个服务器提供了丰富的工具集,并通过工具组(Groups)的方式组织,方便你根据需求启用:

核心基础工具(免费,始终启用)

  • search_engine:执行网络搜索,返回AI优化过的结果。这是免费的,适合日常的信息查询。
  • scrape_as_markdown:将任何网页转换成干净的Markdown格式。这是内容提取的主要方式。
  • search_engine_batch:批量执行多个搜索查询。
  • scrape_batch:批量抓取多个URL。
  • discover:基于AI意图评分的智能搜索,对结果进行相关性排序。适合深度研究和RAG管道。

按需启用工具组

工具组描述包含的典型工具
ecommerce电商平台数据web_data_amazon_product, web_data_walmart_product, web_data_google_shopping
social社交媒体数据web_data_linkedin_posts, web_data_tiktok_posts, web_data_youtube_videos
browser浏览器自动化scraping_browser_snapshot, scraping_browser_click_ref, scraping_browser_screenshot
finance金融数据web_data_yahoo_finance_business
business公司和商业数据web_data_crunchbase_company, web_data_zoominfo_company_profile, web_data_zillow_properties_listing
research新闻和开发者数据web_data_github_repository_file, web_data_reuter_news
app_stores应用商店数据web_data_google_play_store, web_data_apple_app_store
travel旅行信息web_data_booking_hotel_listings
geoGEO与AI品牌可见性web_data_chatgpt_ai_insights, web_data_grok_ai_insights, web_data_perplexity_ai_insights
code代码包智能web_data_npm_package, web_data_pypi_package
advanced_scraping高级批量和AI辅助提取search_engine_batch, scrape_batch, extract

特殊的Code工具组

这是为编程助手专门设计的。通过启用GROUPS="code",你的AI可以直接查询npm和PyPI上的最新包信息,包括版本号、README、依赖关系等。这对于需要做出依赖决策的编码代理来说,非常实用。

GEO工具组

这是一个很有前瞻性的功能。它可以查询ChatGPT、Grok、Perplexity等大语言模型是如何谈论你的品牌或产品的。这对于做生成式引擎优化(Generative Engine Optimization)来说,是一个直接的反馈工具。

这个服务器有两种使用模式:Rapid Mode(免费,包含基础工具)和Pro Mode(付费,解锁所有60+工具)。你可以通过设置环境变量PRO_MODE=true来启用Pro模式。

二、核心优势

企业级的网络访问可靠性

这是Bright Data的核心竞争力。它的代理网络和反爬虫技术非常成熟,能够处理复杂的网站封锁、CAPTCHA和地理限制。普通的爬虫工具可能访问几次就被封了,而Bright Data的基础设施可以稳定地大规模采集数据。

免费额度慷慨

每月5000次请求的免费额度,对于个人开发者和日常使用来说,非常充裕。很多商业API的免费额度只有1000次甚至更少。这使得你可以真正地在生产环境中测试和使用,而不必担心很快超额。

多样化的工具组

这个服务器不是只有一个“抓取”工具,而是提供了针对不同垂直场景的专用工具。电商、社交、金融、商业、旅行……每个工具组都有特定的数据结构化输出。这比通用的抓取工具效率更高,因为解析规则已经内置了。

即时可用的远程端点

Bright Data提供了托管的MCP服务器。你不需要在本地安装任何东西,只需要在MCP客户端中配置一个URL,填入API令牌,就可以开始使用。这对于不想折腾配置的用户来说,非常友好。

编码助手的一站式包查询

code工具组直接解决了编程助手的一个痛点:需要知道某个包的最新版本、README或依赖。以前AI可能会猜测或者给你过时的信息,现在它可以实时从npm和PyPI获取准确的数据。

灵活的工具选择机制

通过GROUPSTOOLS环境变量,你可以精确地控制哪些工具被启用。这可以避免工具列表过长,也可以控制成本,因为Pro模式的工具是按使用量计费的。

三、适用场景

实时信息查询的研究助手

记者、分析师或者任何需要最新信息的人,可以让AI实时搜索新闻、股票价格、天气等。例如,“特斯拉当前的股价是多少?”,AI会通过search_engine获取实时数据并回答。

电商价格监控

电商运营人员可以用ecommerce工具组定期抓取亚马逊、沃尔玛等平台上的产品价格和库存状态。配合批量抓取工具,可以监控数百个商品。

社交媒体舆情监测

品牌方可以用social工具组监测Twitter、TikTok、YouTube上关于自己品牌的讨论。由于Bright Data能绕过反爬,你可以稳定地获取数据,而不必担心被限制。

浏览器自动化任务

通过browser工具组,AI可以控制真实的浏览器:点击按钮、填写表单、截图、滚动页面等。这可以用于自动化测试、数据录入、内容发布等需要交互的场景。

AI品牌可见性监测(GEO)

营销人员可以用geo工具组,直接查询ChatGPT、Grok和Perplexity是如何回答与品牌相关的问题的。例如,“当用户问‘最好的项目管理工具’时,ChatGPT会提到我们的产品吗?”这对优化AI搜索排名很有价值。

代码依赖的实时查询

编程助手可以用code工具组来查询npm或PyPI包的最新信息。例如,“express框架的最新版本是什么?”,AI会返回准确的版本号和发布日期。

批量数据采集

对于需要大规模采集数据的场景,可以使用advanced_scraping工具组中的批量搜索和批量抓取功能。可以提交多个任务并行处理,提高效率。

四、安装教程

brightdata-mcp提供了两种使用方式:使用托管远程端点(零安装)和本地部署。对于大多数用户来说,远程端点是最简单的。

前置准备

你需要一个Bright Data API令牌。访问Bright Data官网注册账号,在控制台中生成API令牌。免费计划每月包含5000次请求。

方式一:使用托管远程端点(推荐,零安装)

这是最简单的方式,不需要在本地安装任何东西。

对于Claude Desktop用户:

  1. 打开Claude Desktop。
  2. 进入 Settings → Connectors → Add custom connector。
  3. 名称填写:Bright Data Web(或者你喜欢的名字)。
  4. URL填写:https://mcp.brightdata.com/mcp?token=你的API令牌
  5. 点击“Add”保存。

对于Cursor用户:

在项目的根目录下创建或编辑.cursor/mcp.json文件:

{
  "mcpServers": {
    "Bright Data": {
      "url": "https://mcp.brightdata.com/mcp?token=你的API令牌"
    }
  }
}

对于其他支持MCP的客户端,配置方式类似,都是指向这个URL,并通过Bearer Token或URL参数传递API密钥。

方式二:本地运行npx

如果你更倾向于本地运行,可以在Claude Desktop的配置文件中添加:

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "你的API令牌"
      }
    }
  }
}

方式三:启用Pro模式或特定工具组

如果你想使用Pro模式(60+工具),或者只想启用特定的工具组,可以在配置中添加环境变量。

例如,只为编程助手启用Code工具组:

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "你的API令牌",
        "GROUPS": "code"
      }
    }
  }
}

同时启用浏览器自动化和高级抓取工具组:

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "你的API令牌",
        "GROUPS": "browser,advanced_scraping"
      }
    }
  }
}

启用所有Pro工具:

{
  "mcpServers": {
    "Bright Data": {
      "command": "npx",
      "args": ["@brightdata/mcp"],
      "env": {
        "API_TOKEN": "你的API令牌",
        "PRO_MODE": "true"
      }
    }
  }
}

验证安装

配置完成后,重启你的AI客户端。然后问一个需要实时信息的问题,比如:

“What's the current price of Bitcoin?”

如果配置成功,AI应该会通过搜索工具返回实时的结果。

五、使用示例

配置完成后,你可以用自然语言让AI执行各种网络操作。以下是一些典型的用法。

示例一:基础搜索

“Search the web for 'latest iPhone 16 rumors' and summarize the top 3 results.”

AI会调用search_engine工具,返回搜索结果,然后基于这些结果进行总结。由于结果已经是AI优化过的格式,这个过程会很顺畅。

示例二:抓取网页为Markdown

“Scrape the article at https://example.com/news/article-123 and give me the content as markdown.”

AI调用scrape_as_markdown工具,返回干净的文本。你可以接着要求“Summarize the main points of this article”。

示例三:电商数据采集(需要Pro模式)

如果你启用了ecommerce工具组,可以这样问:

“Get the product information for ASIN B0C1234XYZ from Amazon, including price, rating, and availability.”

AI会调用web_data_amazon_product工具,返回结构化的JSON数据。

示例四:浏览器自动化(需要Pro模式)

如果你启用了browser工具组,AI可以控制浏览器:

“Use the browser tools to go to https://example.com/login, fill in username 'testuser' and password 'secret', then click the login button and take a screenshot of the dashboard.”

AI会依次调用scraping_browser_snapshotscraping_browser_typescraping_browser_click_refscraping_browser_screenshot,完成整个流程。

示例五:查询npm包信息(Code工具组)

对于编程助手,可以这样问:

“What is the latest version of the React package on npm? Also, get its README summary.”

AI会调用web_data_npm_package工具,返回版本号、依赖关系、README等。

示例六:GEO查询(GEO工具组)

营销人员可以这样问:

“Query ChatGPT about the best project management tools for remote teams. Tell me if our brand 'BrightData' is mentioned in the response.”

AI会调用web_data_chatgpt_ai_insights,向ChatGPT提出预设的问题,并返回带引用的答案。

示例七:批量抓取

“Search for 'machine learning trends 2026' on Google, then scrape the top 5 result pages as markdown, and combine them into a single document.”

AI会先用search_engine获取URL列表,然后用scrape_batch工具一次性抓取多个页面。注意:批量抓取可能需要等待更长时间。

六、常见问题

免费额度如何计算?

免费套餐每月5000次请求。每次调用一个工具(如search_enginescrape_as_markdown)通常消耗一次请求。批量操作可能会消耗多次。你可以在Bright Data控制台中查看实时用量。如果月度请求超过5000次,后续请求会失败,除非你升级到Pro模式。

如何获取API令牌?

访问Bright Data官网,注册账号。登录后,进入控制台(Dashboard),找到API令牌(API Token)部分,生成一个新令牌。注意保管好令牌,不要泄露给他人。

Pro模式的计费方式

Pro模式是付费的,按使用量计费。具体的定价取决于你使用的工具和请求量。建议在启用Pro模式之前,先查看Bright Data官网的定价页面。你可以通过设置PRO_MODE=true来启用,但请注意这会计费。

“spawn npx ENOENT”错误

如果你在本地运行npx方式遇到这个错误,说明系统找不到npx命令。解决方法:

  • 确保Node.js已安装,并且npx在PATH中。
  • 在配置中使用完整路径,比如"command": "/usr/local/bin/node"(macOS/Linux)或"command": "C:\\Program Files\\nodejs\\node.exe"(Windows)。

某些网站的抓取结果不完整

Bright Data的反爬虫技术已经很先进,但极个别网站可能有特别严格的封锁。你可以尝试:

  • 使用Pro模式中的浏览器工具组,通过真实的浏览器渲染来获取内容。
  • 增加超时时间,有些网站响应慢。
  • 检查你的API令牌是否在对应的Web Unlocker zone中有权限。

地理限制的内容无法访问

Bright Data的代理网络覆盖全球。默认情况下,它会自动选择最优的出口节点。如果你需要特定国家/地区的视角,可以在Pro模式中设置自定义的Web Unlocker zone,并指定地理位置。

工具组启用后找不到对应的工具

当你通过GROUPSTOOLS启用特定工具后,可能需要重启MCP客户端才能生效。另外,检查配置的语法是否正确,环境变量名是GROUPS(复数),值用逗号分隔,不要有空格。

七、总结

brightdata-mcp是一个专业级、功能全面的网络访问MCP服务器。它背后是Bright Data多年的技术积累,这体现在它的可靠性和丰富度上。2.3k的Stars和频繁的更新也证明了它的活跃度。

最让我印象深刻的是它的免费套餐。每月5000次请求,对于个人开发者和小型项目来说,是很慷慨的额度。而且它提供了托管的远程端点,真正做到了“零安装,即时使用”。这让它比其他需要本地部署的MCP服务器更容易上手。

工具组的设计也很合理。通过GROUPSTOOLS环境变量,你可以精确控制启用哪些工具,既可以避免工具列表过长,也可以控制成本。特别是code工具组和geo工具组,瞄准了当下很热门的需求(编码助手和AI品牌优化),体现了对开发者需求的敏锐把握。

当然,Pro模式的定价需要你自己去评估。但对于大多数日常需求,免费套餐已经很够用了。而且即使要升级,Bright Data作为企业级服务商,定价也是透明的。

如果你正在开发AI应用,或者你只是想让自己的AI助手能够真正联网,brightdata-mcp是一个很值得尝试的选择。它的可靠性、免费额度和易用性,都让它成为MCP生态中网络访问类的佼佼者。

标签: 内容抓取

已有 33 条评论

    1. StephenPerez StephenPerez

      I'm using the browser tools to test my company's website. It clicks through all menus.

    2. MelissaRoberts MelissaRoberts

      The social tool group for TikTok posts is unique. I haven't seen that in other MCPs.

    3. AndrewCollins AndrewCollins

      The combination of free tier, remote endpoint, and powerful features is unbeatable.