ArXiv MCP 服务器

想象一下，你正在撰写一篇关于大语言模型的论文，需要系统性回顾过去一年arXiv上相关的前沿研究。你可能需要打开浏览器，在arXiv网站上反复搜索、筛选、下载PDF，然后手动整理笔记。这个过程耗时且繁琐。如果能让你的AI助手直接帮你搜索、下载，甚至阅读和分析论文全文，那该有多好？这正是arxiv-mcp-server为你带来的革命性体验。

arxiv-mcp-server是一个模型上下文协议服务器，它为AI助手提供了完整的arXiv论文搜索、获取和分析能力。通过这个服务器，你的AI可以像一位专业的学术研究员一样，检索论文摘要、下载全文，并从海量文献中提取关键信息。

项目基本信息

信息项	详情
项目名称	arxiv-mcp-server
GitHub地址	https://github.com/blazickjp/arxiv-mcp-server
项目描述	A Model Context Protocol server for searching and analyzing arXiv papers
作者	blazickjp
开源协议	Apache License 2.0
开源状态	公开状态
Languages	Python
支持平台	Windows / macOS / Linux / Web
最后更新	2026-04-26

一、项目介绍

arxiv-mcp-server是一个功能极其丰富的MCP服务器。它提供了一套完整的工具集，覆盖了从论文发现到深度分析的整个研究生命周期。

它的核心工具包括：search_papers可以按关键词、分类、日期范围搜索arXiv上的论文；download_paper能将论文以HTML或PDF格式下载到本地；read_paper可以读取已下载论文的全文（Markdown格式）；list_papers则能管理你的本地论文库。

除了这些基础功能，它还提供了一系列高级分析工具。semantic_search能对你的本地论文库进行语义相似度搜索；citation_graph可以获取论文的引用和被引用关系；watch_topic和check_alerts能帮你监控特定主题的新论文发布。此外，它还内置了多个研究提示，如论文深度分析、文献综述生成等，引导AI按学术规范进行系统性的分析。

这个服务器特别注重安全。它的文档中明确警告了提示词注入的风险——恶意论文内容可能试图操控AI行为。它建议用户使用只读配置并在执行AI建议前进行人工判断，显示了项目作者对实际使用场景中安全问题的深刻理解。

二、核心优势

完整的研究工作流支持：从搜索到下载，从阅读到分析，arxiv-mcp-server提供了一个闭环的学术研究环境。你可以先用search_papers发现相关论文，然后用download_paper保存，再用read_paper获取全文，最后利用内置的研究提示进行深度分析。整个过程不需要离开对话界面。

语义搜索与引用网络分析：它的semantic_search工具能基于论文内容而非仅仅标题或摘要进行相似性搜索，帮助你发现传统关键词检索可能遗漏的相关工作。citation_graph则能让你快速了解一篇论文的学术脉络：它引用了谁，又被谁引用。这对于文献综述和追溯研究源头非常有价值。

主动的研究监控功能：watch_topic和check_alerts让你能像设置新闻提醒一样监控学术领域。你可以让AI每天检查是否有关于“多智能体强化学习”的新论文发布，并在有新论文时主动通知你。这让你能始终站在研究前沿。

重视安全，透明清晰：项目文档中有一整节关于提示词注入风险的说明。它诚实地指出，恶意论文内容可能试图操纵AI。它提供了具体的缓解措施，包括使用只读配置和人工审核AI建议。这种对安全问题的公开讨论在处理外部内容的AI工具中是非常可贵的。

三、适用场景

场景一：学术文献综述。这是最核心的应用场景。你可以让AI：“搜索过去一年arXiv上关于‘图神经网络’的论文，重点关注cs.LG和stat.ML分类，下载前10篇，然后帮我写一份文献综述，总结主要的研究趋势和未解决的问题。” AI会调用搜索、下载、阅读工具，最后利用内置的文献综述提示生成一份结构化的报告。

场景二：追踪前沿动态。利用watch_topic和check_alerts，你可以让AI每周自动检查：“过去一周，‘大语言模型推理优化’这个方向有哪些新论文？帮我总结它们的核心贡献。” 这相当于拥有了一个自动化的个人研究助理。

场景三：论文深度分析。当你获得一篇关键论文时，可以请求：“请对arXiv ID为2401.12345的论文进行深度分析，包括它的方法论创新点、实验设置的优缺点以及对未来研究的启示。” AI会调用deep-paper-analysis提示，按照学术规范进行系统性剖析。

场景四：寻找相关研究。如果你有一篇重要的种子论文，可以问：“请找出与arXiv ID 2404.19756这篇论文最相似的5篇论文，并告诉我它们的主要研究方向。” AI会使用semantic_search工具（需要论文已下载）或在arXiv上搜索相关内容。

场景五：理解研究脉络。对于不熟悉的领域，你可以问：“请帮我分析这篇论文的引用网络，它的核心思想源自哪些经典工作，又启发了哪些后续研究？” AI会使用citation_graph工具，为你绘制出一幅学术传承的图谱。

四、安装教程

arxiv-mcp-server提供了多种安装方式。最为推荐的是通过uv tool install，以确保可执行文件全局可用。

第一步：安装uv（如果尚未安装）

uv是一个快速的Python包管理器。安装命令如下：

macOS 或 Linux:

curl -LsSf https://astral.sh/uv/install.sh | sh

Windows:

powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"

第二步：安装arxiv-mcp-server

使用uv tool install命令进行全局安装。这个命令会将arxiv-mcp-server可执行文件添加到你的PATH中。

基础安装（支持HTML格式论文）：

uv tool install arxiv-mcp-server

如果你需要处理那些只有PDF格式的较老论文，请安装PDF支持扩展：

uv tool install 'arxiv-mcp-server[pdf]'

第三步：配置你的MCP客户端

以Claude Desktop为例。找到其配置文件：

macOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Windows: %APPDATA%\Claude\claude_desktop_config.json

使用文本编辑器打开该文件，添加以下配置。你可以通过--storage-path参数指定论文的存储位置（默认为~/.arxiv-mcp-server/papers）。

{
  "mcpServers": {
    "arxiv": {
      "command": "uv",
      "args": ["tool", "run", "arxiv-mcp-server", "--storage-path", "/你/想/存储/论文/的/路径"]
    }
  }
}

如果你已经通过uv tool install安装了服务器，也可以直接使用arxiv-mcp-server命令：

{
  "mcpServers": {
    "arxiv": {
      "command": "arxiv-mcp-server",
      "args": ["--storage-path", "/你/想/存储/论文/的/路径"]
    }
  }
}

对于Windows用户，如果直接命令不生效，可以尝试用cmd包装：

{
  "mcpServers": {
    "arxiv": {
      "command": "cmd",
      "args": ["/c", "uv", "tool", "run", "arxiv-mcp-server", "--storage-path", "C:\\你\\想\\存储\\论文\\的\\路径"]
    }
  }
}

第四步：重启并验证

保存配置文件，完全退出Claude Desktop并重新启动。在新的对话中，尝试提问：“请帮我搜索arXiv上关于‘Model Context Protocol’的论文，只返回5篇。”

如果配置成功，AI会调用search_papers工具，并返回一个包含标题、作者、摘要和链接的论文列表。

五、使用示例

配置完成后，你就可以像指挥一位学术助理一样，让AI帮你进行各类学术文献操作了。

示例一：基础搜索

你问：“搜索arXiv上2025年以后关于‘Transformer模型优化’的论文，分类选cs.LG和cs.CL，按日期排序，返回10篇。”

AI会调用search_papers，设置query、date_from、categories和sort_by参数。

示例二：下载并阅读论文

你问：“请下载论文ID为2401.12345的论文，然后读取它的全文，用中文总结一下摘要部分。”

AI会先调用download_paper，再调用read_paper，然后基于全文进行总结。

示例三：深度论文分析

你问：“请对arXiv ID为2404.19756的论文进行深度分析。”

AI会调用内置的deep-paper-analysis提示。这个提示会指导AI：先检查是否已下载，如果没有则下载，然后阅读全文，并按照执行摘要、方法论、实验结果、贡献和局限性的结构进行分析。

示例四：语义搜索（需先下载论文）

你问：“在我的本地论文库里，有哪些论文和‘test-time adaptation’这个概念最相关？”

AI会调用semantic_search，设置query: "test-time adaptation"，然后返回相似度最高的几篇论文。

示例五：设置研究监控

你问：“请帮我监控主题‘量子机器学习’的新论文，每周检查一次，有新论文时告诉我。”

AI会调用watch_topic设置监控，之后你可以通过check_alerts获取更新。

六、常见问题

问题一：安装后运行提示“command not found: arxiv-mcp-server”。

解决方案：这通常是因为使用uv pip install而非uv tool install安装了包。uv pip install会将包安装到当前虚拟环境，但不创建全局可执行文件。请先运行uv tool uninstall arxiv-mcp-server（如果已安装），然后改用uv tool install arxiv-mcp-server重新安装。

问题二：下载某些论文时失败，尤其是较老的论文。

解决方案：较老的论文可能只提供PDF格式，而没有HTML版本。基础安装的服务器只能处理HTML。请安装PDF扩展：uv tool install 'arxiv-mcp-server[pdf]'。安装后需要重启MCP客户端。对于极少数PDF都无法获取的论文，可能是arXiv本身未提供。

问题三：搜索时返回速率限制错误。

解决方案：arXiv API有严格的速率限制，要求每次请求间隔至少3秒。服务器内部已经实现了自动等待，但如果你的客户端在短时间内发起了大量搜索请求，仍可能触发限制。如果遇到速率限制错误，请等待60秒后重试。

问题四：解析semantic_search或citation_graph功能时提示缺少依赖。

解决方案：这两个功能属于“pro”特性，需要额外安装依赖。进入项目克隆目录（或工作区），运行uv pip install -e ".[pro]"（如果你是从源码运行）。如果使用的是全局工具安装，目前尚不支持pro特性，建议从源码克隆并按照开发模式配置。

问题五：AI读取论文后，做出了奇怪的建议（如建议运行外部命令）。

解决方案：这可能是论文内容中的提示词注入攻击。项目文档中已经警告过此风险。你应该不要盲目执行AI的建议。在对AI的建议采取行动前（特别是涉及运行命令、访问网络或修改文件时），请先人工判断。如果怀疑是恶意注入，可以忽略该建议并报告。

七、总结

arxiv-mcp-server是我见过的最完善的学术型MCP服务器之一。它不仅提供了基础的搜索和下载功能，更通过语义搜索、引用网络、研究监控和引导式分析提示，构建了一套完整的AI辅助研究体系。

项目最令人印象深刻的是其对安全性的深刻认识。它主动、清晰地讨论了提示词注入的风险，并给出了具体可行的缓解措施。在处理外部、不可信内容的AI工具中，这种透明度是专业性的体现。

对于学生、研究人员、工程师或任何需要跟进学术前沿的人，arxiv-mcp-server是一个能极大提升工作效率的工具。它将文献检索、管理、阅读和分析这些耗时的工作流，浓缩成了与AI的几句对话。尤其是watch_topic和check_alerts功能，让你能被动地接收领域动态，而非主动地反复查询。

如果你从事任何形式的研究工作，或者需要系统性地了解某个技术领域，我强烈建议你立即安装arxiv-mcp-server。它不会替你思考，但它会帮你节省下大量用于信息收集和整理的时间，让你能专注于真正的创造性和判断性工作。

已有 32 条评论

ElijahRobinson

Excellent project! One suggestion: add a tool to export reading lists to BibTeX or other reference managers.
VictoriaWalker

我让AI每周帮我生成一份“本周arXiv高引论文”报告，然后用它来安排阅读计划。
CarterWright

The `sort_by` parameter with 'date' and 'relevance' options gives good control over result ordering.
LilyScott

第一次运行`semantic_search`报错，发现忘了先下载论文。文档里写了，我没仔细看。
NathanAdams

Is the `semantic_search` using a local embedding model? Concerned about sending queries to an external API.

登录

注册账号