在日常工作中,PDF 和 Office 文档的格式转换几乎是每个人都无法回避的环节。提取合同中的某一页、将 Word 报告转为 PDF 归档、合并多张扫描件,这些看似简单的操作,在如今的 AI 协作时代,仍然需要手动在各种软件之间反复跳转和操作。Undoom PDF MCP Server 的出现,将这一切常规文件处理操作无缝融入了 AI 对话中。它是一个基于 MCP 协议的强大 PDF 转换工具,让你的 AI 助手(如 Claude Desktop)能够像使用本地软件一样,一句话完成 PDF 的各种转换和加密操作。
项目基本信息
| 信息项 | 详情 |
|---|---|
| 项目名称 | Undoom PDF MCP Server |
| GitHub 地址 | https://github.com/kk520879/undoom_pdf_mcp |
| 项目描述 | 功能强大的 PDF 转换工具 MCP 服务器,集成 PDF 与 Office 文档转换、加密等功能 |
| 作者 | Undoom |
| 开源协议 | MIT License |
| 开源状态 | 公开状态 |
| Languages | Python |
| 支持平台 | Windows(Office 转换必需)/ macOS / Linux |
| 最后更新 | 2025-08-15 |
一、项目介绍
Undoom PDF MCP Server 是一个基于 Python 构建的 MCP 服务器,它将 PDF 和 Office 文档的各种处理能力通过标准化 MCP 工具的形式暴露给 AI 客户端。
核心工具集
该服务器提供了一套覆盖日常文档转换需求的完整工具:
| 工具名称 | 功能 | 关键参数 |
|---|---|---|
pdf_to_images | PDF 转高质量图片 | 页码选择、图片质量(0.25-4.0)、输出目录 |
batch_convert_pdfs | 批量 PDF 转图片 | 文件夹路径、每文件页码映射 |
word_to_pdf | Word 文档转 PDF | 文件路径、输出路径(可选) |
excel_to_pdf | Excel 表格转 PDF | 文件路径、输出路径(可选) |
ppt_to_pdf | PowerPoint 演示转 PDF | 文件路径、输出路径(可选) |
batch_office_to_pdf | 批量 Office 文件转 PDF | 文件夹路径、文件类型筛选 |
get_pdf_info | 获取 PDF 详细信息 | 绝对路径 |
encrypt_pdf | PDF 加密保护 | 密码、输出路径(可选) |
images_to_pdf | 多张图片合并为 PDF | 图片路径列表、页面大小 |
single_image_to_pdf | 单张图片转 PDF | 图片路径、页面大小 |
灵活的页码与质量控制
PDF 转图片时,你可以指定页码(单页、列表、范围或混合格式),并调整从 0.25 到 4.0 的质量参数,用于实现文件大小与清晰度之间的平衡。这种精细程度的控制,能让 AI 准确获取所需内容,而不会浪费上下文窗口的 token。
二、核心优势
全面覆盖常用格式转换
一个服务器,囊括了 PDF、Word、Excel、PowerPoint 和图片之间的几乎所有常见转换。不需要为不同工具拼凑多个服务器或手动切换软件。
批量处理能力
批量 PDF 转图片、批量 Office 转 PDF——这些功能特别适合需要自动化处理大量文档的企业场景。你可以让 AI 一次性处理整个文件夹的文件,而不是逐个操作。
精细的输出控制
特别是在 PDF 转图片时,支持指定页码范围(如 1,3-5,7)和质量等级(0.25 到 4.0)。这种精细化控制让 AI 能按需提取内容,既保证了清晰度,又控制了文件大小。
内存优化与稳定性
项目特别关注内存管理,能自动清理资源以避免内存泄漏。在批量处理或多轮转换场景下,这比一些简单的自动化脚本更为可靠,能够防止处理大文件时系统崩溃。
MIT 开源协议
采用完全商业友好的 MIT 协议,适合集成到内部工具或商业产品中。
三、适用场景
文档数字化与归档
用户:把“合同扫描件”文件夹里的所有 PDF 都转成高质量图片,只处理前 3 页。
AI 调用 batch_convert_pdfs 工具,自动完成批量转换。
Office 文档转 PDF
用户:把这个 Word 报告和 Excel 数据表都转成 PDF,保存到同一个文件夹里。
AI 依次调用 word_to_pdf 和 excel_to_pdf,完成转换。
PDF 安全处理
用户:给这份合同 PDF 加上密码“mypassword123”,保存为加密版本。
AI 调用 encrypt_pdf 工具,完成加密。
扫描件合并与转换
用户:把这三张手机拍的照片合并成一个 PDF 文件,用 A4 纸大小。
AI 调用 images_to_pdf,传入图片路径列表和页面大小参数。
文件信息查阅
用户:帮我看看这个 PDF 有多少页、文件多大、什么时候创建的。
AI 调用 get_pdf_info,返回详细的文件元信息。
四、安装教程
环境要求
| 工具 | 用途 | 下载/安装方式 |
|---|---|---|
| Python | 运行环境 | 3.10 或以上 |
| uv | Python 包管理器 | 推荐使用 |
| Microsoft Office | Office 文件转换 | 仅 Windows 系统需要(用于 Word/Excel/PPT 转 PDF) |
安装方式一:使用 uvx(推荐,直接使用)
项目已发布到 PyPI,可直接使用 uvx 运行,无需克隆仓库:
{
"mcpServers": {
"undoom-pdf-mcp": {
"command": "uvx",
"args": [
"--index-url",
"https://pypi.tuna.tsinghua.edu.cn/simple",
"undoom-pdf-mcp"
]
}
}
}注意:配置中使用了清华大学 PyPI 镜像源以提高下载速度。
安装方式二:从源码安装
# 克隆仓库
git clone https://github.com/kk520879/undoom_pdf_mcp.git
cd undoom_pdf_mcp
# 安装依赖
uv sync然后使用本地开发配置:
{
"mcpServers": {
"undoom-pdf-mcp": {
"command": "uv",
"args": [
"--directory",
"/path/to/your/undoom_pdf_mcp",
"run",
"python",
"undoom_pdf_mcp/main.py"
]
}
}
}启动服务
# 使用 uv 运行
uv run python undoom_pdf_mcp/main.py
# 或直接运行
python undoom_pdf_mcp/main.py配置 Claude Desktop
编辑 Claude Desktop 配置文件(如上述 JSON 所示),完全退出并重启 Claude Desktop。
五、使用示例
示例一:PDF 转图片
用户:把 D:\Documents\report.pdf 这个 PDF 的第 2 到第 5 页转成高质量图片。AI 调用 pdf_to_images,传入 pdf_path、pages: "2-5"、quality: 2.0。转换完成后,图片文件生成在原 PDF 同目录下。
示例二:批量 Office 文件转 PDF
用户:把 D:\Reports 文件夹里所有的 Word 和 Excel 文件都转成 PDF。AI 调用 batch_office_to_pdf,传入 folder_path 和 file_types: [".docx", ".doc", ".xlsx", ".xls"],完成批量转换。
示例三:加密 PDF
用户:给 D:\Documents\secret.pdf 加个密码“abc123”。AI 调用 encrypt_pdf,传入 pdf_path 和 password,生成加密文件。
示例四:图片合并为 PDF
用户:把这三张截图合并成一个 PDF:1.png、2.png、3.png。
AI 调用 images_to_pdf,传入图片路径列表和输出路径,生成合并后的 PDF。
六、常见问题
问:Office 转 PDF 功能提示失败?
答:Office 文件转换依赖于 Windows 系统上安装的 Microsoft Office 软件。请确认:
- 你的系统是 Windows。
- 已安装 Microsoft Office(Word、Excel、PowerPoint)。
- 文件未被其他程序占用。
macOS 或 Linux 用户无法使用 Office 转换功能。
问:PDF 路径怎么填?
答:所有路径都必须是绝对路径。相对路径或波浪号路径(如 ~/Documents/)不会被识别。Windows 上使用双反斜杠或正斜杠均可,如 C:\\Users\\xxx\\file.pdf 或 C:/Users/xxx/file.pdf。
问:图片质量参数选什么好?
答:
0.25:极低质量,文件最小,适合纯文字存档。1.0:原始分辨率,平衡质量和大小。2.0(默认):高质量,适合大多数场景。4.0:超高质量,文件大,适合需要放大查看的图片。
问:内存不够怎么办?
答:服务器内置了自动内存清理机制。处理超大文件时,可以优先处理关键页面(不要一次性转换几百页)。如果仍不足,考虑增加系统物理内存或分批处理。
七、总结
Undoom PDF MCP Server 是一个实用、专注、功能全面的文档转换工具。它将日常繁琐的 PDF 和 Office 文件处理操作通过 MCP 协议标准化,让 AI 助手成为你的文档管理专家。精细的页码和质量控制、批量处理能力,以及对 Office 格式的完整支持,使其在同类工具中尤为突出。对于需要频繁处理文档的开发者、知识工作者和企业用户,花几分钟完成配置,接下来你只需用自然语言说出需求,AI 就会帮你完成所有的 PDF 转换、加密、合并和查阅工作。
路径要绝对路径这个要注意,我一开始用相对路径一直报错。
加密 PDF 功能非常实用,一些敏感文档可以一键加密码。
页码格式说明很清晰,`1,3-5,7` 这种混合格式我以前从来没见过这么详细的文档。
批量转换 Office 文件时一定要把文件都关掉,不然 COM 接口会报错。
内存优化这部分做得不错,Python 运行了一段时间后没有出现内存泄漏的情况。