你是否曾经希望AI不仅能和你对话,还能用自然的声音朗读出来,或者根据你的描述生成图像和视频?今天要介绍的开源项目MiniMax MCP服务器,正是为了实现这个目标而设计的。它由MiniMax官方团队打造,让MCP客户端(如Claude Desktop、Cursor、Windsurf等)能够调用MiniMax强大的文本转语音、声音克隆、视频生成和图像生成API。
项目基本信息
| 信息项 | 详情 |
|---|---|
| 项目名称 | MiniMax |
| GitHub地址 | https://github.com/MiniMax-AI/minimax-mcp |
| 项目描述 | MiniMax官方模型上下文协议(MCP)服务器,支持与强大的文本转语音和视频/图像生成API交互。 |
| 作者 | MiniMax-AI |
| 开源协议 | MIT License |
| 开源状态 | 公开状态 |
| Languages | Python |
| 支持平台 | Windows / macOS / Linux |
| 最后更新 | 2026-04-23 |
一、项目介绍
MiniMax MCP服务器是MiniMax官方推出的MCP工具,让AI助手能够调用MiniMax平台的多项AI能力。目前支持以下5种方法:
text_to_audio:使用指定音色将文本生成音频list_voices:查询所有可用音色voice_clone:根据指定音频文件克隆声音generate_video:根据指定prompt生成视频text_to_image:根据指定prompt生成图片
这个项目支持两种传输方式:
- stdio:本地部署运行,适合Claude Desktop、Cursor等客户端
- SSE:本地或云端部署,通过网络通信,适合远程调用
二、核心优势
官方出品,稳定可靠
由MiniMax官方团队开发和维护,与MiniMax API同步更新,兼容性有保障。
多媒体能力全面
覆盖了生成式AI的多个领域:
- 文本转语音(TTS)
- 声音克隆
- 文本转图像
- 文本转视频
灵活的部署方式
支持stdio和SSE两种传输方式,适应不同场景:
- stdio:适合本地MCP客户端集成
- SSE:适合云端部署和远程调用
多客户端支持
支持多种主流MCP客户端:
- Claude Desktop
- Cursor
- Windsurf
- OpenAI Agents
- 其他支持MCP协议的客户端
开源免费
MIT许可证,代码完全公开,可自由使用和修改。
三、适用场景
AI语音助手
让AI不仅能文字回复,还能用自然的声音朗读出来。可以用于播报新闻、阅读文章、语音提醒等。
内容创作
根据文字描述快速生成配图或视频,用于博客、社交媒体、演示文稿等。
声音克隆
克隆特定人物的声音,用于个性化语音助手、有声内容制作等。
多模态AI应用
结合文本、语音、图像、视频能力,构建更丰富的AI交互体验。
四、安装教程
系统要求
| 工具 | 用途 | 下载/安装方式 | |
|---|---|---|---|
| Python | 运行环境 | [https://python.org/] (版本要求:3.8 或以上) | |
| uv | Python包管理器 | `curl -LsSf https://astral.sh/uv/install.sh | sh` |
| MiniMax API密钥 | 调用API | 从MiniMax开放平台获取 | |
| MCP客户端 | 如Claude Desktop、Cursor等 | 根据客户端官网下载 |
安装步骤
第一步:获取MiniMax API密钥
- 国际版:访问MiniMax国际开放平台获取API密钥,API Host为
https://api.minimaxi.chat(注意额外的"i"字母) - 国内版:访问MiniMax国内开放平台获取API密钥,API Host为
https://api.minimax.chat
重要提示:API密钥和API Host必须匹配同一地区,否则会报"invalid api key"错误。
第二步:安装uv包管理器
curl -LsSf https://astral.sh/uv/install.sh | sh第三步:配置MCP客户端
对于Claude Desktop:
- 前往Claude -> Settings -> Developer -> Edit Config
- 编辑
claude_desktop_config.json,添加:
{
"mcpServers": {
"MiniMax": {
"command": "uvx",
"args": ["minimax-mcp"],
"env": {
"MINIMAX_API_KEY": "你的API密钥",
"MINIMAX_API_HOST": "https://api.minimax.chat 或 https://api.minimaxi.chat",
"MINIMAX_MCP_BASE_PATH": "本地输出目录路径,如/User/xxx/Desktop",
"MINIMAX_API_RESOURCE_MODE": "url 或 local"
}
}
}
}对于Cursor:
- 前往Cursor -> Preferences -> Cursor Settings -> MCP
- 点击"Add new global MCP Server"
- 添加上述配置
Windows用户注意:需要在Claude Desktop中启用开发者模式。点击左上角汉堡菜单中的"Help",然后选择"Enable Developer Mode"。
五、使用示例
配置完成后,你就可以在MCP客户端中使用自然语言来调用MiniMax的各种能力了。
示例1:文本转语音
用户指令:“用自然的女声朗读以下文本:'今天天气真好,适合出门散步'”
AI会调用text_to_audio工具,生成音频文件并返回本地路径或URL。
示例2:列出可用音色
用户指令:“列出所有可用的语音音色”
AI会调用list_voices工具,返回音色列表及其特征。
示例3:声音克隆
用户指令:“根据这个音频文件克隆声音,然后用克隆的声音朗读'你好,我是克隆的声音'”
AI会调用voice_clone工具,先克隆声音,再调用text_to_audio生成音频。
示例4:生成图像
用户指令:“生成一张图像:一只可爱的橘猫坐在窗台上,阳光洒进来”
AI会调用text_to_image工具,生成图像并返回URL。
示例5:生成视频
用户指令:“生成一个视频:海浪拍打沙滩,夕阳西下”
AI会调用generate_video工具,生成视频并返回URL。
示例6:配置资源输出模式
你可以通过MINIMAX_API_RESOURCE_MODE环境变量控制资源的输出方式:
url(默认):返回资源的URL链接local:保存到本地MINIMAX_MCP_BASE_PATH指定的目录
六、常见问题
问题1:提示"invalid api key"
解决方案:API密钥和API Host必须匹配同一地区。
- 国际版:Host为
https://api.minimaxi.chat(注意额外的"i"字母) - 国内版:Host为
https://api.minimax.chat
问题2:提示"spawn uvx ENOENT"
解决方案:
- 在终端运行
which uvx找到uvx的绝对路径 - 在MCP配置中将
"command": "uvx"改为"command": "/usr/local/bin/uvx"(或实际路径)
问题3:Windows上Claude Desktop无法使用MCP
解决方案:需要在Claude Desktop中启用开发者模式。点击左上角汉堡菜单中的"Help",然后选择"Enable Developer Mode"。
问题4:生成的内容保存在哪里?
解决方案:取决于MINIMAX_API_RESOURCE_MODE设置:
url模式:内容存储在MiniMax云端,返回URLlocal模式:内容保存在MINIMAX_MCP_BASE_PATH指定的本地目录
问题5:使用这些工具是否会产生费用?
解决方案:是的,MiniMax API是按使用量收费的。请在MiniMax开放平台查看具体的定价信息。
七、总结
MiniMax MCP服务器是MCP生态中第一个由AI模型厂商官方推出的多媒体生成工具。它将MiniMax的TTS、声音克隆、图像生成、视频生成能力通过MCP协议开放给AI助手,让AI能够“开口说话”、“看图”、“看视频”。
这个项目的最大价值在于:
- 官方维护:由MiniMax官方团队开发,质量有保障
- 多媒体能力:覆盖语音、图像、视频等多个领域
- 灵活部署:支持stdio和SSE两种传输方式
- 多客户端支持:兼容Claude Desktop、Cursor、Windsurf等主流MCP客户端
- 开源免费:MIT许可证,代码完全公开
如果你希望让AI助手具备语音、图像或视频生成能力,MiniMax MCP服务器是目前最好的选择之一。
期待未来能支持更多的AI能力,如视频编辑。
配合其他MCP工具,可以构建多模态AI应用。
我用它来为博客文章生成配图,效果很好。
希望未来能支持批量生成,提高效率。
API错误提示很清晰,能快速定位问题。