MiniMax

你是否曾经希望AI不仅能和你对话，还能用自然的声音朗读出来，或者根据你的描述生成图像和视频？今天要介绍的开源项目MiniMax MCP服务器，正是为了实现这个目标而设计的。它由MiniMax官方团队打造，让MCP客户端（如Claude Desktop、Cursor、Windsurf等）能够调用MiniMax强大的文本转语音、声音克隆、视频生成和图像生成API。

项目基本信息

信息项	详情
项目名称	MiniMax
GitHub地址	https://github.com/MiniMax-AI/minimax-mcp
项目描述	MiniMax官方模型上下文协议(MCP)服务器，支持与强大的文本转语音和视频/图像生成API交互。
作者	MiniMax-AI
开源协议	MIT License
开源状态	公开状态
Languages	Python
支持平台	Windows / macOS / Linux
最后更新	2026-04-23

一、项目介绍

MiniMax MCP服务器是MiniMax官方推出的MCP工具，让AI助手能够调用MiniMax平台的多项AI能力。目前支持以下5种方法：

text_to_audio：使用指定音色将文本生成音频
list_voices：查询所有可用音色
voice_clone：根据指定音频文件克隆声音
generate_video：根据指定prompt生成视频
text_to_image：根据指定prompt生成图片

这个项目支持两种传输方式：

stdio：本地部署运行，适合Claude Desktop、Cursor等客户端
SSE：本地或云端部署，通过网络通信，适合远程调用

二、核心优势

官方出品，稳定可靠

由MiniMax官方团队开发和维护，与MiniMax API同步更新，兼容性有保障。

多媒体能力全面

覆盖了生成式AI的多个领域：

文本转语音（TTS）
声音克隆
文本转图像
文本转视频

灵活的部署方式

支持stdio和SSE两种传输方式，适应不同场景：

stdio：适合本地MCP客户端集成
SSE：适合云端部署和远程调用

多客户端支持

支持多种主流MCP客户端：

Claude Desktop
Cursor
Windsurf
OpenAI Agents
其他支持MCP协议的客户端

开源免费

MIT许可证，代码完全公开，可自由使用和修改。

三、适用场景

AI语音助手

让AI不仅能文字回复，还能用自然的声音朗读出来。可以用于播报新闻、阅读文章、语音提醒等。

内容创作

根据文字描述快速生成配图或视频，用于博客、社交媒体、演示文稿等。

声音克隆

克隆特定人物的声音，用于个性化语音助手、有声内容制作等。

多模态AI应用

结合文本、语音、图像、视频能力，构建更丰富的AI交互体验。

四、安装教程

系统要求

工具	用途	下载/安装方式
Python	运行环境	[https://python.org/] （版本要求：3.8 或以上）
uv	Python包管理器	`curl -LsSf https://astral.sh/uv/install.sh	sh`
MiniMax API密钥	调用API	从MiniMax开放平台获取
MCP客户端	如Claude Desktop、Cursor等	根据客户端官网下载

安装步骤

第一步：获取MiniMax API密钥

国际版：访问MiniMax国际开放平台获取API密钥，API Host为https://api.minimaxi.chat（注意额外的"i"字母）
国内版：访问MiniMax国内开放平台获取API密钥，API Host为https://api.minimax.chat

重要提示：API密钥和API Host必须匹配同一地区，否则会报"invalid api key"错误。

第二步：安装uv包管理器

curl -LsSf https://astral.sh/uv/install.sh | sh

第三步：配置MCP客户端

对于Claude Desktop：

前往Claude -> Settings -> Developer -> Edit Config
编辑claude_desktop_config.json，添加：

{
  "mcpServers": {
    "MiniMax": {
      "command": "uvx",
      "args": ["minimax-mcp"],
      "env": {
        "MINIMAX_API_KEY": "你的API密钥",
        "MINIMAX_API_HOST": "https://api.minimax.chat 或 https://api.minimaxi.chat",
        "MINIMAX_MCP_BASE_PATH": "本地输出目录路径，如/User/xxx/Desktop",
        "MINIMAX_API_RESOURCE_MODE": "url 或 local"
      }
    }
  }
}

对于Cursor：

前往Cursor -> Preferences -> Cursor Settings -> MCP
点击"Add new global MCP Server"
添加上述配置

Windows用户注意：需要在Claude Desktop中启用开发者模式。点击左上角汉堡菜单中的"Help"，然后选择"Enable Developer Mode"。

五、使用示例

配置完成后，你就可以在MCP客户端中使用自然语言来调用MiniMax的各种能力了。

示例1：文本转语音

用户指令：“用自然的女声朗读以下文本：'今天天气真好，适合出门散步'”

AI会调用text_to_audio工具，生成音频文件并返回本地路径或URL。

示例2：列出可用音色

用户指令：“列出所有可用的语音音色”

AI会调用list_voices工具，返回音色列表及其特征。

示例3：声音克隆

用户指令：“根据这个音频文件克隆声音，然后用克隆的声音朗读'你好，我是克隆的声音'”

AI会调用voice_clone工具，先克隆声音，再调用text_to_audio生成音频。

示例4：生成图像

用户指令：“生成一张图像：一只可爱的橘猫坐在窗台上，阳光洒进来”

AI会调用text_to_image工具，生成图像并返回URL。

示例5：生成视频

用户指令：“生成一个视频：海浪拍打沙滩，夕阳西下”

AI会调用generate_video工具，生成视频并返回URL。

示例6：配置资源输出模式

你可以通过MINIMAX_API_RESOURCE_MODE环境变量控制资源的输出方式：

url（默认）：返回资源的URL链接
local：保存到本地MINIMAX_MCP_BASE_PATH指定的目录

六、常见问题

问题1：提示"invalid api key"

解决方案：API密钥和API Host必须匹配同一地区。

国际版：Host为https://api.minimaxi.chat（注意额外的"i"字母）
国内版：Host为https://api.minimax.chat

问题2：提示"spawn uvx ENOENT"

解决方案：

在终端运行which uvx找到uvx的绝对路径
在MCP配置中将"command": "uvx"改为"command": "/usr/local/bin/uvx"（或实际路径）

问题3：Windows上Claude Desktop无法使用MCP

解决方案：需要在Claude Desktop中启用开发者模式。点击左上角汉堡菜单中的"Help"，然后选择"Enable Developer Mode"。

问题4：生成的内容保存在哪里？

解决方案：取决于MINIMAX_API_RESOURCE_MODE设置：

url模式：内容存储在MiniMax云端，返回URL
local模式：内容保存在MINIMAX_MCP_BASE_PATH指定的本地目录

问题5：使用这些工具是否会产生费用？

解决方案：是的，MiniMax API是按使用量收费的。请在MiniMax开放平台查看具体的定价信息。

七、总结

MiniMax MCP服务器是MCP生态中第一个由AI模型厂商官方推出的多媒体生成工具。它将MiniMax的TTS、声音克隆、图像生成、视频生成能力通过MCP协议开放给AI助手，让AI能够“开口说话”、“看图”、“看视频”。

这个项目的最大价值在于：

官方维护：由MiniMax官方团队开发，质量有保障
多媒体能力：覆盖语音、图像、视频等多个领域
灵活部署：支持stdio和SSE两种传输方式
多客户端支持：兼容Claude Desktop、Cursor、Windsurf等主流MCP客户端
开源免费：MIT许可证，代码完全公开

登录

注册账号