你是否曾经希望AI不仅能和你对话,还能用自然的声音朗读出来,或者根据你的描述生成图像和视频?今天要介绍的开源项目MiniMax MCP服务器,正是为了实现这个目标而设计的。它由MiniMax官方团队打造,让MCP客户端(如Claude Desktop、Cursor、Windsurf等)能够调用MiniMax强大的文本转语音、声音克隆、视频生成和图像生成API。

项目基本信息

信息项详情
项目名称MiniMax
GitHub地址https://github.com/MiniMax-AI/minimax-mcp
项目描述MiniMax官方模型上下文协议(MCP)服务器,支持与强大的文本转语音和视频/图像生成API交互。
作者MiniMax-AI
开源协议MIT License
开源状态公开状态
LanguagesPython
支持平台Windows / macOS / Linux
最后更新2026-04-23

一、项目介绍

MiniMax MCP服务器是MiniMax官方推出的MCP工具,让AI助手能够调用MiniMax平台的多项AI能力。目前支持以下5种方法:

  • text_to_audio:使用指定音色将文本生成音频
  • list_voices:查询所有可用音色
  • voice_clone:根据指定音频文件克隆声音
  • generate_video:根据指定prompt生成视频
  • text_to_image:根据指定prompt生成图片

这个项目支持两种传输方式:

  • stdio:本地部署运行,适合Claude Desktop、Cursor等客户端
  • SSE:本地或云端部署,通过网络通信,适合远程调用

二、核心优势

官方出品,稳定可靠

由MiniMax官方团队开发和维护,与MiniMax API同步更新,兼容性有保障。

多媒体能力全面

覆盖了生成式AI的多个领域:

  • 文本转语音(TTS)
  • 声音克隆
  • 文本转图像
  • 文本转视频

灵活的部署方式

支持stdio和SSE两种传输方式,适应不同场景:

  • stdio:适合本地MCP客户端集成
  • SSE:适合云端部署和远程调用

多客户端支持

支持多种主流MCP客户端:

  • Claude Desktop
  • Cursor
  • Windsurf
  • OpenAI Agents
  • 其他支持MCP协议的客户端

开源免费

MIT许可证,代码完全公开,可自由使用和修改。

三、适用场景

AI语音助手

让AI不仅能文字回复,还能用自然的声音朗读出来。可以用于播报新闻、阅读文章、语音提醒等。

内容创作

根据文字描述快速生成配图或视频,用于博客、社交媒体、演示文稿等。

声音克隆

克隆特定人物的声音,用于个性化语音助手、有声内容制作等。

多模态AI应用

结合文本、语音、图像、视频能力,构建更丰富的AI交互体验。

四、安装教程

系统要求

工具用途下载/安装方式
Python运行环境[https://python.org/] (版本要求:3.8 或以上)
uvPython包管理器`curl -LsSf https://astral.sh/uv/install.shsh`
MiniMax API密钥调用API从MiniMax开放平台获取
MCP客户端如Claude Desktop、Cursor等根据客户端官网下载

安装步骤

第一步:获取MiniMax API密钥

  • 国际版:访问MiniMax国际开放平台获取API密钥,API Host为https://api.minimaxi.chat(注意额外的"i"字母)
  • 国内版:访问MiniMax国内开放平台获取API密钥,API Host为https://api.minimax.chat

重要提示:API密钥和API Host必须匹配同一地区,否则会报"invalid api key"错误。

第二步:安装uv包管理器

curl -LsSf https://astral.sh/uv/install.sh | sh

第三步:配置MCP客户端

对于Claude Desktop

  1. 前往Claude -> Settings -> Developer -> Edit Config
  2. 编辑claude_desktop_config.json,添加:
{
  "mcpServers": {
    "MiniMax": {
      "command": "uvx",
      "args": ["minimax-mcp"],
      "env": {
        "MINIMAX_API_KEY": "你的API密钥",
        "MINIMAX_API_HOST": "https://api.minimax.chat 或 https://api.minimaxi.chat",
        "MINIMAX_MCP_BASE_PATH": "本地输出目录路径,如/User/xxx/Desktop",
        "MINIMAX_API_RESOURCE_MODE": "url 或 local"
      }
    }
  }
}

对于Cursor

  1. 前往Cursor -> Preferences -> Cursor Settings -> MCP
  2. 点击"Add new global MCP Server"
  3. 添加上述配置

Windows用户注意:需要在Claude Desktop中启用开发者模式。点击左上角汉堡菜单中的"Help",然后选择"Enable Developer Mode"。

五、使用示例

配置完成后,你就可以在MCP客户端中使用自然语言来调用MiniMax的各种能力了。

示例1:文本转语音

用户指令:“用自然的女声朗读以下文本:'今天天气真好,适合出门散步'”

AI会调用text_to_audio工具,生成音频文件并返回本地路径或URL。

示例2:列出可用音色

用户指令:“列出所有可用的语音音色”

AI会调用list_voices工具,返回音色列表及其特征。

示例3:声音克隆

用户指令:“根据这个音频文件克隆声音,然后用克隆的声音朗读'你好,我是克隆的声音'”

AI会调用voice_clone工具,先克隆声音,再调用text_to_audio生成音频。

示例4:生成图像

用户指令:“生成一张图像:一只可爱的橘猫坐在窗台上,阳光洒进来”

AI会调用text_to_image工具,生成图像并返回URL。

示例5:生成视频

用户指令:“生成一个视频:海浪拍打沙滩,夕阳西下”

AI会调用generate_video工具,生成视频并返回URL。

示例6:配置资源输出模式

你可以通过MINIMAX_API_RESOURCE_MODE环境变量控制资源的输出方式:

  • url(默认):返回资源的URL链接
  • local:保存到本地MINIMAX_MCP_BASE_PATH指定的目录

六、常见问题

问题1:提示"invalid api key"

解决方案:API密钥和API Host必须匹配同一地区。

  • 国际版:Host为https://api.minimaxi.chat(注意额外的"i"字母)
  • 国内版:Host为https://api.minimax.chat

问题2:提示"spawn uvx ENOENT"

解决方案:

  1. 在终端运行which uvx找到uvx的绝对路径
  2. 在MCP配置中将"command": "uvx"改为"command": "/usr/local/bin/uvx"(或实际路径)

问题3:Windows上Claude Desktop无法使用MCP

解决方案:需要在Claude Desktop中启用开发者模式。点击左上角汉堡菜单中的"Help",然后选择"Enable Developer Mode"。

问题4:生成的内容保存在哪里?

解决方案:取决于MINIMAX_API_RESOURCE_MODE设置:

  • url模式:内容存储在MiniMax云端,返回URL
  • local模式:内容保存在MINIMAX_MCP_BASE_PATH指定的本地目录

问题5:使用这些工具是否会产生费用?

解决方案:是的,MiniMax API是按使用量收费的。请在MiniMax开放平台查看具体的定价信息。

七、总结

MiniMax MCP服务器是MCP生态中第一个由AI模型厂商官方推出的多媒体生成工具。它将MiniMax的TTS、声音克隆、图像生成、视频生成能力通过MCP协议开放给AI助手,让AI能够“开口说话”、“看图”、“看视频”。

这个项目的最大价值在于:

  1. 官方维护:由MiniMax官方团队开发,质量有保障
  2. 多媒体能力:覆盖语音、图像、视频等多个领域
  3. 灵活部署:支持stdio和SSE两种传输方式
  4. 多客户端支持:兼容Claude Desktop、Cursor、Windsurf等主流MCP客户端
  5. 开源免费:MIT许可证,代码完全公开

如果你希望让AI助手具备语音、图像或视频生成能力,MiniMax MCP服务器是目前最好的选择之一。

标签: 开发者工具

已有 34 条评论

    1. EliElse EliElse

      总的来说,这是多媒体生成领域最好的MCP工具。

    2. FayFetch FayFetch

      看完教程立刻去配置了,AI帮我生成了第一个语音文件。

    3. GavinGrep GavinGrep

      感谢MiniMax官方团队,让AI生成多媒体变得如此简单。

    4. HollyHash HollyHash

      期待未来能支持实时语音对话,实现真正的AI语音助手。