大多数 AI 能读写思考,但让它们唱歌画画就差点意思。MiniMax 今天发布的 MMX-CLI 要解决的正是这个问题。
苏米注:这个工具的定位很有意思——它不是把 AI 变成瑞士军刀,而是让 AI 自己学会使用工具。这种设计思路值得借鉴。
这个命令行工具给每个 AI Agent 装了七种新感官:图像生成与理解、视频创作、语音合成、音乐生成、视觉识别、搜索和对话,一站式解决内容创作所需要的所有能力。


从安装到使用
安装只需两行命令:
npx skills add MiniMax-AI/cli -y -g
npm install -g mmx-cli
配置完成后,可以开始体验各种功能。
核心功能详解
1. 音乐生成(最亮眼)
这是 MMX-CLI 最吸引人的功能之一:
# 带歌词生成
mmx music generate --prompt "轻快流行乐" --lyrics "[verse] 啦啦啦,阳光明媚" --out song.mp3
# 自动优化歌词
mmx music generate --prompt "独立民谣,忧郁,雨夜" --lyrics-optimizer
# 纯音乐模式
mmx music generate --prompt "电影配乐" --instrumental --out bgm.mp3
实测中,生成 1 分钟音乐消耗约 1500 Token,按标准套餐折算成本不到 0.5 元。
2. 视频生成
视频生成采用异步模式,生成 10 秒动画约需 3 分钟:
# 异步生成,返回任务 ID
mmx video generate --prompt "日落海浪" --async
# 根据任务 ID 下载结果
mmx video download --file-id 176844028768320 --out video.mp4
3. 语音合成
支持 30+ 音色和语速调节:
# 选择特定音色和语速
mmx speech synthesize --text "你好" --voice English_magnetic_voiced_man --speed 1.2
# 流式播放
mmx speech synthesize --text "实时流" --stream | mpv -
4. 搜索功能
比较意外的是搜索功能。当要求 AI"查 MiniMax 最新动态"时,它真的会返回当天推文和新闻,而非训练数据里的陈旧信息。
苏米注:这个功能解决了大模型的一个核心痛点——知识截止。通过实时搜索,AI 可以获取最新信息,这对于内容创作和新闻分析非常重要。
工作流集成
这个工具的优势在于可以简单集成到现有工作流中:
# 从文件读取内容生成语音
echo "新闻快讯" | mmx speech synthesize --text-file - --out news.mp3
# JSON 格式对话历史
cat messages.json | mmx text chat --messages-file - --output json
配置管理也很简单:
# 切换到中国区
mmx config set --key region --value cn
# 检查 Token 余额
mmx quota
设计哲学
官方明确宣称这是"不为人类设计"的开发工具。
这个工具最聪明的设计在于:它没把 AI 变成瑞士军刀,而是让 AI 自己学会使用工具。技术细节上,MMX-CLI 把复杂的多模态能力封装成了简单的命令行接口。
苏米注:这种设计思路值得学习。很多工具喜欢把功能做得很复杂,恨不得把所有可能性都暴露给用户。但 MMX-CLI 反其道而行,用简单的 CLI 接口封装复杂能力,让 AI Agent 可以轻松调用。
使用建议
最后需要提醒的是,最好使用订阅制。按量付费对于这种需要抽卡反复创作的用户,使用得悠着点。
参考资源
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。