AI Agent 办公自动化是今年最热的赛道之一,微软、OpenAI 都在推自己的方案。但大部分方案要么绑死云端、要么闭源收费、要么功能单一。
一个名为 OfficeCLI 的开源项目脱颖而出——一个月斩获 2800+ Star。零依赖,运行起来只有一个二进制文件,让任何 AI Agent 用一行命令就能完全控制 Word、Excel、PowerPoint。

OfficeCLI 是一个命令行工具,专为 AI Agent 打造,轻松读写和修改 Word、Excel、PowerPoint 文件。
和传统 Python 库最大的不同在于,它是从零开始为 AI Agent 设计的。不用装 Office、不用装 .NET 运行时、不用管 XML 命名空间——下载一个二进制文件就能跑。macOS、Linux、Windows 全支持,真正做到了开箱即用。

核心设计理念:一套路径语法搞定所有 Office 文件
Agent 不需要学三套不同的 API,只需要理解一套路径语法。比如要修改第一张幻灯片的第一个形状文本,命令就是:
officecli set deck.pptx '/slide[1]/shape[1]' --prop text="Hello"
所有命令都支持 --json 输出,返回结构化数据。Agent 拿到就能直接用,不用再写正则去解析。
整个 PPT 创建过程可以完全由 AI Agent 驱动,没有任何人工干预。

功能覆盖
Word:支持段落、表格、页眉页脚、水印、目录、公式、表单字段,还有完整的国际化支持,包括从右到左的文字排版。
Excel:支持单元格、公式(150+ 内置函数自动求值)、数据透视表、图表、条件格式、CSV 导入。150+ 内置函数都能自动求值,对于做数据分析的朋友非常实用。
PowerPoint:支持幻灯片、形状、图表、3D 模型、动画、Morph 过渡效果。项目里还放了一些太空主题的 PPT 示例,全部由 AI Agent 通过 OfficeCLI 生成,没用任何模板,也没人工编辑过。

实时预览
用 watch 命令启动一个本地服务器,浏览器里就能实时看到文档变化。每次修改自动刷新,对于调试和迭代特别方便。Excel 的预览甚至支持原生风格的单元格选择和拖拽重定位图表。
AI Agent 集成
OfficeCLI 最大的亮点还是与 AI Agent 的无缝集成。它内置了 MCP 服务器,一条命令就能注册到 Claude Code、Cursor、VS Code、LM Studio 这些工具里:
officecli mcp claude
它还自带 9 个专业技能包,比如生成投资人路演 Deck、学术论文、财务模型、数据仪表板。这些技能包本质上是预置的工作流模板,让 Agent 不用从零开始设计文档结构。
学术论文,支持复杂公式排版:

销售数据仪表板,图表和条件格式都支持:

项目提案文档,格式排版都比较专业:

快速上手
1)一键安装
macOS 或 Linux:
curl -fsSL https://raw.githubusercontent.com/iOfficeAI/OfficeCLI/main/install.sh | bash
Windows:
irm https://raw.githubusercontent.com/iOfficeAI/OfficeCLI/main/install.ps1 | iex
2)创建第一个文档
officecli create deck.pptx
3)添加内容
officecli add deck.pptx / --type slide --prop title="Hello, World!"
4)实时预览
officecli watch deck.pptx
# 浏览器打开 http://localhost:26315

三层操作架构
OfficeCLI 把操作分成了三层:
| 层级 | 说明 | 命令 |
|---|---|---|
| L1 语义视图 | 直接查看文档大纲、纯文本及问题列表 | view |
| L2 DOM 元素操作 | 对具体元素进行操控 | get、set、add、remove |
| L3 原始 XML 底层 | L2 无法满足时,用 XPath 直接修改底层 XML | XPath 操作 |

简单说就是大部分时候用简单的命令就够了,实在搞不定才需要深入到底层。
注意事项
- 路径语法不是标准 XPath,需要稍微适应一下
- 部分特别偏门的 Office 功能可能需要通过 L3 原始 XML 层操作
- 社区讨论和真实用户反馈还不多,遇到问题可能得自己翻文档或 Issue
总结
一行命令,不用管 XML,不用学三套 API。这才是 AI Agent 真正需要的——不是多聪明的模型,而是顺手的工具。
项目基于 Apache-2.0 协议开放
苏米注:OfficeCLI 填补了 AI Agent 在 Office 自动化领域的关键空白。传统方案要么依赖云端 API(如 Microsoft Graph),要么需要复杂的 Python 库(如 python-docx、openpyxl),而 OfficeCLI 用零依赖的二进制文件 + MCP 集成,让 AI Agent 能直接操控 Office 文件。对于需要批量生成报告、自动化文档流程的场景非常实用。
GitHub 地址:github.com/iOfficeAI/OfficeCLI