10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

banana-slides:你是不是在这个开源?用Nano Banana Pro生成PPT

3月前 AI开源项目 1147 0

最近在浏览开源项目时,发现了一个有意思的现象——越来越多的AI工具不再追求"一键完美"的承诺,而是聚焦于解决具体的创作痛点。

banana-slides就是这样一个项目。它在近期迅速获得2000+的Star增长,核心原因并不复杂:它找到了PPT创作中的真实断点有内容、缺设计感。

什么是banana-slides?

banana-slides是一个基于Nano Banana Pro模型的开源PPT生成工具,主打"Vibe驱动"的设计理念。

与市面上依赖模板库或拖拽编辑的工具不同,它的设计逻辑是:

输入形式多元化——支持一句话主题、结构化大纲、或详细页面描述三种起点,适配不同阶段的创作状态

生成逻辑氛围优先——强调整体视觉调性而非套用预设格式,输出结果更接近专业设计师的排版思路

交互方式自然语言化——修改指令不依赖复杂UI菜单,直接用口语下达修改需求(如"把第三页改成案例分析")

核心功能

1. 多路径内容生成

系统支持灵活的创作路径,用户可根据准备程度选择:

  • 一句话生成:输入主题,AI自动产出完整大纲和逐页内容描述
  • 大纲/描述模式:既支持批量一键生成,也支持手动微调细节
  • 文件导入解析:支持PDF、Docx、MD、Txt等格式,后台自动提取关键点、图片链接和图表信息

2. 自然语言编辑引擎

这是banana-slides相比同类产品的明显优势。用户无需学习工具的特定操作逻辑,直接用自然表述修改内容:

  • 局部重绘——对不满意的区域进行语音式修改("把这个柱状图改成饼图")
  • 整页优化——基于模型生成高清且风格统一的完整页面
  • 风格定制——支持上传参考图片或模板,引导生成符合特定美学方向的设计

3. 开箱即用的导出

支持一键导出标准PPTX或PDF格式,默认16:9宽屏比例,排版不需二次调整,可直接用于演示或演讲。

部署与配置

项目提供Docker一键部署方案,上手门槛较低:

第一步:克隆项目

git clone https://github.com/Anionex/banana-slides
cd banana-slides

第二步:配置环境变量

创建.env文件并配置API密钥(支持Gemini或OpenAI双引擎):

# AI Provider格式 (gemini / openai)
AI_PROVIDER_FORMAT=gemini

# Gemini配置
GOOGLE_API_KEY=your-api-key-here
GOOGLE_API_BASE=https://generativelanguage.googleapis.com

# OpenAI配置
OPENAI_API_KEY=your-api-key-here
OPENAI_API_BASE=https://api.openai.com/v1

第三步:启动服务

docker compose up -d

启动后访问:

  • 前端:http://localhost:3000
  • 后端API:http://localhost:5000

项目也支持源码本地部署,详见官方文档。

适用场景分析

用户群体 典型场景 核心价值
设计基础薄弱者 快速成稿、无需学习工具 降低排版和视觉设计的学习成本
内容创作者 教案转PPT、长文转演示稿 将注意力聚焦于内容本身,设计由模型处理
职场专业人士 商业提案、产品说明、汇报总结 快速迭代、保持专业度、节省排版时间
学生群体 课程展示、学位论文答辩、项目汇报 提高完成效率,改善视觉呈现效果

对标与补充说明

市面上同类产品如Gamma、Beautiful.ai强调智能生成,但多数仍依赖预设模板库或UI拖拽操作。

banana-slides的差异点在于:自然语言作为主要交互界面,减少了工具学习成本;强调整体氛围而非模板组合,生成结果的一致性更高。

不过,它也有适配范围的考量——复杂的数据可视化或特殊行业规范(如学术论文标准格式)可能需要后期手动调整。

总结

banana-slides不是在承诺"一键出完美PPT",而是在做一件更务实的事——让有内容的人更高效地产出专业且可交付的演示文稿。从产品设计层面看,它抓住了用户的真实痛点:脑子里有想法,但排版和设计往往成为执行的瓶颈。通过自然语言交互和氛围驱动的生成逻辑,它降低了工具门槛,提高了迭代速度。

如果你已经对千篇一律的模板感到疲倦,也不想在格式调整上反复消耗时间,这个项目值得一试。特别是对于内容创作者、教育工作者和需要频繁汇报的职场人士,快速部署体验一下,可能会改变你对PPT创作的看法。

项目地址:https://github.com/Anionex/banana-slides

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:banana-slides:你是不是在这个开源?用Nano Banana Pro生成PPT
#banana-slides #PPT #Nano Banana Pro 
收藏 1
一张图解构企业智能体:用四层架构把AI变成数字分身
Fish Audio:开源语音合成突破性进展,中文TTS性能超越商用方案
推荐阅读
  • 两款超实用的Docker 端口可视化工具:快速定位端口占用问题
  • RedInk:基于 Nano Banana Pro的开源小红书图文生成器
  • Youtu-agent:灵活自主的智能体开发,轻松用YAML配置实现高效功能
  • ClaudeCodeViewer :ClaudeCode 终于有了趁手的开源 Web 界面
  • DeepCode:从论文到生产代码的全自动多智能体平台
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
8259 5月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
6928 6月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
5217 2月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
4967 6月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
4951 5月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
4688 6月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
4677 1月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
4672 5月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
4407 6月前
Fogsight (雾象):一句话自动生成任何科普动画
4017 5月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Fish Audio:开源语音合成突破性进展,中文TTS性能超越商用方案
2 bb-browser:用浏览器身份做 API, 如何让 AI Agent 绕过反爬机制
3 DeepDiagram:用自然语言生成图表的 AI 可视化平台,6 个专用 Agent 各司其职
4 AutoResearch:让AI自主优化神经网络训练,单卡也能跑的自适应研究系统
5 MindPocket:开源AI知识库,让收藏夹变成可全平台同步、自动摘要、智能对话,查询的第二大脑
6 MemOS 开源 OpenClaw 插件,让 AI Agent 拥有可复用的长期记忆
7 Symphony:OpenAI 开源 Symphony AI 编程自主管理神器!
8 AiToEarn:一人公司的 AI 内容营销开源神器,打通自媒体运营全链路
9 NoizAI Skills:给 OpenClaw 小龙虾装上声音Skills,让 AI Agent 开口说话
10 VoxClaw:小龙虾能说话的开源,在 OpenClaw 上集成语音输出能力
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联