10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

RedInk:基于 Nano Banana Pro的开源小红书图文生成器

5月前 AI开源项目 1885 0

RedInk 的核心目标是让用户仅通过一句自然语言描述(如“秋季显白美甲”),即可自动生成一整套 风格统一、排版清晰、可直接发布的小红书图文内容。

它解决了传统内容创作中:

  • 图文匹配不一致、封面风格不统一;

  • 内容撰写耗时长;

  • 设计门槛高;
    等问题。

一句话总结:

RedInk = “AI 自动撰稿 + AI 生成图片 + 封面设计 + 图文排版” 的一体化工具。

灵感来源?

作者最早灵感来自一个 Linux.do 社区帖子,
有人用“🍌Nano Banana Pro”(一个 AI 图像模型)来做 PPT。
他觉得:既然能自动生成 PPT,为什么不能生成小红书图文?

于是就诞生了 RedInk。

它的目标不是做“好玩”的东西,而是让:

内容创作变得像打字一样简单。

能做什么?

RedInk 让你可以:

  • 输入一个主题(例如“春季穿搭指南”);

  • 自动生成标题页 + 6 到 9 页的图文内容;

  • 每一页都带有风格一致的图片和说明;

  • 图片风格可以基于你的品牌或账号主页;

  • 可以上传参考图片,让生成风格保持一致;

  • 最后还能一键下载所有图片文件。

然后等待10-20秒后,就会有每一页的大纲,大家可以根据的自己的需求去调整页面顺序(不建议),自定义每一个页面的内容(这个很建议)

它会先生成封面,然后并发(同时)生成其他页面。

然后稍等一会儿后,会生成后面的所有页面(这里是并发生成的所有页面(最高25个),如果大家的API供应商无法支持高并发的话,记得要去改一下设置)

如果你的 API 支持高并发(比如 Google Gemini Pro 付费账号),生成速度会非常快(一次最多 25 张图一起生成)。

用到的 AI 技术

RedInk 是一个“图文双引擎”的系统。
它用两个模型分别负责不同部分:

  1. Gemini 3:生成文字内容(标题、描述、段落);

  2. 🍌Nano Banana Pro:生成配图(封面、背景、图像元素)。

这两个模型配合在一起,就能让输出既有“文案逻辑”,又有“视觉风格”。

技术架构(怎么搭起来的)

整个项目是前后端分离的。

后端部分

  • 用 Python 3.11+ 和 Flask 写的;

  • 负责调用 Gemini 或 OpenAI 的 API;

  • 管理任务队列、生成请求、并发控制。

前端部分

  • 用 Vue 3 + TypeScript + Vite;

  • 提供一个漂亮的 Web 界面;

  • 用户可以在网页里输入主题、编辑每一页文案、点击生成图片。

依赖管理

  • Python 部分用 uv;

  • 前端部分用 pnpm;

  • 两者结合实现了轻量级开发与部署。

怎么用?(详细部署流程)

作者还没发布 Docker 镜像,但本地搭建很简单。

第一步:准备环境

你需要:

  • Python 3.11 或更高版本;

  • Node.js 18 或更高;

  • 安装好 pnpm 和 uv。

第二步:克隆项目

git clone https://github.com/HisMax/RedInk.git
cd RedInk

第三步:配置 AI 服务

复制配置模板:

cp text_providers.yaml.example text_providers.yaml
cp image_providers.yaml.example image_providers.yaml

然后编辑文件:

  • 在 text_providers.yaml 填入你的 Gemini 或 OpenAI 的 API Key;

  • 在 image_providers.yaml 填入你的图像生成 API(可以用 Gemini Image 或 DALL·E 3)。

第四步:安装依赖

uv sync
cd frontend
pnpm install

第五步:启动后端

uv run python -m backend.app
# 默认运行在 http://localhost:12398

第六步:启动前端

cd frontend
pnpm dev
# 打开 http://localhost:5173

打开浏览器后,你会看到一个非常简洁的 Web 界面:
输入一句话、点“生成”,几秒后整个图文内容就会出现。

使用体验

生成流程非常清晰:

  1. 输入主题;

  2. 系统自动生成 6~9 页大纲;

  3. 用户可手动调整或修改文字;

  4. 点击“生成图片”;

  5. 实时查看生成进度;

  6. 下载全部图片,一键导出。

图片的风格统一、配色协调、文字布局干净,非常适合直接用于社交媒体发布。

配置和参数(理解一下)

RedInk 可以用两种方式配置:
① Web 页面设置(推荐,界面可视化操作);
② YAML 文件手动配置(开发者用)。

  • 你可以选择使用哪个模型(Gemini / OpenAI)。

  • 可以控制生成并发(一次生成几张图)。

  • 支持同时生成文字 + 图片。

  • 如果你的 API 限制调用频率(比如 GCP 免费账户),可以关闭并发。

并发生成越高,生成越快,但 API 压力也越大。

注意事项

  • 免费的 Gemini 试用账号不适合开启高并发,否则可能报错;

  • 生成图片时页面不要关闭;

  • 图片生成需要几秒钟时间;

  • 如果出现错误,可以在终端查看日志。

项目进展与更新

最新版本(v1.1.0)更新了不少功能:

  • 新增 Web 界面配置(不用手改配置文件了);

  • 新增 高并发模式 开关;

  • API Key 会自动脱敏显示,保护安全;

  • 支持配置实时保存;

  • 优化图片加载性能,修复了部分 500 错误。

未来计划包括:

  • 支持更多输出格式(PDF、长图等);

  • 支持“一句话生成整套 PPT”;

  • 改进历史记录与模板系统。

版权与授权

RedInk 采用 CC BY-NC-SA 4.0 协议:

  • 允许学习、研究、个人使用;

  • 不允许商业使用;

  • 修改后的项目也必须继续开源。

如果你想商用(例如在你的 SaaS 产品中提供图文生成功能),
需要联系作者购买商业授权。

GitHub:https://github.com/HisMax/RedInk

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:RedInk:基于 Nano Banana Pro的开源小红书图文生成器
#RedInk #小红书图文 #Nano Banana Pro 
收藏 1
手把手教你零基础上手 Google Antigravity Agent 编辑器操作教程
OpenNana提示词图库:540 个Nano Banana提示词案例库
推荐阅读
  • Superpowers:用系统化流程让 AI 编码代理更懂你的需求,这套 Superpowers 值得装
  • mcp-use:全栈MCP框架,6行代码接入任意MCP服务器
  • GitNexus:零服务器代码知识图谱引擎,Graph RAG 让 AI 真正读懂代码
  • LocalAI:不花钱、不断网、不怕泄密,把 AI 大模型装进你的本地服务器!
  • Three.js Skills 发布:教 AI 正确写 Three.js,0 门槛上手
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9241 7月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
8752 8月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
6751 4月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
6213 3月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6043 8月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
5899 8月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
5739 7月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5517 8月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5427 7月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
5328 7月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Dexter:金融界的 Claude Code,开源 AI 金融研究 Agent
2 AiToEarn:开源免费的多平台内容分发工具,支持12个社交平台一键发布
3 GPT-Image-2 黄金搭档:chatgpt2api + 提示词库,批量出图工作流全解析
4 EverOS:给 AI 装上自我进化的记忆,Claude Code 插件开源
5 Semble:专为 Agent 打造的代码搜索工具,索引快 218 倍节省 98% Token
6 academic-research-skills:Claude Code 学术研究插件,10 阶段 40+ Agent 全流程辅助论文写作
7 ClawVault开源项目解析:1.2K Star的AI Agent安全防护工具,权限管控+实时告警+自然语言策略
8 OpenHuman:开源AI助手接入118个服务,自带记忆树和Obsidian同步
9 vphone-cli:在 Mac 上运行完整 iOS 26,开源 48 小时 6400+ Star
10 Clawd 开源桌宠:用一只小螃蟹实时监控你的 AI 编程助手
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联