10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

RedInk:基于 Nano Banana Pro的开源小红书图文生成器

7小时前 AI开源项目 41 0

RedInk 的核心目标是让用户仅通过一句自然语言描述(如“秋季显白美甲”),即可自动生成一整套 风格统一、排版清晰、可直接发布的小红书图文内容。

它解决了传统内容创作中:

  • 图文匹配不一致、封面风格不统一;

  • 内容撰写耗时长;

  • 设计门槛高;
    等问题。

一句话总结:

RedInk = “AI 自动撰稿 + AI 生成图片 + 封面设计 + 图文排版” 的一体化工具。

灵感来源?

作者最早灵感来自一个 Linux.do 社区帖子,
有人用“🍌Nano Banana Pro”(一个 AI 图像模型)来做 PPT。
他觉得:既然能自动生成 PPT,为什么不能生成小红书图文?

于是就诞生了 RedInk。

它的目标不是做“好玩”的东西,而是让:

内容创作变得像打字一样简单。

能做什么?

RedInk 让你可以:

  • 输入一个主题(例如“春季穿搭指南”);

  • 自动生成标题页 + 6 到 9 页的图文内容;

  • 每一页都带有风格一致的图片和说明;

  • 图片风格可以基于你的品牌或账号主页;

  • 可以上传参考图片,让生成风格保持一致;

  • 最后还能一键下载所有图片文件。

然后等待10-20秒后,就会有每一页的大纲,大家可以根据的自己的需求去调整页面顺序(不建议),自定义每一个页面的内容(这个很建议)

它会先生成封面,然后并发(同时)生成其他页面。

然后稍等一会儿后,会生成后面的所有页面(这里是并发生成的所有页面(最高25个),如果大家的API供应商无法支持高并发的话,记得要去改一下设置)

如果你的 API 支持高并发(比如 Google Gemini Pro 付费账号),生成速度会非常快(一次最多 25 张图一起生成)。

用到的 AI 技术

RedInk 是一个“图文双引擎”的系统。
它用两个模型分别负责不同部分:

  1. Gemini 3:生成文字内容(标题、描述、段落);

  2. 🍌Nano Banana Pro:生成配图(封面、背景、图像元素)。

这两个模型配合在一起,就能让输出既有“文案逻辑”,又有“视觉风格”。

技术架构(怎么搭起来的)

整个项目是前后端分离的。

后端部分

  • 用 Python 3.11+ 和 Flask 写的;

  • 负责调用 Gemini 或 OpenAI 的 API;

  • 管理任务队列、生成请求、并发控制。

前端部分

  • 用 Vue 3 + TypeScript + Vite;

  • 提供一个漂亮的 Web 界面;

  • 用户可以在网页里输入主题、编辑每一页文案、点击生成图片。

依赖管理

  • Python 部分用 uv;

  • 前端部分用 pnpm;

  • 两者结合实现了轻量级开发与部署。

怎么用?(详细部署流程)

作者还没发布 Docker 镜像,但本地搭建很简单。

第一步:准备环境

你需要:

  • Python 3.11 或更高版本;

  • Node.js 18 或更高;

  • 安装好 pnpm 和 uv。

第二步:克隆项目

git clone https://github.com/HisMax/RedInk.git
cd RedInk

第三步:配置 AI 服务

复制配置模板:

cp text_providers.yaml.example text_providers.yaml
cp image_providers.yaml.example image_providers.yaml

然后编辑文件:

  • 在 text_providers.yaml 填入你的 Gemini 或 OpenAI 的 API Key;

  • 在 image_providers.yaml 填入你的图像生成 API(可以用 Gemini Image 或 DALL·E 3)。

第四步:安装依赖

uv sync
cd frontend
pnpm install

第五步:启动后端

uv run python -m backend.app
# 默认运行在 http://localhost:12398

第六步:启动前端

cd frontend
pnpm dev
# 打开 http://localhost:5173

打开浏览器后,你会看到一个非常简洁的 Web 界面:
输入一句话、点“生成”,几秒后整个图文内容就会出现。

使用体验

生成流程非常清晰:

  1. 输入主题;

  2. 系统自动生成 6~9 页大纲;

  3. 用户可手动调整或修改文字;

  4. 点击“生成图片”;

  5. 实时查看生成进度;

  6. 下载全部图片,一键导出。

图片的风格统一、配色协调、文字布局干净,非常适合直接用于社交媒体发布。

配置和参数(理解一下)

RedInk 可以用两种方式配置:
① Web 页面设置(推荐,界面可视化操作);
② YAML 文件手动配置(开发者用)。

  • 你可以选择使用哪个模型(Gemini / OpenAI)。

  • 可以控制生成并发(一次生成几张图)。

  • 支持同时生成文字 + 图片。

  • 如果你的 API 限制调用频率(比如 GCP 免费账户),可以关闭并发。

并发生成越高,生成越快,但 API 压力也越大。

注意事项

  • 免费的 Gemini 试用账号不适合开启高并发,否则可能报错;

  • 生成图片时页面不要关闭;

  • 图片生成需要几秒钟时间;

  • 如果出现错误,可以在终端查看日志。

项目进展与更新

最新版本(v1.1.0)更新了不少功能:

  • 新增 Web 界面配置(不用手改配置文件了);

  • 新增 高并发模式 开关;

  • API Key 会自动脱敏显示,保护安全;

  • 支持配置实时保存;

  • 优化图片加载性能,修复了部分 500 错误。

未来计划包括:

  • 支持更多输出格式(PDF、长图等);

  • 支持“一句话生成整套 PPT”;

  • 改进历史记录与模板系统。

版权与授权

RedInk 采用 CC BY-NC-SA 4.0 协议:

  • 允许学习、研究、个人使用;

  • 不允许商业使用;

  • 修改后的项目也必须继续开源。

如果你想商用(例如在你的 SaaS 产品中提供图文生成功能),
需要联系作者购买商业授权。

GitHub:https://github.com/HisMax/RedInk

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:RedInk:基于 Nano Banana Pro的开源小红书图文生成器
#RedInk #小红书图文 #Nano Banana Pro 
收藏 1
手把手教你零基础上手 Google Antigravity Agent 编辑器操作教程
GLM-4.6 黑五Coding套餐,折上折!支持 Claude Code、Cline、OpenCode、Roo 代码等
推荐阅读
  • AstrBot:最强AI Agent聊天机器人平台横空出世,一键打通QQ/微信/飞书,主流模型随心配!
  • DocsGPT:给文档接入大模型秒变智能问答神器,让你告别翻文档的痛苦
  • RedInk:基于 Nano Banana Pro的开源小红书图文生成器
  • WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
  • mcp-use:全栈MCP框架,6行代码接入任意MCP服务器
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
5406 1月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
4202 1月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
3667 2月前
SpecKit:从想法到代码只需5步?这个开源框架把规范驱动开发变成了现实
3179 1月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
3001 3月前
SurfSense:私人AI研究助手,私有版的NotebookLM 和 Perplexity开源平替,
2962 1月前
KrillinAI:开源AI视频翻译配音工具,100种语言双向翻译,一键部署全流程
2805 1月前
Bytebot:开源AI桌面代理(Desktop Agent),给AI配一台自己的电脑
2175 2月前
FlyCut Caption:本地化开源智能视频多语言字幕识别与编辑工具
2148 2月前
NeuTTS Air:首个可离线运行的"拟人语音克隆”TTS模型
2132 1月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 RedInk:基于 Nano Banana Pro的开源小红书图文生成器
2 15套免费数据大屏模板开源项目:HTML原生构建,覆盖财务/电商/物流等主流行业
3 NOFX:这个开源项目可以从0到1构建AI量化交易系统,8000+ 开发者力挺的开源 AI 交易系统
4 HivisionIDPhotos:轻量级AI证件照生成工具,离线推理与多尺寸排版一体化方案
5 RuoYi AI | 一款基于 RuoYi 框架开发的AI平台,支持本地化 AI 能力,包括向量检索、知识图谱、数字人交互,AI 流程编排
6 Claude Skills 精选集:提升 AI 工作流效率的开源技能库解析
7 mcp-use:全栈MCP框架,6行代码接入任意MCP服务器
8 AstrBot:最强AI Agent聊天机器人平台横空出世,一键打通QQ/微信/飞书,主流模型随心配!
9 UltraRAG:基于 MCP 协议的 RAG 框架,用 YAML 配置替代代码编写
10 DocStrange:从PDF到Markdown的智能文档转换方案
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联