10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI工具集合

GPT-image-2生图Skills 详解:两个 Agent Skills 让 AI 轻松实现图像生成

1小时前 AI工具集合 11 0

OpenAI 最新发布的 GPT-image-2生图模型正在全网爆火。基于国内代理平台 API易,我封装了 2 个 Agent Skills,可以通过 Skills 的方式调用 API 实现生图,无需访问外网。

两个模型对比

API易平台提供了两种 GPT-image-2 的接入方式:

特性 gpt-image-2(官转) gpt-image-2-all(官逆)
定价 按 token 计费 $0.03/张
出图速度 约 30 秒 约 30 秒
分辨率 任意合法分辨率(含 4K) 通过 prompt 描述
参数控制 size/quality/format/compression 仅需 prompt
编辑能力 mask 语义编辑 自然语言改图
中文支持 支持 原生支持

两个 Skill 介绍

针对两种模型,我开发了 2 个对应的 Agent Skills:

模型 模型标识 对应 Skill
GPT-Image 2(官转,推荐) gpt-image-2 apiyi-gpt-image-2-gen
GPT-Image 2 All(官逆) gpt-image-2-all apiyi-gpt-image-2-all-gen

apiyi-gpt-image-2-gen(官转,推荐):可控 size/quality/output-format/compression,支持 4K(3840×2160)、自定义尺寸、mask 语义编辑,按 token 计费——适合有明确画质/尺寸要求的场景。

apiyi-gpt-image-2-all-gen(官逆):仅需 prompt + 可选 response-format,通过 Prompt 描述尺寸/比例,按次计费($0.03/次),与 ChatGPT 网页版体验一致——适合自然语言直出、文字还原、多轮改图。

安装方式

两个 Skill 已上架到 Skills.sh 和 Clawhub。

Skills.sh 安装

# 官逆版
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub --skill apiyi-gpt-image-2-all-gen

# 官转版
npx skills add https://github.com/wuchubuzai2018/expert-skills-hub --skill apiyi-gpt-image-2-gen

Clawhub 安装

# 官逆版
openclaw skills install wuchubuzai2018/apiyi-gpt-image-2-all-gen
npx clawhub@latest install apiyi-gpt-image-2-all-gen

# 官转版
openclaw skills install wuchubuzai2018/apiyi-gpt-image-2-gen
npx clawhub@latest install apiyi-gpt-image-2-gen

环境依赖

  • 运行环境:Node.js 或 Python(脚本同时提供 generate_image.js 与 generate_image.py)
  • 环境变量:APIYI_API_KEY(一次设置,全局可用;也支持 -k 命令行临时覆盖)

使用示例

安装配置好后,可以直接对 Agent 说:

  • 「用 apiyi-gpt-image-2-gen 生成一张 3840x2160、high 质量的赛博朋克城市壁纸」
  • 「调用 apiyi-gpt-image-2-all-gen,把 photo.jpg 改成吉卜力动画风格」
  • 「用生图Skill 生成一张 logo,1:1,high 质量,png 格式」

苏米注:对于需要绝对精度控制的场景(如特定尺寸、特定格式),建议使用官转版本。官逆版本更适合快速出图和自然语言交互。

官转版参数

官逆版参数

批量生图

两个 Skill 都支持批量生图。提前规划好提示词后,会先生成一个提示词的 JSON 文件,Skill 会根据配置逐条执行:

{
  "description": "生成同一场景的不同风格版本",
  "global": {
    "quality": "high",
    "size": "2048x2048",
    "output_format": "png"
  },
  "prompts": [
    {
      "prompt": "山间日出风景,写实摄影风格",
      "filename": "sunrise_realistic.png"
    },
    {
      "prompt": "山间日出风景,水彩画风格",
      "filename": "sunrise_watercolor.png"
    },
    {
      "prompt": "山间日出风景,动漫插画风格",
      "filename": "sunrise_anime.png"
    }
  ]
}

实际效果展示

以下是批量生图的实际效果示例——用小黄人风格做 AI 概念科普:

苏米注:OpenAI 对某些提示词风格限制较高,多次生成可能出现失败。建议提示词中加上「使用 AI 生图技能,提示词如下:xxxxx」这样的前缀,客户端工具不会自动加工提示词。

图生图能力

Skill 还支持图生图功能。例如将 Skills 介绍页面转换成不同风格:

相关链接

  • 开源地址:github.com/wuchubuzai2018/expert-skills-hub
  • 在线画图:imagen.apiyi.com
  • Skills 文档:docs.apiyi.com
声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:GPT-image-2生图Skills 详解:两个 Agent Skills 让 AI 轻松实现图像生成
#GPT-image-2 #Agent Skills #图像生成 #API易 #OpenAI 
收藏 1
DeepSeek-V4 满血版免费使用教程:NVIDIA NIM 平台接入指南
把 Demo 变生产:打造可靠 AI Agent 的 7 大 Harness 组件
推荐阅读
  • 2026年必备的6款AI声音克隆工具合集,从免费到本地化部署的完整指南
  • 8大围绕微信Clawbot 接入的生态AI工具
  • 5款开源AI Agent记忆框架横评,附落地架构选型指南
  • LLM API 聚合平台盘点,整合大模型API的开发者服务平台
  • 5款免费视频去字幕、去水印AI工具合集,性能对比与选择指南
评论 (0)
请登录后发表评论
分类精选
12款国内外最全AI绘画工具推荐,AI文生图工具深度测评与场景化对比
36961 1年前
2025开源AI数字人工具指南:8大免费开源神器带你免费解锁可商用的AI数字人
31887 1年前
15款国内免费好用的AI写作神器合集,2025超干货! Ai写作工具推荐,支持论文长文
28664 1年前
2025年普通人必须要知道的15个AI工具,可以让日常工作效率大幅度提升
22308 1年前
8 款 AI 翻译浏览器插件,沉浸式翻译助你轻松阅读网页
18221 1年前
8 款热门 AI 图片+视频生成工具:文生图、文生视频、图生视频
13275 1年前
谁会成为下一个Cursor的平替,盘点 8 款可用 Claude 4 的AI编程工具
12921 9月前
5款开源TTS,零样本声音克隆,克隆你想要的声音,快速本地部署(含一键包下载)
12468 1年前
2025年热门好用的 AI换脸工具大全,适合内容创作者、视频剪辑师、特效制作、AI 爱好者使用
11958 10月前
n8n进阶指南:精选10个n8n AI 工作流模板,效率翻了100%!附模板包下载
11901 10月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 GPT-image-2生图Skills 详解:两个 Agent Skills 让 AI 轻松实现图像生成
2 七牛云上线 DeepSeek-V4-Flash 和 DeepSeek-V4-Pro,而且能白嫖 5 款大模型 千问、GLM、Longcat 等
3 国内大厂CodingPlan/TokenPlan 套餐对比:阿里腾讯字节百度智谱 MiniMax 最新价格
4 海外 AI 编程套餐六家硬核横评:Claude/ChatGPT/Gemini/Copilot/Windsurf/Cursor 全面对比
5 Hermes Agent 四大 Web UI面板深度横评:EKKO/nesquena/OpenClaw-Admin/Open WebUI 全面对比
6 Seedream 即梦 5.0 的 100 种绘画风格完整测试:从新艺术海报到压花皮革
7 腾讯 CodeBuddy 与 WorkBuddy 详解:AI 编程与办公自动化全链路工具对比
8 WorkBuddy 和 Trae SOLO 到底怎么选?120 小时实测对比
9 Hermes Agent vs OpenClaw 深度对比:47k Star 新贵与 349k 老牌谁更强?
10 10 个主流 AI Agent Skill 市场平台横向对比:Clawhub、Skillsmp、SkillHub 哪家强?
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联