10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

screenshot-to-code:从截图到代码仅需 3 秒

7月前 AI开源项目 1213 0

在前端开发中,设计稿与代码之间的“断层”一直是高频痛点。

设计师提供的往往是 PNG 或 Figma 文件,而开发者则需要花费大量时间进行布局还原、像素微调和样式还原。这一环节既重复又低效。

最近我在体验一款开源项目 —— screenshot-to-code,它直接用大模型(Claude 3.7 / GPT-4o)来解决这个问题:

上传一张设计稿或截图,几秒内生成可运行的 HTML、React 或 Vue 代码。

这类项目其实不新鲜,但 screenshot-to-code 的实现方式更接近“生产可用”级别,值得开发者深入了解。

项目概述

维度 内容
项目名称 screenshot-to-code
开源协议 MIT
支持输入 图片、Figma 文件、屏幕录像
支持输出 HTML、React、Vue、Tailwind、Bootstrap、Ionic、SVG
模型支持 Claude Sonnet 3.7 / GPT-4o Vision
在线体验 screenshottocode.com(付费版)
本地部署 支持 Docker / Poetry / Node.js

该项目由开发者 abi 创建,核心逻辑是将视觉输入(截图、录屏)通过多模态模型解析为布局结构与样式描述,再生成对应技术栈的代码文件。

核心功能

1. 多模型双引擎

支持 Claude 3.7 与 GPT-4o 双模型切换,生成结果可直接对比,适合开发团队评估不同模型在视觉理解和代码生成上的差异。

2. 多技术栈输出

一次上传可生成多版本代码(如 React + Tailwind / Vue + Tailwind),便于团队根据现有前端架构直接集成。

3. 视频 → 可交互原型(实验功能)

通过录制网站交互视频,AI 能自动识别页面结构与状态变化,重建可点击原型。这在验证交互逻辑或复现竞品界面时尤其有用。

4. 本地 / 云端两种模式

本地运行:开发者可通过 Docker Compose 或 Poetry 本地部署,避免上传设计稿到外部服务器。

在线托管版:无需安装环境,直接上传截图体验出码效果。

5. Mock 模式

支持 MOCK=true 参数,模拟 AI 返回结果,方便测试前后端联调流程。

技术架构

模块 技术栈 功能说明
前端 React + Vite 实时预览、代码高亮、一键复制
后端 FastAPI + WebSocket 支持流式生成与实时反馈
AI 层 Claude 3.7 / GPT-4o Vision 图像理解与结构解析
图像生成 DALL·E 3 / Flux Schnell(可选) 生成补图或视觉增强
部署方式 Docker / Poetry / Yarn 适合个人与团队部署

这种架构使得项目兼具灵活性与可扩展性,开发者可以轻松替换模型接口或扩展输出模板。

安装与快速上手

本地运行(约 3 分钟)

git clone https://github.com/abi/screenshot-to-code.git
cd screenshot-to-code

后端启动

cd backend
echo "OPENAI_API_KEY=sk-xxx" > .env
echo "ANTHROPIC_API_KEY=your-key" >> .env
poetry install && poetry shell
poetry run uvicorn main:app --reload --port 7001

前端启动

cd ../frontend
yarn && yarn dev

打开浏览器访问:http://localhost:5173

Docker 一键启动

echo "OPENAI_API_KEY=sk-xxx" > .env
docker-compose up -d --build

默认访问地址:http://localhost:5173

应用场景

场景 使用方式 价值
快速验证设计稿 设计师导出 Figma 截图,AI 生成页面 验证视觉与响应式布局
低保真原型生成 上传竞品录屏生成原型 用于分析交互逻辑
教学与演示 将静态界面自动转成可运行代码 辅助教学、技术演示
前端组件复用 从截图中提取组件结构 快速搭建 UI 库原型

类似项目对比

项目 输入类型 输出格式 模型 部署方式 开源
screenshot-to-code 图片 / 视频 / Figma HTML / React / Vue Claude / GPT-4o 本地 & 云端 ✅
v0.dev 文本描述 React + Tailwind GPT-4 云端 ❌
Builder.io AI 设计稿 / 文本 React / JSX GPT-4 Vision 云端 ❌

相比 v0.dev 等云端工具,screenshot-to-code 最大的差异化在于 完全开源可部署,能用于企业内部环境或自定义模型接入。

总结

从截图生成代码并非新概念,但 screenshot-to-code 让这件事更接近落地使用:

它不依赖封闭平台,模型可替换,结果可验证,且部署方式灵活。

对前端开发者而言,它适合用于快速原型验证与UI 组件抽取;

对设计师或产品经理而言,它提供了一种低门槛的可视化到可执行路径。

虽然目前生成代码的质量仍需人工调整,但在“从视觉到可运行”这一链路上,这类工具的价值正不断放大。

项目地址:https://github.com/abi/screenshot-to-code

在线体验:https://screenshottocode.com

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:screenshot-to-code:从截图到代码仅需 3 秒
#screenshot-to-code #AI 生成页面 
收藏 1
AI Agent:工作方式的下一次重构,从工具到数字分身
Hugging Face 推出 GOLD:让不同模型家族也能做知识蒸馏
推荐阅读
  • Fun-CineForge:阿里开源的端到端电影配音系统,解决口型同步与多角色音色转换
  • Agent Reach:一句话让AI Agent免费上网的开源项目,赶紧集成到Skills
  • AiNiee:开源AI翻译工具,完美解决游戏、小说、字幕、文档的批量翻译
  • Superpowers:用系统化流程让 AI 编码代理更懂你的需求,这套 Superpowers 值得装
  • Google TimesFM 开源详解:1000 亿时间点预训练,零样本时间序列预测模型
评论 (0)
请登录后发表评论
分类精选
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
9731 9月前
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9723 8月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
7658 5月前
CapCut API:一个剪映API开源项目,让AI自动剪辑视频
6788 6月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
6763 4月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6663 9月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
6564 9月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
6545 8月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5871 9月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5821 8月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Headroom:AI Agent 上下文压缩工具,token 节省 60-95% 的开源方案
2 Taste Skill:反 AI 味前端框架,让 AI 编程助手生成专业级设计界面
3 douyin 短视频运营开源工具:对标账号采集 + 多平台自动发布 + 内容拆解
4 Open File Viewer:支持 110 种文件格式的前端预览 SDK,兼容 Vue/React/Svelte
5 google-search-console-mcp 开源项目:用 MCP 连接 Search Console,AI 自动分析 SEO 数据
6 Omnigent:Databricks 开源的多 Agent 管理平台,5 天获 3000 Star
7 it-tools 开源工具箱:JSON 格式化、JWT 解析、编码转换,支持 Docker 自托管
8 JoyAI-Echo:京东开源长视频生成框架,角色一致性新突破
9 Seedance 2.0 Skill OS:AI 视频生成的制片人工作流,GitHub 开源项目解析
10 Ponytail:让 AI 代码减少 80% 的开源插件,2 天斩获 18000+ Star
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联