AI开源项目

关注最新的AI开源项目,AI智能体开源、AI大模型开源、Github开源工具等

Wan2.2-Animate:一键生成角色动画与视频替换的开源神器
最近阿里开源的 Wan2.2-Animate 在社交平台已经玩疯了,堪称是nano-banana的视频生成版,为什么这么说呢,因为人物角色的一致性! 就是说可以实现统一的角色动画和替换模型,能够完整复制动作和表情。 并且它们发布了模型权重和…
AIClient-2-API:一键把所有AI接口转成OpenAI标准格式
最近在折腾各种AI工具的时候,我发现了一个非常实用的开源项目:AIClient-2-API。 作为一个产品经理,我经常需要在不同的AI模型之间切换:Claude、Gemini、Qwen Code……每家厂商都有自…
FireRedTTS-2:开源多语言多人对话 TTS,支持零样本语音克隆
我一直在关注TTS(Text-to-Speech)的发展,像之前分享的index-TTS2,已经是非常大的突破了。 但随着播客、虚拟角色、智能客服和多模态聊天机器人的普及,对话式语音生成的需求越来越强烈。 但市面上不少方案依然存在两个痛点:…
FluentRead:开源浏览器翻译插件,轻松实现沉浸式阅读体验
今天推荐的这款开源神器 FluentRead,堪称沉浸式翻译的开源平替版,它不仅能实现快速翻译,还拥有出色的隐私保护功能,让你能在浏览网页时畅享无缝的多语言体验。 FluentRead是什么? FluentRead是一款专为多语言阅读需求…
MemFree:集成知识库与互联网的多模态的开源 AI 搜索引擎
作为一名产品经理,我时常面对信息过载和工作中的多任务挑战。 在这个充斥着各类文档、书签和网页内容的世界里,如何高效地找到所需的信息、管理和应用这些知识,成为了我日常工作的一大难题。 最近,我发现了一个颇具创新性的开源项目—&md…
VideoCaptioner:给视频秒加双语字幕,还能自动翻译的开源神器
平时我在体验AI工具时,经常会遇到这样一个场景:明明能听懂视频里的内容,但没有字幕的时候,总觉得少了点“安全感”。尤其是当面对外语视频时,即便听力还不错,长时间盯着没有字幕的内容,依然会感到吃力。 最近我发现了一款特…
Aser:轻量级模块化 AI Agent 框架,连接 Web3 与智能体的桥梁
来自L友的推荐,支持一下! Aser,它不仅是一个极简、模块化的 AI Agent 框架,还天然支持 Web3 和链上应用的对接。对我来说,这是一个很有代表性的“AI + Onchain”探索。 项目介绍 Aser …
AstrBot:一站式多平台智能聊天机器人框架,让开发者专注对话体验
在AI大模型还没流行的时候,我就一直在折腾各种智能客服和群聊机器人,踩过的坑数不胜数。 每换一个平台就要重新适配接口文档,写一堆重复的 if/else;大模型一升级,原来的 prompt 全部要重写;日志分散在不同服务器,排查一次问题就像&…
Codexia:开源桌面级 AI 编程助手,搭配GPT-5-Codex让你的开发效率瞬间开挂
从 GitHub Copilot,到后起之秀 Cursor、Claude Code。但它们大多只是编辑器内的智能补全,在完整的开发体验上,总让我觉得少了点什么。现在GPT-5-Codex来了! 最近我发现了一个开源项目 Codexia,它让…
Bytebot:开源AI桌面代理(Desktop Agent),给AI配一台自己的电脑
最近我刷到一个非常有意思的开源项目 —— Bytebot。说白了,它就是给AI装了一台属于它的“虚拟电脑”,然后让它像一个虚拟员工一样替你处理各种任务。 我第一反应是:这东西跟平时看到的&ld…