AI开源项目

关注最新的AI开源项目,AI智能体开源、AI大模型开源、Github开源工具等

FireRedTTS-2:开源多语言多人对话 TTS,支持零样本语音克隆
我一直在关注TTS(Text-to-Speech)的发展,像之前分享的index-TTS2,已经是非常大的突破了。 但随着播客、虚拟角色、智能客服和多模态聊天机器人的普及,对话式语音生成的需求越来越强烈。 但市面上不少方案依然存在两个痛点:…
FluentRead:开源浏览器翻译插件,轻松实现沉浸式阅读体验
今天推荐的这款开源神器 FluentRead,堪称沉浸式翻译的开源平替版,它不仅能实现快速翻译,还拥有出色的隐私保护功能,让你能在浏览网页时畅享无缝的多语言体验。 FluentRead是什么? FluentRead是一款专为多语言阅读需求…
MemFree:集成知识库与互联网的多模态的开源 AI 搜索引擎
作为一名产品经理,我时常面对信息过载和工作中的多任务挑战。 在这个充斥着各类文档、书签和网页内容的世界里,如何高效地找到所需的信息、管理和应用这些知识,成为了我日常工作的一大难题。 最近,我发现了一个颇具创新性的开源项目—&md…
VideoCaptioner:给视频秒加双语字幕,还能自动翻译的开源神器
平时我在体验AI工具时,经常会遇到这样一个场景:明明能听懂视频里的内容,但没有字幕的时候,总觉得少了点“安全感”。尤其是当面对外语视频时,即便听力还不错,长时间盯着没有字幕的内容,依然会感到吃力。 最近我发现了一款特…
Aser:轻量级模块化 AI Agent 框架,连接 Web3 与智能体的桥梁
来自L友的推荐,支持一下! Aser,它不仅是一个极简、模块化的 AI Agent 框架,还天然支持 Web3 和链上应用的对接。对我来说,这是一个很有代表性的“AI + Onchain”探索。 项目介绍 Aser …
AstrBot:一站式多平台智能聊天机器人框架,让开发者专注对话体验
在AI大模型还没流行的时候,我就一直在折腾各种智能客服和群聊机器人,踩过的坑数不胜数。 每换一个平台就要重新适配接口文档,写一堆重复的 if/else;大模型一升级,原来的 prompt 全部要重写;日志分散在不同服务器,排查一次问题就像&…
Codexia:开源桌面级 AI 编程助手,搭配GPT-5-Codex让你的开发效率瞬间开挂
从 GitHub Copilot,到后起之秀 Cursor、Claude Code。但它们大多只是编辑器内的智能补全,在完整的开发体验上,总让我觉得少了点什么。现在GPT-5-Codex来了! 最近我发现了一个开源项目 Codexia,它让…
Bytebot:开源AI桌面代理(Desktop Agent),给AI配一台自己的电脑
最近我刷到一个非常有意思的开源项目 —— Bytebot。说白了,它就是给AI装了一台属于它的“虚拟电脑”,然后让它像一个虚拟员工一样替你处理各种任务。 我第一反应是:这东西跟平时看到的&ld…
VoxCPM:开源声音克隆TTS神器,0.5B 逼真的语音克隆
最近我刷开源项目时,看到面壁团队(OpenBMB)放出了一个非常炸裂的开源工具 VoxCPM:一款 无需分词器的端到端语音生成(Tokenizer-Free TTS)模型,主打两个能力: 上下文感知的自然语音生成和逼真的零样本声音克隆 Vo…
TEN Framework:几分钟就能搭建Voice Agent 的AI 语音框架,开源GitHub 热榜第一
在过去两年,AI 大模型的浪潮让大家习惯了和 AI 用文字对话——写报告、写代码、甚至头脑风暴。但如果我们把视角放到更真实的场景,其实人类最自然、最高效的交流方式,依然是语音。每天有数十亿人通过说话产生信息,这些数据…