AI开源项目
关注最新的AI开源项目,AI智能体开源、AI大模型开源、Github开源工具等
FlyCut Caption:本地化开源智能视频多语言字幕识别与编辑工具
在日常工作中,我经常会接触到视频处理和字幕编辑。传统的视频剪辑工具虽然功能强大,但在“字幕生成 + 编辑 + 视频裁剪”这一完整链路上,总显得不够顺手。最近我发现了一个开源项目 —— FlyC…
MCPStore: 可视化MCP服务开源管理平台,轻松为你的Agent添加MCP能力
MCP快速发展,我们都想为现有的Agent添加MCP的能力,但是为Agent引入新工具通常需要编写大量重复的“胶水代码”,流程繁琐。
这款McpStore开源的可视化MCP服务管理平台,只需要三行代码就能为你的Age…
Wan2.2-Animate:一键生成角色动画与视频替换的开源神器
最近阿里开源的 Wan2.2-Animate 在社交平台已经玩疯了,堪称是nano-banana的视频生成版,为什么这么说呢,因为人物角色的一致性!
就是说可以实现统一的角色动画和替换模型,能够完整复制动作和表情。
并且它们发布了模型权重和…
AIClient-2-API:一键把所有AI接口转成OpenAI标准格式
最近在折腾各种AI工具的时候,我发现了一个非常实用的开源项目:AIClient-2-API。
作为一个产品经理,我经常需要在不同的AI模型之间切换:Claude、Gemini、Qwen Code……每家厂商都有自…
FireRedTTS-2:开源多语言多人对话 TTS,支持零样本语音克隆
我一直在关注TTS(Text-to-Speech)的发展,像之前分享的index-TTS2,已经是非常大的突破了。
但随着播客、虚拟角色、智能客服和多模态聊天机器人的普及,对话式语音生成的需求越来越强烈。
但市面上不少方案依然存在两个痛点:…
FluentRead:开源浏览器翻译插件,轻松实现沉浸式阅读体验
今天推荐的这款开源神器 FluentRead,堪称沉浸式翻译的开源平替版,它不仅能实现快速翻译,还拥有出色的隐私保护功能,让你能在浏览网页时畅享无缝的多语言体验。
FluentRead是什么?
FluentRead是一款专为多语言阅读需求…
MemFree:集成知识库与互联网的多模态的开源 AI 搜索引擎
作为一名产品经理,我时常面对信息过载和工作中的多任务挑战。
在这个充斥着各类文档、书签和网页内容的世界里,如何高效地找到所需的信息、管理和应用这些知识,成为了我日常工作的一大难题。
最近,我发现了一个颇具创新性的开源项目—&md…
VideoCaptioner:给视频秒加双语字幕,还能自动翻译的开源神器
平时我在体验AI工具时,经常会遇到这样一个场景:明明能听懂视频里的内容,但没有字幕的时候,总觉得少了点“安全感”。尤其是当面对外语视频时,即便听力还不错,长时间盯着没有字幕的内容,依然会感到吃力。
最近我发现了一款特…
Aser:轻量级模块化 AI Agent 框架,连接 Web3 与智能体的桥梁
来自L友的推荐,支持一下!
Aser,它不仅是一个极简、模块化的 AI Agent 框架,还天然支持 Web3 和链上应用的对接。对我来说,这是一个很有代表性的“AI + Onchain”探索。
项目介绍
Aser …
AstrBot:一站式多平台智能聊天机器人框架,让开发者专注对话体验
在AI大模型还没流行的时候,我就一直在折腾各种智能客服和群聊机器人,踩过的坑数不胜数。
每换一个平台就要重新适配接口文档,写一堆重复的 if/else;大模型一升级,原来的 prompt 全部要重写;日志分散在不同服务器,排查一次问题就像&…