#Omni

Omnigent:Databricks 开源的多 Agent 管理平台,5 天获 3000 Star
AI 编程已经进入下半场。现在的焦点不再仅仅是拥有一个 Agent,而是如何高效管理越来越多的 Agent。 Claude Code 负责写代码,Codex 查资料,Cursor 改项目。表面上效率翻倍,实际上开发者每天都在不同窗口间切换。…
OmniVoice Studio:免费开源AI语音生成工具,3秒克隆音色+视频自动配音
OmniVoice Studio 是一款完全开源、完全本地运行的 AI 语音工具,支持 646 种语言,4GB 内存即可运行,自带视频自动配音和 MCP 协议支持。 简单讲,它是一个本地语音工作站,集语音克隆、声音设计、视频翻配、实时听写于…
MinerU2.5-Pro 发布:1.2B 参数开源文档解析模型,OmniDocBench 得分 95.69 超越 Gemini 3 Pro
近期,OpenDataLab 团队发布了最新的文档解析模型(PDF-to-Markdown)——MinerU2.5-Pro。该模型实现了"小尺寸,高精度"。模型参数量仅有 1.2B,但在权威 OmniDocBench…
OmniVoice Studio:本地运行的开源 AI 声音克隆和视频配音工具
OmniVoice Studio:本地运行的开源 AI 声音克隆工具 OmniVoice Studio 是一个开源的 ElevenLabs 替代方案,支持实时听写、零样本语音克隆、视频配音,并且可以在桌面端本地运行。 对经常做视频、播客、课…
MiniCPM-o 4.5 技术报告解读:9B 全双工全模态模型,25 万下载量的端侧 AI 实现
面壁智能联合 OpenBMB、清华大学正式发布 MiniCPM-o 4.5 技术报告,首次公开 Omni-Flow 流式全模态框架核心技术。该模型自 2026 年 2 月发布以来,Hugging Face 下载量突破 25 万+,以 9B …
OmniBox:开源AI知识管理系统,让你的收藏夹不再吃灰!
作为一名长期体验各类AI产品的产品经理,我发现大多数用户都面临同一个痛点:信息收集容易,但知识沉淀困难。 浏览器书签、收藏夹、云盘文件散落四处,需要时却很难快速检索和利用。 今天介绍的OmniBox正是为解决这一问题而设计的开源知识管理系统…
LongCat-Flash-Omni 正式发布并开源:开启全模态实时交互时代
美团正式发布 LongCat-Flash 系列模型,现已开源 LongCat-Flash-Chat 和 LongCat-Flash-Thinking 两大版本,获得了开发者的关注。 今天 LongCat-Flash 系列再升级,正式发布全新…
字节又出狠活:免费开源的 DreamOmni2,让图像编辑变成一句话的事
字节推出新图像编辑器 DreamOmni2:免费、开源、本地可运行,够不够狠!!! 如果你以为这只是又一个“AI 画图工具”,那你真的低估了它。 我第一次上手时,感受更像是在和一个懂我语言的设计助手对话。 我随口输…
即梦悄悄上线数字人新模型OmniHuman 1.5,会跑会跳,能唱能演,还能变脸
即梦全新影视级数字人「OmniHuman 1.5」上线一段时间了!大家的关注点可能都在即梦生图4.0上,其实AI视频生成也是“王炸”! 这款基于单张图像和音频的多模态数字人方案,凭借双人场景生成、超长视频连贯性、情…
OmniAvatar:阿里又放了个大招!一张照片就能生成能说会跳的数字人
由阿里巴巴夸克团队于2025年6月开源的音频驱动全身视频生成模型OmniAvatar来炸场了! 炸在哪?3 步让照片开口说话,虚拟人制作成本暴跌 92%! 说实话,数字人、虚拟人这类产品咱们见得不少了,但要么制作成本高得吓人,要么就是效果僵…