#RAG

Meta宣布彻底解决RAG最大痛点:速度提升30倍,上下文窗口暴增16倍,成本直接腰斩!
大家有没有这种感觉: 明明只想让大模型看10段资料,它偏偏要硬塞100段,消耗的token数像火箭一样增长,速度还慢得像乌龟? 恭喜你,这个行业通病,Meta今天直接给治好了。 他们刚开源了一个叫 REFRAG 的新 …
UltraRAG:基于 MCP 协议的 RAG 框架,用 YAML 配置替代代码编写
最近在梳理 RAG 相关的开源项目时,发现了一个来自清华 THUNLP、东北大学 NEUIR 等机构联合推出的项目——UltraRAG。 它采用了一种相对创新的架构思路:将 RAG 系统的核心组件标准化为 MCP …
RAG 入门课:什么是检索增强生成?大模型为什么离不开它?
本文旨在用通俗易懂的方式解释 RAG(Retrieval Augmented Generation)是什么、为什么需要它,以及如何在实际工具(如 Cherry Studio)中“看到” RAG 的全流程。 1 什么是…
Text-to-SQL聊天机器人实战:用RAG、LangChain和Streamlit搭建了一个“数据库分析师”
在日常的产品或数据工作中,我经常会遇到这样的场景: 会议上,业务方抛来一句话 “上个月新增的客户有哪些?”而数据分析师的第一反应是打开SQL编辑器,手动去查表、写查询、调语法。 这时我就在想,如果AI能“…
LlamaIndex:5 行代码把私有数据变成超级大脑(入门与实践指南)
最近我在折腾各种 AI 开源工具时,重新关注到 LlamaIndex。如果你也在尝试把 ChatGPT 或 Claude 接入自己的业务数据,可能已经踩过不少坑: ChatGPT 再聪明,它也不了解你公司内部的数据库、Notion 笔记…
MirageLSD:AI视频革命,40毫秒延迟,这真的是“直播界的Sora”吗?
相较于 Open AI 的 Agent 发布,我觉得昨晚最重要的发布的这个才是真的爆! 堪称AI视频领域的“核武器”:Decart发布MirageLSD:AI,实时直播40毫秒延迟,这下直播业和游戏业或遭降…
RAGFlow:快速搭建一个能读懂公司文档的智能助手,不止是Chat机器人
RAGFlow 这个开源 RAG 引擎能让你的知识库活起来,现在已经获得接近 60K 的 Star了。它是为个人或企业准备的 RAG 工作流神器, 今天苏米就大家了解RAGFlow这个神器,看看它是如何让AI变得更靠谱,让我们的文档管理和…
Mirage:音频转视频AI工具,快速生成虚拟角色视频
Mirage是Captions推出的一款基于自研全模态基础模型的ai视频生成工具,能根据音频、文本、图像等输入,快速生成有真实情感和动作的虚拟角色视频。Mirage Studio提供自定义虚拟演员、将图片转化为演员、细腻情感表达、逼真皮肤…
Fragment AI:AI有声读物APP,输入一个问题或主题立即制作3-5分钟的有声读物
Fragment AI 是一款能够将任何主题快速转换为简短音频的工具。它可以帮助您快速了解感兴趣的主题,节省您的时间。只需输入主题或问题,即可获得5分钟左右的音频内容。 Fragment AI功能 快速音频摘要:只需输入主题或问题,即可…
全面拆解:四大LLM应用平台深度对比!Dify、Coze、FastGPT、RAGFlow谁更适合你?
前面苏米分享过一篇文章里面介绍过字节跳动的扣子(Coze),目前也属于是可以白嫖的AI资源,优点也提到过可以自定义AI机器人,创建工作流,添加插件,与国内应用对接,具有丰富的应用场景。 最近苏米深度体验了市面上几个主流的LLM应用平台,包括…