#RAG
LLM Wiki:AI 时代知识管理的下一个范式
"最近我发现一件非常有用的事情:用 LLM 来为自己感兴趣的研究主题构建个人知识库。这样一来,我最近大部分的 token 消耗,不再是用来「操作代码」,而是用来「操作知识」。"
这是 Andrej Karpathy—&mdash…
OpenDataLoader PDF 开源项目:PDF 解析精度 0.90 领先同类,支持本地/Hybrid 双模式
OpenDataLoader PDF:开源 PDF 解析新方案,综合精度 0.90 领先同类工具
在构建 RAG(检索增强生成)应用时,PDF 文件解析是一个关键挑战。多栏论文读取顺序混乱、表格变成乱码、数学公式丢失、扫描版 PDF 无…
AI总答非所问?八成是你的知识库在拖后腿,RAG构建实战指南
作为一名长期在一线打磨AI产品的产品经理,我见过太多“模型背锅”的场景:用户问房贷提前还款规则,AI一本正经地给出错误利率;政策刚更新,AI却还在引用去年的条款;客服明明每天在迭代FAQ,AI却像没听说过一样。
这些…
手把手教你将本地RAGFlow转变为远程服务,共享本地RAGFlow知识库
为了数据隐私与安全我们经常面临一个现实问题:需要一个稳定、安全的知识库系统,但动辄数万元的AI服务器让人望而却步。
直到我自己动手用Cloudflare Tunnel + Windows服务搭建了一套私有化部署方案后,才意识到:有些看起来"…
Meta宣布彻底解决RAG最大痛点:速度提升30倍,上下文窗口暴增16倍,成本直接腰斩!
大家有没有这种感觉: 明明只想让大模型看10段资料,它偏偏要硬塞100段,消耗的token数像火箭一样增长,速度还慢得像乌龟?
恭喜你,这个行业通病,Meta今天直接给治好了。
他们刚开源了一个叫 REFRAG 的新 …
UltraRAG:基于 MCP 协议的 RAG 框架,用 YAML 配置替代代码编写
最近在梳理 RAG 相关的开源项目时,发现了一个来自清华 THUNLP、东北大学 NEUIR 等机构联合推出的项目——UltraRAG。
它采用了一种相对创新的架构思路:将 RAG 系统的核心组件标准化为 MCP …
RAG 入门课:什么是检索增强生成?大模型为什么离不开它?
本文旨在用通俗易懂的方式解释 RAG(Retrieval Augmented Generation)是什么、为什么需要它,以及如何在实际工具(如 Cherry Studio)中“看到” RAG 的全流程。
1 什么是…
Text-to-SQL聊天机器人实战:用RAG、LangChain和Streamlit搭建了一个“数据库分析师”
在日常的产品或数据工作中,我经常会遇到这样的场景:
会议上,业务方抛来一句话 “上个月新增的客户有哪些?”而数据分析师的第一反应是打开SQL编辑器,手动去查表、写查询、调语法。
这时我就在想,如果AI能“…
LlamaIndex:5 行代码把私有数据变成超级大脑(入门与实践指南)
最近我在折腾各种 AI 开源工具时,重新关注到 LlamaIndex。如果你也在尝试把 ChatGPT 或 Claude 接入自己的业务数据,可能已经踩过不少坑:
ChatGPT 再聪明,它也不了解你公司内部的数据库、Notion 笔记…
MirageLSD:AI视频革命,40毫秒延迟,这真的是“直播界的Sora”吗?
相较于 Open AI 的 Agent 发布,我觉得昨晚最重要的发布的这个才是真的爆!
堪称AI视频领域的“核武器”:Decart发布MirageLSD:AI,实时直播40毫秒延迟,这下直播业和游戏业或遭降…