但最近重新体验了 Khoj,它的定位比传统的知识库助手更广:不仅是检索工具,也逐渐演化成“可扩展的个人 AI 平台”。
作为一个 Star 32K 的成熟开源项目,Khoj 的能力覆盖本地文档、在线搜索、智能代理、自动化任务等多个维度,对于需要管理大量信息、或想搭建私有化 AI 系统的用户来说,它的适配面更宽。
项目简介
Khoj 在印地语中意为“搜索 / 探索”,产品定位非常直接:帮助用户用自然语言查找资料、管理知识、执行任务。

项目有两个核心特点:
-
可离线运行:支持本地部署和本地模型,私有化程度高。
-
可扩展性强:从个人文件检索到在线搜索、代理系统、自动化任务,功能组合弹性很高。
你可以把它理解为一个“可自定义的 AI 查询层”,覆盖文档、图片、网页、本地模型、在线模型。
核心功能梳理

1)文档检索与 AI 问答
-
支持解析 Markdown、PDF、Word、Notion、Org-mode 等多种格式
-
自动构建向量数据库
-
提问时结合语义搜索与上下文生成答案
-
支持本地模型(llama3、qwen 等)和云端模型(GPT、Claude、Gemini)
这是所有知识库类产品的基础能力,Khoj 重点在于其数据源覆盖更全且支持离线运行。
2)本地 + 在线双通道搜索
-
本地检索你的笔记、文档
-
在线搜索补充实时信息
-
回答中会展示引用来源,便于验证结果
适用于专业用户做深度调研或混合查询(本地知识 + 最新数据)。
3)Agents:可配置的多角色代理
Khoj 可以创建带有:
-
自定义系统提示
-
自定义知识库
-
自定义工具(浏览器、Python 执行等)
的 agent,并且支持多用户共享。
适合用来做:
-
写作助手
-
行业研究分析 agent
-
个人知识库问答 agent
它比单纯的“系统提示词”更接近一个持久的、可复用的小型角色系统。
4)Automations:自动化任务调度
这是 Khoj 的特色能力之一。
你可以设定:
-
每天 9 点抓取行业新闻 → 自动总结 → 发邮箱
-
每周定时分析你的文档更新 → 整理周报
-
定时查询某个数据源 → 输出报告
类似“AI 版 IFTTT + Cron”,适用于专业用户的周期性研究与内容生成任务。
5)代码执行(Python Sandbox)
在聊天中生成并执行 Python 代码,用来:
-
快速做数据分析
-
生成图表和统计结果
-
自动化计算任务
这是很多知识库产品不具备的能力,提升了其在分析类场景中的实用性。
6)多端访问能力
包括 Web、桌面端、移动端、WhatsApp、Obsidian、Emacs。
这对笔记用户或命令行用户来说非常友好。
7)图像生成、语音输入、共享对话
功能更多是锦上添花,强化了工具的交互能力,但不是其核心卖点。
哪些用户适合用 Khoj?
| 场景类型 | 说明 |
|---|---|
| 个人知识库管理 | 强调从本地文件构建“第二大脑”,适用于 Obsidian/Notion 用户 |
| 隐私敏感场景 | 本地模型 + 本地向量化,不依赖云服务 |
| 行业研究 / 内容创作 | 混合文档检索、在线搜索、自动化报告生成 |
| 技术用户的自定义系统 | Agents + Automations + 代码执行,能形成半自动化工作流 |
| 多端笔记用户 | Emacs / Obsidian 集成度高 |
相比普通知识库产品,Khoj 更适合想把 AI 融入日常生产流程的专业用户。
安装、部署与管理
部署方式
-
Docker(最常见)
-
本地安装(支持 Linux / macOS / Windows)
-
官方云端版本
部署步骤通常为:
git clone https://github.com/khoj-ai/khoj
docker compose up -d
随后访问浏览器,绑定模型与数据目录即可开始索引与聊天。

配置项包括:
-
选择使用的 LLM(本地/云端)
-
文档目录与同步方式
-
在线搜索开关
-
自动化任务频率
-
自定义 Agents 设置
UI 友好,非技术用户也能快速上手。
与同类开源项目的差异化对比
| 项目 | 核心定位 | 本地部署 | 自动化任务 | 多端支持 | Agent 系统 | 本地模型 |
|---|---|---|---|---|---|---|
| Khoj | 综合型“第二大脑 + 自动化平台” | ✔️ | ✔️ 强 | 强(浏览器/桌面/笔记工具) | ✔️ | ✔️ |
| AnythingLLM | 轻量级本地知识库聊天 | ✔️ | 一般 | 中 | 基础 | ✔️ |
| OpenWebUI | 前端聊天 UI | ✔️ | 一般 | 一般 | 插件式 | ✔️ |
| LlamaIndex | 数据接入 / 构建链路 | 需要二次开发 | ❌ | 弱 | 代码级 | ✔️ |
相比之下,Khoj 是功能最完整、落地性最强的“本地 AI 助手生态”。
一个简单的真实应用场景
我自己做的一项轻量自动化:
每天上午 9 点:
-
抓取 3 个科技媒体 RSS
-
总结成“技术趋势摘要”(约 300 字)
-
自动发到我的邮箱
配置不到 10 分钟,效果稳定,同时避免了大量重复的信息收集工作。

对于需要持续输入行业资讯的产品经理或独立开发者来说,这类自动化非常实用。
总结
从产品体验来看,Khoj 的优势主要有三点:
-
功能覆盖广:检索、聊天、在线搜索、自动化、代理都可用
-
完全开源可自托管:适用于隐私要求高的用户
-
可扩展性强:适合有技术背景、想构建自己工作流的人群
它不是那种“一键解决全部需求”的工具,而是一个可塑性很强的知识与任务处理平台。你可以从简单的“文档问答”开始用,逐步扩展到“多代理 + 自动化”的复杂系统。
如果你正在寻找一个可靠、私有化、可拓展的知识库 AI,Khoj 是值得实际部署体验的开源项目。
开源地址: