10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

Headroom:AI Agent 上下文压缩工具,token 节省 60-95% 的开源方案

1小时前 AI开源项目 12 0

跑 Claude Code 改个稍大的项目,一个长任务下来几万 token 就没了。Codex 调试一段日志,光日志本身就把上下文吃掉一大半。更难受的是,这些 token 大部分都是垃圾信息——一百行 grep 结果里真正有用的就那三行,但模型得全读。日志里一大坨是无关的 INFO,可你不敢删,怕漏掉关键报错。

最近刷到一个叫 Headroom 的开源项目,给 AI Agent 装一层上下文压缩层,在所有内容送进 LLM 之前先压一遍。一段 10144 token 的内容,压完只剩 1260。

图片 1

Headroom 是什么

Headroom 是一个夹在 AI Agent 和 LLM 之间的中间层。你平时喂给模型的所有东西——工具输出、命令行结果、代码搜索结果、RAG 检索片段、文件内容、对话历史——在送进 LLM 之前,Headroom 会先拦下来压一遍。效果基本一样,但是 token 少了一大截。

图片 2

它有四种接入方式:

  • 库(Library):Python 或 TypeScript 里直接 compress(messages) 调用,几行代码接入
  • 代理(Proxy):headroom proxy --port 8787 起本地代理,零代码改动,任何 OpenAI 兼容客户端都能套用
  • Agent 包装:headroom wrap claude | codex | cursor | aider | copilot,主流编程 Agent 直接包住
  • MCP server:注册三个工具 headroom_compress、headroom_retrieve、headroom_stats,MCP 原生客户端直接用

图片 3

6 种压缩算法

Headroom 不靠一把锤子敲所有钉子。很多同类工具就是简单截断或用一个小模型统一压缩,而 Headroom 会先做内容路由,判断这块东西是 JSON、代码、日志还是自然语言,然后挑对的算法去压。

图片 4

目前内置了 6 种压缩方案:SmartCrusher 针对 JSON 的统计式压缩,节省 70-90%。CodeCompressor 基于语法树进行代码压缩,适用于 Python、JS、Go、Rust、Java、C++,保留 import、函数签名、类型信息,模型读压完的代码还能正确理解结构。

自然语言压缩方面,作者训练了 Kompress-v2-base 模型,用大量 agentic trace 训练,知道 Agent 场景下哪些话可以丢掉。

压了还能找回来

市面上所有压缩方案几乎都有同一个毛病:压完就没了。信息一旦被截掉或被摘要掉,模型万一发现关键信息丢了就没辙。Headroom 搞了个叫 CCR 的机制。

图片 5

原始数据本地存着,永远不删。压完的精简版送进 LLM,模型如果发现信息不够用,可以直接调 headroom_retrieve 工具把原文按需捞回来。这等于给模型装了个备忘录:日常对话用压缩版省钱,需要细节的时候再翻回原文。

图片 6

Headroom 覆盖所有容类型(工具、RAG、日志、文件、历史),数据全部留在本地,可逆。在覆盖范围、部署方式、本地化、可逆性四个维度上,Headroom 是唯一全部支持的。

压缩效果和准确性

代码搜索和 SRE 排查这种大量结构化噪声场景效果最猛,token 直接砍掉 9 成。代码库探索因为代码本身信息密度高,压缩空间小,但也有近一半节省。数学题零掉分,事实问答反而涨了 3 个点(可能是压缩后模型注意力更集中),工具调用保持 97%。

图片 7

省 token 不以牺牲答案质量为代价。

跨 Agent 记忆和自动学教训

除了压缩,Headroom 还有两个特别实用的功能。

跨 Agent 共享记忆:现在大家手上不止一个 Agent,Claude Code、Codex 等等,如果每个 Agent 各自学一遍项目背景,token 重复消耗。Headroom 搞了个本地 SQLite 加向量库的记忆层,Claude 和 Codex 之间共享同一份记忆,自动去重。Claude 学过的项目结构,Codex 直接拿来用,不用再读一遍。

headroom learn:让 Agent 自己总结教训。这个功能会扫描你跑失败的会话,分析哪里翻车了、为什么翻车,然后自动把约束调整规则写进 CLAUDE.md 或者 AGENTS.md。等于 Agent 在帮你维护规则文件,越用越聪明。

图片 8

快速上手

上手非常简单,三步:

# 1. 安装
pip install "headroom-ai[all]"          # Python
npm install headroom-ai                 # Node / TypeScript

# 2. 选一种接法
headroom wrap claude                    # 直接包住 Claude Code
headroom proxy --port 8787              # 起本地代理

# 3. 看省了多少
headroom perf

要求 Python 3.10+。如果不想本地装,还有 Docker 镜像:

docker pull ghcr.io/chopratejas/headroom:latest

在 token 还是 AI Coding 主要成本和瓶颈的当下,上下文压缩这件事很重要

Headroom 把它做成了一个本地、可逆、覆盖全内容类型的完整方案,接法灵活

加上跨 Agent 记忆和自动学教训这两个加分项,特别适合 AI Coding Agent 深度用户

开源地址:github.com/chopratejas/headroom

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Headroom:AI Agent 上下文压缩工具,token 节省 60-95% 的开源方案
#Headroom # AI Agent # token 优化 # 上下文压缩 # 开源项目 # Claude Code # Codex 
收藏 1
Taste Skill:反 AI 味前端框架,让 AI 编程助手生成专业级设计界面
百度 DuMate :系统级 AI 助手,跨软件自动化处理办公任务
推荐阅读
  • AgentCPM-Report:本地部署的超级写作智能体,让数据隐私与深度研究(DeepResearch)能力兼得
  • VoltAgent 开源 DESIGN.md 合集:50+ 顶级品牌设计系统,让 AI 生成一致 UI
  • Lingji Cut(灵剪):开源本地优先的 AI 视频全链路创作工作台
  • wechat-chatgpt:快速把国内外主流大模型无缝接入微信生态
  • LlamaIndex:5 行代码把私有数据变成超级大脑(入门与实践指南)
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9721 8月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
9716 9月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
7655 5月前
CapCut API:一个剪映API开源项目,让AI自动剪辑视频
6780 6月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
6755 4月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6656 9月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
6562 9月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
6540 8月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5866 9月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5819 8月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 Headroom:AI Agent 上下文压缩工具,token 节省 60-95% 的开源方案
2 Taste Skill:反 AI 味前端框架,让 AI 编程助手生成专业级设计界面
3 douyin 短视频运营开源工具:对标账号采集 + 多平台自动发布 + 内容拆解
4 Open File Viewer:支持 110 种文件格式的前端预览 SDK,兼容 Vue/React/Svelte
5 google-search-console-mcp 开源项目:用 MCP 连接 Search Console,AI 自动分析 SEO 数据
6 Omnigent:Databricks 开源的多 Agent 管理平台,5 天获 3000 Star
7 it-tools 开源工具箱:JSON 格式化、JWT 解析、编码转换,支持 Docker 自托管
8 JoyAI-Echo:京东开源长视频生成框架,角色一致性新突破
9 Seedance 2.0 Skill OS:AI 视频生成的制片人工作流,GitHub 开源项目解析
10 Ponytail:让 AI 代码减少 80% 的开源插件,2 天斩获 18000+ Star
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联