#模型
whichllm:本地跑大模型选模型神器
这两年开源模型从 Llama 到 Qwen,再到 Gemma,能力一点点逼近闭源模型。于是不少人开始动心思,想要在自己电脑上本地部署模型,试图解决高昂的 Token 费用。
但在 HuggingFace 上有上百多万个开源模型,参数量从 1…
Claude Code 免费接入 Qwen 3.6:讯飞模型白嫖完整教程
讯飞开放平台近期推出了一个活动,在 Claude Code 中可以免费使用 Qwen 3.6 和 Qwen 3.5 模型,Token 额度不限量,活动截止至 2026 年 6 月 30 日。对于日常使用 Claude Code 的开发者来说…
Codex CLI 接本地模型实战:填平三个坑,本地推理省钱又安全
Codex CLI 出来之后我一直想拿它接本地模型。原因很简单——不用每次跑都走 API,省钱,数据也不用往外送。
理想很丰满,现实很骨感。折腾了一下午,踩了三个坑才跑通。记录一下,给有同样需求的朋友省点时间。
环境…
Codex++ 开源:让 OpenAI Codex 接入国产大模型,告别 ChatGPT 订阅
Codex 是 OpenAI 官方的编程智能体桌面应用,补全、改 Bug、读项目、跑 Agent,体验确实出色。但用过的人都清楚它的几个痛点:
要么需要 ChatGPT 订阅,要么烧 OpenAI API,对个人开发者不够友好
需要海外账…
谷歌开源 Gemma 4 12B:统一无编码器架构,16GB 内存笔记本即可运行多模态模型
谷歌 DeepMind 发布了 Gemma 4 12B 模型。该模型将多模态智能能力集成到轻量级架构中,可在消费级笔记本电脑上运行。
Gemma 4 12B 填补了 Gemma 系列的关键空缺:比边缘端的 E4B 更强,比 26B 混合专…
OpenCode Zen 免费模型快速接入Claude Code 使用实操教程指南
Claude Code 作为 Anthropic 官方推出的 AI 编程助手,功能强大但需要付费订阅。而 OpenCode Zen 提供了多个完全免费的模型供开发者使用,包括 DeepSeek、小米、NVIDIA、MiniMax 等厂商的模…
Holo3.1开源Computer Use模型发布:35B版性能超越Qwen3.5、Claude Sonnet 4.6
6 月 2 日,法国 AI 公司 H Company 推出 Holo3.1 系列开源计算机控制大模型。这是继两个月前 Holo3 发布后,该团队针对生产环境反馈优化的版本,核心解决此前计算机控制 AI 代理(Computer-use Age…
Claude Code 接入国产模型报 400?保姆级降级教程帮你解决
近期,部分用户在升级 Claude Code 至 2.1.154 及以上版本后,在使用第三方 API 接入国产模型时遇到了 400 错误。经排查,原因是新版本未正确传递系统提示词(System Prompt)导致报错。
目前最稳定的解决方案…
Agnes AI 全模态 API 无限期免费:文本、图像、视频模型实测与接入指南
榜单排名前十的 AI Lab Agnes AI 正式宣布:自 6 月 1 日起,旗下核心的全模态模型(包含文本、图片、视频)API,向全球开发者与创作者无限期免费开放。
没有限时、不需要绑定信用卡。
文本模型 Agnes-2.0-Flas…
MiniMax M3 即将发布:MSA 稀疏注意力重构大模型效率
MiniMax 在 X 上发布预告:"M2 系列到头了,M3 要来了。"
工程负责人补充:"Tech blog coming soon. And M3 :)"。这条简短预告获得 37 万阅读、2000 多赞,社区嗅到了重要信号。
性能数据…