10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI编程开发

whichllm:本地跑大模型选模型神器

1小时前 AI编程开发 13 0

这两年开源模型从 Llama 到 Qwen,再到 Gemma,能力一点点逼近闭源模型。于是不少人开始动心思,想要在自己电脑上本地部署模型,试图解决高昂的 Token 费用。

但在 HuggingFace 上有上百多万个开源模型,参数量从 1B 到 100B,该如何选择。对于大部分人来说,光搞清楚自己的电脑能跑哪些模型,可能就得折腾大半天。更惨的是,当我们把模型权重下载到本地并部署了,才发现输出一句话得等半分钟,根本无法使用,然后再卸载删除,重新找模型,重新下载部署,试错成本极高。

图片 1

最近找到一个开源的命令行工具 whichllm,能帮我们解决本地部署模型选择的痛点。它能根据电脑的硬件配置,推荐哪个模型能跑起来又快又好。

与其他检测工具的区别是,它不止关注模型能不能跑,还会判断跑哪个模型更划算,把性能拉满。简单举个例子:一张 24GB 显存的 RTX 4090,理论上能跑得下 32B 的模型。但它会将 27B 模型排在第一推荐位置,理由各项基准测试评分更高,而且是最新模型。

图片 2

也就是说,它不止告诉我们哪些模型能跑,还会考虑到哪些模型体验更好、性价比更高。

如何使用?

安装之后,只需打开终端,输入 whichllm 命令行,它就会自动检测你的硬件配置。市面上主流的 N 卡、A 卡、Apple 芯片,甚至纯 CPU 的机器,都能识别出来。

接着就会基于你的配置信息,计算清楚每个模型大概能跑多少 tok/s。表格里会显示出模型名称、参数量、量化方式、综合评分还有下载量,所有信息一目了然。

图片 3

实用命令

工具还有几个实用的命令:

  • 快速体验:只需一条命令 whichllm run 就能下载、部署模型并开启对话。
  • 模拟显卡:如果在纠结购买哪张显卡,可以先跑一下 whichllm --gpu "RTX 4090",模拟看看可以跑哪些模型。
  • 查询需求:想知道某个模型需要什么级别的显卡才能跑,则可以用 whichllm plan 这条命令。

图片 4

安装使用

只需一行 pip 命令就能搞定:

pip install whichllm

装好之后敲 whichllm 命令即可开始,它会自动检测硬件并给出推荐列表。

局限性

不过也有几个缺点,客观说一下:

  • 速度计算是基于显存带宽和参数量推算的,可能会跟实测有些出入。
  • 对于 Windows 上的 A 卡检测,精度不如 Linux,需要靠系统接口去补全信息。
  • 在 Apple 芯片和纯 CPU 环境下,为了稳定,只推荐 GGUF 格式。

总结

关于本地跑模型这件事,后面肯定有越来越多的人会去尝试。那么前提比较关键的是,不要只顾着"能跑多大模型",而是要选择好模型。whichllm 的出现,便帮我们把试错的成本降下来了,剩下的精力花在真正有意思的事情上。

GitHub 项目地址:https://github.com/Andyyyy64/whichllm

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:whichllm:本地跑大模型选模型神器
#whichllm #本地大模型 #开源模型 #命令行工具 #GPU 
收藏 1
AI Agent四层模型:LangChain从入门到精通
腾讯妙境Miora:AI创意设计智能体产品解读
推荐阅读
  • ClaudeCode Workflow Studio(cc-wf-studio):Claude Code工作流编辑器如何改变AI自动化开发方式
  • Cursor Auto Helper:让Cursor自动开发项目、实时显示用量对话自动继续、断连重试等
  • 最近用的贼多的 3 个 Claude Code 开源宝藏:WaveTerm、Claude HUD、浏览器自动化
  • 高手都在用的神级Cursor Rule:RIPER-5模式可以大大提升 Claude 的性能
  • Cursor 0.46更新,新增支持Claude 3.7 + GPT 4.5,Cursor Pro 无限续杯攻略,全自动化工具使用说明
评论 (0)
请登录后发表评论
分类精选
手把手教你用支付宝订阅 Cursor Pro:国内用户最全开通教程(附取消自动扣费)
28551 11月前
Claude Code Rules:claude.md文件配置完全指南
21725 10月前
Claude Code + MCP 实战教程:手把手教你如何在Claude Code里面使用MCP
15748 10月前
手把手教你在VS Code & Cline/RooCode 中使用Kimi K2 模型,配置实录+开发实战体验
15046 11月前
学生党0元白嫖!手把手教你解锁Cursor Pro年VIP,超详细申请教程(附避坑指南)
15015 1年前
Claude Code 官方已支持Windows系统!手把手教你免费安装使用Claude Code
13831 11月前
Cursor 0.46更新,新增支持Claude 3.7 + GPT 4.5,Cursor Pro 无限续杯攻略,全自动化工具使用说明
13826 1年前
Cursor进阶指南:如何解决Cursor上下文长度的限制超出后”降智“问题
13615 1年前
Cursor代码生成器中文使用教程,Cursor新手入门完全指南,全网最全面详细的Cursor使用教程
13359 1年前
手把手教你在Claude Code 中使用Kimi K2 模型,超简单配置教程分享
11273 11月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 whichllm:本地跑大模型选模型神器
2 Codex 视频工作流实战:6 个开源 Skills,让 AI 自动完成剪辑全流程
3 Karpathy CLAUDE.md 中文版:四条规则让 AI Agent 少自作主张,实测效果惊艳
4 Codex CLI 接本地模型实战:填平三个坑,本地推理省钱又安全
5 MumuSpec CLI 发布 npm:14 份 Spec 模板 + 五轮工作流,规范 AI 编程
6 Codex 深度使用指南:烧了 20 亿 Token 总结的 10 条实战经验
7 Claude Code Dynamic Workflows:从 Prompt 到 Loop 的 AI 编程范式转变
8 Codex Claude Code /goal 长时间运行指南:解决自动停止问题
9 Claude Code Dynamic Workflows 详解:编排复杂任务的工作流引擎
10 Superpowers 深度拆解:用语言级纪律系统解决 AI 假完成问题
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联