10+年产品经理聊聊产品、测测产品,产品人交流学习成长平台,按 Ctrl+D 收藏我们
关于我 留言板 小程序 标签云

苏米客

  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
  • 登录
  • 首页
  • AIGC
    • AI最新动态
    • AI学习教程
    • AI工具集合
    • AI产品百科
    • AI编程开发
    • AI提示词
    • AI开源项目
    • AI智能体
  • Axure
    • Axure动态
    • Axure教程
  • 产品
    • 用户体验
    • 产品设计
    • 苏米杂谈
  • 资源
    • 产品UI组件库
    • 开源图标库
    • 中后台框架
  • 书单
    • AI书籍
    • 用户体验
    • UI视觉
    • 产品研究
    • 其他类型
  • 下载
    • Axure组件
    • Axure原型
    • 文档报告
    • 素材资源
当前位置: 首页 » AI开源项目

Qwen3.6-35B-A3B-Uncensored:35B参数仅3B激活的完全解锁开源MoE模型

2小时前 AI开源项目 12 0

Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 是一个基于 Qwen3.6 MoE 架构的去审查开源模型,由 HauhauCS 制作。该模型在 465 个测试案例中实现了 0 次拒绝,在 HuggingFace 上获得了超过 150 万次月下载量,成为近期最火的开源模型之一。

什么是 Uncensored(去审查)模型?

大多数商业大模型都内置了安全审查机制,当用户提出敏感、争议性或成人内容相关的问题时,模型会拒绝回答。Uncensored 模型做的就是移除这些审查限制。

HauhauCS 制作的 Qwen3.6-35B-A3B-Uncensored-Aggressive 版本,在 465 个测试案例中实现了 **0 次拒绝**——无论什么问题,它都会给出回答。开发者明确表示:没有修改数据集和能力,保留了原作者设计的全部功能,只是移除了拒绝机制。

技术架构:35B参数,每次推理仅 3B激活

模型的核心在于其独特的 MoE(Mixture of Experts,混合专家)架构:

参数 数值
总参数 350 亿
每次激活参数 约 30 亿
专家数量 256 个
每 Token 路由专家 8 个
层数 40 层
原生上下文长度 262K
架构 混合注意力(线性 + 全 softmax,3:1)
多模态支持 文本、图像、视频

这意味着什么?

  • 运行成本低:每次推理只激活 3B 参数,相当于一台消费级显卡(如 RTX 4090)就能流畅运行
  • 能力强:35B 总参数提供了丰富的知识储备和推理能力
  • MoE 架构优势:256 个专家各司其职,处理不同类型的问题时调用最合适的专家

适用场景

  • 内容创作:小说、剧本、角色对话——不会因为触及敏感话题就被打断
  • 安全研究:测试 AI 安全边界、研究越狱方法
  • 红队测试:评估模型在极端场景下的表现
  • 学术自由:研究敏感但不违法的话题
  • 本地部署:完全私有,数据不出本地

Aggressive 变体是"激进"版本——模型完全解锁,不会拒绝任何提示。偶尔可能会附加简短的免责声明,但完整内容一定会生成。

与其他开源模型对比

vs. Llama 3.1 8B/70B

维度 Qwen3.6-35B-A3B Llama 3.1 70B
运行硬件需求 RTX 4090(Q4 量化约 20GB) 2×A100 80GB
激活参数 3B 70B
上下文长度 262K 128K
多模态支持 图文视频 仅文本
去审查版 ✅ 可用 ❌ 社区有但较少

vs. Mistral Large / Mixtral 8×22B

维度 Qwen3.6-35B-A3B Mixtral 8×22B
总参数 35B 141B
激活参数 3B 39B
运行硬件 RTX 4090 A100 80GB
上下文长度 262K 64K
中文能力 强 弱

vs. DeepSeek-V3 671B

维度 Qwen3.6-35B-A3B DeepSeek-V3
运行硬件 RTX 4090 8×H100
激活参数 3B ~37B
本地部署 ✅ 轻松 ❌ 几乎不可能
审查 完全移除 有审查
协议 Apache 2.0 DeepSeek 协议

核心优势总结:

  • 硬件友好:消费级显卡即可运行,无需服务器
  • 零拒绝:465 个测试案例 0 次拒绝
  • 多模态:支持图像和视频理解
  • 超长上下文:262K tokens,适合长文档处理
  • 中文原生:阿里巴巴出品,中文能力远超大多数开源模型
  • 完全开源:Apache 2.0 协议,可商用

量化质量与推荐参数

HauhauCS 使用了 imatrix(重要性矩阵)进行量化,确保在降低模型大小的同时最大程度保留性能。K_P("Perfect")量化是自定义技术,使用模型特定分析来在最重要的地方选择性保留质量,相当于将质量提升 1-2 个量化等级,但文件大小仅增加约 5-15%。

量化版本 文件大小 推荐场景
Q2_K_P 11.7 GB 极限压缩,内存受限
IQ4_XS 15.4 GB 平衡质量与大小
IQ4_NL 18.7 GB 较高精度
Q4_K_M 19.8 GB 推荐,质量最佳平衡
Q4_K_P 21.2 GB 更高精度
Q6_K_P 30.6 GB 接近原版质量
Q8_K_P — 最佳质量

推荐参数设置

思考模式(默认):

{ 
  "temperature": 1.0, 
  "top_p": 0.95, 
  "top_k": 20, 
  "min_p": 0, 
  "presence_penalty": 1.5 
}

编码/精确任务:

{ 
  "temperature": 0.6, 
  "top_p": 0.95, 
  "top_k": 20, 
  "min_p": 0, 
  "presence_penalty": 0 
}

快速上手指南

最简单的方式:Ollama

ollama run hf.co/HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive:Q4_K_M

llama.cpp 本地部署

# 安装 
brew install llama.cpp 

# 启动 OpenAI 兼容的 API 服务(带 Web UI) 
llama-server -hf HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive:Q4_K_M 

# 或直接终端对话 
llama-cli -hf HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive:Q4_K_M

完整推理命令

llama-cli \ 
  -m Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_M.gguf \ 
  --mmproj mmproj-Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-f16.gguf \ 
  --jinja -c 131072 -ngl 99

vLLM 服务部署

pip install vllm 
vllm serve "HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive"

Docker 一行运行

docker model run hf.co/HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive:Q4_K_M

适合谁?

推荐使用场景:

  • ✅ 本地部署 AI,数据不出本机
  • ✅ 内容创作(小说、剧本、角色扮演)
  • ✅ 安全研究与红队测试
  • ✅ 长文档处理(262K 上下文)
  • ✅ 图像/视频理解
  • ✅ 消费级硬件上运行高质量模型

不建议使用的场景:

  • ❌ 需要严格内容审核的生产环境
  • ❌ 面向未成年人的产品
  • ❌ 法律法规要求过滤的内容场景

总结

Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive 的核心价值在于:

  • 零门槛运行:RTX 4090 即可部署,无需昂贵的服务器
  • 零拒绝回答:465 测试案例 0 次拒绝
  • 零功能损失:保留原模型 100% 能力,仅移除审查
  • 多模态支持:文本+图像+视频理解
  • 超长上下文:262K tokens
  • 完全开源:Apache 2.0 协议可商用

对于需要本地部署、完全控制、无审查限制的开发者来说,这可能是目前最好的选择之一。

开源地址

HuggingFace:HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive

基础模型:Qwen/Qwen3.6-35B-A3B
许可证:Apache 2.0

声明:本站原创文章文字版权归本站所有,转载务必注明作者和出处;本站转载文章仅仅代表原作者观点,不代表本站立场,图文版权归原作者所有。如有侵权,请联系我们删除。
未经允许不得转载:Qwen3.6-35B-A3B-Uncensored:35B参数仅3B激活的完全解锁开源MoE模型
#Qwen3.6 #MoE模型 #开源模型 #Uncensored #本地部署 
收藏 1
开源纯真IP库在线查询系统:IP地理位置查询、本机IP查询、域名解析
pyVideoTrans 开源视频翻译工具:语音识别+翻译+配音+声音克隆一站式解决方案
推荐阅读
  • ChatWiki:基于微信的开源AI工作流平台,微信生态的AI知识库Agent构建平台
  • OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
  • Claude Skills 精选集:提升 AI 工作流效率的开源技能库解析
  • VoxClaw:小龙虾能说话的开源,在 OpenClaw 上集成语音输出能力
  • Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
评论 (0)
请登录后发表评论
分类精选
OpenSpec:比 Cursor Plan 更聪明?试试这款让 AI 编码更靠谱的规范驱动工具
9326 7月前
WeKnora:终于等到了腾讯ima的开源知识库框架,用 API 轻松打造本地智能文档检索
8922 8月前
Antigravity-Manager:这个开源神器让你白嫖ClaudeOpus 4.5,Gemini 3!还能接Claude Code等任意平台
7025 5月前
awesome-openclaw-skills:700+ Skills 一条命令装配完成,如何让本地 AI Agent 真正落地可用
6319 3月前
AIRI:你的开源AI女友,让你随时拥有属于自己的 AI VTuber
6175 8月前
CompressO:开源免费的视频压缩神器,让你的硬盘瞬间轻松 10 倍
6014 8月前
就要创作:从提示词到创作团队,开源 AI 网文写作平台
5865 7月前
iFlow CLI:让命令行终端不止于编程的AI效率开源神器
5571 9月前
Composio:让AI Agent自动完成工作任务,能让AI一键操控你的所有软件
5477 7月前
CapCut API:一个剪映API开源项目,让AI自动剪辑视频
5431 5月前

文章目录

关注「苏米客」公众号

订阅推送更及时,手机查看更方便
分类排行
1 One API 自建 AI 网关:15 分钟整合所有模型 Key,告别中转站跑路风险
2 PilotDeck 开源 AI Agent 操作系统:一个人指挥一支智能体军队
3 pyVideoTrans 开源视频翻译工具:语音识别+翻译+配音+声音克隆一站式解决方案
4 Qwen3.6-35B-A3B-Uncensored:35B参数仅3B激活的完全解锁开源MoE模型
5 开源纯真IP库在线查询系统:IP地理位置查询、本机IP查询、域名解析
6 Apex Dashboard:Obsidian 的一站式工作控制台插件
7 OpenHarness:港大开源轻量级 Agent 基础设施,兼容 15+ 大模型提供商
8 DeepSeek Reasonix:开源终端 AI 编程代理,前缀缓存让成本降低 70%
9 PinMe 2.0开源:一句话搞定前端、后端、数据库,AI全栈部署新工具
10 Cockpit Tools开源:AI IDE账号管理中控台,支持Codex多开与配额监控
©2015-2024 苏米客XMSUMI 版权所有 · WWW.XMSUMI.COM 闽ICP备14005900号-6
微信文章助手 程序库 免费影视APP 免费字体下载 Axure RP 10 免费Axure模板 Axure元件库下载 申请友联