AI最新动态
为您提供AI人工智能新闻,人工智能消息,人工智能动态,人工智能行业等人工智能行业资讯报道
微软王炸开源 TRELLIS.2!如何改变 3D 生成的交付方式?
作为经常体验各类 AI 工具的产品经理,我见过不少 Image-to-3D 的解决方案。它们通常要么生成精度不足,要么后处理复杂,要么材质支持有限。但微软最近开源的 TRELLIS.2,在这几个维度上的表现让我重新审视了这一赛道的现状&md…
限时免费:GLM‑4.6在 Cline 免费开放,VS Code + Cline上手体验
这两天在更新 Cline 到 v3.44.0 时,看到官方把 GLM‑4.6 直接开放到 cline:z-ai 端口,且限时免费。
我作为长期在 IDE 里对比不同代码助手的产品经理,第一反应不是“羊毛”,而是:这…
扣子Coze重磅上线「扣子编程」,智能体、工作流、网页应用,移动应用通通都是一句话搞定!
作为产品经理,我最近把时间都投在各类 AI 开发、编排和发布工具的对比上。
扣子上线的「扣子编程」,让我第一次在一条自然语言输入之后,看到系统从需求梳理、服务匹配、自动编码到测试与部署的一体化闭环。
本文按我的实际体验,讲清楚它能做什么、适…
Gemini 3 Flash 正式发布,比国产 AI 更便宜,免费、极速、吊打前代
今天,我们正式扩充 Gemini 3 模型家族,推出了全新的 Gemini 3 Flash。
这款模型专为追求极致速度而生,以极低的成本提供了前沿的智能体验。此次发布标志着我们将 Gemini 3 的下一代智能技术全面引入 …
小米发布MiMo V2 Flash模型,而且支持免费接入 Claude Code
小米也了发布适配Claude Code的Mimo V2模型。
目前免费用mimo-v2-flash模型,可以通过下面的地址进行访问:
https://platform.xiaomimimo.com/
注册并获取免费API密钥后,和之前…
Wan 2.6:角色与音色可参考,多镜头更稳定,短视频制作更可控
作为一个长期用AI工具做内容设计和产品探索的人,我对视频生成的“可控性”一直很敏感:角色能否保持一致、镜头是否能按叙事意图切换、声音和口型是否对齐。
今天把万相2.6试了一圈,我的核心结论是:它把创作方式从&ldqu…
智谱一周连续开源8个项目,GLM-4.6V 视觉模型才最大功臣
GLM-4.6V重磅开源!
智谱在一周内连续开源了8个项目,其中GLM-4.6V开场即是王炸:
周一:GLM-4.6V视觉模型开源(MIT协议,支持商用)
周二:AutoGLM手机端Agent
周三:GLM-ASR语音识别开源,同时发布智…
n8n 2.0 来了,到底改了什么?升级迁移项目该怎么做?
等了两年,n8n 2.0 终于来了。
这次升级简单说:很多过去能用的“灵活写法”会被默认关闭,换来的是更稳的生产运行。
这篇文章我按实际迁移过程来分享:哪些变化需要重点理解、升级前要查什么、如何在不影响生产的前提…
Ovis-Image:7B参数文生图模型终结乱码,吊打 GPT-4o AI 生图“文字渲染”新标杆
经常使用文生图大模型的朋友们都知道,大多数开源的文生图模型在处理文字时都很容易翻车,经常生成出乱码或者奇怪的符号。
虽然谷歌的Nano Banana 模型可以很好地处理文字,但它的参数量高达 20B,并且也无法开源使用,只能在网页端使用或者…
GLM-4.6V重磅开源!9B与106B两档视觉模型的本地与云端实测
刚刚,智谱开源了他们最强的视觉模型:GLM-4.6V
让我兴奋的是,这次一口气开源了两个尺寸:一个是106B的GLM-4.6V,另一个是9B的GLM-4.6V-Flash(消费级显卡就能本地部署)。
在同参数量级下,多模态交互、逻辑推理、长…