今日凌晨,Qwen 团队再度公布重磅更新——此前已经广受好评的 Qwen3-30B-A3B 模型迎来了新版本:Qwen3-30B-A3B-Instruct-2507。机器学习爱好者 Vaibhav (VB) Srivastav 第一时间分享了使用反馈:「最新的 Qwen3-30B-A3B-2507 在搭载 MLX 的 Mac 上运行速度极快」。
聚焦官方给出的数据,这个非思考模式(non-thinking mode)的新模型,将长文本理解能力提升至 256K,仅激活 3B 参数,就能取得可媲美 Gemini 2.5-Flash(non-thinking)、GPT-4o 等顶尖闭源模型的超强性能。同时,其在指令跟随、逻辑推理、文本理解、数学、科学、编程及工具使用等方面均有显著提升。
目前,「一键部署 Qwen3-30B-A3B-Instruct-2507」已上线至 OpenBayes 公共教程中,一键克隆即可快速体验 demo。小贝已经为大家进行了实测,询问北京多地区的暴雨和台风登陆上海这两个极端天气现象之间是否有关联,测试了这个非思考模式的模型,其迅速从多个角度给出了回答。
此外,我们还为新用户准备了惊喜算力资源福利,使用邀请码「Qwen3-2507」注册即可获得 2 小时双卡 A6000 使用时长(资源有效期 1 个月),数量有限,不要错过!
教程地址:
https://go.openbayes.com/G7u7K
Demo 运行
01 Demo 运行阶段
1.登录 OpenBayes,在「公共教程」页面,选择「一键部署 Qwen3-30B-A3B-Instruct-2507」教程。
2.页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。
3.选择「NVIDIA RTX A6000-2」以及「PyTorch」镜像,OpenBayes 平台上线了新的计费方式,大家可以按照需求选择「按量付费」或「包日/周/月」,点击「继续执行」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!
小贝总专属邀请链接(直接复制到浏览器打开):
https://go.openbayes.com/9S6Dr
4.等待分配资源,首次克隆需等待 2 分钟左右的时间。当状态变为「运行中」后,点击「API 地址」旁边的跳转箭头,即可跳转至 WebUI 页面。请注意,用户需在实名认证后才能使用 API 地址访问功能。
02 效果演示
1.最近极端天气频发,北京接连暴雨后,上海又迎来了台风,让我们来问问 Qwen3-30B-A3B-Instruct-2507 上海台风和北京暴雨的是否有关系,看看它怎么回答。
* 进入 API 后,若左上角不显示「Model」,这表示模型正在初始化,由于模型较大,请等待约 2-3 分钟后刷新页面即可。
2.该版本的模型是一个非思考模式(non-thinking mode)的新模型,从多个角度客观给出了分析。