XR 和 AI 在 Siggraph 2025 上主导图形的未来,获取gltf/glb格式

发布于:2025-09-12 ⋅ 阅读:(24) ⋅ 点赞:(0)

Meta 的 Boba 和 Tiramisu XR 耳机(来源:Meta)

Siggraph 2025 今年重返不列颠哥伦比亚省温哥华,庆祝《玩具总动员》诞生 30 周年和视频游戏实时渲染 20 周年。虽然 Siggraph 需要时间来欣赏过去,但它更多的是展望未来,多年来它一直是图形行业发展方向的重要指标。Siggraph 是一个以研究为导向的会议,世界上一些最聪明的人才会在这里分享他们对众多图形相关主题的最新研究。例如,Adobe Research 在 Siggraph 2025 上分享了超过 25 篇已发表的论文,其中大多数以这样或那样的方式触及了人工智能。获取glb/gltf格式模型 , glb下载官网

Nvidia 的新 GPU 和物理 AI 模型

Nvidia 在 Siggraph 2025 上举办了为期三天的活动,有数十场演示和一整天的演讲专门讨论渲染和 OpenUSD 框架。虽然 OpenUSD 多年来一直是 Nvidia 的一个关键话题,但今年更加关注新的 GPU 以及它们如何为专业用户提供新的计算和 AI 功能。具体来说,Nvidia 宣布推出配备 Blackwell GPU 的新型 RTX PRO 服务器。今年早些时候在 GTC 6000 上发布的 RTX PRO 2025 GPU 主要用于工作站应用。这一点在 Cadence Live 上得到了扩展,Millennium M2000 同时提供 HGX B200 和 RTX PRO 6000 GPU。与上一代 L40S GPU (Ada Lovelace) 相比,这些新服务器提供了从 4 倍实时渲染 FPS 到 6 倍 LLM 推理吞吐量的改进。英伟达表示,包括思科、戴尔科技、慧与、联想和美超微在内的合作伙伴将提供这些系统。

除了新的 RTX PRO 6000 服务器外,Nvidia 还宣布了两款工作站 GPU,以完善运行 Blackwell 的 RTX PRO 系列的其余部分。RTX PRO 4000 Blackwell SFF 版是一款双插槽卡,具有 24GB VRAM 和 770 AI TOPS,仅需要 70 瓦功率。这应该意味着这些 GPU 不需要外部电源,因为仅 PCIe 插槽就提供 75 瓦的功率。RTX PRO 4000 售价 1,500 美元,而 RTX PRO 2000 是一款 545 TOPS GPU,配备 16GB RAM 和相同的 70 瓦 TDP,售价 700 美元。这些是 Ada 一代 RTX 4000 和 RTX 2000 GPU 的 Blackwell 替代品。

Nvidia 还宣布了新的 Omniverse 库和 Cosmos 物理 AI 模型,以通过更精确的物理建模来加速机器人技术的训练和实施。Nvidia 的 Issac Sim 将新的 Omniverse NuRec 库与高斯 splats 相结合,以快速生成模仿现实世界的 3-D 模拟。Nvidia 还与 Google DeepMind 合作,将 USD 集成到 Mujoco 的文件格式中,以将 USD 无缝集成到 Omniverse 中。新的 Cosmos 型号延续了世界一代主题。Cosmos Transfer1 支持创建逼真的可控合成数据,该数据从多个视频源中提取,以创建用于训练的合成 3D 环境。同时,Cosmos Predict2 是一种图像到未来世界状态模型,旨在预测模拟的运动和动作。Nvidia 还发布了 Cosmos Reason 7B,这是其最先进的推理视觉语言模型,适用于多种设备上的 AI 应用程序。这些应用程序包括物理 AI 数据管理和注释、机器人推理和 AI 代理的视频分析。

Meta 的新原型耳机

Meta 在 Siggraph 的 Reality Labs 研究部门总是有一些有趣的东西可以炫耀。今年也不例外,提拉米苏和 Boba 3 耳机旨在展示 Meta 的研究方向。提拉米苏的目标是创建分辨率是 Quest 3 的三倍多的超现实 VR,亮度是 Quest 3 的 14 倍。

Meta的提拉米苏VR头显(图源:Meta)

虽然这款耳机远未做好商业准备,但它确实展示了技术上的可能性以及 VR 在图像质量和亮度方面的未来发展方向。Meta 在 Nvidia 的 DLSS 5 的帮助下使用虚幻引擎 3 演示了这款耳机,这抵消了以如此高分辨率渲染的部分计算成本。需要注意的一件事是,Meta 表示当前迭代的耳机具有非常有限的 33 x 33 度视野,比当今大多数耳机要窄得多。

Boba 1、Boba 2 和 Boba 3 耳机(来源:Meta)

另一方面,Boba 3 将视野提升到一个完全不同的极限,提供 200 度的 FoV。这比大多数消费类耳机提供的 110 度 FoV 要宽得多。200 度对角线 FoV 是通过将 180 度水平 FoV 与 120 度垂直 FoV 相结合来测量的,Meta 将其分别与 Quest 3 的 110 度和 96 度进行比较。Meta 声称 Boba 3 的 FoV 覆盖了大约 90% 的人眼 FoV,其中大部分不是全分辨率。Boba 3 还有一个 VR 原型版本,其重量比 Boba 660(3 克)甚至 Quest 3(840 克)轻得多(698 克)。Boba 3 耳机和提拉米苏均在 Siggraph 2025 期间在 Meta 展位进行了演示。

Arm 在 2026 年倾向于神经渲染

Arm 今年一直在积极提升其 GPU 的图形功能。该公司今年早些时候宣布推出 Arm ASR,以提高包括游戏在内的图形图像质量,现在正在以神经超级采样功能的形式将神经技术添加到产品组合中。此功能在桌面领域已经很常见了很长一段时间,因为 Nvidia 和 AMD 已经经历了多代自己的神经超级采样器,但它对于移动设备来说相对较新,并且支持更低的 GPU 工作负载。Arm 声称通过以较低分辨率渲染然后超采样到原始分辨率,GPU 的工作量减少了多达 50%。这与竞争对手对其实施人工智能加速超级采样的说法一致。

Arm 还宣布了自己的帧生成技术,称为神经帧速率升级,这是业界的一项新功能,提供了在保持高帧速率的同时节省电量的机会。这些神经功能计划于 2026 年在 Arm 下一代 GPU 的硬件级别内置,并且还将附带 Vulkan 图形 API 的 ML 扩展。Arm 还将为那些不使用 Vulkan 的人提供神经图形开发工具包。

Khronos 将 glTF 扩展为地理空间高斯分区

Khronos 集团是图形领域最重要的标准机构之一。与许多其他标准机构一样,它对大多数人来说是完全看不见的,但它的工作对于该行业的未来发展绝对至关重要。Khronos 联盟开发了一种名为 glTF 的移动高效 3D 格式(它代表图形库传输格式),以最小的开销实现跨平台 3D 体验和资产。Khronos 集团在 Siggraph 2025 上宣布,它将与开放地理空间联盟、Niantic Spatial、Cesium 和 Esri 合作,将地理空间高斯碎片集成到 glTF 3-D 资产格式标准中。高斯 splats 已成为一种流行的 AI 加速技术,用于以最低成本生成人物、地点和物体的 3D 模型。

这种合作应该会扩大 glTF 的应用范围,使更多行业能够利用已经流行的格式,同时由于高斯 splats,还可以更快、更轻松地创建 3D 资产。我相信,3D 地理空间行业将从其成员已经为 Web 和移动构建的深度 glTF 基础设施中受益匪浅,随着该格式的进一步应用,更是如此。

XR 和 AI,永远在一起

Siggraph 2025 再次肯定了 XR 和 AI 之间存在无数的交叉点,无论我们谈论的是集成到 glTF 中的地理空间高斯碎片,还是严重依赖 AI 使高分辨率渲染成为可能的新型 XR 耳机。英伟达显然已经表明,它将 3D 渲染与人工智能相结合,作为其业务的基本组成部分,而其 GPU 是这一愿景的核心。甚至 Arm 也表明,其下一代 GPU 将专注于神经图形技术,并且我们坚定地处于神经图形时代——无论是在云端、PC 还是移动设备中。根据 Siggraph 2025 上展示的研究和新发展,我预计在未来几个月和几年内将看到更多 XR 和 AI 的新颖