IT之家 4 月 3 日消息,科技媒体 9to5Mac 昨日(4 月 2 日)发布博文,报道称苹果研究团队联合香港大学发布最新论文,提出名为 LGTM 的全新渲染框架。
IT之家援引博文介绍,该框架全称为“Less Gaussians, Texture More”,核心突破在于解耦 3D 场景的几何结构与表面纹理,让系统在保持几何形状简单的同时,通过叠加纹理层实现 4K 级超高清画质。
当前主流的“前馈 3D 高斯泼溅”(Feed-forward 3D Gaussian Splatting)技术,能利用 AI 将 2D 图片快速转化为可多角度观看的 3D 场景,但在处理高分辨率画面时,随着像素增加,算力需求呈指数级暴涨,导致设备难以负荷。
LGTM 正是为解决这一痛点而生。研究团队采用两步走策略:首先让模型从低分辨率图像中学习场景结构,确保几何框架在 2K 或 4K 渲染下不出现破绽;随后引入第二个网络专门负责外观细节,将高分辨率纹理精准映射到几何结构上。这种分工避免了全链路高算力消耗。
对于普通用户而言,这项技术主要能提升苹果 Vision Pro 体验。该头显双眼屏幕合计拥有约 2300 万像素,单眼像素量超过 4K 电视。
现有渲染技术在如此高分辨率下极易遭遇性能瓶颈,导致画面卡顿或模糊。LGTM 有望解决这一算力难题,带来更流畅的沉浸式体验。
实际演示显示,接入 LGTM 框架后,生成的 3D 场景在纹理细节和文字清晰度上均有显著提升,画面效果已非常接近真实原图。这意味着未来用户在使用头显查看虚拟环境或进行透视体验后,将获得更逼真、更清晰的视觉效果。
参考