关闭广告

剑桥大学定义图形世界:神经网络让纹理压缩像画家调色一样自然

科技行者786人阅读


在数字图形的世界里,纹理就像是给3D模型穿上的衣服,让原本光秃秃的几何体变得生动逼真。然而,这些"衣服"往往非常占用存储空间和计算资源,就像一个衣柜里堆满了厚重的冬装。剑桥大学计算机科学技术系的研究团队在2026年2月发表的这项研究(论文编号arXiv:2602.02354v1),就像是发明了一种神奇的压缩技术,能够把厚重的冬装变成同样保暖但轻薄如丝的材料。

这项研究的核心在于探索一种全新的纹理表示方法——隐式神经表示(Implicit Neural Representation,简称INR)。传统的纹理存储方式就像是用数码相机拍照,每个像素点都要单独记录颜色信息,数据量庞大。而INR技术则更像是训练一位画家的大脑,让神经网络学会根据坐标位置直接"想象"出该处应该是什么颜色,从而用极少的参数就能重现复杂的纹理图案。

研究团队选择了四种不同的神经网络架构来完成这项"画家训练计划"。第一种是最基础的多层感知机(MLP),就像是刚入门的画家,只掌握了基本的绘画技巧。第二种加入了正弦激活函数的SIREN网络,如同天赋异禀的画家,天生对曲线和波浪有着敏锐的感知。第三种则配备了傅里叶位置编码的MLP,相当于给画家配了一副特殊眼镜,能够更清晰地捕捉到高频细节。第四种虽然实现了多分辨率哈希编码,但由于纹理分辨率限制,研究团队认为它在此场景下优势不明显。

为了验证这些"画家"的能力,研究团队从包含5640张图像、47个不同类别的可描述纹理数据集中精心挑选了25张最具代表性的样本。这个选择过程就像是为画家选择最具挑战性的题材,研究人员使用拉普拉斯方差作为衡量标准,这个指标能够反映图像的复杂程度和清晰度,确保选出的样本能够全面考验不同网络的表现能力。

在实际的"绘画比赛"中,研究团队发现每种网络都有着独特的"绘画风格"和擅长领域。最基础的MLP就像是用模糊的画笔作画,总是产生朦胧的效果,虽然有时这种朦胧美反而适合某些场景,但整体上缺乏细节表现力。SIREN网络则展现出了对曲线的天赋,能够很好地表现波浪、云朵等自然纹理,但在处理直线和几何图案时却显得力不从心,经常产生一些"波浪状"的意外效果。

最令人印象深刻的是配备傅里叶编码的MLP,它就像是戴上了高倍显微镜的画家,能够捕捉到极其精细的纹理细节。在感知质量评估中,这种网络几乎达到了与原始纹理难以区分的程度。然而,它也有自己的"个人风格"——偶尔会在画面中添加一些细微的颗粒感,特别是在处理大面积单一颜色区域时。

研究过程中,团队还发现了一个有趣的现象:优化器的选择对"画家"的表现有着决定性影响。Adam优化器就像是一位耐心的绘画老师,能够稳定地指导网络学习,而Rprop优化器虽然有时能带来惊喜,但整体表现不够稳定,经常让画家在学习过程中走弯路。

为了让这些"数字画家"更加实用,研究团队还探索了多级纹理(mipmap)的处理能力。在传统的图形系统中,为了在不同距离下显示合适的纹理细节,需要预先生成多个不同分辨率的版本,就像为同一幅画准备不同尺寸的复印件。而神经网络画家们学会了根据一个额外的"距离参数"来调整绘画的精细程度,就像真正的画家能够根据观看距离调整笔触粗细一样。

在与传统压缩技术ASTC的比较中,神经网络方法展现出了明显的优势。ASTC就像是用印刷机批量生产图像,虽然压缩率很高,但质量损失明显,特别是在感知质量方面。而神经网络方法更像是让画家用记忆重新绘制,虽然可能在某些像素级别的细节上有微小差异,但整体的视觉效果和艺术感受却能很好地保持。

研究团队甚至尝试了一个更加前卫的想法——在神经网络的参数空间中进行"创作"。他们训练了一个生成模型来学习不同纹理对应的网络参数模式,就像是培养一位能够模仿不同画家风格的超级画家。虽然这个方向的结果还不够完美,但已经展示出了令人兴奋的可能性。

为了将这项技术真正应用到实际的图形渲染中,研究团队将他们的方法集成到了Mitsuba 3渲染器中。这个集成过程就像是为专业的艺术工作室配备了这些"数字画家",让它们能够实时参与到3D场景的渲染过程中。虽然目前的渲染速度还不能满足实时游戏的需求,但对于电影制作、建筑可视化等对质量要求更高的应用场景来说,这种技术已经显示出了巨大的潜力。

在训练效率方面,这些"画家"的学习过程相对迅速,在配备RTX 5080Ti显卡的设备上,大约只需要50到200秒就能完成一个纹理的学习过程。这个速度虽然不能用于实时应用,但对于内容创作者来说已经相当实用了。

研究团队还详细分析了不同网络架构的内存占用情况。相比传统的纹理存储方式,神经网络方法的内存占用要小得多,特别是对于高分辨率纹理来说,这种优势更加明显。这就像是用一小段乐谱就能让音乐家演奏出完整的交响曲,而不需要存储每一个音符的录音。

通过大量的实验和评估,研究团队证明了神经网络在纹理表示方面的巨大潜力。在多个评价指标中,特别是在LPIPS(学习感知图像块相似性)这个更贴近人类视觉感受的指标上,神经网络方法都表现出了显著的优势。这意味着即使在技术细节上可能有微小差异,但人眼看到的效果几乎与原始纹理无异。

这项研究不仅仅是一个技术验证,更像是为未来的数字内容创作开启了一扇新的大门。随着游戏画面越来越逼真,虚拟现实体验越来越丰富,对纹理质量和存储效率的要求也越来越高。传统的纹理压缩技术就像是用更小的相框装更大的画,总是要在质量和大小之间做出妥协。而神经网络方法则提供了一种全新的思路——让计算机学会"理解"纹理的本质,然后用这种理解来重现纹理,而不是简单地存储像素信息。

当然,这项技术目前还有一些限制。比如对于每种纹理都需要单独训练网络,这个过程虽然不算太长,但也不能做到即时完成。另外,在处理某些特定类型的纹理时,不同的网络架构会表现出明显的偏好,需要根据具体应用场景来选择最合适的方法。

展望未来,这项技术有着广阔的应用前景。在游戏开发中,它能够显著减少游戏包的大小,同时保持高质量的视觉效果。在虚拟现实应用中,它能够在有限的硬件资源下提供更丰富的视觉体验。在电影和动画制作中,它为创作者提供了新的工具来表现复杂的材质效果。

研究团队在论文的最后部分还提出了许多值得探索的未来方向。比如如何更智能地选择网络超参数,如何处理各向异性过滤,如何将多个相似纹理压缩到同一个网络中等等。这些方向就像是为这幅宏大的技术蓝图添加了更多精彩的细节,等待着后续的研究者去填充和完善。

说到底,这项来自剑桥大学的研究就像是在数字世界中重新定义了"记忆"的概念。传统的纹理存储方式是"死记硬背",每个像素都要精确记录。而神经网络方法更像是"理解记忆",通过学习纹理的内在规律和模式,用更少的信息重现更丰富的视觉效果。这种从量变到质变的转换,不仅仅是技术上的进步,更代表了我们对数字内容表示方式的全新思考。

对于普通用户来说,虽然可能不会直接接触到这些底层技术,但它们带来的改变却会悄无声息地影响我们的数字生活体验。未来的游戏可能会更小但更精美,虚拟现实体验可能会更流畅但更逼真,这一切的背后,都有着像这项研究一样的基础技术创新在默默支撑。有兴趣深入了解技术细节的读者可以通过论文编号arXiv:2602.02354v1查询完整的研究报告。

Q&A

Q1:神经网络纹理压缩技术与传统JPEG压缩有什么区别?

A:传统的JPEG压缩就像用印刷机复制图像,通过删减信息来减小文件大小,但会造成明显的质量损失。而神经网络纹理压缩更像是训练一位画家的大脑,让网络学会根据坐标位置直接"想象"出该处的颜色,用极少的参数就能重现复杂纹理,在大幅减少存储空间的同时保持极高的视觉质量。

Q2:SIREN网络在处理纹理时有什么特殊优势?

A:SIREN网络使用正弦激活函数,就像天赋异禀的画家对曲线和波浪有着敏锐感知。它特别擅长表现自然纹理如波浪、云朵等,能够很好地捕捉这些图案的周期性特征。但在处理直线和几何图案时却显得力不从心,经常会产生一些意外的波浪状效果。

Q3:这项纹理压缩技术什么时候能应用到实际游戏中?

A:目前这项技术的训练过程需要50-200秒,渲染速度还不能满足实时游戏需求。但对于电影制作、建筑可视化等对质量要求更高的应用场景已经显示出巨大潜力。随着硬件性能提升和算法优化,未来几年内很可能会在游戏开发中看到这项技术的应用,特别是在减少游戏包大小方面。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

剑指千亿!松江卫星互联网产业按下“加速键”

上观新闻 浏览 1772

小米车主第1天提车在交付中心撞人 小米内部人士回应

澎湃新闻 浏览 4645

新能源车主必看,动力电池已经规模化退役

百姓评车 浏览 1019

高市早苗再有新动作日本准备拥有核武 中俄要早做准备

头条爆料007 浏览 6024

美方公开核航弹测试画面

北京青年报 浏览 1384

连续三个月创历史新高 蔚来公司10月新车交付首超4万台

网易汽车 浏览 1636

宗馥莉几乎搞砸了一切

功夫财经 浏览 1947

女子家门口遇害案被告家属首发声:女儿带刀是为"防身"

南方都市报 浏览 4684

魏晨一家三口合体,妻子抱着儿子看他演唱会

柠檬有娱乐 浏览 1429

于文文贵州演唱会晕倒,曝被救护车拉走

扒虾侃娱 浏览 820

一图看懂|朝鲜庆祝空军成立80周年 展示了哪些新式武器

澎湃新闻 浏览 1352

52岁郭德纲也没想到 徒弟阎鹤祥给他争光了

乡野小珥 浏览 1463

锡安复出生涯首次替补18+6 鹈鹕送公牛9战第8败吉迪11+7+5

醉卧浮生 浏览 1262

测Manus 1.5:丝滑,超预期,Manus独特上下文工程的一次关键展示

硅星人 浏览 1926

李禹熹公开和荣梓杉聊天记录!​开房都不舍花钱,还拿私密照威胁

萌神木木 浏览 1950

任重正式宣布与孙骁骁结婚!

广西阿妹香香 浏览 1764

《新闻女王2》首播爆开!开局高能剧情紧凑,黄宗泽演技拖后腿

萌神木木 浏览 1596

最有种的女明星

江湖人称艾掌门 浏览 1621

奇瑞汽车12月销量超23万辆同比减16%,2025全年超263万辆

IT之家 浏览 1120

宋慧乔怎么不会老啊?

时尚COSMO 浏览 1207

涉诈百亿!影视巨头华文映像创始人被抓

情感大头说说 浏览 1262
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1