国思软件 - 参数量暴降，精度反升！哈工大宾大联手打造点云分析新SOTA

　　PointKAN 团队投稿

　　量子位 | 公众号 QbitAI

　　新架构选择用 KAN 做 3D 感知，点云分析有了新 SOTA！

　　来自哈尔滨工业大学（深圳）和宾夕法尼亚大学的联合团队最近推出了一种基于 Kolmogorov-Arnold Networks(KANs)的 3D 感知解决方案——PointKAN，在处理点云数据的下游任务上展现出巨大的潜力。

　　PointKAN 与同类产品的比较

　　替代传统的 MLP 方案，PointKAN 具有更强的学习复杂几何特征的能力。

　　此外团队还提出 PointKAN-elite 版本，使用 Efficient-KANs 结构，在保持准确率的同时显著降低参数量。

　　以下是更多详细内容介绍。

　　为什么要选择 KANs

　　当前多层感知机（MLPs）凭借其高效的特征学习机制，已成为点云分析的基础架构组件。

　　然而在处理点云复杂几何结构时，MLP 的固定激活函数难以有效捕捉局部几何特征，同时存在参数量冗余大、模型效率低下的问题。

　　而 KANs 是以 Kolmogorov-Arnold 表示定理(KART)作为数学依据的一种新颖的神经网络架构，与多层感知机(MLP)结构的最大区别是 KANs 使用可学习函数替代固定激活函数。

　　KANs 使用一维B样条函数作为基函数通过相加和复合运算实现高维复杂函数，为函数拟合提供了一个灵活且可解释的框架。

　　目前，KANs 已初步应用于计算机视觉和医学成像等领域，展现出了有效性和通用性，但在点云分析领域中基于 KANs 的模型拥有巨大潜力尚未开发。

　　因此，探索在点云分析任务中有效整合 KANs 与现有模型的方法，仍是一个重要且有前景的研究方向。

　　PointKAN 框架解析

　　PointKAN 的整体流程如下图所示。

　　相比于 MLPs，尽管 KANs 具有更强的高维函数逼近能力和更高的参数效率，但将其适配到 3D 点云上并非易事。

　　一方面，KANs 的样条激活函数通过离散节点逼近单变量函数，很难充分捕捉局部点云的几何特征，限制了其学习细节特征的能力。

　　另一方面，每一维输入的激活函数需要存储多个参数，对于大规模网络，KANs 的内存需求可能成为瓶颈，并且 KANs 中使用的B样条函数对于现代硬件上的并行计算未进行优化，导致推理速度较慢。

　　为了解决上述问题，研究团队提出了 PointKAN，其特点是包含几何仿射模块和并行结构的局部特征提取模块，以及 KANs 的高效版本Efficient-KANs来减少内存占用并加快训练和推理速度。

　　Geometric Affine Module

　　为了在后续的局部特征提取阶段能得到更加丰富的信息，在这个模块中包含两个部分Group-Norm和S-Pool。

　　Group-Norm 对分组内特征进行归一化、仿射变换和组中心特征传播，整个过程表达如下：

　　S-Pool 用于对各组特征进行聚合，作为后续模块的输入，对各组点云进行全局信息的补充，考虑到最大池化会导致信息丢失，而S-Pool 则最大限度保留组内各点特征信息，数学形式如下：

　　Local Feature Processing

　　对 Geometric Affine Module 的两部分输出在 Local Feature Progress(LFP)中分别使用KAN Block进行并行处理。

　　在 KAN Block 中，团队在 KAN Layer 后加上深度卷积(DwConv)操作来协助 KANs 在高维通道信息上学习到丰富的特征表示，整个过程可以被表示为：

　　共享的 LFP 旨在从分组点云中学习到局部特征，在经过最大池化后与从各组中心点云学习到的全局信息相加，使得各组点云最终输出的聚合特征更加丰富。

　　Global Feature Processing

　　Global Feature Progress(GFP)由 Residual Point(Resp)Block 组成，用于提取深度聚合特征。

　　由于结构中只包含前馈 MLP，使得可以在 GFP 中添加多个重复 Residual Point(Resp)Block，整个模型仍然能高效运行。

　　总的来说，代替使用复杂的局部几何提取结构，PointKAN 的一个阶段由Geometric Affine Module、Local Feature Processing和Global Feature Processing三部分组成，通过重复的四个阶段来构造一个层次化处理点云的深度网络。

　　Efficient-KANs 结构

　　KANs 中的激活函数是由B样条函数生成的，而B样条函数需要递归计算，这并不适合现代 GPU 的并行计算架构。

　　在参数量和计算效率上，每个输入-输出对都有不同的参数和基函数，那么随着 KANs 中隐藏层宽度的增加，参数量呈指数增长，这也导致了巨大的计算开销和可扩展性问题。

　　Efficient-KANs 很好的解决了这些问题，首先使用有理函数代替B样条函数作为 KANs 中的基函数，激活函数如下所示：