ClofNet
1、局部坐标系 ClofNet的作者指出,在传统的等变几何GNN表征框架中(例如EGNN),通常只考虑了原子或粒子之间的相对位置来描述它们的相互作用,这种方法并没有考虑到外部条件,如恒定电场对粒子间相互作用的影响。在一个恒定电场中,电场对粒子的作用是一个固定方向的向量,这对所有粒子都是一样的,并且与它们的相对位置无关。因此,ClofNet提出了局域坐标系的解决方案,这个坐标系不仅能够捕捉粒子间的相对位置,还能够包含其他的物理因素,如电场方向,局域坐标系具体的定义方法如图1所示。 如图1所示,考虑了一个多体系统中的两体子系统\((x_i,x_j)\),这个系统不随时间变化,可以被看作是一个具有两个节点和一条边的图。一般而言,两个粒子间的相互作用函数可以分解成两部分:\(U\left(x_{i},x_{j}\right):=U_{\mathrm{in}}\left(\parallel x_{i}-x_{j}\parallel\right)+U_{\mathrm{ext}}\left(x_{i},x_{j}\right)\) ,其中第一部分是相对距离\(\left|x_i-x_j\right|\)的函数(例如电静力),第二部分描述了可能取决于相对距离和角度(例如电磁场、扭力)的外部力场的影响。因此,\(U_{\mathrm{ext}}\left(x_i,x_j\right)\)的梯度可以沿着任意方向在3D空间中发散。大多数几何GNN方法在处理这种力预测问题时,都是通过采用不变特征(例如,相对距离)作为输入,并表示沿径向的力,即\(F_{i}=k\left(x_{i}-x_{j}\right)\),这在梯度\(\nabla U_{\mathrm{ext}}(x_i,x_j)\)不是沿着径向时是不够的。为了解决这个问题,clofNet提出了一个正交的等变局部坐标系框架(一种正交基组),用于构建和表示几何数据更完备的局部结构。具体来说,取\(x_{i}-x_{j}\)作为第一个分量/方向\(\mathrm{a}\),然后\(x_i\times x_j\)作为第二方向\(\mathrm{b}\)。最后,前两个方向的叉积被作为第三方向\(\mathrm{c}\)。这三个向量\(\mathrm{a}\),\(\mathrm{b}\)和\(\mathrm{c}\) 定义了一个局部坐标系,由于叉乘的性质,\(\mathrm{b}\)垂直于\(\mathrm{a}\),\(\mathrm{c}\)垂直于\(\mathrm{a}\)和\(\mathrm{b}\) 。换句话说,这个坐标系具有正交性。 2、clofNet模型总体架构 clofNet模型处理数据的流程可以分为中心化(Centralization)、局部完备框架(Complete Frame)、标量化(Scalarize)、消息传递模块(GMP)、向量化(Vectorize)和迭代更新六个步骤,如图2所示。 针对输入数据,模型首先将每个点的位置进行中心化处理。这通常意味着会从每个位置向量中减去所有位置向量的平均值,以确保模型对平移保持不变。这是因为通过减去所有点位置向量的平均值,实际上是在重新定位整个系统的中心(质心)到原点(坐标系的中心)的距离。这样,模型就不会将任何特定的位置作为参考点,因此无论系统在空间中如何平移,模型的输出都将保持不变。 局部完备框架\(\mathcal{F}_{ij}\)就是上一小节解释的局部正交坐标系。具体来说,令\(a_{ij}^{t}=\frac{x_{i}(t)-x_{j}(t)}{\begin{Vmatrix}x_{i}(t)-x_{j}(t)\end{Vmatrix}}\),则可以定义\(b_{ij}^{t}=\frac{x_{i}(t)\times x_{j}(t)}{\left|x_{i}(t)\times x_{j}(t)\right|}\)和\(c_{ij}^t=a_{ij}^t\times b_{ij}^t\)。这三个相互正交的基组可以构建一个\(SO(3)\)-等变框架\(\mathcal{F}{ij}:\mathrm{EquiFrame}\left(x_{i},x_{j}\right)=\left(a_{ij}^{t},b_{ij}^{t},c_{ij}^{t}\right)\)。实际操作中,我们添加一个小常数\(\epsilon\)到归一化因子中,以防\(x_{i}\)和\(x_{j}\)发生重合。 基于上述的局部完备框架\(\mathcal{F}_{ij}\),可以将任意几何向量转换为\(SO(3)\)不变的标量值。具体方法是将几何向量投影到\(\mathcal{F}_{ij}\)的基组上,通过内积获得相应的系数,这些系数是不变标量,表示为\(t_{ij}=\left(x_{i}\cdot a_{ij}^{t},x_{i}\cdot b_{ij}^{t},x_{i}\cdot […]