CvxNet : 学習可能な固体オブジェクトの分解ネットワークアーキテクチャ

CvxNet: Learnable Convex Decomposition [1]

Google Researchの研究チームが、凸状の低次元ファミリーを表すネットワークアーキテクチャを紹介し、成果を2020年度のCVPR会議に寄稿しています。この手法では、自動エンコードプロセスによって自動的に派生するそうです。
本論では、自動凸分解、画像から3Dへの再構成、部品ベースの形状検索など、このアーキテクチャのアプリケーションを調査し、その結果を載せています。動画を見ると直感的には理解しやすいものになっています。

背景として、固体状のオブジェクトは、凸状のポリトープ(つまり、凸状)のコレクションに分解できます。少数の凸を使用する場合、このような分解はジオメトリを区分した近似と考えることができます。この分解はコンピュータグラフィックスの基本であり、リアルタイムの物理シミュレーションなど、ジオメトリを近似する最も一般的な方法です。
凸状オブジェクトには、同時に明示的および暗黙的な表現であるという特性もあり、凸包の頂点を計算することによって導出されたメッシュとして明示的に解釈したり、半空間制約またはサポート関数のコレクションとして暗黙的に解釈したりできます。それらの暗黙の表現は、表現する必要のあるジオメトリのトポロジから離れて抽象化するため、ニューラルネットワークのトレーニングに特に適しています。

今回提案した手法は、グラフィックス/物理パイプラインで直接使用できるとし、論文中では、他のベンチマークされた手法との比較を行っています。

[1] : Deng, B., Genova, K., Yazdani, S., Bouaziz, S., Hinton, G., & Tagliasacchi, A. (2020). Cvxnet: Learnable convex decomposition. In Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition (pp. 31-44).

URL : http://openaccess.thecvf.com/content_CVPR_2020/papers/Deng_CvxNet_Learnable_Convex_Decomposition_CVPR_2020_paper.pdf