西安疫情最新资讯CapsNet再次飞跃夸张提升无监督学习图像特征让世界惊叹

在《Stacked Capsule Autoencoders》一文中,Sara Sabour、Geoffrey Hinton以及牛津大学的研究者提出了一个胶囊网络的新版本,该网络能够无监督地学习图像特征,并取得了最先进的效果。文章指出,物体可以被看作是由相互关联的几何组成部分构成,因此识别物体时利用这些几何关系应该具有对视点变化的鲁棒性,因为内在几何关系不会随着视点变化而改变。

论文中提出了一种无监督胶囊网络,它通过一个神经编码器来推断物体胶囊的位置和姿势,这个编码器通过反向传播训练并使用混合姿势预测方案来预测已发现部件的姿势。同时,该编码器还可以直接从图像中检测到具体部件,每个像素都建模为仿射变换部分做出的混合预测结果。通过未标记数据训练后,对象及其部件胶囊进行聚类。

该方法在SVHN上获得了55%的无监督分类结果,在MNIST上获得了接近最先进分类结果98.5%。这种称为Stacked Capsule Autoencoder(SCAE)的全名可分为两个阶段:Part Capsule Autoencoder(PCAE)和Object Capsule Autoencoder(OCAE)。

PCAE负责将图像分割成组件,并推断其姿势,将图像像素重构为转换后的部件模板像素混合产物;OCAE则尝试将发现得部件及其姿势组合成更小的一组对象,再结合针对每个部件混合预测方案解释其姿势。

每个物体胶囊通过将OV乘以OP,为这些混合提供空间关系。在未标记数据上进行训练时,SCAE捕获整个物体及其部之间空间关系。

总之,该工作主要贡献于提出一种全新的表示学习方法,其中高度结构化,可以用来训练编码器网络,将图像分割成为相应部门及其姿态,而另一个编码器网络则可以将这些部门组合成为连贯整体。尽管不涉及分类/聚类目标,但SCA依然是唯一一种,无需互信息MI即可获得有竞争力的无监督对象分类方法之一。这篇文章基于https://arxiv.org/pdf/1906.06818.pdf