智能资讯AI五彩缤纷争夺冠军CMU朱俊彦团队亮相自动配对大师系统

作者:李梅

编辑:陈彩娴

近日,深度学习领域的火热趋势——生成式AI,让我们见证了一场技术革命。无数预训练图像生成模型如雨后春笋般涌现,每一个模型都有其独特的风格和擅长领域。然而,在这个众多模型中,如何迅速找到满足个人创作需求的最佳匹配呢?正是为了解决这一问题,卡内基梅隆大学朱俊彦团队提出了基于内容的模型搜索算法。

这项创新算法允许用户输入文本、图像、草图或甚至另一个生成模型,然后系统会快速检索出最相似的相关深度图像生成模型。这一切得以实现,是通过将每个生成模型产生的样本分布转化为优化问题来实现,以最大化在给定查询的情况下生成与之匹配概率。

实验表明,这种基于内容的搜索方法不仅能显著提升速度(0.08毫秒),而且保持了高精度,对比传统蒙特卡洛方法提高了5倍。此外,该算法还能够支持多模态查询,如同时使用“Nicolas Cage”和“dog”,从而检索到能生成“Nicolas Cage dog”图片的StyleGAN-NADA 模型。

此外,该研究也揭示了不同网络特征空间中的性能差异。在某些情况下,CLIP表现尤为突出,而DINO和Inception则更适合艺术风格类别。而对于真实图像重构和编辑任务,该算法同样显示出强大的潜力,可根据需要进行逆映射或编辑操作。

尽管该研究取得显著成就,但仍存在一定局限性,如在处理抽象形状或复杂多模态查询时可能出现误判。但未来,这一基础工作对探索更多类型内容生成模式搜索提供了巨大启发,为未来的研究开辟了新的可能性。