简介 本推文介绍了来自清华大学Hanlei Zhang , Hua Xu,等人共同提出的一种多模态话语语义发现的多模态无监督聚类方法。他们在这篇收录于ACL 2024的论文《Unsupervised Multimodal Clustering for Semantics Discovery in Multimodal Utterances》中提出了UMC方法,通过构建多模态数据的增强视图,并结合创新的高质量样本选择机制和双重对比学习策略,该方法在聚类指标方面实现了2-6%的显著提升,超越了当前的