一、简介 从2010年开始,深度学习方法为语音识别,图像识别和自然语言处理领域带来了巨大的变革。这些领域中的任务都只涉及单模态的输入,但是最近更多的应用都需要涉及到多种模态的智慧。多模态深度学习主要包含三个方面:多模态学习表征,多模态 ...