多模态ML指的是多模态机器学习 。“模态”简单理解就是信息呈现的方式 ,比如图像、文本、语音等。多模态机器学习就是让计算机同时处理多种不同模态的信息 ,并综合这些信息来进行学习和决策 。
就好像人一样 ,我们不仅能用眼睛看图像 ,还能用耳朵听声音 ,用嘴巴说话表达 ,多模态机器学习就是让机器也具备类似处理多种不同类型信息的能力 ,能够把图像、文本、语音等不同模态的信息融合起来 ,从而更全面、准确地理解和处理信息 ,做出更智能的决策 。
至于“CMUPaulLiang170页PPT讲述” ,这里推测可能是卡内基梅隆大学(CMU)的Paul Liang制作了一份170页的幻灯片 ,内容应该是围绕多模态机器学习展开详细讲解 ,可能包含多模态机器学习的原理、方法、应用案例、研究成果等诸多方面的内容 。 |
|