想象一下,单模态就像是你只用一种感觉去了解世界 ,比如只靠眼睛看 ,那你就只能获取到视觉方面的信息 。要是环境很暗 ,或者物体有遮挡 ,很多东西你就看不到、了解不到了 。
而多模态呢 ,就好比你同时用眼睛看、用耳朵听、用手触摸 。比如你在一个陌生的地方 ,光用眼睛看可能找不到路 ,但是如果耳朵能听到指示牌上语音提示的方向 ,手能摸到一些有触感标识的引导物 ,那找到路的可能性就大多了 。
这份严谨证明呢 ,就是用科学的方法实实在在地表明 ,多模态能从不同渠道收集各种信息 ,这些信息相互补充 ,让我们对事物的理解更全面、更准确 。就好像给我们认识世界的能力加了好多层“保险” ,所以多模态比单模态更好啦 。 |
|