标签:从而实现跨模态理解。