标签:增强了文本到图像的上下文理解能力。用户可以通过多张图像的拼接与联合描述