标签:– 场景描述口语化+具象化(“不用反复布景重拍”“在用户家中听懂指令”)