标签:结合SFT与全异步训练框架