标签:包括优选教师模型、筛选高难度样本、构建多样化推理路径