标签:在1300亿个有效 token 上完成训练(arXiv:2411.04905)