标签:– 局部 AR-ness@k:表示在 k 长度范围内连续预测下一个 token 的比例。

N扩散语言模型

当然可以!以下是对原文进行整理后更利于SEO优化的文章,并附上