由于预训练,模型和词表都是从头开始,我们这里没有提供从给定数据集学习词表的方法。目前项目里直接使用了modernbert ...