在平均序列长度为15的数据集,我使用了您的模型,提升了很多性能。但是换了平均序列长度为3的数据集,不光没有提升,还变差了。不知道这种情况下,还有没有可能把模型救活? 我将您的模型,放在了transformer输入之前。