我使用官方的脚本在同样的业务数据上SFT,InternVL2.5-4B的效果会比InternVL3-4B会好1.5%。数据是单张图片的单轮问答。 官方的训练脚本参数是否有优化空间,还是新版模型很难适用于下游任务?