Skip to content

InternVL3.5微调性能不佳 #1182

@hekaijie123

Description

@hekaijie123

我使用官方的脚本在同样的业务数据上SFT,InternVL2.5-4B的效果会比InternVL3-4B会好1.5%。数据是单张图片的单轮问答。
官方的训练脚本参数是否有优化空间,还是新版模型很难适用于下游任务?

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions