搜索

首页/笔记/详情

分享一款大语言模型蒸馏的开源工具包DistillFlow

博文: 31 作品: 312 开源: 3

私信我

分享一款大语言模型蒸馏的开源工具包DistillFlow

800_auto

一个名为DistillFlow的开源工具包引起了广泛关注，它专门设计用于简化和扩展大语言模型的蒸馏过程。

DistillFlow的核心功能在于其能够训练多个教师模型和一个学生模型。通过对学生模型输入的挑战性转换，DistillFlow能够生成幻觉遮挡以及不太自信的预测。

800_auto

然后，构建一个自监督学习框架：教师模型中自信的预测作为注释，指导学生模型学习那些不太自信的预测的光流。

这一自监督学习框架使我们能够有效地从无标签数据中学习光流，不仅适用于非遮挡像素，也适用于遮挡像素。

技术亮点

自监督学习框架：DistillFlow通过自监督学习框架，使得从无标签数据中学习光流成为可能...

点击查看剩余70%

{{collectdata}}

网友评论

{{item.title}}

{{item.summary}}

博文: 31 作品: 312 开源: 3

私信我

云产品购物券

最新提问