普通电脑3小时就能训练出26M参数的ai小模型框架MiniMind来了

普通电脑3小时就能训练出26M参数的ai小模型框架MiniMind来了

800_auto

MiniMind 是一个轻量级的语言模型项目,旨在在 3 小时内通过简单的步骤训练出一个仅 26M 参数的小型模型,即使是普通的个人 GPU 也能进行推理和训练。

该项目提供了完整的数据处理、预训练、微调和偏好优化的流程,并且支持多种流行的框架和多卡训练。

800_auto

Min...

点击查看剩余70%

{{collectdata}}

网友评论