Databricks 发布了Dolly 2.0

Databricks 发布了Dolly 2.0

这是一个改进版本的大规模语言模型Dolly。

Dolly 2.0 是第一个开源的指令跟随语言模型,它在人工生成的数据集上进行了调优,可用于研究和商业用途。

800_auto

Dolly 1.0 使用斯坦福大学的Alpaca团队创建的OpenAI API数据集进行训练。但是,该数据集的服务条款试图阻止任何人创建与OpenAI竞争的模型,所以Dolly 1.0不能用于商业用途。所有目前已知的主要指令跟随模型都面临这个限制。为了解决这个问题,Databricks决定创建一个没有商业用途限制的新数据集。

Dolly 2.0是一个基于EleutherAI pythia模型系列的120亿参数语言模型,在一个透明且免费提供的新数据集上进行了调优。这个数据集称为datab...

点击查看剩余70%

{{collectdata}}

网友评论