WizardLM:利用 Evol-Instruct 提高大语言模型 (LLM) 执行复杂指令的能力-BFW编程笔记

WizardLM:利用 Evol-Instruct 提高大语言模型 (LLM) 执行复杂指令的能力

先说说什么是Evol-Instruct？

Evol-Instruct是一个用于训练模型执行复杂指令的技术。具体来说:

? Evol-Instruct 首先生成一系列随机的初级指令。

? 然后模型开始尝试根据这些指令去执行相应动作。如果模型能成功执行,则保留这条指令。

? Evol-Instruct 会根据模型执行结果,进化出更“先进”的指令来训练模型。

? 模型再次根据新指令去执行,如果能成功则继续进化指令,如果失败则修正指令。

? 指令跟模型的“进化”通过这种...