WizardLM:利用 Evol-Instruct 提高大语言模型 (LLM) 执行复杂指令的能力
先说说什么是Evol-Instruct?
Evol-Instruct是一个用于训练模型执行复杂指令的技术。具体来说:
? Evol-Instruct 首先生成一系列随机的初级指令。
? 然后模型开始尝试根据这些指令去执行相应动作。如果模型能成功执行,则保留这条指令。
? Evol-Instruct 会根据模型执行结果,进化出更“先进”的指令来训练模型。
? 模型再次根据新指令去执行,如果能成功则继续进化指令,如果失败则修正指令。
? 指令跟模型的“进化”通过这种...
点击查看剩余70%
网友评论