英伟达开源了其最新的生成合成数据的通用大模型 Nemotron-4 340B

英伟达开源了其最新的生成合成数据的通用大模型 Nemotron-4 340B

英伟达宣布推出了 Nemotron-4 340B,这是一个包含 3400 亿参数的通用大模型。该模型主要用于生成合成数据,以帮助开发人员在无法访问大型标记数据集的情况下训练大语言模型(LLM)。Nemotron-4 340B 系列包括基础模型、Instruct 模型和 Reward 模型,它们可以形成一个 pipeline,用于生成和改进 LLM 的训练数据。

800_auto

这些模型经过优化,可与 NVIDIA NeMo 框架和 NVIDIA TensorRT-LLM 库配合使用,以提高效率和推理性能。Nemotron-4 340B 在 Hugging Face 上开源,并且可以通过 NVIDIA NIM? ai.nvidia.com 微服务访问...

点击查看剩余70%

{{collectdata}}

网友评论