英伟达发布仅次于与openai的o1的通用大模型Nemotron-4 340B
英伟达宣布推出Nemotron-4 340B,这是一款具有3400亿参数的开源大模型,旨在帮助开发者生成合成数据,训练大型语言模型(LLM),并应用于医疗、金融、制造等多个行业。Nemotron-4 340B系列包括基础模型、Instruct模型和Reward模型,形成一个完整的pipeline,用于生成高质量的合成数据,提升LLM的性能和鲁棒性。
高质量的训练数据对自定义LLM至关重要,但往往难以获取。Nemotron-4 340B通过开放模型许可,为开发者提供了一个免费且可扩展的解决方案。该模型系列已在Hugging Face平台上线,并将很快在ai.nvidia.com提供,支持NVIDIA NIM微服务和标准API部署。
Nemotron-4 340B Instruct模型能够创建多样化的合成数据,而Re...
点击查看剩余70%
网友评论