快手发布国产sora文生视频模型可灵,可生成30帧2分钟视频

快手发布国产sora文生视频模型可灵,可生成30帧2分钟视频

800_auto

快手推出的「可灵」视频生成大模型,是一款全新的国产 AI 技术产品,能够生成长达 2 分钟、30 帧每秒的高分辨率视频,支持多种宽高比。

6664e59674dd6.gif

该模型基于类 Sora 的 DiT 结构,采用了 Transformer 而非传统的 U-Net,以及自研的 3D VAE 网络和全注意力机制,以提高对复杂时空运动的建模能力。

快手大模型团队在模型设计、数据保障、计算效率和模型能力扩展等方面进行了深入研究,确保了模型的高效和高质量。

「可灵」模型已在快影 APP 中开启邀测,并且支持 720P 视频生成和竖版视频生成能力。

此外,快手还基于「可灵」大模型推出了其他应用,如「AI 舞王」等,展现了快手在大模型领域的深厚技术实力和广泛应用场景。

官网:https://kling.kuaishou.com/

{{collectdata}}

网友评论