快手可灵大模型可生成最长约3分钟视频

2024年06月25日来源：北京日报客户端

导语：其生成的视频分辨率高达1080P，且支持自由的宽高比。

　　6月21日，快手可灵视频生成大模型宣布推出图生视频功能，支持根据不同文本内容，将静态图像转化为生动的5秒视频。同时，可灵支持对已生成的视频一键续写和连续多次续写，每次续写都能将视频延续约5秒，最终可实现长达3分钟的视频。

　　6月6日，可灵视频生成大模型上线。据介绍，可灵大模型为快手AI团队自研，基于快手在视频技术方面的多年积累，采用Sora相似的技术路线，结合多项自研技术创新，效果对标Sora。记者看到，可灵大模型不仅具备概念组合能力和想象力，还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080P，且支持自由的宽高比。此前，网友展示的可灵生成的“吃面条”视频，自然流畅，一度火爆出圈。

　　记者了解到，目前，用户可在快手旗下的快影APP申请使用可灵大模型，进行文生视频的创作。凭着比肩Sora的视频效果，可灵邀测帐号一号难求。截至6月21日，已有超过14万人排队申请测试。由于目前“可灵”只向国内用户开放邀测，有大量国外网友以发中文、制作表情包等形式花式求号。

　　基于可灵大模型，更多应用方向也已经或即将落地。记者注意到，基于肢体驱动的“AI舞王”功能已在快手和快影APP成功落地，用户只需上传一张全身或半身照片，即可体验一键跳舞的乐趣。近期还将上线“AI唱跳”新玩法，可以同时驱动表情和肢体动作，仅需一张照片就能生成唱跳“爱你”的生动视频。

　　今年2月15日，OpenAI发布“文生视频”模型Sora，可以创建长达60秒的视频，其中包含高度详细的场景、复杂的摄像机运动以及多个角色，也可以根据静态图像制作动画，引发行业关注，Sora也一度成为国产大模型的对标方向。

　　“国内厂商在对标Sora的过程中，技术积累是一个关键因素。”中国数实融合50人论坛专家洪勇表示，这要求国内团队不仅要掌握类似的深度学习技术，还要有能力进行创新。

　　对图生视频大模型而言，视频时长为什么重要？在数字化领域专家、中关村物联网产业联盟副秘书长袁帅看来，模型在生成视频的一致性、动态性和连贯性等方面的表现，是衡量模型性能的重要指标。同时，模型在生成视频时长、分辨率等方面的能力，也是衡量模型实用性的重要因素，也能反映出模型在实际应用中的稳定性和可靠性。

【责任编辑：王熙雁】

推荐阅读

品牌活动

24小时阅读榜

热门标签

广电总局	中国广电	中央广播电视总台	卫星互联网	重温经典
有线	微短剧	5G	网络整合	人事
超高清	应急广播	政企业务	系统性变革	AIGC