中广格兰旗下网站:中广互联  格视网  卫星界  社区
登录注册

登录X

没有账号?  快速注册>

首页新闻正文

快手可灵大模型可生成最长约3分钟视频

导语:其生成的视频分辨率高达1080P,且支持自由的宽高比。

  6月21日,快手可灵视频生成大模型宣布推出图生视频功能,支持根据不同文本内容,将静态图像转化为生动的5秒视频。同时,可灵支持对已生成的视频一键续写和连续多次续写,每次续写都能将视频延续约5秒,最终可实现长达3分钟的视频。

  6月6日,可灵视频生成大模型上线。据介绍,可灵大模型为快手AI团队自研,基于快手在视频技术方面的多年积累,采用Sora相似的技术路线,结合多项自研技术创新,效果对标Sora。记者看到,可灵大模型不仅具备概念组合能力和想象力,还能够生成大幅度的合理运动、模拟物理世界特性。其生成的视频分辨率高达1080P,且支持自由的宽高比。此前,网友展示的可灵生成的“吃面条”视频,自然流畅,一度火爆出圈。

​  记者了解到,目前,用户可在快手旗下的快影APP申请使用可灵大模型,进行文生视频的创作。凭着比肩Sora的视频效果,可灵邀测帐号一号难求。截至6月21日,已有超过14万人排队申请测试。由于目前“可灵”只向国内用户开放邀测,有大量国外网友以发中文、制作表情包等形式花式求号。

  基于可灵大模型,更多应用方向也已经或即将落地。记者注意到,基于肢体驱动的“AI舞王”功能已在快手和快影APP成功落地,用户只需上传一张全身或半身照片,即可体验一键跳舞的乐趣。近期还将上线“AI唱跳”新玩法,可以同时驱动表情和肢体动作,仅需一张照片就能生成唱跳“爱你”的生动视频。

  今年2月15日,OpenAI发布“文生视频”模型Sora,可以创建长达60秒的视频,其中包含高度详细的场景、复杂的摄像机运动以及多个角色,也可以根据静态图像制作动画,引发行业关注,Sora也一度成为国产大模型的对标方向。

  “国内厂商在对标Sora的过程中,技术积累是一个关键因素。”中国数实融合50人论坛专家洪勇表示,这要求国内团队不仅要掌握类似的深度学习技术,还要有能力进行创新。

  对图生视频大模型而言,视频时长为什么重要?在数字化领域专家、中关村物联网产业联盟副秘书长袁帅看来,模型在生成视频的一致性、动态性和连贯性等方面的表现,是衡量模型性能的重要指标。同时,模型在生成视频时长、分辨率等方面的能力,也是衡量模型实用性的重要因素,也能反映出模型在实际应用中的稳定性和可靠性。

【责任编辑: 王熙雁 】

推荐阅读

热门标签

作者专栏更多

关注我们

    中广互联
  1. 大视频行业最具影响力的媒体社群平台,重要新闻、独家视频、深度评论分析,推动电视行业与各行各业的连接。

  2. 电视瞭望塔
  3. 集合电视台、网络视听、潮科技等各种好玩信息。

  4. 5G Plus
  5. 专注于报道广电行业新鲜5G资讯,致力于成为广电行业有权威、有深度的5G自媒体平台。

  6. 4K8K
  7. UHD、4K、8K的最新资讯和最深入的分析,都在这里。

  8. 中广圈子
  9. 视频产业的专业圈子,人脉、活动、社区,就等你来。

  10. 格兰研究
  11. 我们只沉淀有深度的信息和数据。

  12. 卫星界
  13. 致力于卫星电视信息、卫星通信技术、天地一体网络应用案例、以及广电、通信等产业的市场动态、政策法规和技术资讯的传播。