【深度】Sora发布引热议，生成式人工智能将如何推动广电视听新质生产力的大发展？

2024年02月20日来源：国家广电智库

导语：广电视听行业要把握发展大势，守正创新，推动人工智能在行业应用安全可靠可控，实现广电视听行业高质量发展。

　　（本文作者：国家广电总局发展研究中心　沈雅婷）

导读

　　2024年2月16日凌晨，Open AI发布文生视频模型Sora，引发广电视听行业内外的热烈讨论。毫无疑问，以Sora为代表的生成式人工智能将推动广电视听新质生产力的大发展，并引发行业颠覆性变革。广电视听行业要把握发展大势，守正创新，推动人工智能在行业应用安全可靠可控，实现广电视听行业高质量发展。

　　近日，Open AI继推出聊天机器人ChatGPT和图像生成器DALL·E之后，再次进军文生视频领域，发布文生视频模型Sora，并将其定位为“世界模拟器”。相较于同赛道谷歌Lumiere、Meta Emu、Runway Gen-2、Pika等产品模型，Sora呈现出惊人的技术跃迁，引发行业内外的广泛热议。

一、文生视频模型Sora发布引发热议

　　现阶段Sora尚未对公众开放，但通过分析Sora官网和OpenAI CEO Sam Altman在社交网站上陆续发布的生成视频示例，大家发现Sora根据文本提示生成的视频内容镜头流畅、画质高清、视觉表现丰富，能够很好地展现场景中的光影关系、物体间的遮挡关系、角色的动作细节等，时长可达1分钟，展现出前所未见的专业视频生成能力。

　　人工智能专家、技术公司掌门人、高校学者纷纷探讨Sora呈现出的技术优越性，展望生成式人工智能技术加速迭代将给经济社会带来的影响。根据Sora官网公布的有限的技术文件，Sora是一个在不同时长、分辨率和宽高逼的视频及图像基础上训练而成的扩散模型，同时采用了Transformer架构。另外，Sora还能将现有的静态图像转化成视频，精准赋予图像中内容以生动的动作；模型还能拓展现有视频或补全缺失的帧。在Sora呈现的系列技术特性基础上，大部人都认为Sora已经初步具备了理解真实世界并对世界进行模拟的能力，当前存在的弱点会在技术迭代中得到解决；英伟达人工智能研究院首席研究科学家Jim Fan认为Sora是一个数据驱动的物理引擎，视频生成领域的GPT-3时刻已经到来；周鸿祎认为Sora的诞生意味着通用人工智能的实现可能从10年缩短至一两年；经济学人杂志刊文认为，生成式AI将在2024年成为主流。但有人开始担忧Sora可能引发的社会和伦理问题。

　　相较于早期聊天机器人、图像生成器等生成式人工智能技术的发布，Sora作为一种文生视频技术，直接对标广电视听行业内容创作生产这一关键核心领域，愈发牵动广大广电视听行业从业人员的心弦。部分影视从业人员认为不远的将来强大的视频生成工具将抢走其谋生的饭碗，大批摄像师、剪辑师将下岗，宣传片、广告片、短视频将更快地受到影响。也有部分人认为AI将能够快速生成逼真的场景和特效，进一步降低内容生产的成本，完成创作者关于内容画面的想象。目前生成式人工智能在视听内容生产领域已经有了较为广泛的应用，比如动画电影前期动态分镜预览中开始大量使用文生图模型Midjourney。

OpenAI CEO奥特曼在社交媒体根据网友的文字内容提示发布Sora生成的视频内容

二、广电视听将发生系统性生态变革

　　Sora作为生成式人工智能这一新质生产力的代表，将大大提升视听内容的生产效率，通过生产要素的组合优化推动视听产业生态转型，进一步推动视听传播生态的深刻变革。

　　一方面，生成式人工智能涌现的巨大新质生产力将使得传统广电视听的从业人员从技术性的制作活动中解放出来，传统广电视听产业链将实现重塑。科技公司、人工智能企业等科技主体将成为广电视听产业发展的重要支撑。广电视听行业的从业人员将更加注重开展人工智能技术工具的学习和应用，实现内容创意的创新表达。现有视听内容资源和数据将实现更大范围的开发利用。传统的技术体系将经历体系性重构。传统的视听内容生产关系也将在各方势力的角逐中实现新的平衡。

　　另一方面，专业视频的创制门槛将进一步降低，机器生成内容将以指数级增长态势涌向各个渠道，视听传播生态将迎来巨大的机遇和挑战。任何人，即使没有视听内容制作技能，只要有想法，就能够通过各类技术工具轻松创建视听内容。小说等文学作品可以直接生成动漫、电视剧。视听内容数量尤其是机器生成内容爆发式增长，视听内容市场将迎来新一波繁荣。然而，生成式人工智能也使得真实和虚拟内容见的分野逐渐模糊，社会面临虚假信息、内容欺诈等新风险。比如2024年1月，人工智能生成的流行歌星泰勒·斯威夫特 (Taylor Swift) 的虚假色情图片在社交媒体上疯传，短时间内浏览量飙升至上千万，美国白宫为此表达了对AI生成照片的担忧。2月，虚拟机器人电话冒充美国总统拜登的声音，劝说接听者不要在新罕布什尔州初选中投票。

三、人工智能生成内容应坚持正确的价值取向

　　广播电视和网络视听是重要的意识形态阵地，对标广电视听工作的工作定位和使命任务，生成式人工智能仍然是技术工具，需要正确价值观来驾驭，需要广电视听工作人员发挥主观能动性去引导和补足，主要体现在两方面。

　　一是真实性。真实性是新闻、专题片、访谈、纪录片等纪实性内容的生命，人民群众主要依靠纪实性内容来认识感知客观世界并指导行动。生成式人工智能无法自动生成真实人物、真实场景、真实事件，不能完全替代纪实性内容的采集和录制。随着生成式人工智能技术的持续迭代，仿真能力和虚拟世界的构建能力越来越强，如何让群众准确区分真实和虚拟也是极具挑战的课题。

　　二是价值引领。技术先进性并不意味着思想先进性。生成式人工智能是在现有数据和资料基础上对现实世界进行认知和演绎，很容易受到现有训练资料偏见的影响，呈现出种族和性别刻板印象，然而优质的视听内容作品应当以社会主义核心价值观为引领，传承和弘扬中华优秀传统文化，展现社会主义先进文化，这点仍然需要发挥人的主观能动性，需要文艺创作者基于自身的观察体悟，才能孕育出立足时代伟大实践、反映人民火热生活的精品力作。

四、确保人工智能应用安全可靠可控

　　现阶段人工智能已经较为广泛地应用在广电行业智能推荐、场景生成、人脸合成、视频修复、虚拟数字人等领域，智能视频剪辑、智能写稿、智能排播等功能也大量应用到节目采写和生成领域，传统广电生产效能和服务水平不断提升。此次Sora的发布再次展现了人工智能在视频生成领域的潜能和风险。

　　一方面，要积极促进生成式人工智能在广电视听行业的应用。充分认识以生成式人工智能为代表的新质生产力的革命性力量，积极拥抱技术发展大势。完善网络算力等新型基础设施，激活数据等新型生产要素，为视听行业发展提供强大支撑。推动超高清电视、机顶盒、虚拟现实（增强现实）设备等产品普及，加快高新视听技术产业发展和应用。加强新型人才的培养力度，提升行业人员知识快速迭代能力。

　　另一方面，要重视防范风险实现应用的安全可靠可控。尤其要加强对生成视频内容的标注，使用户能够显著区分真实和虚拟内容。在《生成式人工智能服务管理暂行办法》基础上制定完善利用生成式人工智能服务从事新闻出版、影视制作、文艺创作等活动的管理办法。推动科技企业加强行业自律，通过技术手段从源头防止错误信息、仇恨内容、偏见内容、色情暴力等内容的传播。加强国内国际交流合作，构建开放、公正、有效的治理机制，共同做好风险防范。

【责任编辑：徐亚新】

广电总局	中国广电	中央广播电视总台	卫星互联网	机顶盒
有线	微短剧	5G&6G	网络整合	人事
超高清	应急广播	国际传播	系统性变革	AIGC