潮流

原创 《现代电视技术》编辑部

导读

当前,人工智能(AI)浪潮持续涌动,正以前所未有的速度、广度和深度渗透入社会生活的方方面面,计算能力、感知算法和认知科学不断突破,大语言模型、多模态模型、智能体等技术持续迭代,以文生图/文生视频/图生视频模型为代表的人工智能生成内容(AIGC)技术尤为引人注目,国外的Sora、Movie Gen、Gen-4 等模型的生成能力不断完善引领产业进步,国内的即梦、海螺、可灵等模型奋起直追且各具特色,中央广播电视总台也于今年2月正式推出“央视听媒体大模型2.0”,各种基于AIGC模型的新模式、新应用层出不穷,为媒体行业数字内容的智能化生产打开了无限的想象空间。

图片

依托ViT (Vision Transformer)、Clip、DiT (Diffusion Transformer)、世界模型(World Model)、大语言模型(Large Language Model)等技术的飞速进步,AIGC模型已初步具备感知现实世界、认知物理定律的能力,模型生成的图片、视频在画面绚丽精细的同时,对于真实世界的客观规律符合性上也有了长足进步。在视频时长上,头部模型一次生成的视频长度可达到几分钟量级,由“短视频”开始向“长视频”过渡。在镜头语言层面,头部模型生成视频不仅能够支持镜头的“推拉摇移”操作,还可实现镜头拍摄主体或镜头拍摄背景的转换与变化,视频内容正在从2024年初的“单镜头呈现”发展为目前的“多镜头组合”,这表明AIGC的视频生产能力正在由“镜头级”向“场景级”进化,模型开始具备一定的叙事能力。

作为以内容生产制作为主的媒体行业,是AIGC技术赋能应用的天然舞台,AIGC技术呈现出来的上述变化也越来越贴合媒体行业的生产需求。当前,国内各家广播电视机构都在积极拥抱AIGC技术,以总台为首,上海、北京、河南、河北、福建、安徽等省级台,吉林、成都、中山、南京、太原、无锡等地市级台,都纷纷成立 AIGC实验室,通过媒体基础设施的创新,促进行业的智能化发展。通过LLM和AIGC技术的结合使用,现有生产流程中的节目脚本策划、人物形象设计、分镜脚本编制、视频内容制作、节目成片润色等环节均可注入智能化辅助生产能力,由大模型快速生成内容初稿或视频素材,再配合大模型的多模态内容匹配、智能剪辑等技术,节目生产效率可以得到显著提升。涌现出了央视听媒体大模型2.0、上海台Scube系统、四川观察“如意”AI互动平台、江苏台AI Hub智能工具集平台、浙江智慧果AIGC创作平台等一系列典型应用。

自2024年2月Sora模型横空出世以来,一年多时间我们已经看到AIGC技术得到了显著进步,其发展速度难以估量。未来随着模型能力的进一步升级,AIGC还具有颠覆内容生产底层逻辑、再造内容生产流程、重构全新生产传播形态的巨大潜力,这就需要我们牢牢把握发展机遇,应势而上加速培育数字内容生产领域的新质生产力,为媒体行业高质量发展提供源源不断的技术动能。