
依托ViT (Vision Transformer)、Clip、DiT (Diffusion Transformer)、世界模型(World Model)、大语言模型(Large Language Model)等技术的飞速进步,AIGC模型已初步具备感知现实世界、认知物理定律的能力,模型生成的图片、视频在画面绚丽精细的同时,对于真实世界的客观规律符合性上也有了长足进步。在视频时长上,头部模型一次生成的视频长度可达到几分钟量级,由“短视频”开始向“长视频”过渡。在镜头语言层面,头部模型生成视频不仅能够支持镜头的“推拉摇移”操作,还可实现镜头拍摄主体或镜头拍摄背景的转换与变化,视频内容正在从2024年初的“单镜头呈现”发展为目前的“多镜头组合”,这表明AIGC的视频生产能力正在由“镜头级”向“场景级”进化,模型开始具备一定的叙事能力。
作为以内容生产制作为主的媒体行业,是AIGC技术赋能应用的天然舞台,AIGC技术呈现出来的上述变化也越来越贴合媒体行业的生产需求。当前,国内各家广播电视机构都在积极拥抱AIGC技术,以总台为首,上海、北京、河南、河北、福建、安徽等省级台,吉林、成都、中山、南京、太原、无锡等地市级台,都纷纷成立 AIGC实验室,通过媒体基础设施的创新,促进行业的智能化发展。通过LLM和AIGC技术的结合使用,现有生产流程中的节目脚本策划、人物形象设计、分镜脚本编制、视频内容制作、节目成片润色等环节均可注入智能化辅助生产能力,由大模型快速生成内容初稿或视频素材,再配合大模型的多模态内容匹配、智能剪辑等技术,节目生产效率可以得到显著提升。涌现出了央视听媒体大模型2.0、上海台Scube系统、四川观察“如意”AI互动平台、江苏台AI Hub智能工具集平台、浙江智慧果AIGC创作平台等一系列典型应用。
自2024年2月Sora模型横空出世以来,一年多时间我们已经看到AIGC技术得到了显著进步,其发展速度难以估量。未来随着模型能力的进一步升级,AIGC还具有颠覆内容生产底层逻辑、再造内容生产流程、重构全新生产传播形态的巨大潜力,这就需要我们牢牢把握发展机遇,应势而上加速培育数字内容生产领域的新质生产力,为媒体行业高质量发展提供源源不断的技术动能。
