潮流

依托ViT (Vision Transformer)、Clip、DiT (Diffusion Transformer)、世界模型（World Model）、大语言模型（Large Language Model）等技术的飞速进步，AIGC模型已初步具备感知现实世界、认知物理定律的能力，模型生成的图片、视频在画面绚丽精细的同时，对于真实世界的客观规律符合性上也有了长足进步。在视频时长上，头部模型一次生成的视频长度可达到几分钟量级，由“短视频”开始向“长视频”过渡。在镜头语言层面，头部模型生成视频不仅能够支持镜头的“推拉摇移”操作，还可实现镜头拍摄主体或镜头拍摄背景的转换与变化，视频内容正在从2024年初的“单镜头呈现”发展为目前的“多镜头组合”，这表明AIGC的视频生产能力正在由“镜头级”向“场景级”进化，模型开始具备一定的叙事能力。

作为以内容生产制作为主的媒体行业，是AIGC技术赋能应用的天然舞台，AIGC技术呈现出来的上述变化也越来越贴合媒体行业的生产需求。当前，国内各家广播电视机构都在积极拥抱AIGC技术，以总台为首，上海、北京、河南、河北、福建、安徽等省级台，吉林、成都、中山、南京、太原、无锡等地市级台，都纷纷成立 AIGC实验室，通过媒体基础设施的创新，促进行业的智能化发展。通过LLM和AIGC技术的结合使用，现有生产流程中的节目脚本策划、人物形象设计、分镜脚本编制、视频内容制作、节目成片润色等环节均可注入智能化辅助生产能力，由大模型快速生成内容初稿或视频素材，再配合大模型的多模态内容匹配、智能剪辑等技术，节目生产效率可以得到显著提升。涌现出了央视听媒体大模型2.0、上海台Scube系统、四川观察“如意”AI互动平台、江苏台AI Hub智能工具集平台、浙江智慧果AIGC创作平台等一系列典型应用。

自2024年2月Sora模型横空出世以来，一年多时间我们已经看到AIGC技术得到了显著进步，其发展速度难以估量。未来随着模型能力的进一步升级，AIGC还具有颠覆内容生产底层逻辑、再造内容生产流程、重构全新生产传播形态的巨大潜力，这就需要我们牢牢把握发展机遇，应势而上加速培育数字内容生产领域的新质生产力，为媒体行业高质量发展提供源源不断的技术动能。