研究概述
视频生成已经从"又一个更好的模型"演进为关于"视频这个 modality 到底该用来干什么"的根本路线分歧。 2026 年 3 月 Sora 2 关停、Runway GWM-1 世界模型登台、Kling ARR 突破 3 亿美元、字节 Seedance 2.0 借 CapCut 全球分发—— 几件大事同时发生,恰好划清了"内容生成派"和"世界模拟派"的分野。 本报告从玩家、技术、商业三个层面系统拆解整个赛道,回答"现在在哪、往哪走、押什么"三个核心问题。
22+
覆盖玩家
6
发展阶段
8
技术路线
$1.1B+
全球市场规模
玩家研究
5 份 · 覆盖 22 家玩家
01 / 重点
快手可灵 Kling 深度专研
盖坤+张迪+万鹏飞团队、DiT 架构演进、Kling 1.0 → 3.0 版本史、$300M ARR 商业化、国内外市场表现、与 Sora/Veo/Seedance 全面对比。
02
国内其他玩家
字节 Seedance/即梦、生数 Vidu、MiniMax 海螺、阿里通义万相、腾讯混元、爱诗 PixVerse、智谱、潞晨、昆仑 SkyReels、阶跃星辰——10 家深度拆解 + 横向对比。
03
海外头部:Sora / Veo / Runway
OpenAI Sora 从爆红到 2026-03 关停的完整复盘、Google Veo 3.1 分发霸权、Runway Gen-4.5 + GWM-1 战略转型世界模型,三家差异化定位对比。
04
海外挑战者
Pika/Luma/Higgsfield/Genmo/Lightricks/Meta MovieGen/Stability/Moonvalley/Hotshot/Haiper/Kaiber/Krea——第二梯队全景,谁在活谁在死。
05
赛道全景与对标
市场规模、Artificial Analysis Arena 与 VBench 2.0 榜单、技术路线对比、商业化模式、ARR 排名、应用场景地图、梯队分级、给从业者的结论。
技术拆解
4 份 · 原理 / 训练 / 发展史 / 路线
06
基本原理与推理逻辑
视频的数学本质、扩散模型、DiT 架构、3D VAE、时空注意力、推理完整流程(CFG / 采样器 / 蒸馏)、与 LLM 的 6 大本质差异。附一页速记卡。
07
训练阶段详解
10 个训练阶段——数据准备 / VAE / 主预训练 / HQ 微调 / SFT / RLHF / 多任务 / 蒸馏。成本分布、开源闭源差距来源、ASCII 全流程图。
08
发展阶段论
6 个阶段:GAN (2014) → VQ-VAE (2019) → Diffusion (2022) → DiT/Sora (2024) → 音视频一体 (2025) → 世界模型萌芽 (2026)。"现在在哪"+"下阶段何时"核心判断。
09
技术路线与未来趋势
8 条技术路线(架构/音视频/长视频/推理加速/多模态/应用层/开闭源/合规)。每家押注总结、3 个最确定趋势、VC/创业者视角的 bet 建议。