2月16日,OpenAI发布文生视频大模型Sora,引起各界关注。Sora可以直接输出长达60秒的视频,远超此前文生视频的10S长度,达到了短视频的普遍时长,且拥有极度稳定的长镜头乃至多镜头和丰富稳定的物理交互。其细分AI视频视觉算法也引发市场关注。

  消息面上,近日,国务院国资委召开“AI赋能产业焕新”中央企业人工智能专题推进会。会议指出,开展AI+专项行动,强化需求牵引,加快重点行业赋能,构建一批产业多模态优质数据集,打造从基础设施、算法工具、智能平台到解决方案的大模型赋能产业生态。

  据悉,文生视频模型Sora从算法模型来看,使用了Diffusion模型Transformer的架构。申港证券分析师曹旭特在12月18日的研报中曾从技术路线探讨过AI视频的未来发展,文生视频模型背后其实有两条技术路线:一是从文本或图像生成中得到广泛的应用,基于Transformer架构的技术路线;二是扩散模型。而此次的Sora模型则是融合了两种技术路线推动视频生成技术的发展。

  两种技术路线的融合可能会推动视频生成技术的发展,并对AI行业的竞争格局产生影响。斯坦福大学AI科学家李飞飞团队与谷歌合作,推出了视频生成模型W.A.L.T,该模型成功地将Transformer架构整合到了隐视频扩散模型中,隐扩散模型(LDM)可在源自自动编码器的更低维隐空间中运行,从而降低计算需求。曹旭特此前曾认为在文生视频领域距离GPT时刻的来临仍需一定的时间,预计明年二季度会出现下一个出圈的AI视频应用。业内分析指出,此次Sora的问世大概率会进一步按下加速键。

  目前AI视频有两个较大的门槛,一是算力的掣肘,视频领域对算力需求更高;另一方面是竞争环境的激烈,当前头部科技巨头基本都已入局,只是产品尚未全面公测。值得注意的是,从W.A.L.T模型的例子来看,不能忽视算法的演进对AI视频领域的影响,曹旭特建议重点关注:视觉算法领先的虹软科技、当虹科技、格灵深瞳。同时可关注应用侧的金山办公、万兴科技、福昕软件等。

  据不完全统计,涉及AI视频视觉算法相关业务的上市公司有当虹科技、虹软科技、深科达、格灵深瞳、天准科技、博杰股份等。

  AI应用的迭代升级、推陈出新,推动AI工具在行业场景中的实际应用落地与变现,也将持续刺激与反哺算力基础设施相关需求持续火热。光模块方向是少数出海真正受益全球AI建设浪潮的,业绩释放能力强劲,预计短期也将迎来加速,当前建议重视光模块投资机会。中长期,把握高景气赛道,我们坚定看好AI算力产业链。

  光模块&光器件:中际旭创、天孚通信、源杰科技(电子联合覆盖)、新易盛、博创科技、仕佳光子、光库科技、中瓷电子(新材料联合覆盖);建议关注:鼎通科技、太辰光、剑桥科技、光迅科技。

  视频生成模型迎来技术突破,我们看好AI板块尤其是AI多模块的机会,建议关注:(1)AI多模态:万兴科技、美图公司(与海外组联合覆盖)、易点天下、焦点科技、当虹科技;(2)AI应用:金山办公、科大讯飞、恒生电子、鼎捷软件、福昕软件、用 友网络、金蝶国际、泛微网络、致远互联;(3)AI算力:华为链+海光信息、寒武纪、云天励飞、景嘉微(电子组联合覆盖)。