发布时间:2024-12-15 09:09:01 来源: sp20241215
本报记者 袁传玺
在经历了去年AI大模型爆发式增长后,AI技术迎来新一轮更新迭代。文生视频模型Sora的出现,开启了AI的新时代,也对企业的算力提出更高的要求。
浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员盘和林对《证券日报》记者表示,Sora的出现,让国内AI企业趋之若鹜,但实现Sora同等级应用的难度并不小,对算力的需求会越来越大,所以各大AI企业应从现实出发,考虑应用落地的难易度。
AI发展步伐加快
大模型驱动的生成式AI具有极为广阔的应用前景,有望为众多行业带来强大的赋能效应。随着Sora的出现,AI发展的步伐将进一步加快。
“Sora在视频处理领域有巨大潜力,为未来更复杂、更精细的视频处理任务提供了可能性。”艾媒咨询CEO兼首席分析师张毅对《证券日报》记者表示,Sora的文生视频、图生视频等功能需要AI模型具备强大的泛化能力,这要求AI模型能够学习和理解视频内容的内在规律和结构,从而生成更加逼真、生动的视频内容。这也将推动AI模型在泛化能力方面进一步发展。
“Sora的出现不仅为人工智能领域提供了新的可能性,也将促进人工智能与其他技术的融合。例如,可以将Sora与虚拟现实(VR)、增强现实(AR)等技术结合,创建更加逼真的虚拟场景和交互体验;也可以将Sora与深度学习、计算机视觉等技术结合,提高视频处理和分析的准确性和效率。”张毅进一步表示。
天风证券研报表示,随着OpenAI发布Sora,文生视频模型能力大幅提升,内容创作工作流有望被颠覆,下一个亿级用户的互联网平台雏形已然出现。2000亿美元的短视频创作生态有望率先被颠覆,生成式AI在视频创作和世界模型的大踏步进步将实现对视频、3D、游戏等下游应用场景的渗透。
算力或成AI企业门槛
生成式AI模型的训练是一个计算极为密集的过程。这些模型包含数百万乃至数十亿个参数,需要在庞大的数据集上进行多轮迭代训练。在训练过程中,涉及大量矩阵运算和梯度计算等计算密集型操作。因此,为确保训练过程的顺利进行,必须依赖强大的计算资源来加速。
例如,ChatGPT的训练参数达到了1750亿、训练数据45TB,每天生成45亿字的内容,支撑其算力至少需要上万颗英伟达的GPU A100,单次模型训练成本超过1200万美元。
而Sora的出现对企业的算力提出了更高的要求。近日,360创始人周鸿祎提到,Sora的技术路线如果被开源,国内将能很快赶上,但在追赶Sora时,算力有可能成为门槛。“Sora能生成一分钟的视频,就意味着也能生成10分钟、60分钟的视频,但不做更长的视频,或因算力和成本的限制。”周鸿祎猜测。
银河证券研报称,据相关研究推测,Sora参数规模估算在30B,如果按此参数测算,推演出Sora训练单次算力需求或可达到8.4×10^23Flops,相当于GPT-3的2.7倍。伴随Sora不断迭代,训练数据集规模增大,未来算力需求将呈现指数级爆发式增长。
盘和林也表示,鉴于Sora设立时间并不久,估计现阶段参数量不大,但由于模型本身是一个不断积累的过程,未来几年参数量还会不断增长,Sora需要的参数量更为庞大,对算力的需求势必更大。
“算力或将成为AI企业的门槛与瓶颈,因为目前国内AI企业算力存在缺口,算力主要依赖于软件生态的CUDA和硬件生态的GPU,所以国内AI产业应该努力解决算力的问题,为AI应用的研发提供强有力的基础保障。”盘和林进一步表示。
(责编:罗知之、陈键)