12月6日,谷歌正式推出新的大语言模型Gemini 1.0,并针对不同场景发布Ultra、Pro和Nano三个不同版本。Gemini 1.0的Ultra版本在多项能力上超越GPT-4,并且成为第一个在MMLU(大规模多任务语言理解)上超越人类专家的模型。
事件2:视频AIGC加速发展
11月29日,美国 AI 初创公司Pika labs正式发布首款文生视频产品Pika 1.0,根据官方介绍,该产品能够生成和编辑3D动画、动漫、卡通和电影,并可进行视频局部修改和风格调整,具有领先的连贯性及语义理解能力。
Gemini 1.0的 Ultra 版本在多项能力上超越GPT-4,并且成为第一个在 MMLU(大规模多任务语言理解)上超越人类专家的模型。Gemini 的多模态能力使其不仅能够理解和生成文本、代码,还能够看懂和生成图像。Gemini 将陆续出现在谷歌体系内更多产品和服务中,如搜索、广告、Chrome 和 Duet AI。
短期来看,Gemini的发布将进一步带来对多模态模型的更多期待,对产业而言,多模态料将带动算力需求的提升;而在中长期来看,预计多模态模型的升级将丰富相关产品的使用场景,叠加硬件升级、算法优化带来的成本优化,2C产品的进展值得期待。持续看好本轮生成式AI浪潮对科技产业的长周期影响和改变,继续关注算力、算法、数据、应用等环节的领先厂商。
2、11月29日,文生视频公司Pika labs正式发布Pika1.0。Pika由斯坦福华人博士生郭文景等创立于2023年4月,是仅有4人的初创公司,创立初衷在于构建较Runway更易使用的的AI视频生成工具。半年以来公司用户已超50万,每周生成数百万个视频,且已经获得了5500万美元融资。
Pika 1.0 具备几个突出特点:
1)视频效果优质,拥有电影质感,动画级特效。从像素风到到黑白幻灯片效果,演示出的5种风格转化,几乎涵盖了现有电影和动画大部分风格。且类似于Midjourney对于图片「外画」功能,Pika1.0可以根据已有的素材直接扩展视频,生成不同高宽比的内容;
2)支持对于视频实时编辑和修改。可以直接在视频中添加想要的素材,支持三种模态的提示输入。
多模态大模型能够提升用户交互体验,促进AIGC应用产品形态和功能的创新,提升用户付费意愿。AI 生态企业的垂直应用有望受益于语音、图像等多模态能力的完善。同时,伴随GPT-5等模型的推出,预计将看到:1)多模态模型带来的算力需求增长以及 2)越来越多的AI场景与产品的出现。持续看好后续AI产业的前景,后续GPT-5等模型的发布或将带来更多的催化。
此外,随着AIGC革命不断深化,AI与产业结合成为当前的最重要的发展主题之一。图片-视频-3D 等图像多模态的落地处于循序渐进的过程,AIGC正在对传统创意图像生成领域带来显著变革,推进设计软件从“工具类”应用向“生产力”的角色转变。据机构测算,平面设计领域AI短期内实现替代10-15%的生产力,国内市场增量约42-63亿元;国内AI商品图市场潜在市场空间约为41-93亿元。《2023年度AI设计实践报告》数据显示,设计师层面接近一半的设计师使用过原生AI工具,未使用的最大原因是需要付费;企业层面,8.4%的企业已使用AI来辅助设计,渗透率仍较低;行业方面,互联网、快消领域对AI介入偏好度高。此外,国产AI工具使用率低于海外,国内相关厂家的产品力仍有较大提升空间。
AIGC有望打开内容创意类工具企业市场空间,传统有场景、有数据和用户的企业或更受益。预计1)2024年将出现全民刷屏级AI营销案例;2)国产工具有望超过海外工具。
展望未来,AI应用或将成为此轮AI行情下半场的重要投资方向,各个领域出现创新性AI应用,建议关注:1)文生图/文生视频等创作类场景;2)AI教育;3)企业服务。与此同时,伴随AI应用逐步落地,算力需求或呈量级式提升,据《中国人工智能计算力发展评估报告》显示,2023年我国人工智能算力市场规模将达到664亿元,同比增长82.5%,预测到2027年之前,中国智能算力规模年复合增长率将达33.9%,同期通用算力规模年复合增长率为16.6%。文生视频的高计算难度和高数据要求将支撑上游 AI算力需求持续旺盛,光模块、交换机、算力租赁、数据中心作为 AI 算力产业链核心环节有望受益,建议关注板块投资机遇。
文章来源:华夏基金
大家都在看

