
林荣群:AI 时代下的智能视频编解码新思路
「如果能在信源端实现标准化控制,生成固定格式的视频,就可以实现更高效的压缩和传输。」
林荣群
鹏城实验室博士后,
ISCAS2024 神经网络视频
编码竞赛第一名,
鹏城云脑文生视频大模型负责人
周世付:虚拟数字人的发展趋势与技术突破
3D 智能数字人:3D 形式将成为主流,结合大语言模型实现更高级的智能化。
实时互动:传输表情参数而非图像像素,依靠终端设备重建数字人形象,实现低延迟、高流畅度的互动体验。
虚实融合:将数字人融入虚拟空间,增强沉浸式互动体验。
-
低成本应用:通过技术进步降低计算量和成本,推动数字人在更广泛的场景中应用。
「从语音中提取嘴唇的表情参数,然后在图像处理阶段,只驱动或处理人脸的嘴唇区域。这种方案可以显著缩小模型的体积,并实现在终端设备上的实时推理。」
周世付
声网人工智能算法负责人
陈建华:新一代视频编解码标准 VVC 的机遇与挑战
「随着 AI 或者 5G 的发展,人眼视觉不再是视频消费唯一的形式了。面向机器视觉这样的视频会越来越多、越来越丰富,所以这也会很大地推动面向机器视觉编码的发展。」
陈建华
阿里巴巴达摩院高级算法专家
曹磊:AI Codec 将引领视频编解码技术革新
「AI Codec 的发展顺应了 AI 芯片的发展,也是顺应了 AI 的发展。」
曹磊
双深科技 CEO
张旭东:AI 视频生成技术的飞跃与实践
强大的语义理解能力:能够精准捕捉复杂的场景描述。
多镜头语言支持:实现镜头间的流畅过渡。
极致的推理速度:仅需 30 秒即可生成一段视频。
出色的一致性表现:在不同场景中保持人物形象、动物特征等元素的一致性。
-
参考图像支持:可以根据提供的商品图、人物照片等生成相关视频。
这些特性赋予 AI 生成视频在广告制作、影视宣发等领域巨大的应用潜力。张旭东以动画电影《熊猫呼呼》和科幻电影《毒液》的宣传视频为例,展示了 AI 技术如何将原本 1-2 天的制作周期压缩至 3 小时内,极大地提升了效率。
「主体一致性是 Vidu 的主轴,也是其独有的优势。」
张旭东
生数科技产品总监
圆桌讨论:视频生成的 ChatGPT 时刻何时到来?


