常常有朋友会问,XbotGo/Blink Focos作为人工智能摄影师,是如何对运动进行拍摄的?
简而言之,我们的设备是通过人和球的运动速度、移动方向、加速趋势、具体动作和关节变化情况、来同时追踪多个人的位移变化,来综合计算最优的画面,完全脱离人工的干预来实现镜头自动实现追踪拍摄。
那么,今天就用浅显易懂语言跟大家介绍一下XbotGo的底层技术之一——“运动中的光流算法”。
“
什么是“光流算法(optical flow)”
光流算法是计算机视觉领域中的一种技术,用于追踪图像序列中物体在连续帧之间的运动。它基于这样的原理:当物体在相邻的图像帧中移动时,它们的像素会随之移动,形成一种“光流”模式。这种算法通过分析像素值的变化,来估计物体的运动速度和方向。
运动中的光流算法在许多应用中都有用武之地,包括视频分析、目标跟踪、机器人导航和运动捕捉等领域。它可以帮助理解物体在视频中的轨迹和速度变化,从而实现更智能化的图像处理和分析任务。这种算法在不同的情境下可能会有不同的变体和实现方式,但其核心目标始终是准确地捕捉物体的运动信息。
目标检测:目标检测是在视频流中找到物体并将其像素分组的过程。目标检测通过不同的方法来执行,如背景减除、帧提取、光流和时差法。
物体表示:物体表示可以使用多种技术来完成,如基于运动的表示、颜色表示等。物体可以是人、动物、鸟类、车辆、树木等。
物体跟踪:在图像中找到物体的路径被定义为物体跟踪。物体跟踪有不同的类型,如核心跟踪、阴影跟踪等。
“
光流算法在体育运动拍摄中的应用
自动化的球员检测和追踪在如今的学术界和专业体育领域中具备重要意义,然而,要实现这一目标却充满了挑战。体育比赛的自动化拍摄在技术和操作层面上都存在一些难点。首先,现场比赛的环境可能是复杂多变的,包括光线条件、场地尺寸以及观众的干扰。这些因素可能影响到自动化系统的准确性和稳定性,需要寻找方法来应对这些变化。
其次,不同类型的体育比赛可能涉及不同的规则和战术,这要求自动化系统具备对多种比赛类型的识别和适应能力。例如,足球、篮球和网球等项目的规则和比赛方式截然不同,因此需要设计灵活的算法来适应各种情况。
另外,球员的外貌、装备和动作都可能存在差异,这可能对球员检测和追踪造成挑战。特别是在职业比赛中,球员可能会穿着相似的队服,需要解决混淆识别的问题。
“
XbotGo:不只光流算法
为了应对这些挑战,我们的研发人员不断探索不同的技术方法,如基于机器学习的模型、深度学习网络等,以提高自动化球员检测和追踪的准确性。同时,考虑到不同比赛类型和环境的变化,算法的灵活性和可调整性也是至关重要的因素。
图源:Real-time multi-sport action tracking with convolutional neural networks
作者:Axel Baldanza, Jean François Aujol, Yann Traonmilin, François Alary
同时,我们还结合了位移流(displacement flow)算法,虽然在一些研究中认为这似乎是识别击球最有用的信息之一,特别是在区分相似击球时。但是在无数次的测试和反馈中,我们的技术团队发现,将空间信息与光学流的奇异点识别相结合识别,可以检测出与分类任务最相关的视频帧区域。
在目前的产品中,再加上人和球的运动速度、移动方向、加速趋势、具体动作和关节变化情况、来同时追踪多个人的位移变化,综合计算最优的画面,完全脱离人工的干预来实现镜头自动实现追踪拍摄。
目前,我们的技术团队通过持续的研究和创新,每天都在对算法进行优化和迭代,在下一个App版本的更新中,有望实现更稳定和更流畅的拍摄,同时,在未来的整个产品迭代中,有望在自动化体育比赛拍摄领域取得更大的进步。
关注公众号,持续获取更多
有关XbotGo人工智能摄影师
使用技巧、精彩玩法、活动信息 ![]()

