由中国人工智能学会(CAAI)主办,国家开放大学、CAAI 教育工作委员会、浙江大学人工智能教育教学研究中心联合承办的人工智能通识课程系列直播公开课特别邀请了浙江大学肖俊教授带来《视觉智能技术》的主题分享。
主讲人简介
视觉智能技术
课程报告中,肖俊教授首先概述了计算机视觉技术的关键任务及其重要性,回顾了从传统图像处理方法到现代深度学习模型的发展历程,并探讨了未来的研究方向。在报告中,详细介绍了视觉智能技术的基础概念和发展历程,强调视觉通道信息占人体大脑感知信息的80%左右,如在工业、商业和物联网环境中,80%的信息为视觉信息,计算机视觉作为人工智能重要分支的角色,目的就是让计算机通过处理和分析图像或视频来模拟人类视觉系统的能力,从数字视觉数据中提取、理解和解释有用的信息,并通过算法使计算机去理解和解释图像或视频数据。报告中,肖俊教授举例介绍了视觉智能技术的主要任务,包括物体识别、运动跟踪、场景理解等,并提到了视觉通道信息在人类感知中的重要性,强调了计算机视觉面临的挑战及其广泛应用,例如自动驾驶、医学图像分析、安全监控等领域。此外,重点分享了大模型驱动下的视觉智能发展与应用,介绍了图像描述生成技术发展过程中融合计算机视觉与自然语言处理,使得机器不仅能理解图像,还能生成逻辑连贯的文本描述,而多模态模型的发展,会使得视觉智能更加贴近人类的认知模式,语义分割技术的进步,使得精确分割特定物体成为可能。未来研究应致力于提高视觉智能系统的可解释性,使其不仅仅是“黑盒子”,以适应更多复杂的现实世界场景。
本文部分来源CAAI 教育工委会

