

「超级云讲堂」第55期：认知启发的视觉-语言技术

北京超级云计算中心

2022-09-06

导读：指导单位：中国计算机学会高性能计算专业委员会主办单位：北京超级云计算中心

「超级云讲堂第55期」

指导单位：中国计算机学会高性能计算专业委员会

主办单位：北京超级云计算中心

直播平台：bilibili、视频号、知乎

本期嘉宾：于静，中国科学院信息工程研究所副研究员，CCF YOCSEF学术委员会学术秘书，CCF多媒体技术专业委员会委员

第55期内容预告

认知启发的视觉-语言技术

随着各行业多模态数据的快速增长和累积，如何跨越视觉、语言等不同模态信息实现对世界更加泛化的分析和推理，对于提升计算机的智能水平至关重要。因此，结合视觉与语言的跨模态智能技术成为近年来备受关注的研究领域，在多媒体智能创作、智慧教育、AI辅助医疗等越来越多场景中得到应用。

目前解决视觉-语言问题的主流深度学习方法主要依靠观察大量数据“归纳”出输入与输出的关联关系。人类的认知机制能否启发AI算法设计，让机器在一定程度上具备人的“认知”能力？

本次报告围绕：视觉-语言跨模态技术、介绍基于现有认知科学理论、在跨模态概念理解、关系识别、复杂推理、知识积累等共性基础问题上的最新进展，及其在一列些视觉-语言任务中的应用，期望对海南的产业发展有所启发和帮助。

报告章节

01 跨模态理解的基本问题

02 认知启发的跨模态概念概念表征与理解

03 认知启发的跨模态关系组织与理解

04 认知启发的跨模态知识积累与应用

05 跨模态技术应用及展望

报名预约

扫码报名预约，开播前有短信提醒；观看直播可参与互动抽奖，更可免费领取5000核时/500元卡时计算资源。

互动抽奖礼品

于静老师推荐书目：《学会提问》[Asking the Right Questions: A Guide to Critical Th]

（于静老师亲笔签名版）

特邀讲师

于静副研究员

于静，中国科学院信息工程研究所副研究员，CCF YOCSEF学术委员会学术秘书（2022-2023），CCF多媒体技术专业委员会委员。

于静致力于计算机视觉-自然语言处理相结合的跨模态智能领域。在TIP、TMM、PR等国际期刊和ICML、CVPR、AAAI, ACM MM、IJCAI等国际会议发表学术论文40余篇，亦担任TMM、PR、CVPR、ICCV、ECCV、AAAI、IJCAI等学术期刊和会议审稿人。主持和参与国家自然科学基金、国家重点研发计划项目、中科院战略性先导科技专项项目等各类国家级/省部级科研课题10余项。

个人主页：

https://mmlab-iie.github.io/

「超级云讲堂」由中国计算机学会高性能计算专业委员会指导，北京超级云计算中心主办，是集科研、学术、教育为一体的在线科普、公益直播讲堂。邀请各领域技术大咖、知名学者解读最新、最热科研、科普话题，分享基于云上科研环境的应用经验与成功实践。致力于打造一个易参与、乐分享、勤思考、善实践的科研、科普、学术交流平台，搭建科研、教研工作者与公众的纽带和桥梁，不但注重科学思想的传播，更注重不同领域思想的交叉和碰撞，志在营造多元的、思辨的科学文化交流氛围。

目前云讲堂已连续开播54期，B站粉丝数量1.1W+，累计观看次数达500000+，并拥有29个直播交流群，群活跃粉丝数量6000+。

往期课程观看链接：

https://space.bilibili.com/505497082

直播扣扣交流群号：794834983

直播平台：bilibili、视频号、知乎

科普、公益、多元、思辨