「超级云讲堂第55期」
指导单位:中国计算机学会高性能计算专业委员会
主办单位:北京超级云计算中心
直播平台:bilibili、视频号、知乎
本期嘉宾:于静,中国科学院信息工程研究所副研究员,CCF YOCSEF学术委员会学术秘书,CCF多媒体技术专业委员会委员
第55期 内容预告
认知启发的视觉-语言技术
随着各行业多模态数据的快速增长和累积,如何跨越视觉、语言等不同模态信息实现对世界更加泛化的分析和推理,对于提升计算机的智能水平至关重要。因此,结合视觉与语言的跨模态智能技术成为近年来备受关注的研究领域,在多媒体智能创作、智慧教育、AI辅助医疗等越来越多场景中得到应用。
目前解决视觉-语言问题的主流深度学习方法主要依靠观察大量数据“归纳”出输入与输出的关联关系。人类的认知机制能否启发AI算法设计,让机器在一定程度上具备人的“认知”能力?
本次报告围绕:视觉-语言跨模态技术、介绍基于现有认知科学理论、在跨模态概念理解、关系识别、复杂推理、知识积累等共性基础问题上的最新进展,及其在一列些视觉-语言任务中的应用,期望对海南的产业发展有所启发和帮助。
报告章节
01 跨模态理解的基本问题
02 认知启发的跨模态概念概念表征与理解
03 认知启发的跨模态关系组织与理解
04 认知启发的跨模态知识积累与应用
05 跨模态技术应用及展望
报名预约
扫码报名预约,开播前有短信提醒;观看直播可参与互动抽奖,更可免费领取5000核时/500元卡时计算资源。
互动抽奖 礼品
于静老师推荐书目:《学会提问》[Asking the Right Questions: A Guide to Critical Th]
(于静老师亲笔签名版)
特邀讲师
于静 副研究员
于静 ,中国科学院信息工程研究所副研究员,CCF YOCSEF学术委员会学术秘书(2022-2023),CCF多媒体技术专业委员会委员。
于静致力于计算机视觉-自然语言处理相结合的跨模态智能领域。在TIP、TMM、PR等国际期刊和ICML、CVPR、AAAI, ACM MM、IJCAI等国际会议发表学术论文40余篇,亦担任TMM、PR、CVPR、ICCV、ECCV、AAAI、IJCAI等学术期刊和会议审稿人。主持和参与国家自然科学基金、国家重点研发计划项目、中科院战略性先导科技专项项目等各类国家级/省部级科研课题10余项。
个人主页:
https://mmlab-iie.github.io/
「超级云讲堂」由中国计算机学会高性能计算专业委员会指导,北京超级云计算中心主办,是集科研、学术、教育为一体的在线科普、公益直播讲堂。邀请各领域技术大咖、知名学者解读最新、最热科研、科普话题,分享基于云上科研环境的应用经验与成功实践。致力于打造一个易参与、乐分享、勤思考、善实践的科研、科普、学术交流平台,搭建科研、教研工作者与公众的纽带和桥梁,不但注重科学思想的传播,更注重不同领域思想的交叉和碰撞,志在营造多元的、思辨的科学文化交流氛围。
目前云讲堂已连续开播54期,B站粉丝数量1.1W+,累计观看次数达500000+,并拥有29个直播交流群,群活跃粉丝数量6000+。
往期课程观看链接:
https://space.bilibili.com/505497082
直播扣扣交流群号:794834983
直播平台:bilibili、视频号、知乎
科普、公益、多元、思辨
海报设计:王泊霖
图文/编辑:韩岳彤
审核:杨伟峰
审核发布:胡永利

