光学文字识别(OCR)技术在信息录入、图像理解、智慧金融、智能办公、智慧教育、电子商务、信息安全、文化传承等诸多领域有非常广阔的应用前景,是计算机视觉及人工智能领域的重要研究问题之一。近年来,基于数据驱动的深度学习技术已成为OCR领域的主流方法,但其性能极大依赖费时费力的海量数据收集和标注。
在今天的课程中,金连文教授将从如何低成本利用大规模数据、如何降低深度学习模型对标签数据的依赖这一视角,来为大家介绍OCR领域一些新的研究进展,并对此领域的一些重要问题及发展趋势进行讨论和展望。
观看本期直播的观众朋友们可免费领取由北京超算提供的500元卡时计算资源,还有超多精美周边礼品等你来拿哦!赶紧预约起来吧!
特邀嘉宾
金连文教授
金连文,华南理工大学二级教授,目前兼任中国图象图形学学会(CSIG)常务理事、CSIG文档图像分析与识别专委会主任、广东省图象图形学会副理事长、CSIG-CV、CAAI-PR和CAA-PRMI专委会常务委员等职。
主要研究领域为光学文字识别、文档图像理解、手写文字分析与识别、计算机视觉及应用等,在国内外权威期刊及重要国际会议上发表论文200余篇,其中CCF A+SCI Q1论文100余篇,Google Scholar 论文被引用数11000余次、H指数54,部分研究成果在工业界得到规模化应用。先后荣获省部级科技奖5项(其中一等奖2项、二等奖3项),中国人工智能学会、中国图象图形学学会、中国电子学会科技进步二等奖各1次;指导学生荣获国际国内权威学术竞赛冠军20余次。
分享内容
- 面向OCR的数据增广与数据合成技术
- 弱监督手写文本行/手写篇幅文档识别方法
- 基于Transformer的弱监督端到端场景文本识别
- 自监督文字识别新方法新进展介绍
- 应用演示(Optional)
特邀主持
MMOCR 负责人:GT ,德克萨斯大学奥斯汀分校计算机硕士,曾在 UT ML Lab, CLOVA AI Lab 等机构研究和实习,并在 ICLR 等会议发表论文。主要研究方向为 OCR 及多模态 NLP。
直播预约
直播时间:
2023年 2 月 23日(本周四)
20: 00 - 21: 00
识别上方二维码填写表单预约直播,即可免费领取 500 元卡时高性能计算资源。
直播期间,在 OpenMMLab 视频号/B 站或北京超算视频号/B 站 参与弹幕讨论,小助手将在每平台抽取 2 名同学送出 OpenMMLab 精美周边 or 北京超算惊喜礼品【交流群内联系小助手领取奖品哦~】。
为了方便大家交流沟通,我们还建立了以【AI 奇妙夜】为主题的社群,直播相关的所有资料都将在群里分享,还能与大佬 1v1对话,期待你的加入!
栏目介绍
追踪社会热点,解读 AI 前沿,用开源的算法,促进 AI 知识渗透,以超算/高性能计算为原点,开启人工智能前沿应用视角。北京超级云计算中心联合计算机视觉开源社区 OpenMMLab ,共同发布直播栏目【AI 奇妙夜】,作为「超级云讲堂」的特别栏目,每月一期周四晚八点,陪大家一同打开 AI 领域的奇妙之门。
活动组织方
指导单位:中国计算机学会高性能计算专业委员会、北京市科学技术协会
主办单位:北京超级云计算中心、OpenMMLab
协办单位:中国图象图形学学会、北京图象图形学学会
北京超级云计算中心(简称“北京超算”),成立于 2011 年,是由北京市人民政府主导、院市共建的“北京超级云计算和国家重要信息化基础平台”, 现坐落于北京怀柔综合性国家科学中心—怀柔科学城。为推进国家“东数西算”工程实施,北京超算已在北京、宁夏、内蒙等地前瞻性地布局了三个主算力枢纽,以构建跨域资源协同调度体系,优化算力之间的统筹联动。
目前,北京超级云计算中心服务用户数超过 200,000 家,并连续三年蝉联中国HPC TOP100排行榜通用CPU算力性能(同构众核CPU性能)第一名。中心将持续扩容计算资源,满足大规模并行计算需求,可根据用户的计算量、应用程序及业务场景,提供随需供应、不排队、省心省时的高品质 VIP 计算服务。
OpenMMLab 开源社区具备深度学习时代最完整的计算机视觉开源算法体系,是产学研用四位一体的开放开源算法平台。
OpenMMLab 专注于视觉深度学习领域,涵盖 30+ 计算机视觉方向,支持 300+ 算法,提供 2,300+ 预训练模型。所有的工具箱都基于统一架构,提供代码工程组织架构优秀、拥有大量高质量算法内容的代码库,与提供模型训练能力的 PyTorch 等深度学习框架协同互补。
海报设计:王泊霖
图文/编辑:韩岳彤
审核:刘芳、杨伟峰
审核发布:胡永利

