

AI奇妙夜 | 从数据驱动到模型自监督学习，金连文教授带你解密OCR

北京超级云计算中心

2023-02-21

导读：2月23日（本周四）晚8点，不见不散

光学文字识别（OCR）技术在信息录入、图像理解、智慧金融、智能办公、智慧教育、电子商务、信息安全、文化传承等诸多领域有非常广阔的应用前景，是计算机视觉及人工智能领域的重要研究问题之一。近年来，基于数据驱动的深度学习技术已成为OCR领域的主流方法，但其性能极大依赖费时费力的海量数据收集和标注。

在今天的课程中，金连文教授将从如何低成本利用大规模数据、如何降低深度学习模型对标签数据的依赖这一视角，来为大家介绍OCR领域一些新的研究进展，并对此领域的一些重要问题及发展趋势进行讨论和展望。

观看本期直播的观众朋友们可免费领取由北京超算提供的500元卡时计算资源，还有超多精美周边礼品等你来拿哦！赶紧预约起来吧！

特邀嘉宾

金连文教授

金连文，华南理工大学二级教授，目前兼任中国图象图形学学会（CSIG）常务理事、CSIG文档图像分析与识别专委会主任、广东省图象图形学会副理事长、CSIG-CV、CAAI-PR和CAA-PRMI专委会常务委员等职。

主要研究领域为光学文字识别、文档图像理解、手写文字分析与识别、计算机视觉及应用等，在国内外权威期刊及重要国际会议上发表论文200余篇，其中CCF A+SCI Q1论文100余篇，Google Scholar 论文被引用数11000余次、H指数54，部分研究成果在工业界得到规模化应用。先后荣获省部级科技奖5项（其中一等奖2项、二等奖3项），中国人工智能学会、中国图象图形学学会、中国电子学会科技进步二等奖各1次；指导学生荣获国际国内权威学术竞赛冠军20余次。

分享内容

- 面向OCR的数据增广与数据合成技术

- 弱监督手写文本行/手写篇幅文档识别方法

- 基于Transformer的弱监督端到端场景文本识别

- 自监督文字识别新方法新进展介绍

- 应用演示（Optional）

特邀主持

MMOCR 负责人：GT ，德克萨斯大学奥斯汀分校计算机硕士，曾在 UT ML Lab, CLOVA AI Lab 等机构研究和实习，并在 ICLR 等会议发表论文。主要研究方向为 OCR 及多模态 NLP。

直播预约

直播时间：

2023年 2 月 23日（本周四）

20: 00 - 21: 00

识别上方二维码填写表单预约直播，即可免费领取 500 元卡时高性能计算资源。

直播期间，在 OpenMMLab 视频号/B 站或北京超算视频号/B 站参与弹幕讨论，小助手将在每平台抽取 2 名同学送出 OpenMMLab 精美周边 or 北京超算惊喜礼品【交流群内联系小助手领取奖品哦~】。

为了方便大家交流沟通，我们还建立了以【AI 奇妙夜】为主题的社群，直播相关的所有资料都将在群里分享，还能与大佬 1v1对话，期待你的加入！

栏目介绍

追踪社会热点，解读 AI 前沿，用开源的算法，促进 AI 知识渗透，以超算/高性能计算为原点，开启人工智能前沿应用视角。北京超级云计算中心联合计算机视觉开源社区 OpenMMLab ，共同发布直播栏目【AI 奇妙夜】，作为「超级云讲堂」的特别栏目，每月一期周四晚八点，陪大家一同打开 AI 领域的奇妙之门。

活动组织方

指导单位：中国计算机学会高性能计算专业委员会、北京市科学技术协会

主办单位：北京超级云计算中心、OpenMMLab

协办单位：中国图象图形学学会、北京图象图形学学会

北京超级云计算中心（简称“北京超算”），成立于 2011 年，是由北京市人民政府主导、院市共建的“北京超级云计算和国家重要信息化基础平台”，现坐落于北京怀柔综合性国家科学中心—怀柔科学城。为推进国家“东数西算”工程实施，北京超算已在北京、宁夏、内蒙等地前瞻性地布局了三个主算力枢纽，以构建跨域资源协同调度体系，优化算力之间的统筹联动。

目前，北京超级云计算中心服务用户数超过 200,000 家，并连续三年蝉联中国HPC TOP100排行榜通用CPU算力性能（同构众核CPU性能）第一名。中心将持续扩容计算资源，满足大规模并行计算需求，可根据用户的计算量、应用程序及业务场景，提供随需供应、不排队、省心省时的高品质 VIP 计算服务。

OpenMMLab 开源社区具备深度学习时代最完整的计算机视觉开源算法体系，是产学研用四位一体的开放开源算法平台。

OpenMMLab 专注于视觉深度学习领域，涵盖 30＋计算机视觉方向，支持 300+ 算法，提供 2,300+ 预训练模型。所有的工具箱都基于统一架构，提供代码工程组织架构优秀、拥有大量高质量算法内容的代码库，与提供模型训练能力的 PyTorch 等深度学习框架协同互补。

海报设计：王泊霖

图文/编辑：韩岳彤

审核：刘芳、杨伟峰

审核发布：胡永利

【声明】内容源于网络

北京超级云计算中心

北京超级云计算中心（简称“北京超算”），成立于2011年，是在北京市人民政府指导下院市共建的国家重要信息化基础平台，现坐落于北京怀柔综合性国家科学中心--怀柔科学城。

内容 377

粉丝 0

北京超级云计算中心北京超级云计算中心（简称“北京超算”），成立于2011年，是在北京市人民政府指导下院市共建的国家重要信息化基础平台，现坐落于北京怀柔综合性国家科学中心--怀柔科学城。

总阅读201

粉丝0

内容377