1月21日,“基于语料库的语言对比与翻译研究高端论坛(2018)”在河南工业大学举行,国内100多名专家学者济济一堂,深入探讨国内语料库的现状与发展成果,以期推动各个学科的语料库建设与翻译教学。本次高端论坛由全国语料库翻译学研究会指导,河南工业大学外语学院主办,河南华译教育咨询有限公司承办,上海佑译信息科技有限公司(UTH国际)和上海一者信息科技有限公司协办。河南工业大学常务副校长赵豫林教授、全国语料库翻译学研究会会长、北京外国语大学王克非教授出席开幕式,河南工业大学外语学院院长马玉梅教授主持论坛。UTH国际执行副总裁王志涛先生发表题为《学科化垂直语料库云平台与教学、科研创新》的主题演讲。
王志涛指出,UTH国际是一个以多语言大数据为核心的创新型公司,自2014年起就不遗余力的投入语料大数据基础设施建设和语言应用技术创新。目前UTH国际已构建起全球领先的150亿+精确双语句对平行语料库为核心的多语言大数据中心,为国内外多所高校和科研机构提供多语言大数据内容定制及语料库建设等解决方案。

UTH国际执行副总裁王志涛先生发表主旨演讲
王志涛指出,MT+PE、TM+PE、TM+MT+PE等新型翻译方式在欧美语言服务界已逐步成为主流操作模式,中国国内前5名的语言服务公司也都在积极的部署机器翻译引擎,这一趋势在移动互联和大数据时代必将以比过去快得多的速度影响到语言服务人才的培养,高等教育尤其是MTI教育应未雨绸缪,做好准备。他介绍了UTH国际已经发布的芝麻翻译(基于学科化语料大数据的智能教学与实训平台)、芝麻搜索(多功能语料库与教学、科研大数据云平台),同时演示了公司刚刚上线的法律语料库、旅游语料库、生命科学语料库等多款垂直语料库产品,以及即将发布的口译教学与实训语料库云平台、非母语翻译母语审校过程评价式语料库云平台等多款特色语料库产品。这些创新型产品均为云平台,并以多语言大数据为核心,是对传统教育教学所用“知识型”教科书和类似教学资源的颠覆,以开放、鲜活、互动(人机、人人)的数据驱动教学、科研和学生自主学习是这些语料库平台的典型功能。

UTH国际即将发布的其他语料库产品
王志涛表示,将平行语料、可比语料、单语语料等多种形式的语料以云平台的形式应用于教学、科研中是目前UTH国际产品开发和迭代的主要思路。平行语料、可比语料、单语语料等多种形态的语料在一个云平台上可以构建一个立体、互联的网络,而语料本身则同时以文本/语篇、句对和术语三种格式在平台上有最佳可视化展示并能够做到相互转化与生成。这样的语料库对于教学和科研有着很高的价值,也是UTH国际所致力于的目标。王志涛表示,以上语料展现形式在UTH国际的芝麻搜索(多功能语料库与教学、科研大数据平台)和旅游语料库等产品中已经基本实现,并在多所高校的教学、科研实际应用中获得了非常好的评价。此外,这些语料库对于学科建设、教材编写、词典编纂等也有着很高的应用价值。

王志涛先生与高校教师交流
同时,作为该高级论坛的一个有机组成部分,UTH国际还在“语料库运用与项目申报”研修班上以“学科化垂直语料库云平台的研制与应用”为题做了分享。1月24日下午,UTH国际研发副总监王慧和产品总监朱励作为联合讲师,就该主题与各位学员展开交流。研发副总监王慧现场对UTH国际在语料库产品的研制立意、研制过程、研制方法、研制成果等多个方面的进行了说明和展示。

研发副总监王慧先生分享语料库产品
产品总监朱励结合高校教师在教学、科研过程中的问题与难点,分享了芝麻翻译——基于学科化大数据的智能教学与实训平台、芝麻搜索——多功能语料库与教学、科研大数据平台的功能与应用场景。学员们现场试用,并纷纷表示,“终于为几天来的理论学习找到了突破口”。
在问答环节和会后,大家展开了更深入的讨论与交流。学员提出的问题归纳和汇总如下:
学校有大量原始双语文本或零散语料,不知道如何处理、如何利用
学校有语料,但自建语料库太困难,没有相应的技术人员,时间也不够
学校没有语料,基于学科建设的需要,需要研制通用语料库或专业语料库
是否可以校企合作,联合申报课题
高校有自己的特色专业,需要相应的语料库与平台
针对这些问题,产品总监朱励根据不同的需求提出了多样化的解决方案。如:为高校提供学科化的高质量语料,以及提供语料加工、对齐处理等服务,根据高校的语料需求校企合作共建语料库,提供定制化的平台技术支持,联合申报课题以及为高校定制语料库及平台等。

产品总监朱励现场解答教师问题
本次“语料库运用与项目申报”研修班,不仅是一场基于语料库的理论和实践分享,也是一场行业内的交流盛会,更是校企沟通的桥梁。通过研修班,高校教师学员加深了对UTH国际及产品的了解,并充分表达了强烈的校企合作愿望,希望通过“理论研究+语料定制+技术方案”实现共赢共荣。
会议邀请了语料库翻译学研究会会长王克非教授,北京外国语大学中国外语教育研究中心梁茂成教授,上海交通大学外国语学院胡开宝教授,南京大学外国语学院陈新仁教授,曲阜师范大学外国语学院秦洪武教授,北京师范大学比较文化研究所所长张政教授,北京外国语大学英语学院张威教授,西南大学外国语学院胡显耀教授,河南大学外国语学院刘泽权教授等多位业界大咖参会并主持、发言。主题涵盖《双语语料库与比较研究》、《深度学习、人工神经网络与机器翻译》、《中国外交话语英译中的中国外交形象研究》、《文本数据挖掘支持的批评性话语分析》、《语料库语用学:学科概况与前沿动态》、《语料库翻译学计量研究(2013-2017)》、《国家社科基金语言、文学类立项现状与态势—基于2013-2017年数据的统计分析》等国内外热点研究问题。
外语学院院长马玉梅教授主持闭幕式,高度赞扬了此次研讨会所取得的丰硕成果。全天的会议为大家带来一场学术与精神的碰撞,一百多位专家学者共襄盛举,共同奉献了一场珍贵的学术交流,从语料库的对比研究到社科基金的立项,从垂直语料库建设到校企合作推动翻译教学,都具有重大的价值与意义。

与会人员留影


