大数跨境
0
0

欧盟ParaCrawl委员会核心委员增至7名,UTH国际仍牢牢占据一席

欧盟ParaCrawl委员会核心委员增至7名,UTH国际仍牢牢占据一席 UTH国际
2018-02-02
2

近日,欧盟ParaCrawl项目咨询委员会召集第一次电话会议,标志着委员会工作正式启动。委员会后续将持续召集电话会议和组织论坛,推动ParaCrawl项目迈向更高的台阶。ParaCrawl项目咨询委员会由业内极具影响力的专家组成,其中包括来自欧盟(EU)、世界贸易组织(WTO)和世界知识产权局(WIPO)等国际组织的成员,还有来自Mozilla(柏林)、Facebook(法国)、TransPerfect(巴塞罗那)以及UTH国际(上海)等各行业在全球居于领先地位的企业代表。

此次会议中,委员会各委员首先欢迎新近加入的世界知识产权局统计机器翻译高级工程师Bruno Pouliquen先生,至此委员会增加至7名核心成员:

随后,各委员介绍了各自情况和关注点,并就项目进展进行了讨论。在讨论中,WTO(世界贸易组织)语言文档和信息管理部部长Josep Bonet先生、Mozilla公司机器学习研究员Kelly Davis先生、欧盟机器翻译项目经理Andreas Eisele先生、Facebook首席科学家Holger Schwenk先生分别指出本项目的成果可用于训练机器翻译引擎,提高翻译质量,与Firefox集成及数据挖掘服务等。但同时也强调,本项目需要扩大语料来源,包含更多非官方和政治文本,扩展语料范围和丰富度。UTH执行副总裁王志涛指出UTH已经积累了覆盖220多种语言的超过150亿句对的高质量数据,在数据爬取和深度挖掘方面具有丰富的经验,并且同排名中国前三的互联网公司搜狗达成了战略合作。他表示,愿意与委员会成员分享经验,推动项目的顺利开展。同时,在垂直领域语料库方面,UTH建设了中国领先的多个基于学科化语料库的教学科研平台,可为ParaCrawl项目垂直领域的语料采集和处理献计献策。

会后,各位委员还对委员会的官方表述做了邮件交流,达成了如下一致意见:

The ParaCrawl stakeholder board is a small yet very powerful group of experts in the field, comprising representatives from large international organisations namely the EU (eTranslation), WTO and WIPO and global industrial representatives namely Mozilla (Berlin), Facebook (Paris), TransPerfect (Barcelona) and UTH International (Shanghai).


截至目前,ParaCrawl项目组已爬取了超过十万个网站的内容,包含11个语言对,约9000多万句对(近20亿字符),项目组正在进行质量检查以及数据清洗,预计4月中旬将正式发布并更新至ELRC-Share资源库。同时,委员会初步确定将按照科研机构、企业和政府机构的需要,发布元数据不同的语料库数据。

ParaCrawl项目咨询委员会的第二次会议计划在2018年2月中旬召开,届时各位委员将交流语料检查的情况,并提出建设性的意见。

关于UTH国际:

上海佑译信息科技有限公司(简称UTH国际),是大数据和互联网时代的新型多语信息处理解决方案提供商, 具有国际领先的核心技术和商业模式创新优势。公司致力于语料大数据基础设施建设和语言应用技术创新, 目前已构建起全球领先的150亿+精确双语句对平行语料库为核心的多语言大数据中心,覆盖“一带一路”沿线国家官方语言中的33种。

UTH国际在全球率先提出语料库三级垂直领域划分的方法论,其中15个一级领域与语言服务产业界的需求方向相匹配,而178个三级领域完美对应了高等院校的学科专业设置,从而从多语言大数据的底层架构上为打通产学研奠定了良好的基础。 

UTH国际已推出的主要产品包括: 芝麻翻译—基于学科化大数据的智能教学与实训平台、芝麻搜索--多功能语料库与科研大数据平台、芝麻译库—百亿句对翻译记忆库平台、芝麻秘语(云译汇/云译通)—拖拽式多格式文档秒速翻译利器、芝麻发布—跨境电商平台一键式多语言本地化应用程序、专门用途系列化多功能语料库等等。可为高等教育、科研院所、语言服务提供商、语言服务需求方、跨境电商、影视传媒、文化旅游、人工智能等多个方向和领域提供高端应用和服务。

UTH国际与全球200多家高校和科研院所达成了校企合作协议,并支持和促成了近15所高校的协同创新项目和国家系/省部级重大课题。同时,作为世界教育翻译联盟(WITTA)的40名创始会员之一及其知识成果转化委员会副主席单位,与全球30多个国家的顶级翻译教育高校通力合作,开展一系列以翻译教育创新、翻译培训和围绕跨语言多学科教学资源库建设与应用等为主题的创新活动计划。

【声明】内容源于网络
0
0
UTH国际
UTH国际是大数据和互联网时代的新型多语信息处理解决方案提供商, 具有国际领先的核心技术和商业模式创新优势。
内容 310
粉丝 0
认证用户
UTH国际 上海佑译信息科技有限公司 UTH国际是大数据和互联网时代的新型多语信息处理解决方案提供商, 具有国际领先的核心技术和商业模式创新优势。
总阅读590
粉丝0
内容310