大数跨境
0
0

DWPI 是怎样炼成的系列之数据清理篇——聊聊PACO和它背后的隐秘之师

DWPI 是怎样炼成的系列之数据清理篇——聊聊PACO和它背后的隐秘之师 科睿唯安
2016-10-13
0
导读:怎样可以比较全面且准确的检索到一个大公司及其旗下子公司们的专利情况呢?
前几天吉吉被朋友的夺命连环CALL 拉去江湖救急。

吉吉,怎样可以比较全面且准确的检索到一个大公司及其旗下子公司们的专利情况呢?比如,西门子。
 
搜索关键字‘Siemens’?

亲,你以为名字里有Siemens就是西门子旗下的子公司吗?

亲,你听说过Nokia Siemens Networks(诺基亚西门子通信)么?

亲,BSH Bosch und Siemens Hausgeräte GmbH (博西家用电器有限公司)了解一下么?
 
编写检索式?

且不说检索式语法要学一阵,单说万一老板大人一开心让你查查中国铁路总公司及其子公司们的专利情况,可咋办?吉吉偷偷告诉你,中国铁路总公司拥有超过1800家子公司和分支机构哦!

1800多家公司和机构名称并联在一起。。。
                                             
 
盆友,还有一个问题你可能没想到。

针对非英语国家的组织机构名称,还可能出现英文名称变体哦。比如一个中文机构名称可能对应着很多种不同的英文翻译。
 

比如下面这些,都是属于中国烟草总公司郑州烟草研究院的英文名称变体。

CHINA CIGARETTE HEAD OFFICE ZHENGZHOU CIGARETTE RES INST
CHINA NAT TOBACCO CORP ZHENGZHOU ACAD
CHINA TOBACCO CO ZHENGZHOU TOBACCO RES I
CHINA TOBACCO CO ZHENGZHOU TOBACCO RES INST
CHINA TOBACCO CORP ZHENGZHOU TOBACCO INS
CHINA TOBACCO HEAD OFFICE ZHENGZHOU TOBA
CHINA TOBACCO HEAD OFFICE ZHENGZHOU TOBACCO ACAD
CHINA TOBACCO MAIN OFFICE ZHENGZHOU TOBACCO ACADEME
CHINESE TOBACCO PARENT CO ZHENGZHOU TOBACCO RES INST
ZHENGZHOU TOBACCO ACAD
ZHENGZHOU TOBACCO ACAD CHINA TOBACCO CO
ZHENGZHOU TOBACCO INST CHINA TOBACCO COR
ZHENGZHOU TOBACCO RES INST CHINA TOBACCO
ZHENGZHOU TOBACCO RES INST CNDC
ZHENGZHOU TOBACCO RES INST CNTC
ZHENGZHOU TOBACCO RES INST GEN TOBACCO CO LTD
ZHENGZHOU TOBACCO RES OFFICE CHINA TOBACCO PARENT CO
ZHENGZHOU TOBACCO RESEARCHING INST CHINA TOBACCO GEN CO
ZHENZHOU TOBACCO ACAD CHINA NAT TOBACCO
ZHENZHOU TOBACCO ACAD CHINA NAT TOBACCO CORP
ZHENZHOU TOBACCO RES INST CNDC
ZHENZHOU TOBACCO RES INTUITION CHINA TOBACCO HEAD

亲,DWPI了解一下么?吉吉看着小伙伴懵圈的双眼,默默地亮出了杀器——DWPI Assignee Code(专利权人代码) 简称PACO。

第一步找到西门子的标准PACO即SIEI-C。


第二步以SIEI-C作为Assignee Code- DWPI 字段关键字,选择想要搜索的时间范围,比如1970年1月1日至今,点击搜索。我们检索到508,373件专利。


我们再来看看之前提到的Nokia Siemens Networks和BSH Bosch und Siemens Hausgeräte GmbH是否混进了西门子的标准PACO(SIEI-C)呢?

Nokia Siemens Networks享用NSNN-C的标准PACO而BSH Bosch und Siemens Hausgeräte GmbH的标准PACO则是BSHB-C。两者都没有混入SIEI-C中。



等等,还有个问题,为啥PACO的后面会有个小尾巴“-C”呢?

其实,PACO(DWPI Assignee Code)是指为专利权人分配的由4位字母组成的编码,共分为四大类:

标准专利权人代码,格式为四位字母+‘-C’,即XXXX-C
非标准专利权人代码,格式为四位字母+‘-N’,即XXXX-N
个人专利权人代码,格式为四位字母+‘-I’,即XXXX-I
俄罗斯专利权人代码,格式为四位字母+‘-R’,即XXXX-R
 
标准专利权人代码(即XXXX-C)是经过DWPI编辑团队人工加工过的信息。一般而言,一家母公司旗下的所有子公司同享一个XXXX-C代码。我们在用PACO进行检索查询时,一定要选择标准专利权人代码(即XXXX-C格式)。

而非标准专利权人代码(即XXXX-N)由系统按照专利权人名称自动截取、分配,多个不相关的组织机构有可能同享一个代码,因此并不具备专有性和区分性。
 
吉吉啊,PACO好是好,可是刚才讲的西门子是外国名企,咱中国这边PACO情况又如何呢?
 
DWPI 编辑团队遍布英国,中国,印度等诸多国家,持续为客户提供高附加值的专利信息,巩固着DWPI业界翘楚的地位。

你是不是已经看到了那个熟悉的字眼?中国!

是的,DWPI编辑团队中有中国人,DWPI有编辑团队在北京。

近几年,Clarivate Analytics(原汤森路透知识产权与科技事业部)中国办公室致力于不断提高中国数据质量。仅2016年1月至7月,PACO中国团队就清理了超过100万组数据,整理了超过2万1千家公司的信息,数以百计的企业拥有了自己的标准专利权人代码。

随着中国团队的不断努力,我们坚信中国数据将日臻完善。

DWPI中国,我们懂中文,我们懂专利,我们更懂你!

专利世界的旗舰数据内容DWPI
(Derwent World Patents Index®)

DWPI是德温特世界专利索引的简称。作为Clarivate Analytics(原汤森路透知识产权与科技事业部)的旗舰数据库,50多年来,DWPI为遍布世界各地的企业、大学、研究机构和专利授予机构提供高附加值、经过深加工的专利名称和摘要,独一无二的分类,索引灵活的检索选项,广泛的交付平台选择。

PACO加工只是DWPI编辑团队中的小小分支。除了DWPI Assignee Code之外,DWPI编辑团队还为专利信息做了诸多方面的深加工,增添了很多酷炫的功能,最大程度保证了专利信息的查全与查准率,赢得了全球40个国家和区域的专利授权机构的审查员的青睐。
 
DWPI 深加工包括但不限于:
保留著录项目数据原貌的同时对错误数据进行修订;
为专利量较大的公司设立专有的专利权人代码并定期更新;
完全按照专利所描述的技术进行同族专利归并以便让科研人员更清晰的了解技术发展脉络;
人工改写专利标题与摘要,用简单且结构化的方式描述专利说明书中所有重要信息以便研究人员检索与阅读;
通过独有的德温特手工代码分类对技术进行细分,让研究人员不必担心因利用关键词检索而遗漏重要专利。

 
本文仅从专利权人代码加工角度介绍了DWPI数据,下期将讲述DWPI改写的精彩故事,敬请期待。
 

作者:许喆,

Content Specialist Team Lead - Chinese Content


Clarivate Analytics(原汤森路透知识产权与科技事业部)


【声明】内容源于网络
0
0
科睿唯安
科睿唯安是专业信息服务的全球领先企业,致力于提供值得信赖的数据与深入的分析,助力客户加速创新步伐。官网:clarivate.com.cn
内容 1636
粉丝 0
科睿唯安 科睿唯安是专业信息服务的全球领先企业,致力于提供值得信赖的数据与深入的分析,助力客户加速创新步伐。官网:clarivate.com.cn
总阅读395
粉丝0
内容1.6k