大数跨境

常用数据库及生物网站介绍(下篇)

常用数据库及生物网站介绍(下篇) 云南泽浩
2022-07-12
2
导读:如何在浩如烟海的数据里找到有用的信息,无疑是每个科研人会遇到的问题。Proteintech在研发或生产过程中

如何在浩如烟海的数据里找到有用的信息,无疑是每个科研人会遇到的问题。Proteintech在研发或生产过程中也需要提前查阅大量相关资料,关于如何有效搜集也积累了一些经验。这篇文章将分享一些常用的数据库和生物网站。

另外,视频版已经分享到我们的视频号咯~


上篇已介绍文献检索与追踪核酸序列数据库,这篇开始介绍常用蛋白质研究相关数据库

内容较多,试试点击右上角搜索页面内容,直接空降到对应内容~

快速导航


文献检索与追踪

PubMed、Google学术、

PubCrawler、Web of Science

核酸序列数据库

GenBank、UCSC、Ensembl、

蛋白研究数据库

Uniprot、OMIM、GeneCards、GENATLAS、

BioGPS、PAXdb、Proteinatlas、

String、ExPASy、PDB、KEGG、Reactome、


蛋白质研究相关数据库


8

Uniprot

http://www.uniprot.org/

Uniprot由Swiss-Prot、 TrEMBL 和 PIR三大国际蛋白质序列数据库的数据整合而成,旨在为科学人员提供一个全面的、高质量的、可免费使用的蛋白质序列和功能信息数据库。

Uniprot内容包含四个部分:

1. UniProtKB蛋白质知识库是收集蛋白功能信息的功能核心。其中SwissProt标记的是高质量的、人工注释、非冗余的数据,而TrEMBL代表的是计算分析后的预测序列,未经验证过的数据。

2. UniRdf蛋白质参考序列集,从UniProtKB(含isoform序列信息)提供的序列进行相似度分类。

3. UniParc蛋白质序列归档库包含了世界上大多数公开可用的蛋白质序列,并且对每一个唯一序列提供唯一的标识符(UPI),相同序列被合并。

4. Proteomes蛋白组包含基因组完全测序物种的蛋白质组信息。

除常规的蛋白质信息查找外,Uniprot还提供BLAST(相似度搜索)、Align(序列比对)、Retrieve/ID mapping(数据批量提取和登录号映射)、Peptide search(多肽搜索)、SPARQL(应用程序接口)等功能选择。

BLAST和Align功能比较常见,这里介绍Retrieve/ID mapping功能。它不是很常见,但是用途也比较广泛。

用实例好好给大家展示下使用方法。我们想获得p53信号通路的相关蛋白的信息。

1. 先准备好这些蛋白的 GeneID,填入信息。


2. 选择信息填写,这里填写的是GeneID和UniProtKB。

3. UniProtKB中搜索结果就可以下载。

4. 值得注意的是,只有添加到展示页面的内容才能被下载。如果还需要其他隐藏信息,可以通过点击修改功能就可以修改展示页面的内容。

蛋白质信息搜集是怎么获得的呢?以p53为例,搜索页面会出现p53的相关序列。

在此先说个小功能,序列没有选中前,BLAST和Align是不能使用状态。当选中一条序列后,BLAST可以使用;当选中两条或以上序列后,Align是可用状态。

也就是说可以对蛋白序列直接进行BLAST和Align,而不用复制到其他数据库进行分析。

选择点击某一序列,能获得功能、名称、表达位置 、表达情况、结构、序列等信息。

9

OMIM

http://www.ncbi.nlm.nih.gov/omim

OMIM为“0nline Mendelian Inheritance in Man”的简称,人类在线孟德尔遗传数据库,是一个全面的、权威的人类基因和遗传表型、疾病数据库。

它与其他数据库的区别在于:

• OMIM侧重于疾病表型与其致病基因之间的关联;

• 不是以序列为核心的数据库结构,不包含EST、假基因和遗传标记,而且所有的cDNA序列存在对应的功能注释;

因此它可用来搜索基因相关的表型,或表型相关的基因。

下图为p53搜索结果。它涵盖基因或蛋白的介绍比较丰富,并且文本形式为主。大家如果想写某一基因或蛋白的材料,OMIM无疑是一个很好的参考网站。


10

GeneCards

http://www.genecards.org/

GeneCards是一个提供了所有已知和预测的人类基因的综合数据库。该数据库自动整合了150个网络资源的基因中心数据,包括基因组、转录组、蛋白质组、遗传、临床和功能信息。

以TP53为例,GeneCards能够提供的信息相当丰富,在下图框列出,不愧是号称基因信息最全面的网站


11

GENATLAS

http://genatlas.medecine.univ-paris5.fr/

GENATLAS 也是一个综合程度非常高的,针对基因和蛋白质进行注释的数据库。主要特点在于录入的基因、表型都具有参考文献支持。

搜索关键词除了基因名称、表型、疾病、还可以对基因在染色质的位置进行检索。

以p53为例,结果页面包括相关疾病、DNA/RNA/蛋白信息、表达情况、动物模型等。


12

BioGPS

http://www.biogps.org/

BioGPS是一个免费的统筹和查询基因和蛋白功能注释的数据库。它的优势在于网站的页面简单明了,适用于查询某一基因在不同组织和细胞的表达情况。

还是以p53举例,在搜索框输入“p53”,点击Search按钮。

结果页面左侧为p53的mRNA在不同组织的表达情况,zoom可用来调节柱形图的高度。右侧为基因的基本信息介绍,点击链接将跳转至对应的数据库页面,操作非常简单。


13

PAXdb

http://pax-db.org/

PAXdb是基于质谱数据的蛋白质丰度数据库,它提供间接的质量评估,将不同的细胞或组织的蛋白质丰度使用统一的丰度指标进行排名。

PaxDb的优势是包含了几个不同物种中大量蛋白质的估计丰度值。此外,你可以找到关于物种间蛋白质丰度变化的信息。

以TP53为例,可以从页面获得以下信息:TP53在Hek293细胞中的表达量较高(164ppm),在人体中所有蛋白中TP53属于中高表达情况。


14

Proteinatlas

http://www.proteinatlas.org/

Proteinatlas(人类蛋白质图谱数据库)是基于蛋白组学、转录组学以及系统生物学数据,可以绘制蛋白质图谱的数据库。通过这几年的更新,数据库的类别已经扩展到数十种,包括组织、细胞、器官、大脑、肿瘤组织等。

以p53为例,简单介绍下常用的功能:

TISSUE:不同的组织中,p53的RNA和蛋白的表达情况

PATHOLOG:在不同的病理样本中,p53的RNA和蛋白的表达情况

SUBCELL:在不同的细胞中,p53的定位及表达情况

CELL LINE:在不同的细胞中,p53的RNA表达情况


15

String

http://string-db.org

String是研究蛋白质相互作用的数据库。它涉及的物种和蛋白数量相当庞大,非常全面。除了可以对这些蛋白生成精美的蛋白质-蛋白质-互相作用(PPI)图,还提供了输入蛋白的的分析,包括常见的功能富集分析(GO、KEGG),参考出版物等。

但是String的数据也收录了预测的蛋白质/基因间的相互作用关系,因此它的结果还需要进一步筛选甄别。

与P53相互作用蛋白网络


16

ExPASy

http://www.expasy.org/

Expasy成立于1993年8月,是第一个生命科学网站,当时它被称为“ExPASy,专业蛋白质分析系统”,主要关注蛋白质。

2011年6月,它成为瑞士生物信息学研究所(SIB)生物信息学资源门户网站,即SIB开发的多种生物信息学资源目录。

目前ExPASy是一个用于生物信息学的大型在线工具合集。

其中使用较多的功能有以下:

• 利用ExPASy获得蛋白的等电点和分子量。

(https://web.expasy.org/compute_pi/)

• 对常规2-DE和2D-DIGE凝胶进行差异蛋白表达分析,检测蛋白丰度变化,用于发现生物标志物。

(https://www.expasy.org/resources/melanie)


17

PDB

https://www.rcsb.org/

PDB是权威的蛋白质结构的数据库,数据主要来源于实验测定的生物大分子的三维结构,包括蛋白质、核酸、糖类、蛋白质与核酸复合物。


18

KEGG

http://www.genome.jp/kegg/

KEGG是一个整合了基因组、化学和系统功能信息的数据库。它可以系统分析基因产物在细胞中的代谢途径以及这些基因产物的功能,有助于把基因及表达信息作为一个整体的网络进行研究。

涉及内容包括

KEGG通路图

BRITE功能层次

功能单元模块

同源性分析

基因与蛋白质

基因组

小分子

多糖

生化反应

网络

疾病

药物


KEGG通路图是该数据库的核心内容,它是由科研人员根据已有研究文献而绘制的通路图,非常适用于科研工作者研究信号通路或基因上下游的相关信息。


19

Reactome

http://reactome.org

Reactome是一个免费、开源、数据经过编审和同行评审的生物分子通路知识数据库。其目标是为生物分子通路知识的可视化、解释和分析提供直观的生物信息学工具,以支持基础研究、基因组分析、建模、系统生物学和相关教育的便利开展。

内容涉及到信号通路的描述、分子、结构、涉及蛋白的表达情况等。


与KEGG通路图相比,Reactome除了线性的通路图,部分通路也绘制了较为精美的彩图。




以上就是全部内容啦

当然只看不练犹如纸上谈兵

实践摸索才能了解其背后的功能或作用

大家可以点击网址多多练习

工欲善其事必先利其器

↓↓  也许您还喜欢  ↓↓↓

Proteintech 荣获2022年度“研究者之选”奖项

Proteintech 战略投资 Active Motif

Proteintech 全资收购 ChromoTek

Proteintech 与 HebeCell 达成战略合作

实验手册通路海报关于Proteintech











【声明】内容源于网络
0
0
云南泽浩
泽浩公司-专业实验室产品供应商
内容 278
粉丝 0
云南泽浩 泽浩公司-专业实验室产品供应商
总阅读23
粉丝0
内容278