1.介绍
ptm是一个包含蛋白质翻译后修饰(PTMs)分析工具的R包。
特点:
² 可以直接下载、过滤和分析MetOSite数据库中的数据;
² 整合了主要蛋白PTMs和序列数据库及相关搜索工具;
² 数据可视化:可以通过使用图表、图形等可视化元素对数据进行可视化,提供了一种可访问的方式来查看和理解与PTM相关的数据中的趋势、异常值和模式;
² 此外,还提供了各种实用功能,以使R环境的统计和图形能力能够处理生物序列和结构数据。
2.安装
在尝试安装ptm之前,应该安装一个相对较新的R版本并在系统上运行。官方还鼓励安装RStudio(R的一个有用的集成开发环境)。要安装这个包,需要启动R version 4.0以上的版本。
if (!requireNamespace("BiocManager", quietly = TRUE))
install.packages("BiocManager")
BiocManager::install("Biostrings")
BiocManager::install("muscle")
install.packages("ptm")
3.env.plot()
在环境中绘制每个位置上氨基酸的z-score。PTM位点附近的氨基酸对于促进或阻碍特定氨基酸上的取代基至关重要。因此,关于修饰位点周围的氨基酸以及它们之间的相关性的信息是非常有价值的。
positive <- c("ERNLLsVAYKN", "SWRIIsSIEQK", "LNEPLsNEDRN", "LTLWTsDQQDD", "WRVLSsIEQKS", "ESELRsICTTV", "ASQAEsKVFYL", "RKILLsEWKSQ", "GGSSCsQTPSR", "QVLLEsGEKST", "ARAVYsDADIF", "NRQLPsDGKKM", "SPGYRsVRERT", "KDRTTsEAQTE", "KTEAEsYEGLL", "CGRTGsGKSSL", "HVPAPsPQGPG", "IQESEsHSKNG", "LHGKKsGKPPL", "SISAPsSDKPL", "NTVANsPQTLL", "PYAHLsKKEKK", "GKQQVsPIRNL", "VCEKQtITKWP", "ASQAGsRKESR", "FIRGVsGGERK", "LTPGGsMGLQV", "PCPRYsNPADF", "GITGSsQDTYV", "KLKGKsPGIIF", "GQQLAsMLRWT", "YKVLSsLGYHV", "FISGLsDQLIP", "LFRSRsLREFE", "PGIDLsQVYEL", "SPRTLsPTPSA", "IRRSSsDFFYS", "PASSTsGSPSR", "TPTSRsPQHYS", "MKARSsSYADP")
control <- c("PEKACsLAKTA", "AYKAAsDIAMT", "LALNFsVFYYE", "ATVVEsSEKAY", "TLSEDsYKDST", "AWRVIsSIEQK", "PEKACsLAKTA", "VKKENsVETQA", "MSGGSsCSQTP", "SGHQPsQSRAI", "FALVLsALILA", "RTFSEsSVWSQ", "CGSVGsGKTSL", "EDPQQsNPCPE", "STLEYsNERLK", "GTMDPsQVPEH", "PIVTPsGEVVV", "AVIQEsESHSK", "LYSNLsKPFLD", "TSTRGsVQMLT", "FDEPSsYLDVK", "PTQKFsGGWRM", "HIINLsLTFHG", "SRLESsGKNKS", "EKEILsNINGI", "TMIFSsVCYWT", "LVKTLsRLAKG", "QAAQHsPYVAL", "YSGVGsSDGNS", "VPVAPsSSSGG", "SSSSGsAAAAL", "SEGEAsEEGLY", "PADQFsDGREP", "GPAEEsRVRRH", "CSSEKsKVTSS", "SYGDVsGGVRD", "GIRCDsCEKYI", "SVPASsTSGSP", "RSGPEsGRSSP", "TTAGNsSQVSD")
pos <- env.matrices(positive)[[2]]
ctr <- env.matrices(control)[[2]]
results <- env.Ztest(pos, ctr, alpha = 0.05)
env.plot(Z = results[[1]], aa = 'L', pValue = 0.05, title = "Glutamete around p-Ser")
图1.亮氨酸在不同位置上的富集情况
4.ptm.plot()
显示沿着蛋白质序列的PTM位点。此函数返回与一级结构的属性(如溶剂可及的表面积、疏水性等)相关的图。
ptm.plot(up_id = "P04406", property = 'avg.hyd', ptm = 'meto')
图2.以甲硫氨酸亚砜化为PTM,以疏水性指数作为沿一级序列绘制的特性,观察P04406(3-磷酸甘油醛脱氢酶)
5.ddG.profile()
表示给定位置对蛋白质稳定性变化的敏感性(ΔΔG)。ptm使用了两种流行的计算方法来预测氨基酸变化对蛋白质稳定性的影响:FoldX和I-Mutant
E27 <- ddG.profile('1pga', 'A', pos = 27)
图3.在Gβ1的野生型中发现丙氨酸(A)
6.site.type()
通过目标蛋白质的KEGG标识符计算其在某个物种中的Shannon’s entropies。
lyz21 <- shannon(target = id.mapping('P61626', from = 'uniprot', to = 'kegg'),
species = 'two-hundred', base = 2, alphabet = 21)
plot(lyz21$n, lyz21$Haa, ty = 'b', xlab = 'Position', ylab = 'Shannon Entropy')
points(lyz21$n[which(lyz21$Haa < 0.25)], lyz21$Haa[which(lyz21$Haa < 0.25)], pch = 19, col = 'blue')
points(lyz21$n[which(lyz21$Haa > 3)], lyz21$Haa[which(lyz21$Haa > 3)], pch = 19, col = 'red')
图4.人类溶菌酶(P61626)在“two-hundred”物种列表中的Shannon’s entropies
>>>end
扫描二维码
关注我们

