大数跨境
0
0

Mascot Blog专题 | Mascot云计算

Mascot Blog专题 | Mascot云计算 康昱盛
2023-02-03
2
导读:本期关键词:cluster, licensing, pc hardware, virtual machine

越来越多的商业化软件和应用程序以云服务订阅的形式提供,其软件在某个第三方运营平台的数据中心运行。经常有客户问到是否可以在云端运行 Mascot Server。答案当然是肯定的,但也要具体情况具体分析。本期Blog即对该问题进行详细介绍。
本期关键词:clusterlicensingpc hardwarevirtual machine





云服务的两大模型

首先,我们可以将云服务分为两个大类:Software as a service (SaaS) 和Infrastructure as a service (IaaS)。

SaaS在第三方服务器上运行,用户定期支付订阅费,使用网络浏览器访问软件的功能,比如Google Docs、 Microsoft Office 365等。请注意,SaaS与软件许可订购不同。某些软件的产品许可证需要按月或按年支付使用费用,但软件会安装在您自己的 PC 上。而SaaS除了软件许可的费用,还包括了运行、软硬件维护等费用,不需要本地化配置与维护硬件。

(https://www.wallarm.com/what/what-is-saas)

IaaS与SaaS不同的是,云端供应商为用户分配虚拟机(VM),而用户则为所使用的资源(如CPU、内存、磁盘、网络等)付费,用户可以在自己的VM中安装任何需要的东西。事实上,SaaS通常是在 IaaS 基础之上实现的。无论是哪种情况,虚拟机都是在云端供应商所运营的数据中心运行。

(https://www.atatus.com/blog/what-is-iaas-how-iaas-different-from-saas-and-paas/#what-is-iaas)

下图总结了本地化配置(On-site)、IaaS、SaaS三种模式下,用户需要管理的不同部分。

(modified from https://www.wallarm.com/what/what-is-saas)




Mascot有订阅服务吗?

SaaS 是很多基于 Web 服务的不错的模型,这些服务对每位用户的资源要求相对较低,基本上不需要个性化定制,可以从规模经济中受益并拥有大量潜在用户。相反,如果用户使用的CPU时间或RAM空间非常大且无法预测,或用于传输GB级大小的文件,那么SaaS 就不是一个好的选择。这些导致高昂的潜在成本,因此您永远无法达到规模经济,每增加一个用户,其成本将超过订阅所得收入。因此,我们不在 SaaS 模型下提供 Mascot Server 或 Mascot Distiller,因为蛋白质组学数据文件通常都比较大且可变因素较多。

典型的Mascot工作流程如下图:获取来自仪器的原始下机数据文件;对原始数据提峰并转换为MGF格式,然后提交给Mascot Server进行搜库;将结果下载到 Mascot Distiller 等客户端应用程序,进行定量和其他处理。

每一步都是可变的:

▶  原始文件和 MGF 文件可以很小,也可能是几个GB。将服务限制为较小的文件会限制它的应用范围,但允许很大的文件会使每个用户的网络使用和存储变得不可预测。一般来说,单个实验可以产生一个或者数十个MS/MS数据。

▶  数据库也可大可小。很难根据搜库参数预测其持续时间,除非应用严格的限制条件来控制search space的大小。

▶  与数据库检索相比,定量需要时间的也不固定。除非您使用的是Mascot的基本工作流程且所有条件保持一致,否则您将需要在每次分析时自定义数据库、搜库参数、定量方法等来匹配实验条件,这在SaaS基础上不太可行。




Mascot和IaaS

相比之下,IaaS是一个代替购买和维护物理硬件的可选方案。只需轻轻一点,就可以在云端配置 32 个 vCPU 虚拟机。明显的好处是,无需为硬件支付前期资金,几分钟内即可使用。用户只需为资源使用付费,然后在用完后删除虚拟机。

(modified from https://www.edubridgeindia.com/blog/what-is-the-difference-between-iaas-paas-and-saas/)
Mascot Server 可以在任何Intel或AMD处理器的IaaS 虚拟机上运行。您可以访问这个Help页面来了解软件架构和配置要求:https://www.matrixscience.com/help/mascot_cloud.html。虚拟 CPU、RAM 和磁盘要求与常规硬件虚拟化基本相同,有一点不同的是,云平台的 CPU 核心映射选择比较少。

如果预算充足,或者用户所在单位要求将一切都迁移到云端,那么在云虚拟机中运行Mascot Server是个很好的选择。事实上,云计算的性能和安全性通常都非常好,而且云存储的数据备份也十分便利。如果工作流程中有任何定量需求,那么就可以在同一云端运行 Mascot Server、Mascot Daemon 和 Mascot Distiller。Distiller 和 Daemon完全可以在虚拟机中很好地运行。但是,由于它们都是 GUI 应用程序,因此需要通过远程桌面访问云虚拟机,这当然不如在自己的电脑桌面上运行方便,数据保密性也需要斟酌。

(modified from https://www.edubridgeindia.com/blog/what-is-the-difference-between-iaas-paas-and-saas/)

IT的预算总是有限的,因此要综合考虑成本问题。首先,Mascot 许可证是永久性的,在云端运行 Mascot 不需要额外的费用。将Mascot许可证从物理硬件转移到虚拟硬件也不收取任何费用,反之亦然。如果您要购买新许可证,无论是在本地还是在云端运行,成本都是一样的。
云服务的成本在很大程度上取决于您的使用模式。根据粗略的经验,我们观察到,假设全年连续运行搜库,那么在云平台上运行Mascot Server一年的成本与购买具有相同硬件规格的物理服务器的成本大致相同。这适用于 1-2 个 CPU 和更大的集群模式。原因是,用户实质上是将硬件采购、监控、维护、更换和数据中心安全外包给第三方,此外还要为他们的电费、网络数据传输、存储等付费。单纯从成本角度考虑,如果第一年之后物理硬件的内部管理成本超过了云服务器的费用,那么将Mascot转移到云端更划算。

如果只是间歇性使用Mascot,可以只在需要时启动云虚拟机以节省成本。如果是大于等于4个CPU的许可证,可以将 Mascot 配置为具有多个搜索节点的集群模式,在不需要时关闭节点并保持主节点在线以查看搜索结果。Mascot Server 目前不支持根据当前或预测的使用情况自动分配虚拟资源,也就是auto scaling。原因与 SaaS相同:很难预测处理一个“随机”数据集需要多长时间,因此也很难预测应该添加多少 CPU 才能达到所需的平均搜索持续时间或每分钟/小时的搜索次数。添加的节点越多,启动起来延迟就会越多,因为数据库要逐个完成配置。

(https://www.atmmarketplace.com/articles/its-time-to-rethink-how-we-manage-the-cost-of-cash/)

💡 Tips
我们建议用户尝试一下云计算,看看实际月度花费有多少。如果您的Mascot Server许可证在维保期内,我们可以免费为您提供1-CPU,30天许可证用于云计算测试。您可以访问https://www.matrixscience.com/help/mascot_on_aws.html了解在 Amazon Web Services上配置Mascot Server的详细要求和步骤。
如果您想要了解更多Mascot软件详情,欢迎点击文末“阅读原文”进入康昱盛官方网站或直接联系我们。
Tel: 021-54975000
E-mail: support@cloudscientific.com‍

— 往期回顾 —

【Mascot Newsletter 2023-01】Mascot Server对于TMT/TMTpro标记定量互补峰的处理

Mascot Blog专题 | 使用Mascot Distiller提取完整交联谱峰

点击“阅读原文”进入康昱盛官网~

【声明】内容源于网络
0
0
康昱盛
生物医药领域信息解决方案供应商:分子模拟、药物设计、基因组学、蛋白组学、生物信号通路分析、电子实验记录本、信息管理系统
内容 254
粉丝 0
康昱盛 生物医药领域信息解决方案供应商:分子模拟、药物设计、基因组学、蛋白组学、生物信号通路分析、电子实验记录本、信息管理系统
总阅读121
粉丝0
内容254