大数跨境
0
0

美国政府结束停摆1周,NCBI已恢复正常更新文献及数据信息

美国政府结束停摆1周,NCBI已恢复正常更新文献及数据信息 Dr.X的基因空间
2025-11-18
2

美国政府结束停摆,NCBI回归正常

写在前面的
2025年10月1日,因第119届美国国会未能通过当天开始实施的2026财年拨款法案,美国联邦政府于东部时间凌晨12时01分开始停摆。历时约1个半月,到11月12日结束停摆。期间国家生物技术信息中心NCBI数据库因为政府停摆而停止更新。停摆结束后该网站已经恢复正常.目前可以追踪最新的文献和数据。

GenBank 268.0 版正式发布!

GenBank 268.0 版已在 NCBI FTP 站点上线。本版本包含 47.01 万亿个碱基,共计 59.0 亿条记录。

本版本包含以下内容:

  • 传统记录:258,320,620 条,序列数据含 5,676,067,778,413 个碱基对
  • 全基因组鸟枪法(WGS)记录:4,441,331,387 条,序列数据含 40,390,433,406,298 个碱基对
  • 批量导向的转录组霰弹枪组装(TSA)记录:1,010,159,820 条,序列数据含 864,483,775,194 个碱基对
  • 批量导向的转录组链接序列(TLS)记录:190,505,830 条,序列数据含 78,568,415,110 个碱基对

新增内容

  • 传统记录部分新增 441,315,689,217 个碱基对,新增 318,618 条序列记录,更新 21,337 条记录
  • 日均新增和 / 或更新 6,071 条传统记录
  • WGS 部分新增 2,005,645,040,628 个碱基对,新增 146,358,464 条序列记录
  • TSA 部分新增 4,771,738,760 个碱基对,新增 3,743,783 条序列记录
  • TLS 部分新增 62,892,189 个碱基对,新增 163,338 条序列记录
  • 本版本的序列数据文件总数增加 424 个,各分类如下:
  • 细菌(BCT):新增 14 个,现总计 477 个
  • 环境样本(ENV):新增 1 个,现总计 39 个
  • 无脊椎动物(INV):新增 134 个,现总计 1,513 个
  • 哺乳动物(MAM):新增 14 个,现总计 203 个
  • 植物(PLN):新增 224 个,现总计 2,456 个
  • 病毒(VRL):新增 1 个,现总计 340 个
  • 脊椎动物(VRT):新增 36 个,现总计 458 个

即将到来的变更

  • inference 限定符新增两种推断类型:结构域架构(Domain architecture):用于标注基于蛋白质结构域集合的分析结果;直系同源物证据(Ortholog evidence):支持基于直系同源分析程序和数据源得出的特征注释
  • 新增 /transcript_id 限定符:明确关联父 mRNA 特征与其子编码序列(CDS)特征,对呈现基因注释的层级结构至关重要
  • 有关 /inference 和 /transcript_id 限定符的更多详情,请参阅发布说明,并关注 2025 年 10 月更新的 INSDC 特征表文档。
    补充信息
  • 下载说明:未压缩的 GenBank 268.0 版序列数据平面文件约需 8,262 GB 存储空间,ASN.1 格式数据文件约需 2,842 GB
  • 更多详情:可查阅发布说明,或 FTP 站点上 GenBank 和 ASN.1(ncbi-asn1)目录下的 README 文件
       NCBI停止更新期间,我已将开始大量使用欧洲生物信息中心数据库EBI来实时追踪文献和公共数据,整体使用体验较好。

【声明】内容源于网络
0
0
Dr.X的基因空间
【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
内容 176
粉丝 0
Dr.X的基因空间 【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
总阅读184
粉丝0
内容176