大数跨境
0
0

图像检索相关开源数据集资源汇总

图像检索相关开源数据集资源汇总 极市平台
2024-07-07
0
↑ 点击蓝字 关注极市平台
编辑丨极市平台

CUB-200-2011

下载地址:https://www.cvmart.net/dataSets/detail/1113

CUB-200 是一个包含 200 种鸟类的具有挑战性的数据集。扩展版本将每个类别的图像数量大约增加了一倍,并添加了新的零件本地化注释。所有图像都使用边界框、零件位置和属性标签进行注释。

iNaturalist

下载地址:https://www.cvmart.net/dataSets/detail/1114

iNaturalist 2017 数据集 (iNat) 包含来自 5,089 个自然细粒度类别的 675,170 张训练和验证图像。这些类别属于 13 个超类别,包括 Plantae(植物)、Insecta(昆虫)、Aves(鸟类)、Mammalia(哺乳动物)等。iNat 数据集高度不平衡,每个类别的图像数量差异很大。例如,最大的超类别“Plantae(植物)”有来自 2,101 个类别的 196,613 张图像;而最小的超类别“原生动物”只有来自 4 个类别的 381 张图像。

Stanford Online Products

下载地址:https://www.cvmart.net/dataSets/detail/1115

斯坦福在线产品(SOP) 数据集有 22,634 个类别,包含 120,053 张产品图像。前 11,318 个类别(59,551 张图像)用于训练,其余 11,316 个类别(60,502 张图像)用于测试

Google Landmarks Dataset v2

下载地址:https://www.cvmart.net/dataSets/detail/1116

这是 Google Landmarks 数据集 (GLDv2) 的第二个版本,其中包含带有代表人造和自然地标的标签的图像。该数据集可用于地标识别和检索实验。此版本的数据集包含大约 500 万张图像,分为 3 组图像:训练、索引和测试

Flickr Image dataset

下载地址:https://www.cvmart.net/dataSets/detail/1117

Flickr30k 数据集已成为基于句子的图像描述的标准基准。本文介绍了 Flickr30k 实体,它用 244k 共指链扩充了 Flickr30k 的 158k 标题,将同一图像的不同标题中对相同实体的提及链接起来,并将它们与 276k 手动注释的边界框相关联。

GPR1200 Dataset

下载地址:https://www.cvmart.net/dataSets/detail/1118

这是一个易于使用且易于访问但具有挑战性的基准数据集,包含 1200 个类别和 10 个类别示例。从不同图像区域的六个公开数据集中手动选择类和图像,确保了高类多样性和清晰的类边界。


公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列ICCV2023论文解读极市直播
极视角动态欢迎高校师生申报极视角2023年教育部产学合作协同育人项目新视野+智慧脑,「无人机+AI」成为道路智能巡检好帮手!
技术综述:四万字详解Neural ODE:用神经网络去刻画非离散的状态变化transformer的细节到底是怎么样的?Transformer 连环18问!

点击阅读原文进入CV社区

收获更多技术干货


【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读8.7k
粉丝0
内容8.2k