大数跨境
0
0

10大城市交通多场景应用开源数据集:涵盖深度估计、标志识别、恶劣天气等关键任务

10大城市交通多场景应用开源数据集:涵盖深度估计、标志识别、恶劣天气等关键任务 极市平台
2025-09-28
0
↑ 点击蓝字 关注极市平台
编辑丨极市平台
部分内容来自于网络,如有侵权,请联系做删文处理

DDAD: Dense Depth for Autonomous Driving

数据集下载链接:http://i71i.com/bgp2

DDAD 是丰田研究所(TRI)推出的一款新自动驾驶基准,主要用于在充满挑战且多样化的城市条件下,开展远程(长达 250m)和密集深度估计工作;其旨在为深度估计提供更真实、更具挑战性的基准,以捕捉多样化的城市场景,数据来源于配备高精度激光雷达传感器(Luminar-H2)的全球自动驾驶汽车车队,且覆盖美国(如旧金山、底特律)和日本(如东京)的城市环境。

包含单目视频、精确的地面实况深度(跨越整个 360 度视野)、17,050 个训练帧以及 4,150 个评估帧,同时还涵盖密集的地面实况深度图。

适用于自动驾驶领域相关的深度估计研究,尤其适合针对多样化城市场景下的远程、密集深度估计任务开展训练与评估。

Road Sign Recognition

数据集下载链接:http://i71i.com/bgqe

道路标志识别数据集是服务于自动驾驶系统关键组成部分 —— 交通标志识别的数据集,对推动自动驾驶领域发展有重要作用;该数据集包含 2863 张开源道路标志图像及相应注释,涵盖九个基本路标类别,具体为限速 20、限速 30、限速 50、限速 60、限速 70、限速 80、限速 100、限速 120、停。

数据集由 train、test、valid 三个主要文件夹组成,每个文件夹下均包含 “图像” 和 “标签” 两个子文件夹,整体包含道路标志图像文件与对应注释文件。

适用于目标检测任务,核心用于训练计算机视觉模型,使其具备识别和定位道路标志的能力,进而助力自动驾驶系统的交通标志识别功能开发。

Zebra Crossing Image Dataset

数据集下载链接:http://i71i.com/bgtw

该数据集由 DataCluster Labs 收集,是一组极具挑战性的数据集,包含来自多个建筑工地的 3000 + 张挖掘机车辆图像;图像从 200 + 个不同地点捕获并经众包获取,由 1000 + 众包贡献者参与,每张图像均经 DataCluster Labs 的计算机视觉专业人员手动审查和验证;其特征包括高清及以上分辨率(1920x1080 及以上)、涵盖白天黑夜等各种照明条件与不同距离、视点,且使用 2020-2022 年的手机拍摄。

包含 3000 + 张挖掘机车辆图像文件,同时提供 COCO、YOLO、PASCAL-VOC、Tf-Record 四种可用的注释格式文件。

针对生成式人工智能、视觉问答、图像分类和 LMM(大语言模型)开发进行了优化,可用于道路上的物体识别、自动驾驶汽车相关技术研发,为实现稳健的模型性能提供基础。

Car

数据集下载链接:http://i71i.com/b4rx

大型数据集对训练机器学习算法,尤其是对象检测任务十分关键。检测和分类图像、视频中物体的能力,在自动驾驶、机器人技术、监控和安全系统等诸多应用领域都至关重要。开发准确可靠的对象检测模型,需要能代表待检测对象和场景的高质量数据。收集这类数据可通过捕获包含感兴趣对象多个实例的图像,像汽车检测中,含多辆汽车的图像能让算法了解汽车形状、尺寸、方向的可变性,以及汽车所处的不同环境,但收集和手动注释此类数据集存在挑战。

该数据集包含 1521 个文件,其中有 759 个.jpg 格式文件、761 个.txt 格式文件、1 个.yaml 格式文件。

适用于物体检测任务,对于汽车检测尤为宝贵,能助力研究人员和从业者开发可在一系列现实场景中准确检测和分类汽车的机器学习算法,且带注释边界框坐标的图像也便于训练和评估目标检测模型。

Vehicle Image Captioning Dataset

数据集下载链接:http://i71i.com/b4rp

该数据集是全面的车辆图像字幕数据集,用于助力了解道路场景,包含在印度不同道路场景中拍摄的 1000 + 张高分辨率图像,且图像来自印度各个城市和地区,涵盖白天和黑夜场景、不同距离、不同背景及视角;每张图像都附有人类生成并验证的详细标题,标题遵循特定问题格式,从左到右描述道路上的每个物体,包含车辆颜色、挡风玻璃外观等多类信息,单条标题长度达 60-70 字,能提供丰富上下文;同时,数据集还包含 15 + 类印度车辆的边界框注释。

包含 1000 + 张高分辨率车辆图像文件、对应每张图像的人类生成并验证的标题文本文件,以及 15 + 类印度车辆的边界框注释文件。

针对生成式人工智能、视觉问答、图像分类和 LMM(大语言模型)开发进行了优化;适用于图像字幕、物体检测、场景理解、AI 研究、图像标题和描述生成、自动驾驶汽车导航和场景理解、流量分析与管理、城市规划和基础设施发展等任务,为实现稳健的模型性能提供基础。

Intersection-Flow-5K

数据集下载链接:http://i71i.com/b4gb

Intersection-Flow-5K 是专为实际交通监控评估设计的专业基准,旨在解决现有基准无法充分应对交通交叉口监控的独特挑战,如基础设施相机观察到的持续遮挡模式、极端尺度变化和复杂照明条件(与以自我为中心的驾驶数据集有根本不同);该数据集通过城市十字路口系统采样构建,包含 6928 张高分辨率图像(1920x1080)及 8 个类别的 406000 多个注释,注释协议要求标记严重遮挡物体(高达 75% 遮挡)和极小物体(最小 15x15 像素),且训练、验证、测试集拆分平衡,其中训练集 5483 张图像、验证集 722 张图像、测试集 723 张图像,涵盖车辆、总线、自行车等 8 类对象。

包含 6928 张高分辨率(1920x1080)交通交叉口监控图像文件,以及对应 8 个类别的 406000 多个注释文件(覆盖训练、验证、测试三个拆分集)。

适用于交通交叉口监控相关的技术评估与模型训练,可用于解决交通监控场景下的物体检测、识别等任务,为开发适应复杂交通监控环境的算法提供基准支持。

Traffic Light Detection Image Set

数据集下载链接:http://i71i.com/b4ga

该交通灯检测图像集包含在不同时间、天气和城市环境等各种条件下捕获的交通信号灯真实图像,交通信号灯有红、黄、绿不同状态,图像具备照明、角度和背景的多样性,能支持相关机器学习任务;数据集不包含注释,可由用户灵活创建自定义标记数据集。

包含 50 张 JPEG 格式(.jpg)、分辨率变化且为高质量的交通信号灯图像文件,无标签 / 注释文件。

适用于自动驾驶系统的对象检测、交通信号灯状态分类以及计算机视觉研究等机器学习任务,且由于图像多样性,在该数据集上训练的模型可较好推广到现实场景。

Poland License Plate Dataset

数据集下载链接:http://i71i.com/b4gh

该数据集包含 196664 张车牌照片,照片涵盖各种道路类型、路段和交通场景,为相关任务提供多样化基础;每个图像文件均与特定 CSV 文件配对,CSV 文件可将图像文件名映射到对应的车牌文本和国家 / 地区标签,是 OCR(光学字符识别)、车牌识别和车辆登记分析的全面资源。

包含 196664 张车牌图像文件,以及与之配对的 CSV 文件(用于关联图像文件名、车牌文本和国家 / 地区标签)。

适用于 OCR(光学字符识别)、车牌识别、字符识别和车辆登记分析任务;可助力研究人员探索交通模式、改善交通管理、训练自动驾驶汽车学习模型,还能推进自动驾驶技术、增强交通监控系统,为城市及现实环境中更安全高效的交通解决方案提供支持。

Foggy Cityscapes Images

数据集下载链接:http://i71i.com/b4gj

雾城市景观变化数据集是公开可用雾城市景观数据集的衍生产品,旨在评估不同雾条件下的计算机视觉算法;该数据集共包含 1500 张图像,按雾的强度分为三类且分布均衡,每类各 500 张,其中 1 级为无雾(能见度高、无明显雾气,可作晴朗天气基线)、2 级为中雾(中等雾度,能见度较无雾类明显降低)、3 级为浓雾(雾浓度高,能见度较无雾和中雾类显著降低)。

包含 1500 张雾城市景观图像文件,按雾强度分为无雾、中雾、浓雾三类对应的图像子集。

适用于评估不同雾条件下的计算机视觉算法,为开发适应雾天环境的视觉处理模型(如去雾算法、雾天场景识别等)提供数据支持。

Urban Landscapes with Complex Structures

数据集下载链接:http://i71i.com/b4g1

该数据集聚焦日本和香港等城市,包含展现高耸摩天大楼、熙熙攘攘街道及错综复杂城市景观的高清内容,借助 SAM2 能够轻松分割其中不同的建筑风格、车辆和行人,可呈现复杂城市环境里最精细的细节。

包含 3 个.mp4 格式的视频文件以及 5 个.jpg 格式的图像文件,整体共 8 个文件。

适用于城市景观相关的计算机视觉研究,可助力对不同建筑风格、车辆和行人的分割等任务,能为探索复杂城市环境细节提供数据支持。


公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列大视觉模型 (LVM) 解读扩散模型系列极市直播
技术综述:小目标检测那点事大模型面试八股含答案万字长文!人体姿态估计(HPE)入门教程

点击阅读原文进入CV社区

收获更多技术干货


【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读197
粉丝0
内容8.2k