大数跨境
0
0

从异常行为到精细分析:多视角人体感知开源数据集

从异常行为到精细分析:多视角人体感知开源数据集 极市平台
2025-10-24
2
↑ 点击蓝字 关注极市平台
编辑丨极市平台
部分内容来自于网络,如有侵权,请联系做删文处理

UCSD 异常数据集

数据集下载链接:http://i71i.com/xi1l

UCSD 异常检测数据集通过高处俯瞰人行道的固定相机获取,人行道人群密度从稀疏到拥挤不等,正常视频仅含行人,异常事件源于人行道中非行人实体流通或异常行人运动模式(如骑自行车者、滑冰者等自然发生的异常,非人为暂存)。

包含 Peds1 和 Peds2 两个场景子集的视频文件(分为训练和测试样本,片段拆分为约 200 帧的剪辑),以及每帧的二进制异常标志注释文件,部分剪辑还包含手动生成的像素级二进制掩码注释文件。

适用于异常检测相关的计算机视觉研究任务,可用于训练和评估能识别、定位人行道场景中异常事件(非行人实体、异常行人运动)的算法,尤其支持对算法定位异常区域能力的性能评估。

苏黎世自动行人和自行车计数

数据集下载链接:http://i71i.com/xiaw

该数据集包含 2019 年苏黎世市的行人与自行车交通自动记录数据,由苏黎世市土木工程办公室收集,计数地点分布于整个城市;其中自行车交通通过嵌入路面的感应回路记录,行人交通通过被动红外辐射记录,数据涵盖计数位置 ID、日期时间、双向自行车及行人通行频率等信息。

主要包含 CSV 格式文件(如 2019_verkehrszahlungen_werte_fussgaenger_velo.csv 等),同时涉及其他辅助文件(如 gpkg、pdf、shp 等格式),整体共 15 个文件,数据表格包含 8 列(或 51 列,综合不同来源信息)。

适用于交通流量分析、行人与自行车交通模式研究,可为城市交通管理、基础设施规划等提供数据支持。

车辆和人类数据集的鸟瞰图 (YOLO)

数据集下载链接:http://i71i.com/xiax

该数据集是用于航空图像训练和测试目标检测模型(尤其基于 YOLO 的模型)的高质量资源,由空中交通图像、VisDrone、用于车辆检测的环形交叉路口航空图像和 VSAI_Dataset 四个著名数据集汇集而成,专为鸟瞰角度检测车辆和人类定制。

包含超 35,000 张航空场景图像文件,以及对应近 120 万个实例的注释文件(为 YOLO 兼容文本文件,含归一化边界框坐标);数据集按 YOLO 标准设计结构化目录,包含训练和测试图像及其相应标签的单独文件夹,支持无缝集成到 YOLOv8/YOLOv11 管道。

适用于基于 YOLO 的目标检测模型(如 YOLOv8、YOLOv11)的训练与测试,核心用于鸟瞰角度的车辆(小型、大型)和人类检测任务;可支持交通监控、空中监视、无人机分析等航空图像分析领域的前沿研究与实际应用,也适用于开发或改进目标检测模型。

人类活动识别的开放数据集

数据集下载链接:http://i71i.com/xia1

该数据集用于人类活动识别(HAR)研究,包含通过智能手机传感器(加速度计和陀螺仪)从 90 名参与者(75 名男性、15 名女性)收集的 18 种不同活动信息;拥有 1945 个直接收集的原始活动样本,以及从中提取的 20750 个子样本;涵盖的活动包括站立、坐着、说话 - 坐着、站立谈话、站 - 坐、躺着、躺立、捡、跳跃、俯卧撑、仰卧起坐、步行、向后行走、步行环、跑步、上楼梯、下楼梯、乒乓球,且每种活动有明确的执行时长或次数要求;加速度计数据已省略重力加速度,未应用滤波器消除噪声,数据集可免费下载、修改和使用。

适用于人类活动识别(HAR)领域的研究,可用于训练和评估基于智能手机传感器(加速度计、陀螺仪)数据的人类行为感知模型,支持对 18 种特定活动的识别任务开发,为机器感知人类行为的算法研究提供数据基础。

MPII

数据集下载链接:http://i71i.com/xiaa

MPII 人体姿势描述数据集是对广泛使用的 MPII 人体姿势数据集的扩展,添加了丰富的文本注释,这些注释由多种先进语言模型(LLM)生成,包含对正在执行的活动、在场人数及特定姿势的详细描述;数据集与 MMPose 中提供的图像分割一致,包含 14644 个训练样本和 2723 个验证样本,每张图像附有不同 LLM 生成的一个或多个姿势描述,还包含源自原始数据集注释的活动类型、人数、姿势关键点等额外信息。

以 JSON 格式文件为主,按不同配置(对应不同 LLM,如 GPT-4、GPT-3.5-turbo、LLAMA-2 等)划分,每个配置包含训练和验证拆分的文件(如 GPT-4-0613/train.json、GPT-3.5-turbo-0613/val.json 等),文件中包含图像文件名、视频 ID、活动描述、人数、人物信息、文本描述等字段数据。

适用于多模态学习研究,可探索图像与文本描述关联的模型,支持视觉问答、自然语言查询的图像检索等任务;适用于细粒度活动识别,助力识别特定人类活动和姿势;还可用于训练文本增强的可视化模型(如 CLIP-3),支持人员检测、人数统计、姿势估计等任务,为结合视觉和文本数据的研究提供支持。


公众号后台回复“数据集”获取100+深度学习各方向资源整理


极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列大视觉模型 (LVM) 解读扩散模型系列极市直播
技术综述:小目标检测那点事大模型面试八股含答案万字长文!人体姿态估计(HPE)入门教程

点击阅读原文进入CV社区

收获更多技术干货


【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读12.0k
粉丝0
内容8.2k