Spharx AI Visual Perception Dataset
千亿数量级-7H45数据集
动态环境下的多视角高帧率视觉感知数据集
Spharx AI Visual Perception Dataset
极光7H45数据集深度介绍
数据集概述
全称为Spharx 7H45 AI Visual Perception Dataset,是一个面向动态环境的多视角高帧率视觉感知数据集,专为自动驾驶和具身智能应用设计。数据集采用先进的采集设备和标注技术,确保数据的准确性和可靠性。
7H45
连续采集时长
混合模式
视频+关键帧
数据规模
10TB+
当前数据总量
1000万+
当前图像数量
未来规划
计划数据总量≤2000TB
计划图像数量≥200亿张
存储格式
RAW视频流 + 关键事件图像
构建逻辑与数据格式
视频模式连续采集
确保运动序列完整性,捕获完整运动轨迹
关键事件触发机制
检测到关键事件时自动触发高分辨率拍照
自适应帧率调整
根据任务类型和环境变化自动调整帧率
数据质量评估体系
| 质量维度 | 具体含义 | 在7H45数据集中的体现 |
|---|---|---|
| 覆盖度 | 不同场景和天气的覆盖范围 | 涵盖动态环境下的多视角采集 |
| 准确性 | 标注的正确性 | 关键事件触发的高分辨率拍照 |
| 一致性 | 不同传感器数据的时间同步 | 计划与其他传感器协同采集 |
| 多样性 | 数据分布的全面性 | 多视角、高帧率、动态环境 |
| 时效性 | 数据的新鲜度 | 实时采集与自适应调整 |
| 平衡性 | 类别分布的均衡性 | 视频帧与关键图像的合理配比 |
标注体系
目标检测标注
在图片中框出特定目标物体,标注类别和位置信息
语义分割标注
将图片中的每个像素点分配一个类别标签
实例分割标注
每个属于物体的像素被赋予唯一ID,区分同一类别的不同个体
标注质量要求
0.8
目标检测标注 IoU ≥ 0.8
95%
语义分割标注准确率 ≥ 95%
一致性评估方法
- Kappa系数
- Kendall协调系数
- ICC组内相关系数
- 成对一致性检验
应用场景深度分析
自动驾驶场景
- 多视角采集提供360度环境覆盖,高帧率确保快速移动物体的清晰捕获
- 高分辨率关键帧确保小目标(如行人、交通标志)的准确识别
- 连续的视频序列为车辆轨迹预测提供时序信息
- 丰富的环境数据为自动驾驶决策系统提供充分的信息支撑
具身智能场景
- 多视角特性有助于具身智能理解空间布局和物体关系
- 高帧率数据能够捕捉细微的动作变化,支持动作识别和模仿学习
- 通过迁移学习,结构化场景的数据可以适应非结构化环境
- 基于该数据集训练的模型具备快速的环境感知能力,满足实时性要求
