Spharx AI Visual Perception Dataset

千亿数量级-7H45数据集

动态环境下的多视角高帧率视觉感知数据集

Spharx AI Visual Perception Dataset
极光7H45数据集深度介绍

数据集概述

全称为Spharx 7H45 AI Visual Perception Dataset,是一个面向动态环境的多视角高帧率视觉感知数据集,专为自动驾驶和具身智能应用设计。数据集采用先进的采集设备和标注技术,确保数据的准确性和可靠性。

7H45
连续采集时长
混合模式
视频+关键帧

数据规模

10TB+
当前数据总量
1000万+
当前图像数量
未来规划
计划数据总量≤2000TB
计划图像数量≥200亿张

存储格式

RAW视频流 + 关键事件图像

构建逻辑与数据格式

视频模式连续采集

确保运动序列完整性,捕获完整运动轨迹

关键事件触发机制

检测到关键事件时自动触发高分辨率拍照

自适应帧率调整

根据任务类型和环境变化自动调整帧率

数据质量评估体系

质量维度具体含义在7H45数据集中的体现
覆盖度不同场景和天气的覆盖范围涵盖动态环境下的多视角采集
准确性标注的正确性关键事件触发的高分辨率拍照
一致性不同传感器数据的时间同步计划与其他传感器协同采集
多样性数据分布的全面性多视角、高帧率、动态环境
时效性数据的新鲜度实时采集与自适应调整
平衡性类别分布的均衡性视频帧与关键图像的合理配比

标注体系

目标检测标注

在图片中框出特定目标物体,标注类别和位置信息

语义分割标注

将图片中的每个像素点分配一个类别标签

实例分割标注

每个属于物体的像素被赋予唯一ID,区分同一类别的不同个体

标注质量要求

0.8
目标检测标注 IoU ≥ 0.8
95%
语义分割标注准确率 ≥ 95%

一致性评估方法

  • Kappa系数
  • Kendall协调系数
  • ICC组内相关系数
  • 成对一致性检验

应用场景深度分析

自动驾驶场景

  • 多视角采集提供360度环境覆盖,高帧率确保快速移动物体的清晰捕获
  • 高分辨率关键帧确保小目标(如行人、交通标志)的准确识别
  • 连续的视频序列为车辆轨迹预测提供时序信息
  • 丰富的环境数据为自动驾驶决策系统提供充分的信息支撑

具身智能场景

  • 多视角特性有助于具身智能理解空间布局和物体关系
  • 高帧率数据能够捕捉细微的动作变化,支持动作识别和模仿学习
  • 通过迁移学习,结构化场景的数据可以适应非结构化环境
  • 基于该数据集训练的模型具备快速的环境感知能力,满足实时性要求

申请使用数据集

如有需要使用Spharx 7H45数据集,请联系我们获取详细信息和访问权限