
目前关于自动驾驶数据集你想知道的,应该都在这里了,这是「整数智能」自动驾驶数据集八大系列分享之系列一:
自动驾驶数据集分享是整数智能推出的一个全新分享系列,在这个系列中,我们将介绍目前为止各大科研机构和企业推出的所有公开自动驾驶数据集。数据集主要分为八个系列:
-
系列一:目标检测数据集
-
系列二:语义分割数据集
-
系列三:车道线检测数据集
-
系列四:光流数据集
-
系列五:Stereo Dataset
-
系列六:定位与地图数据集
-
系列七:驾驶行为数据集
-
系列八:仿真数据集
本文是<系列一目标检测数据集>的第一篇,一共分为三篇来介绍。
过去,研究人员创建和发布的数据集相对较小,这些数据集的数据来源也比较有限,通常仅限于摄像头数据。随着采集设备的升级, 自动驾驶数据集也在不断升级。以谷歌自动驾驶汽车为例,谷歌自动驾驶汽车在外部车顶上装置了64束激光测距仪,能够使自动驾驶汽车把激光测的数据和高分辨率的地图相结合,使得做出不同类型的数据场景,以便在自动驾驶中躲避障碍物及遵循交通规则。除此之外,Pandset、nuScenes、BLVD等均采用了激光雷达传感器。
除了国外的一些知名数据集,百度、华为、滴滴和西安交大研究所也先后推出了国内的自动驾驶数据集,如Apollo Scape数据集、SODA10M 数据集、D²-City数据集和BLVD数据集,为国内自动驾驶技术的进展提供了重要的研究材料。
下面共包括14个数据集:
01
「Waymo数据集」
-
发布方:Waymo
-
下载地址:
https://waymo.com/open/
-
发布时间:2019年发布感知数据集,2021年发布运动数据集
-
大小:1.82TB
-
简介:Waymo数据集是到目前为止最大、最多样化的数据集,相比于以往的数据集,Waymo在传感器质量和数据集大小等方面都有较大提升,场景数量是nuScenes数据集的三倍
-
Perception Dataset
-
1950个自动驾驶视频片段,每段视频包括20s的连续驾驶画面
-
汽车、行人、自行车、交通标志四类标签
-
1260万个3D框,1180万个2D框
-
传感器数据:1 个中程激光雷达、4 个短程激光雷达、5个摄像头
-
采集范围涵盖美国加州的凤凰城、柯克兰、山景城、旧金山等地区的市中心和郊区。同时涉及各种驾驶条件下的数据,包括白天、黑夜、黎明、黄昏、雨天、晴天

-
Motion Dataset
-
包括574 小时的数据,103,354个带地图数据片段
-
汽车、行人、自行车三类标签,每个对象都带有2D框标注
-
挖掘用于行为预测研究的行为和场景,包括转弯、并道、变道和交汇
-
地点包括:旧金山、凤凰城、山景城、洛杉矶、底特律和西雅图
02
「PandaSet」
-
发布方:禾赛科技&Scale AI
-
下载地址:
https://scale.com/resources/download/pandaset
-
发布时间:2019
-
大小:16.0 GB
-
简介:Pandaset面向科研及商业应用公开。首次同时使用了机械旋转式和图像级前向两类激光雷达进行数据采集,输出点云分割结果
-
特征
-
48000多个摄像头图像
-
16000个激光雷达扫描点云图像(超过100个8秒场景)
-
每个场景的28个注释
-
大多数场景的37个语义分割标签
-
传感器:1个机械LiDAR,1个固态LiDAR,5个广角摄像头,1个长焦摄像头,板载GPS / IMU
03
「nuScenes」
-
发布方:无人驾驶技术公司Motional
-
下载地址:
https://scale.com/open-datasets/nuscenes/tutorial
-
论文地址:
https://arxiv.org/abs/1903.11027
-
发布时间:2019
-
大小:547.98GB
-
简介:nuScenes 数据集是自动驾驶领域使用最广泛的公开数据集之一,也是目前最权威的自动驾驶纯视觉 3D 目标检测评测集。nuScenes数据集灵感来源于kitti,是首个包含全传感器套件的数据集。其中包含波士顿和新加坡的 1000 个复杂的驾驶场景。该数据集禁止商用
-
特征
-
全传感器套件:1个激光雷达、5个雷达、6个摄像头、GPS 、 IMU
-
1000个场景,每个场景20秒(850个用于模型训练,150个用于模型测试)
-
40万个关键帧,140万张相机图片,39万个激光雷达扫描点云图像,140 万个雷达扫描点云图像
-
为23个对象类标注的1400万个3D标注框
04
「Lyft Level 5」
-
发布方:来福车(Lyft)交通网络公司
-
下载地址:
https://level-5.global/register/
-
论文地址:
https://arxiv.org/pdf/2006.14480v2.pdf
-
发布时间:2019年发布Lyft-perception数据集,2020年发布Lyft-prediction数据集
-
Lyft-perception
-
简介:来福车的自动驾驶汽车配备了一个内部传感器套件,可以收集其他汽车、行人、交通灯等的原始传感器数据
-
特征
-
超过 55,000 帧,由人工进行3D标注
-
130万3D标注
-
3万激光雷达点云数据
-
350个60-90分钟的场景
-
Lyft-prediction
-
简介:该数据集包括无人驾驶车队遇到的汽车、骑自行车者、行人等其他交通行为主体的动作记录。这些记录来自通过原始激光雷达、相机和雷达数据,是训练运动预测模型的理想选择
-
特征
-
1000 个小时的驾驶记录
-
17 万个场景:每个场景持续约 25 秒,包括交通信号灯、航拍地图、人行道等
-
2575 公里:来自公共道路的 2575 公里数据
-
15242 张标注图片:包括高清语义分割图以及该区域的高清鸟瞰图
05
「H3D – HRI-US」
-
发布方:本田研究所
-
原创文章,作者:整数智能,如若转载,请注明出处:https://www.agent-universe.cn/2022/03/8392.html