libcity笔记:支持的数据

发布于:2024-05-07 ⋅ 阅读:(32) ⋅ 点赞:(0)

数据下载地址:Standard Dataset in LibCity - Google 云端硬盘

1 交通速度数据

数据名称 地点 时间 出处

描述

METR_LA

美国洛杉矶

 Mar. 1, 2012 ~

Jun. 27, 2012

GitHub - liyaguang/DCRNN: Implementation of Diffusion Convolutional Recurrent Neural Network in Tensorflow 由环路探测器在高速公路上收集,包含来自 207 个传感器的交通速度数据

LOS_LOOP

美国洛杉矶

 Mar. 1, 2012 ~

Jun. 27, 2012

https://github.com/lehaifeng/T-GCN/tree/master/data  与METR LA略有不同,缺失值通过线性插值得到补充

PEMS

美国加州 2001 ~ present http://pems.dot.ca.gov 记录加利福尼亚高速公路的速度数据,包括时间小时,平均时间,车道点

PEMSD3

美国加州3区 Sept. 1, 2018 ~ Nov. 30, 2018 GitHub - Davidham3/STSGCN: AAAI 2020. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting PeMSD3 数据集包括 358 个传感器和流量信息

PEMSD4

美国加州湾区 Jan. 1, 2018 ~ Feb. 28, 2018 ASTGCN-2019-mxnet/data/PEMS04 at master · Davidham3/ASTGCN-2019-mxnet · GitHub 包含29条道路上的3848个传感器

PEMS_BAY

美国加州湾区  Jan. 1, 2017 ~ Jun. 30, 2017 GitHub - liyaguang/DCRNN: Implementation of Diffusion Convolutional Recurrent Neural Network in Tensorflow 包含6个月的交通速度统计数据,包括325个传感器

PEMSD7

美国加州7区 Jul. 1, 2016 ~ Aug. 31, 2016 GitHub - Davidham3/STSGCN: AAAI 2020. Spatial-Temporal Synchronous Graph Convolutional Networks: A New Framework for Spatial-Temporal Network Data Forecasting 包含883个传感器站的交通流量信息

PEMSD7(M)

美国加州7区  the weekdays of May and June of 2012 STGCN/datasets at master · Davidham3/STGCN · GitHub 述了加州第7区228个站点的高速公路速度信息

PEMSD8

美国加州San Bernardino  Jul. 1, 2016 ~ Aug. 31, 2016 ASTGCN-2019-mxnet/data/PEMS08 at master · Davidham3/ASTGCN-2019-mxnet · GitHub 数据来自8条公路上的1979个传感器

LOOP_SEATTLE

美国西雅图  2015 全年 https://github.com/zhiyongc/Seattle-Loop-Data 由部署在西雅图地区高速公路(I-5、I-405、I-90和SR-520)上的感应环路探测器收集,包含来自323个传感器站的交通状态数据

Q_TRAFFIC

中国北京 Apr. 1, 2017 ~ May 31, 2017 GitHub - JingqingZ/BaiduTraffic: This repo includes introduction, code and dataset of our paper Deep Sequence Learning with Auxiliary Information for Traffic Prediction (KDD 2018). Q-Traffic 数据集包含三个子数据集:查询子数据集、交通速度子数据集和路网子数据集

SZ_TAXI

中国深圳 Jan. 1, 2015 ~ Jan. 31, 2015 https://github.com/lehaifeng/T-GCN/tree/master/data 包含深圳市的出租车轨迹,包括道路邻接矩阵和道路交通速度信息

M_DENSE

西班牙马德里 Jan. 1, 2018 - Dec. 21, 2019 GitHub - rdemedrano/crann_traffic: A Spatio-Temporal Spot-Forecasting Framework for Urban Traffic Prediction 包含马德里市交通测量的历史数据。在每个点每 15 分钟进行一次测量,包括每小时汽车数量的交通强度

ROTTERDAM

荷兰鹿特丹 135 days of 2018 https://github.com/RomainLITUD/DGCN_traffic_forecasting 包含 208 条链路的交通状态信息

2 地铁数据(偏OD)

数据名称 地点 时间 出处

描述

SHMETRO

中国上海 Jul. 1, 2016 - Sept. 30, 2016 GitHub - ivechan/PVCGN: code for "Physical-Virtual Collaboration Graph Network for Station-Level Metro Ridership Prediction" 基于中国上海的地铁系统构建的。 2016年7月1日至2016年9月30日,共收集8.118亿笔交易记录,日客流量882万人次

BEIJING_SUBWAY

中国北京 Feb. 29, 2016 - Apr. 3, 2016 GitHub - JinleiZhangBJTU/ResNet-LSTM-GCN: Code for Deep-learning Architecture for Short-term Passenger Flow Forecasting in Urban Rail Transit

连续五周的05:00-23:00从北京地铁采集的数据。

截至2016年3月北京共有17条线路和276个地铁站(不包括机场快线及其上的车站)

HZMETRO

中国杭州 Jan. 1, 2019 - Jan. 25, 2019 GitHub - ivechan/PVCGN: code for "Physical-Virtual Collaboration Graph Network for Station-Level Metro Ridership Prediction" 根据 2019 年 1 月收集的杭州地铁系统交易记录创建的。该系统拥有 80 个运营站点和 248 个边,每天有 235 万乘客

NYCTAXI_DYNA

美国纽约

用不规则区域划分方法统计区域流入流出的数据集

源自下面的NYCTAXI

NYCTAXI_OD

美国纽约

它使用不规则区域划分方法计算区域之间的起点-终点流量

源自下面的NYCTAXI

NYCTAXI_GRID

美国纽约

用基于网格的划分方法计算区域的流入和流出

源自下面的NYCTAXI

NYC_TOD

美国纽约 2014 GitHub - liulingbo918/CSTN: Taxi Origin-Destination Demand Prediction 使用基于网格的划分方法计算区域的流入和流出

3 轨迹数据

数据名称 地点 时间 出处

描述

TAXIBJ

中国北京

Jul. 1, 2013 ~ Oct. 30, 2013,

Mar. 1, 2014 ~ Jun. 30, 2014,

Mar. 1, 2015 ~ Jun. 30, 2015

 Nov. 1, 2015 ~ Apr. 10, 2016

数据地址失效 · Issue #3 · TolicWang/DeepST · GitHub 包含出租车 GPS 数据,包括人流、气象和节假日信息

T_DRIVE

中国北京 Feb. 2, 2008 ~ Feb. 8, 2008 T-Drive trajectory data sample - Microsoft Research 包含10357辆北京出租车的每周轨迹约1500万个点,轨迹总距离达到900万公里

PORTO

葡萄牙波尔图 Jul. 1, 2013 ~ Jun. 30, 2014 https://archive.ics.uci.edu/ml/datasets/Taxi+Service+Trajectory+-+Prediction+Challenge%2C+ECML+PKDD+2015 描述了在葡萄牙波尔图市运行的所有 442 辆出租车所执行的轨迹

NYCTAXI

美国纽约 2009 ~ present TLC Trip Record Data - TLC 包含 GPS 为纽约市从 2009 年到 2020 年收集的不同类型出租车的轨迹

NYCBIKE

美国纽约 Jun. 2013 ~ present Citi Bike System Data | Citi Bike NYC 包含从 NYC CitiBike 系统收集的自行车轨迹

AUSTINRIDE

美国奥斯汀 Jun. 4, 2016 ~ Apr. 13, 2017 Ride-Austin-june6-april13 - dataset by ride-austin | data.world 包含从 2016 年 8 月 1 日到 2017 年 4 月 13 日的奥斯汀骑行轨迹,包括超过 140 万次旅行

BIKEDC

美国华盛顿 Sept. 20, 2010 ~ Oct. 2020 System Data | Capital Bikeshare 描述了华盛顿自行车系统的自行车道,其中包括 472 个停靠点

BIKECHI

美国芝加哥 Jun. 27, 2013 ~ 2018 Divvy Data 展示了 2013 年至 2018 年芝加哥共享单车的发展情况

Foursquare

东京、美国 Apr. 12, 2012 ~ Feb. 16, 2013 https://sites.google.com/site/yangdingqi/home/foursquare-dataset#h.p_ID_46

Foursquare 是一个基于位置的社交网站,用户可以在其中通过签到来分享他们的位置。

使用链接中的第二个数据集,即 NYC and Tokyo Check-in Dataset 。

对链接提供的原始数据进行了预处理,并将其拆分为 Foursquare-TKY 和 Foursquare-NYC

Gowalla

 Feb. 2009 ~ Oct. 2010 SNAP: Network datasets: Gowalla Gowalla 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID

Brightkite

Apr. 2008 ~ Oct. 2010 SNAP: Network datasets: Brightkite Brightkite 是一个基于位置的社交网站,用户通过签到分享他们的位置,包含用户信息、用户签到时间、用户纬度、经度、用户位置ID

Instagram

美国纽约 Jun. 15, 2011 - Nov. 8, 2016 DMIS Lab, Korea University - CAPE

该数据集最大的特点是每条签到记录不仅包含POI信息,还包含用户创建签到记录时写入的文本信息。

因此,该数据集对于将轨迹语义特征纳入轨迹预测的相关研究尤为重要。

Chengdu_Taxi_Sample1

中国成都 Aug. 03, 2014 - Aug. 30, 2014 https://github.com/UrbComp/DeepTTE/tree/master/data Chengdu_Taxi_Sample1 数据集是Chengdu_Taxi 数据集的部分样例数据集。包含1800条成都市出租车轨迹数据。

Beijing_Taxi_Sample

中国北京 Oct. 01, 2013 - Oct. 31, 2013 https://github.com/YibinShen/TTPNet/tree/master/data Beijing_Taxi_Sample 数据集是Beijing_Taxi 数据集的部分样例数据集,这里每一天只提供了1000条北京市出租车轨迹数据

 4 地图匹配

数据名称 地点 时间 出处

描述

Seattle

美国西雅图 Jan. 17,2009 20:27:37~22:34:28 https://www.microsoft.com/en-us/research/publication/hidden-markov-map-matching-noise-sparseness/

这个用于地图匹配的数据集显示了在美国华盛顿州西雅图及其东部郊区开车时拍摄的GPS数据。

轨迹从Marymoor公园附近开始。

数据是用RoyalTek RBT-2300 GPS记录器以1HZ的频率采样的。

这次驾驶发生在2009年1月17日星期六,从20:27:37 UTC(当地时间12:27:37)开始,到22:34:28 UTC(当地时间14:34:28)结束,经过的时间为02:06:51。

Global

Dataset for testing and training map-matching methods

这个用于地图匹配的数据集可以在世界范围内验证地图匹配的假设。

由于这个数据集覆盖全球,可以提高泛化能力

BJ_ROADMAP

中国北京

原始数据集包含 OpenStreetMap 格式的节点和边的属性。

建图有两种实现方式,分别是节点为交叉点,关系为路段,以及节点为路段,关系为交叉点。分别命名为 “bj_roadmap_node” 和 “bj_roadmap_edge”。

5 风险数据

数据名称 地点 时间 出处

描述

NYC_RISK

美国纽约 Jan.01,2013 ~ Dec.31,2013 GitHub - Echohhhhhh/GSNet: AAAI 2021. GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting NYC_RISK 数据集包含了2013年纽约道路、风险和POI数据

CHICAGO_RISK

美国芝加哥 Feb.01,2016 ~ Sep.30,2016 GitHub - Echohhhhhh/GSNet: AAAI 2021. GSNet: Learning Spatial-Temporal Correlations from Geographical and Semantic Aspects for Traffic Accident Risk Forecasting 2016年1月到9月芝加哥道路和风险数据