实验二报告

发布于:2022-11-09 ⋅ 阅读:(13) ⋅ 点赞:(0) ⋅ 评论:(0)

Hefei University of Technology

复杂网络导论课程
实验报告

专业名称: 交通工程专业
年 级: 2019级
学生姓名: 曾培圣
指导教师: 王世广
学院名称: 汽车与交通工程学院
完成时间: 2022年1月

一、 实验所属课程名称
复杂网络导论
二、 实验名称
家乡城市网络交通空间联系强度分析
三、实验时间
2021年12月——2022年1月

  1. 实验目的

熟悉交通网络的建模方式,认识家乡城市在地域中的交通地位及城市间联系。调研多模式(长途客运,普通铁路,高铁,城际公交等)客流的地域分布,尝试挖掘地域交通存在的问题并提出改善建议。
可选一个省份内的所有地级市(数量不足时可考虑县级市)、家乡城市及相邻省份城市(不少于15个)进行分析。
五、实验所用部分软件
ArcGIS 10.5、Gephi、Python等
六、实验过程及内容

  1. 获取研究区域地理数据。
  2. 统计研究城市人口。
  3. 数据导入Arcgis,整合筛选有用信息。
  4. 对数据进行字段计算,求解各个城市吸引力大小。
  5. 求解省外城市与广东城市的吸引力大小。
  6. 导出城市信息数据,处理为gephi可导入的点表格和边表格。
  7. 导入数据进入gephi中,进行指标统计。
  8. 对网络进行随机攻击,重新统计指标。

1、城际交通网络获取与构建

  1. 研究对象


图 1广东区位图
广东,简称“粤”,中华人民共和国省级行政区,省会广州。因古地名广信之东,故名“广东”。位于南岭以南,南海之滨,与香港澳门广西湖南江西福建接壤,与海南隔海相望。下辖21个地级市、65个市辖区、20个县级市、34个县、3个自治县。截至2020年11月1日零时,广东省的常住人口为126012510人。
广东是岭南文化的重要传承地,在语言风俗、生活习惯和历史文化等方面都有着独特风格。广东也是中国人口较多的省份之一。广东省属于东亚季风区,从北向南分别为中亚热带、南亚热带和热带气候,是全国光、热和水资源丰富的地区,是农耕文明发祥地之一。
广东是中国的南大门,处在南海航运枢纽位置上。早在三千多年前就已经形成以陶瓷为纽带的贸易交往圈,并通过水路将其影响扩大到沿海和海外岛屿。到了清代,广州成为全国唯一的对外通商口岸。改革开放后,广东成为改革开放前沿阵地和引进西方经济、文化、科技的窗口。
自1989年起,广东国内生产总值连续居全国第一位,成为中国第一经济大省,经济总量占全国的1/8,已达到中上等收入国家水平、中等发达国家水平。广东省域经济综合竞争力居全国第一。广东珠三角9市将联手港澳打造粤港澳大湾区,成为与纽约湾区旧金山湾区东京湾区并肩的世界四大湾区之一。
表 1广东基本情况

中文名 广东 政府驻地 广州市越秀区东风中路305号
外文名 Guangdong,Kwangtung 电话区号 020、066+、075+、076+
别 名 南粤 邮政区码 51-52(广州:510000)
行政区划代码 440000 气候条件 亚热带季风气候
行政区类别 人口数量 12601.25万(2020年常住人口)
所属地区 华南地区 著名景点 长隆欢乐世界深圳华侨城白云山雁南飞观澜湖罗浮山广州塔丹霞山
地理位置 中国南岭以南,南海之滨 机 场 广州白云国际机场深圳宝安国际机场
面 积 179725 km²(2018) 火车站 广州南站广州站广州东站深圳北站
下辖地区 21个地级市、20个县级市 车牌代码 粤A—粤Z
地区生产总值 110760.94 亿元(2020年)
  1. 广东省客运量基本情况现状概况:

表 2广东省客运量基本情况现状统计表

指标 单位 数值
客运量总数量 万人 142144.5
铁路客运量 万人 34120.8
公路客运量 万人 105248.8

表 3广东省客运量总数量现状统计表

区域 指标 数量(万人)
广东省 客运量总数量 142144.5

表 4全国客运量总数量现状统计表

区域 指标 数量(万人)
全国 客运量总数量总值 1793820.3

表 5广东省客运量总数量占全国客运量总数量比重统计表

指标 数量(万人) 占总值比重
客运量总数量 142144.5 7.92%

表 6广东省客运量总数量(2016-2018)统计表

年份 指标 数量(万人)
2016 客运量总数量 130345.4
2017 客运量总数量 137418.4
2018 客运量总数量 142144.5

表 7广东省客运量总数量(2017-2018)变动统计表

年份 客运量总数量(万人) 变动值
2017 137418.4 5.43%
2018 142144.5 3.44%

表 8全国客运量总数量(2016-2018)统计表

年份 指标 数量(万人)
2016 客运量总数量总值 1900194.3
2017 客运量总数量总值 1848620.1
2018 客运量总数量总值 1793820.3

表 9全国客运量总数量(2017-2018)变动统计表

年份 客运量总数量总值(万人) 变动值
2017 1848620.1 -2.71%
2018 1793820.3 -2.96%

表 10广东省客运量总数量同全国客运量总数量(2017-2018)变动对比表

年份 广东省变动值 总值变动值
2017 5.43% -2.71%
2018 3.44% -2.96%
  1. 广东省铁路客运量指标分析

表 11广东省铁路客运量现状统计表

区域 指标 数量(万人)
广东省 铁路客运量 34120.8

表 12全国铁路客运量现状统计表

区域 指标 数量(万人)
全国 铁路客运量总值 337494.7

表 13广东省铁路客运量占全国铁路客运量比重统计表

指标 数量(万人) 占总值比重
铁路客运量 34120.8 10.11%

表 14广东省铁路客运量(2016-2018)统计表

年份 指标 数量(万人)
2016 铁路客运量 25603.0
2017 铁路客运量 28766.5
2018 铁路客运量 34120.8

表 15广东省铁路客运量(2017-2018)变动统计表

年份 铁路客运量(万人) 变动值
2017 28766.5 12.36%
2018 34120.8 18.61%

表 16全国铁路客运量(2016-2018)统计表

年份 指标 数量(万人)
2016 铁路客运量总值 281405.2
2017 铁路客运量总值 308379.3
2018 铁路客运量总值 337494.7

表 17全国铁路客运量(2017-2018)变动统计表

年份 铁路客运量总值(万人) 变动值
2017 308379.3 9.59%
2018 337494.7 9.44%

表 18广东省铁路客运量同全国铁路客运量(2017-2018)变动对比表

年份 广东省变动值 总值变动值
2017 12.36% 9.59%
2018 18.61% 9.44%
  1. 广东省公路客运量指标分析

表 19广东省公路客运量现状统计表

区域 指标 数量(万人)
广东省 公路客运量 105248.8

表 20全国公路客运量现状统计表

区域 指标 数量(万人)
全国 公路客运量总值 1367170.4


表 21广东省公路客运量占全国公路客运量比重统计表

指标 数量(万人) 占总值比重
公路客运量 105248.8 7.70%

表 22广东省公路客运量(2016-2018)统计表

年份 指标 数量(万人)
2016 公路客运量 102094.2
2017 公路客运量 105919.3
2018 公路客运量 105248.8

表 23广东省公路客运量(2017-2018)变动统计表

年份 公路客运量(万人) 变动值
2017 105919.3 3.75%
2018 105248.8 -0.63%

表 24全国公路客运量(2016-2018)统计表

年份 指标 数量(万人)
2016 公路客运量总值 1542758.7
2017 公路客运量总值 1456784.3
2018 公路客运量总值 1367170.4

表 25全国公路客运量(2017-2018)变动统计表

年份 公路客运量总值(万人) 变动值
2017 1456784.3 -5.57%
2018 1367170.4 -6.15%

表 26广东省公路客运量同全国公路客运量(2017-2018)变动对比表

年份 广东省变动值 总值变动值
2017 3.75% -5.57%
2018 -0.63% -6.15%
  1. 广东省水运客运量指标分析


表 27广东省水运客运量现状统计表

区域 指标 数量(万人)
广东省 水运客运量 2774.9


表 28全国水运客运量现状统计表

区域 指标 数量(万人)
全国 水运客运量总值 27981.5

表 29广东省水运客运量占全国水运客运量比重统计表

指标 数量(万人) 占总值比重
水运客运量 2774.9 9.92%

表 30广东省水运客运量(2016-2018)统计表

年份 指标 数量(万人)
2016 水运客运量 2648.2
2017 水运客运量 2732.6
2018 水运客运量 2774.9

表 31广东省水运客运量(2017-2018)变动统计表

年份 水运客运量(万人) 变动值
2017 2732.6 3.19%
2018 2774.9 1.55%

表 32全国水运客运量(2016-2018)统计表

年份 指标 数量(万人)
2016 水运客运量总值 27234.4
2017 水运客运量总值 28300.3
2018 水运客运量总值 27981.5

表 33全国水运客运量(2017-2018)变动统计表

年份 水运客运量总值(万人) 变动值
2017 28300.3 3.91%
2018 27981.5 -1.13%

表 34广东省水运客运量同全国水运客运量(2017-2018)变动对比表

年份 广东省变动值 总值变动值
2017 3.19% 3.91%
2018 1.55% -1.13%
  1. 城际交通网络构建

利用Arcgis构建城市基本联系网,并进行可视化操作。

  1. 导入全国省shp数据,进行筛选,留下广东省,以及相邻省份的shp数据。


图 2全国地图

  1. 进行编辑将多余省,市去除,、;保留广东省周围省市,为做广东省周围城市分析作准备。


图 3编辑地图

  1. 调节市图层透明度,使省之间的边界更加清晰。


图 4设置透明度

图 5处理后广东省图

  1. 筛选数据,对不需要的数据进行去除。


图 6图层原始数据

图 7图层处理后数据

  1. 导入数据表格,为构建城市基本联系网打下基础。

表 35城市人口数据

Id Label 人口(万) lng lat
潮州市 潮州市 256.84 116.7855 23.78555
东莞市 东莞市 1046.66 113.875 22.93453
佛山市 佛山市 949.89 112.9445 23.00653
广州市 广州市 1867.66 113.539 23.33085
河源市 河源市 283.77 114.9578 24.04462
惠州市 惠州市 604.29 114.5027 23.2351
江门市 江门市 479.81 112.6726 22.26739
揭阳市 揭阳市 557.78 116.1198 23.33614
茂名市 茂名市 617.41 110.9535 22.01009
梅州市 梅州市 387.32 116.0794 24.20307
清远市 清远市 396.95 112.875 24.31431
汕头市 汕头市 550.2 116.5956 23.33031
汕尾市 汕尾市 267.28 115.5889 22.8753
韶关市 韶关市 285.51 113.7745 24.82037
深圳市 深圳市 1756.01 114.1372 22.64532
阳江市 阳江市 260.3 111.7746 22.02781
云浮市 云浮市 238.34 111.7937 22.81603
湛江市 湛江市 698.12 110.1649 21.07535
肇庆市 肇庆市 41.14 112.2053 23.53771
中山市 中山市 441.81 113.3936 22.5199
珠海市 珠海市 243.96 113.3622 22.15192
  1. 使用Arcgis中的要素转点工具,构建以市为单位的节点。


图 8要素转点操作

图 9要素转点后

  1. 对转出的点集添加XY坐标。


图 10添加XY坐标

图 11添加XY坐标后

1 城际交通网络的图形可视化

  1. 在属性表中添加字段,先求对广州的吸引力,就添加广州的X,Y坐标。


图 12添加研究城市坐标

  1. 先求广东省内各市的之间吸引力,将广东省内的各市筛选出。


图 13筛选出广东省内各市

图 14导出广东省内数据

  1. 对XY坐标进行转线。


图 15XY转线

图 16XY转线后

  1. 对属性表格进行数据连接,对字段进行处理,筛选出人口数据;为进行吸引力分析打下基础。


图 17XY转线后属性表

图 18导入人口数据

  1. 对图层进行投影,并添加字段,计算距离。


图 19投影操作

图 20计算几何

  1. 添加吸引力字段,并进行计算。


图 21计算吸引力字段
吸引力计算公式:

图 22吸引力结果

  1. 利用吸引力,对属性进行可视化,选择符号系统,选择数量,选择吸引力,选择分位数法,类选择5类。


图 23使用符号系统可视化

图 24可视化结果

图 25调整线条粗细

3、城际交通网络分析

  1. 自从1998年Watts和Strongatz提出小世界网络模型,R.Albert和A.-L.Barab等人于1999年发表了他们发现无标度网络的研究成果以来,复杂网络的研究在过去几年得到了迅速发展。这种研究方法把复杂系统简化为点以及连顶点的线段的集合,点代表系统的基本单元,称为顶点;线段代表顶点之间的相互作用,称为边,每个顶点和每条边都可以加上称为“权”的不同的说明。这很可能是一种合适的抓住本质的抽象,因此已经取得了许多值得称道的成就。
  2. 对于复杂网络的研究涉及到社会科学与自然科学的多个门类,复杂网络的具体形态多种多样。在众多的研究对象中,有关传输网络的研究引起国内外许多学者的关注,例如航空路线网络区、道路网络铁路网络,人行交通网络以及电力网。针对交通网络,国内外有些学者提出了比较著名的一些模型,例如Barrat-Barthelemy-Vespignani(BBV)模型就是基于点强度驱动和边权逐渐加强机制建立的网络演化模型,可以模仿现实系统中相互作用强度的变化。
  3. 对所有广东省内所以市进行吸引力计算,并对吸引力进行可视化。
  4. 对其他所有市,统一操作求吸引力。


图 26珠海吸引力

图 27中山吸引力

图 28肇庆吸引力

图 29阳江吸引力

图 30汕尾吸引力

图 31汕头吸引力

图 32清远吸引力

图 33梅州吸引力

图 34茂名吸引力

图 35揭阳吸引力

图 36江门吸引力

图 37惠州吸引力

图 38河源吸引力

图 39佛山吸引力

图 40东莞吸引力

图 41深圳吸引力

图 42云浮吸引力

图 43湛江吸引力

图 44韶关吸引力

图 45广州吸引力

图 46潮州吸引力

图 47可视化效果总图
3.1 网络指标计算与分析

  1. 导出Arcgis里的市数据,整理成点表格和边表格,为导入gephi构造网络打下基础。


图 48表转excel

  1. 导出后的数据表格。


图 49导出后数据

图 50点表格

图 51边表格

  1. 将表格分别另存为csv文件,以导入gephi。


图 52另存为csv

  1. 在gephi中导入点表格,选择GBK格式。


图 53导入点表格

  1. 在gephi中导入边表格,选择GBK格式。


图 54导入边表格

  1. 使用Force Altas布局(力导向图)。调整斥力强度为900,使图形更加美观,勾选<吸引力分布>和<由尺寸分布>功能。


图 55Force Altas布局

  1. 使用外观功能,对节点颜色进行设置,使用导入数据时的人口数据,进行分级显示。


图 56外观设置

  1. 使用Force Altas2布局,勾选<劝阻Hubs>,<linlog模式>和<防止重叠>功能进行分布。


图 57Force Altas2布局

  1. 使用Fruchterman Reingold布局。


图 58ruchterman Reingold布局

  1. 使用Geo layout布局,使lng经度,lat纬度进行匹配。


图 59Geo layout布局

  1. 使用扩展布局,并加上标签。


图 60扩展布局
现实世界的网络大部分都不是随机网络,少数的节点往往拥有大量的连接,而大部分节点却很少,节点的度数分布符合幂率分布,而这就被称为是网络的无标度特性(Scale-free)。将度分布符合幂律分布的复杂网络称为无标度网络。
下图为一个具有10万个节点的BA无标度网络的度数分布示意图:

图 61BA无标度网络度分布
从上面的多种网络布局图中,我们可以看出城市关系网络使一个全局耦合网络,是一种规则网络。三种常见的规则网络:全局耦合网络( Globally coupled network)、最近邻耦合网络( Nearest-neighbor coupled network)和星形耦合网络( Star coupled network),如下所示:

图 62三种规则网络
如果一个网络中的任意两个节点之间都有边直接相连,那么就称该网络为一个全局耦合网络,简称全耦合网络。
规模不大的组织内部成员一般都相互认识,因此,如果我们定义两个相互认识的人之间有一条边,那么这些成员就构成了一个全耦合网络。例如,如果你是学生,那么你所在班级的所有同学就构成一个全耦合网络。但是,当一个组织规模大到一定程度之后,要使得所有成员之间都相互认识就变得极为困难甚至不可能了。例如,如果你在一所大学学习或工作,显然一般说来你不可能与这所大学的每一个人都相互认识。对于技术网络也存在同样的问题:如果一个通信网络中只有5个节点,那么在每两个节点之间都通过光纤等介质直接相连还是可以实现的;而对于今天的互联网,如果想要在任意两个路由器之间都直接物理相连就无异于天方夜谭了。
这些例子说明,要想构建和维护一个大规模的全耦合网络的成本是极其高昂的。例如,你即使每天其他什么事都不干,只在校园里面去认识人,那么要与校园里数以万计的人中的每一个都认识和交流,你所需花的时间也是难以想象的。这也反映了全耦合网络作为实际网络模型的局限性:大型实际网络一般都是稀疏的,它们的边的数目一般至多是O(N)而不是O(N)。
另一方面,尽管从全局看大规模实际网络具有稀疏性,但是,网络中可能会存在不少稠密的甚至是全耦合的子图。为了有一个直观的感觉,下图给出了Twitter上168个用户之间的稠密的关注关系:

图 63Twitter上168个用户关系
基本拓扑性质:
N个节点构成的全耦合网络中有N(N-1)/2条边。在具有相同节点数的所有网络中,全耦合网络具有最多的边数、最大的聚类系数C=1和最小的平均路径长度L=1。
3.2 网络鲁棒性分析

  1. 将城市网络导出,并整理为点,边表格,导入gephi后。
  2. 选择显示节点标签,使用微软雅黑,调整字体。
  3. 使用Force Atlas进行布局,调整斥力强度为900,勾选吸引力分布,由尺寸调整。


图 64重力布局

  1. 随机删除节点,重新统计网络指标。

表 36随机攻击后指标对比

属性 平均度 平均加权度 网络直径 图密度 模块化 连接部件 平均聚类系数 平均路径长度
城际网络 21 21 1 1.1 0 1 0.966 1
随机攻击 19 19 1 1.056 0 1 1 1
差值 2 2 0 0.044 0 0 0.034 0

图 65随机攻击指标对比
图 66随机攻击指标对比2
图 67随机攻击指标对比3

图 68随机攻击指标对比4

  1. 从上述的数据统计中,我们可以看到平均度和平均加权度在减少;网络直径并没有变化都为1;图密度有了一定的下降,模块化程度,连接部件,平均聚类系数,平均路径长度也没有太大的变化。

3.3 网络结构与功能的关联规律

  1. 求取网络的各项指标,并与gephi中已有案例网络进行对比。在交通网络中平均路径长度和集群系数具有一定的重要性。如果网络的平均路径长度越小,集群系数越大,那么平均而言转车的概率越小。

表 37城市空间强度关系网络指标

属性 平均度 平均加权度 网络直径 图密度 模块化 连接部件 平均聚类系数 平均路径长度
案例 6.597 21.299 5 0.087 0.545 1 0.736 2.641
城际网 21 21 1 1.1 0 1 0.966 1
差值 14.403 0.299 4 1.013 0.545 0 0.23 1.641

图 69城际网指标对比1
图 70城际网指标对比2
图 71城际网指标对比3

图 72城际网指标对比4
3.4 网络问题分析及优化

  1. 中国科技大学研究小组基于技术网络的性质,提出了一个流驱动的加权网络模型。该模型不仅考虑了新节点加入的影响,同时考虑了边权随时间的演化和老节点之间新边的生成。在往交通网络的研究中,人们仅是单一地去研究航空网、铁路网以及公路网。但在一个国家或者某个区域内,人们出行常常是换乘不同的交通工具,不同的交通运输方式存在合作与竞争,政府对不同交通基础设施的建设总是统一规划,以实现公路、铁路航空水运以及管道等多种运输方式的结构优化和协调发展,形成一个科学合理的立体交通网络。从理论统计物理的角度出发,利用复杂网络的理论来研究广东省周围地区公路、铁路、航空、水运四种单一客运交通网以及四种交通方式构成的客运交通复合网,着重考虑加权的情况。
  2. 选取广东省的21个城市为节点,和周围的省会城市,以及一些大城市。每个城市人口和本城市的人口的乘积与距离的平方作为该节点城市的吸引力,对于四种单一客运交通网,任意两个城市之间若存在直达的某种客运交通方式就连边。
  3. 重力模型是人们从牛顿的片有引力模型中得到启发而建立的。它把两地的人 口数量和经济发展水平看作是两地运输需求的引力因素,把两地间的运输阻力看 作是两地运输需求的阻力因素。区域间的交通量与区域的各自的引力因素成广义 的正比关系,而与两区域间的阻力因素成广义反比关系。这里,实际运输阻力r,包括出行时间、距离和费用,由千时间、距离和费用的单位不统一,而且出行时间和 费用大致与两地的距离成正比。
  4. 通过对网络各种指标的计算,我们可以得出该网络是均匀网络的结论。这是因为在Arcgis中构建吸引力时,我们假定每个城市都与该吸引的城市有吸引力,即每个城市都有边相连,所以导出图层数据,构建城市吸引力联系网络时,是每个节点都有边相连的。这便无意中构造了一个全局耦合网络。从中,我们观察该网络的指标特性:平均度较大,达到21,这是因为每个节点都有大量的边与它相连。网络直径也很小,为1,也符合全局耦合网络的规律。图密度也很大,为1.1,这说明规则图的密度一般会比随机图要大。而因为它是规则图,所以模块化直接为0。而平均聚类系数也很大,几乎接近1了。

3.5 省外空间联系网络

  1. 选中需要研究的要素,进行导出。整合在一个图层内进行研究,包括省外的几个大市,以及与广东联系紧密的市,如赣州市等。


图 73筛选省外城市

图 74导出省外与省内数据

图 75导出数据2

图 76进行标注1

图 77进行标注2

  1. 对邻接的省市进行吸引力研究,主要选取各省大城市。


图 78长沙

图 79南宁

图 80赣州

图 81福州

图 82台湾

图 83海口

图 84南昌

图 85总图

  1. 在做实验的过程中,通过多次吸引力的计算与可视化,可以从中归纳出一些规律。例如在一定的距离内,广州吸引力总是比较大,一方面是因为人口较大,距离比人口小的城市影响力更小。从而大城市在中距离中,吸引力都是比较大的。其中外省的省城相互之间吸引力也是很大的,例如福州与南昌,南昌与长沙等。

3.6 小结
本章内容研究了广东省大陆城市连接关系网及与外省的大城市的复合城市关系网。对网络些主要的统计性质,如平均路径长度、集群系数、同类性、度分布、边权和点强度分布、相关性以及“缺完全度”和“方便性”。通过在Arcgis中处理基础数据,展示城市之间的吸引力大小,并从中总结出一定的规律。最后也再进行了省外与省内城市的吸引力计算。其中在导出Arcgis的数据时,也遇到了许多困难,最终在gephi中对网络进行研究;同时也是第一次接触到全局耦合网络,许多外观上的显示方法使用不了。比如先进行模块化计算,再使用Modularity Class对社区结构进行显示。