2019210025曾培圣

发布于:2022-11-09 ⋅ 阅读:(7) ⋅ 点赞:(0) ⋅ 评论:(0)

Hefei University of Technology

复杂网络导论课程
实验报告

专业名称: 交通工程专业
年 级: 2019级
学生姓名: 曾培圣
学 号: 2019210025
指导教师: 王世广
学院名称: 汽车与交通工程学院
完成时间: 2022年1月

**一、 **实验所属课程名称
复杂网络导论
二、 实验名称
公交网络分析
三、实验时间
2021年12月——2022年1月

  1. 实验目的

熟悉交通网络的建模方式,认识多种网络视角下的家乡城市道路网或公交线网特征;并基于GIS课程识别的常发性拥堵路段,分析网络指标与交通状态之间的关系。
可选两个不同年份的城市道路网、一个城市道路网和一个公交线网进行分析。
五、实验所用部分软件
ArcGIS 10.5、Gephi、Python等
六、实验过程及内容

  1. 获取公交站点数据
  2. 整理公交站点数据
  3. 导入点边表进入Gephi
  4. 对外观进行设置
  5. 对网络进行统计
  6. 对网络进行过滤
  7. 对网络不同角度展示
  8. 对原始网络,过滤网络进行对比
  9. 对网络进行分析

1、交通网络获取与构建

  1. 公共交通的车辆情况

2019年韶关市拥有公共汽车200辆。以换算系数1.0计,折合标准车200标台。可以算出韶关市公交车服务人数为2957人/标车,相应为人车辆拥有率为3.38标车,远低于国标(GB50220-95)中大城市10~12.5标车/万人标准。与国内同类城市相比,处于较低水平。

  1. 公交站场设施

目前韶关公交站场设施较为缺乏,只有火车站广场公共汽车站与南郊金沙小区内公共汽车维修站场两处。因此存在公交车辆没有停车专用场地、停车场严重不足、停车场与保养场分离问题严重。

  1. 公交线网

历史统计资料显示,韶关市公交线网发展处于缓慢增长状态。1996年已达到111公里,到2019年才增长为153公里,年增长率仅为4%,线路长度年均增长点仅为4,7公见。其中2019-2019年间,公交线路长度处于零增长状态。目前韶关公交线路平均长度为119公里。韶关市历年公交线路长度发展趋势。
表 1历年公交线路长度变化

年份 1996 2019 2019 2019 2000
公交线路长度(公里) 111 111 108 127 127
年份 2019 2019 2019 2019 2019
公交线路长度(公里) 127 127 132 153 153

目前在城市中心区公交线路网密度约为3.3km/km2,达到规范要求3-4km/km2而指标。而城市边缘地区线路网密度则远没有达到2-2.5km/km2标准。韶关目前公交线网重复系数约为2.9,亚复线路最多道路如解放路部分路段存12条公交线路经过,而西河大桥与武江桥各有12条公交线路经过,公交线布设普遍集中在干道上,根据调查线网情况,去除部分远郊线路,根据统计剖析,全市公交线路平均非直线系数为1.49,高于国标值。

  1. 公交客流特征剖析

韶关市公交客运量一直呈上升趋势。从1996年至2019年年均增长292.7万人次,年均增长率为34.6%其增长幅度超过公交车辆规模、线路长度增长,表明目前公交车内拥挤桯度比以前高了。从韶关市历年公交车辆拥有量及客运变化趋势可看出,总体来说,韶关市公交运输能力发展迅速,为城市社会经济发展提供了重要支撑。公交客流最大集散点为火车站,这与火车站地区布设大量公交线路有关,同时也是最大公交枢纽站。

  1. 获取数据的基本方法

打开高德地图API,登录自己的账号,进入控制台。新建应用,选择Web端(JS API)。
新建成功后,得到一个Key。
使用公交线路获取小工具:Run Main Window。
在软件中输入获取的Key和城市名称,线路数输入1-999,随后等待软件成功获取完成公交线路数据。

图 1控制台密钥获取

图 2获取数据的软件

图 3获取公交数据

  1. 城市交通网络构建
  2. 公交网络的原始法建模

以公交站点为节点,如果相邻的公交站点间存在着公交服务,则节点之间存在一条连边。网络为无向网络,边权为站点之间的公交车辆数。

  1. 公交网络的对偶法建模

以公交站点之间的连边作为节点,如果公交线路之间存在交点,则节点之间存在连边。

  1. 公交网络图的构建

将获取的数据导入Arcgis中,并进行x,y坐标显示,可以得到基于WGS1984坐标系下的公交站点图。
利用Arcgis中的点集转线工具,可以在公交站点间进行连线,并且通过字段线路,连接该线路的公交站点;最终形成公交线路网。

图 4Arcgis中韶关公交线路网络

图 5韶关公交站点图

1 城市交通网络的图形可视化

  1. 将原始公交站点表格数据,整理为可以导入gephi中的表格格式:点表格,边表格。


图 6获取的公交站点数据

图 7整理后的点数据表格

图 8整理后的边数据表格

  1. 将表格另存为csv文件,其中要选择“CSV(逗号分隔)(.csv)”,选择“CSV UTF-8(逗号分隔)(.csv)”会在导入时出现乱码。


图 9另存为CSV文件操作

  1. 打开gephi,第一步导入点表格;选择GBK格式。


图 10导入数据

图 11选择GBK格式

图 12导入点数据后

图 13导入的点数据

  1. 第二步,导入边表格,同样选择GBK格式;同时设置为无向图和承接当前工作区。


图 14导入边数据

图 15选择无向图

图 16导入边数据后

  1. 使用Geo layout,与点的横纵坐标进行匹配,同时选择合适的scale大小,使点与边显示在图框中。


图 17使用Geo layout

图 18使用使用Geo layout后

  1. 首先调整节点的外观⇨颜色⇨选择Ranking⇨渲染方式选择:度。


图 19节点颜色-度

  1. 其次通过节点度调整节点的大小⇨Ranking⇨渲染方式选择:度⇨设置最小尺寸:5,最大尺寸:70。


图 20节点大小-度

  1. 对边的颜色进行设置⇨Ranking⇨渲染方式选择:边的权重⇨选择一个颜色带。


图 21边的颜色

3、城市交通网络分析

3.1 多种网络的呈现
Gephi布局是根据某种策略对节点和边进行排布,使图形既具有特定需要的合理性,也易于视觉识别。它们的核心都是平衡一个网络中节点的斥力和引力关系。
一般来说,布局应满足:

  • 使节点均匀分布在有限的区域内;
  • 避免边的交叉和弯曲;
  • 保持边的长度一致;
  • 使整体布局能反映图的内在特性。

默认布局(12种)大致可分为两类:

  • 力引导布局,共 6 种:force atlas;force atlas2;fruchterman reingold;openord;yifan hu;yifan hu 比例;
  • 辅助性的、带有编辑和调整性质的布局,共 6 种:noverlap;rotate;扩展;收缩;标签调整;随机布局。

表 2布局特点

布局类型 描述 参数配置
force atlas 使布局更加紧凑,可读性更强 1、惯性:值越大,图摇摆幅度越大
2、斥力强度:节点排斥其他节点的强度,值越大,节点距离越大
3、吸引强度:连接节点的吸引力强度,值越大,有连接的节点越被拉进
4、重力:值越小,图越分散;值越大,图越被压缩
5、速度:布局运动的速度,值越大,图布局的速度越快
force atlas 2 改进的 force atlas,速度更快 1、缩放:节点的斥力强度,值越大,斥力越大,图越稀疏
2、更强的重力:已定义好的较强的重力
3、重力:自定义的重力值,可以比更强的重力更强
4、劝阻 hubs:只有输入的边会被推到边缘
5、LinLog 模式:线性和对数模式的切换
6、防止重叠:将重叠的节点展开7、容差(速度):布局速度的选取,较小的值速度慢,但精度更高
Fruchterman Reingold 布局 FR 布局,基于再次改进的弹性模型 1、区:定义图形的幅度,值越大图越大,越稀疏
2、重力:定义重力值,值越大重力越强,节点越被中心吸引
3、速度:布局的速度,值越大布局速度越快,但越不精确
Noverlap(交叠) 可防止节点重叠,但不考虑节点标签重叠 1、速度:速度越快,精度越差
2、节点间距:间距为 1 时,节点会连接在一起,间距为 2 时,节点会分开;间距为 1.1 时,间距增加 10%,小于 1 时允许节点重叠
3、幅度:增加幅度半径,幅度为 0 时,没有余量,幅度为 10 时,节点分开至少 20 像素,负幅度允许重叠
Openord 支持多核、并行,适合处理节点较多的图 布局阶段分为 liquid、expansion、cooldown、crunch 和 simmer 5 个过程
Rotate 顺/逆时针旋转 将图形从整体上做顺时针或逆时针旋转
Yifan Hu 在多层级力引导算法中引入超节点概念 1、最佳距离:值越大,整个图的尺寸越大
2、相对强度:值越大,节点越稀疏
扩展/收缩布局 对图形做整体上的放大或缩小处理 比例因子为 1,图保持原状;
大于 1:图放大,值越大,放大比例越大;
小于 1:图缩小,值越小,缩小比例越大
标签调整布局 防止节点标签重叠 1、速度:值为 1,可较缓慢地把标签重叠的节点躲避开,使节点标签没有重叠,值越大,速度变快,但躲避的幅度会较大
2、包括节点的大小:勾选后,会使重叠的节点也躲开
随机布局Gephi 初始导入数据时的模式,将节点随机散步在正方形内 空间大小可以设置随机散步节点的正方形的边长
  1. Geo layout布局

根据点数据的经度和纬度坐标进行布局,一般选择墨卡托投影坐标系。

图 22Geo layout布局

  1. Force Altas布局(力导向图)

首先是,使用预设置进行分布的Force Altas布局图。

图 23Force Altas布局
其次是,勾选<吸引力分布>和<由尺寸分布>功能后,重新进行分布的Force Altas布局图。

图 24重新分布的Force Altas布局
然后是,调整斥力强度为:900,再重新进行分布中,选取合适的界面进行分布的Force Altas布局图。

图 25调整斥力强度

  1. Force Altas2布局


图 26Force Altas2布局
勾选<劝阻Hubs>,<linlog模式>和<防止重叠>功能后,重新进行分布。

图 27重新分布Force Altas2布局
3.2 网络指标计算与分析
主要选择Geo layout布局形式进行分析。
3.2.1 原始网络的统计分析

  1. 选择一个合适的网络。


图 28原始公交站点线路网络

  1. 使用统计功能,依此对各网络属性进行运行,利用软件求出网络概述指标和节点,边,动态概述指标等。


图 29指标统计计算

  1. 求得的各项指标。

平均度:

图 30平均度
平均加权度:

图 31平均加权度
网络直径(平均路径长度):

图 32网络直径1

图 33网络直径2

图 34网络直径3

图 35网络直径4

图 36网络直径5
图密度:

图 37图密度
点击次数:

图 38点击次数1

图 39点击次数2

图 40点击次数3
模块化:

图 41模块化
PageRank:

图 42 PageRank
连接部件:

图 43连接部件
平均聚类系数:

图 44平均聚类系数
特征向量中心度:

图 45特征向量中心度

  1. 统计汇总各类指标

表 3原始公交站点线路网络指标

属性 平均度 平均加权度 网络直径 图密度 模块化 连接部件 平均聚类系数 平均路径长度
2.406 3.641 47 0.005 0.836 21 0.072 14.445

图 46原始公交站点线路网络指标1
图 47原始公交站点线路网络指标2
图 48原始公交站点线路网络指标3

  1. 分析指标

模块化:Modularity Measure(模块化度量值),由Newman等人提出,是目前常用的一种衡量网络中社区稳定度的方法。模块度值的大小主要取决于网络中结点的社区分配,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度来获得最优的网络社区划分。
从图中可以看到该图的模块化结果为0.836,比较接近1,所以社区结构的强度是较高的。度和平均度相差不大,网络直径接近50,平均路径长度较小。
3.2.2 过滤网络的统计分析

  1. 对网络进行过滤,节点度范围1~3。

首先对节点度大的点进行过滤,即只显示度较小的点。选择拓扑⇨选择度范围⇨选择1~3。

图 49度过滤操作
过滤后图:

图 50度过滤后
二者对比图:

图 51原始公交站点线路网络与过滤网络对比

  1. 过滤后网络指标统计

表 4原始网络与过滤网络指标指标对比

属性 平均度 平均加权度 网络直径 图密度 模块化 连接部件 平均聚类系数 平均路径长度
原始值 2.406 3.641 47 0.005 0.836 21 0.072 14.445
度1~3 1.378 1.875 19 0.003 0.985 129 0.022 5.107

图 52指标对比1
图 53指标对比2
图 54指标对比3
从各类图中可以看出,连接部件在只留下度为1~3的节点时,急剧上升。连接部件是确定网络中连通分量的个数。在所有参数中,平均度、平均加权度、网络直径、图密度、平均聚类系数、平均路径长度均有一定的幅度减少,而连接部件提高很大,模块化有一定的提高,更接近于1,说明强度更高了。

  1. 对网络进行过滤,节点度为5~10。

表 5原始网络与过滤网络指标对比

属性 平均度 平均加权度 网络直径 图密度 模块化 连接部件 平均聚类系数 平均路径长度
原始值 2.406 3.641 47 0.005 0.836 21 0.072 14.445
度1~3 1.378 1.875 19 0.003 0.985 129 0.022 5.107
度5~10 1.444 3.056 8 0.041 0.744 13 0.25 2.8


图 55过滤后图

图 56实际地图

图 57原始公交站点线路网络与过滤网络对比
图 58指标对比1
图 59指标对比2
图 60指标对比3
对度为510的节点进行过滤筛选,可以发现度大的节点数量比度为13的节点数量少许多。同时,将过滤后的图对比实际的道路地图,发现度最大的节点即为韶关东站。这在现实中也是符合情况的,韶关东站不仅是许多公交线路的起点和终点,也是客运站的出发点。同时韶关东站地理位置关键,是三河两岸中的其中一岸,起着交通枢纽的作用。
3.3 网络鲁棒性分析
随着科技的发展,我们的生活中到处充满着复杂系统,复杂网络逐渐成为科学家们研究的热点。复杂网络给我们的生活带来了很大的便利,但是复杂网络无时无刻不受到各种攻击,包括随机攻击和恶意攻击。因此,复杂网络的抗毁性研究变得尤为重要,其中复杂网攻击策略是抗毁性研究的关键。
指数网络都具有很强的鲁棒性,在静态攻击下至少移除80%的节点网络才濒临崩溃,即使在最有效的攻击策略RBC的攻击下也要移除40%的节点。BA无标度网络在受到攻击时比较脆弱,静态攻击下只需移除40%的节点网络就陷入瘫痪,而在动态攻击下仅仅移除20%的节点网络就瘫痪。
无标度网络对随机破坏具有很强的抗毁性,但是对于蓄意攻击却十分的脆弱。本文将渝渗理论和优化方法相结合,分别给出了在一定网络平均度约束下无标度网络对随机破坏和蓄意攻击的鲁棒性优化策略。数值结果发现,无标度网络对于随机攻击在最小节点度m=1时,网络的抗毁性最强。当网络同时遭受随机破坏和蓄意攻击时,如果网络平均度〈κ〉=3,那么最小度为1的情况下,网络的鲁棒性最好;如果网络平均度κ大于3,那么网络的鲁棒性随着最小节点度的增大而增大。
网络的攻击策略主要有两种,一种是蓄意攻击,一种是随机攻击。

  1. 对网络进行蓄意攻击,按度由大到小依次移除,查看网路的变化,重新对网络指标进行计算。

许多复杂系统对于随机攻击表现出令人惊奇的容错性。Barabasi等证明了无标度网络对随机攻击具有鲁棒性,但是对蓄意攻击却很脆弱。以往,关于对无标度网络进行攻击的大部分研究都是考虑直接删除掉节点。
表 6蓄意攻击后网络指标

属性 平均度 平均加权度 网络直径 图密度 模块化 连接部件 平均聚类系数 平均路径长度
原始值 2.406 3.641 47 0.005 0.836 21 0.072 14.445
蓄意攻击 2.185 3.265 51 0.005 0.869 30 0.063 14.977


图 61蓄意攻击后网络
图 62蓄意攻击后网络指标对比1
图 63蓄意攻击后网络指标对比2
图 64蓄意攻击后网络指标对比3
由图表可以得知,网络的直径大小在去除较大节点后,提高较大,也就是说网络中的最短路径变长了。同时也可以看到,平均集聚系数和平均路径长度都有所下降,但是下降的幅度不大。

  1. 对网络进行随机攻击,对节点随机移除,查看网路的变化,重新对网络指标进行计算。

表 7随机攻击后网络指标

属性 平均度 平均加权度 网络直径 图密度 模块化 连接部件 平均聚类系数 平均路径长度
原始值 2.406 3.641 47 0.005 0.836 21 0.072 14.445
随机攻击 2.267 3.339 51 0.005 0.868 26 0.074 15.218
差值 0.139 0.302 4 0 0.032 5 0.002 0.773


图 65随机攻击后网络
图 66随机攻击后网络指标对比1
图 67随机攻击后网络指标对比2
图 68随机攻击后网络指标3
可以看到随机攻击,对网络影响不大,但是有的指标变化幅度比其他变化幅度要大,例如连接部件和网络直径。应该是在随机攻击时,不可避免地也会攻击到一些较为重要的节点,从而导致网络的一些指标大幅度变化。
文中考虑了两种攻击策略的情况,蓄意性攻击实际上对公交网络的破坏性更为严重,所以在未来的研究中可以进一步考虑蓄意性攻击的影响及应对措施。
3.4 网络结构与功能的关联规律

图 69公交站点网络指标对比
表 8公交站点网络特征

网络基本指标 原始网络 过滤网络
无标度指标 4.07 2.88
连通度 0.53 0.48
复杂度 1.55 1.33
  1. 小世界网络具备两个基本规则,一个与网络的聚集性有关,一个与网络的平均路径有关。通过平均聚类系数指标可以判断网络是否符合第一项规则。在考虑公交站点网络平面特征情况下,随着网络规模的增大,网络的连通程度提高。这是由于网络中潜在边的数量随着节点的增加而线性增长,因此较大规模的网络需要更多的边来保证网络的连通性。根据公交站点原始网络和过滤网络的连通度指标计算结果可见,公交站点路线网络的连通性大于过滤网络的平均聚类系数,符合小世界网络的第一项规则。第二项规则可以根据网络的平均路径长度来判断,符合小世界网络的第二项规则。因此公交站点原始网络和过滤网络均具备小世界网络特性。
  2. 依据图论和复杂网络理论研究了公交站点线路网络的特性,并根据现实情况选择了原始韶关公交线网作为研究对象,对比分析了原始线网和过滤线网的网络特性,得出原始线网和所研究的过滤线网都具备无标度特性和小世界特性,且过滤线网的连通度、复杂度比全局线网低,鲁棒性比全局线网高。利用显示方法和数据统计分别确定过滤线网的关键节点和关键边,得出局部线网中的韶关东站等站点从网络拓扑结构和乘客换乘两个方面考虑都为关键节点。

3.5 拥堵的结构性解释

图 70韶关交通态势图

图 71度大节点过滤图
根据之前进行的交通态势数据获取,再结合网络线路分析。再进行节点过滤时,发现城市中心主要拥堵路段,大部分为度较大的节点。节点的度是该点的邻边数,度越大,说明该点与其他节点的连接越多。度为4~10的节点以及更大的节点主要在城市中心,与拥堵地段相匹配。这一点反应在交通方面上,可能理解为度大的节点即许多路径要通过的节点,如果车流量大,则该点汇聚多处车流,容易发生拥堵。
3.6 网络的不同展示
统计分析里面的不同算法→选择不同的渲染模式→最终图形,可以展示网络不同的一面,有利于我们从另一个角度去分析网络的特点。

模块化

  1. 由于我们节点本身大小与节点标签尺寸都是选择Rank中的度,所以由图可以明显看出谁的度越大,说明在个图中与其他点联系越大,作用越大。
    2) 由于我们节点本身颜色和标签颜色的渲染方式都选的模块化,所以整个图以度大的节点最终呈现出社区稳定。
    3) 模块化:Modularity Measure(模块化度量值),由Newman等人提出,是目前常用的一种衡量网络中社区稳定度的方法。
    4) 模块度值的大小主要取决于网络中结点的社区分配C,即网络的社区划分情况,可以用来定量的衡量网络社区划分质量,其值越接近1,表示网络划分出的社区结构的强度越强,也就是划分质量越好。因此可以通过最大化模块度Q来获得最优的网络社区划分。

PageRank

PageRank算法主要应用在搜索引擎的搜索功能中,其主要用来计算网页的重要程度,将最重要的网页展示在网页的前面,此算法主要围绕以下两个假设:
①如果存在一个网页,它被许多其他的链接链接到,则说明这个网页比较重要,则此网页的PageRank值比较高。
②如果存在一个网页,它本身的PageRank值比较高,且此网页又链接了一个网页,则这个被链接的网页比较重要,其PageRank值较高。

  1. 进行模块化计算,为后续使用Modularity Class进行分类显示打下基础。


图 72模块化计算

  1. 设置节点颜色,使用Modularity Class。


图 73节点颜色-Modularity Class

  1. 统计:利用统计模块的连通组件:连接部件功能识别连通分量,可以选择有向或无向,有向可以生成强连通和弱连通。

进行连接部件计算,为后续使用Component Id进行分类显示打下基础。

图 74连接部件计算

  1. 设置节点颜色,使用Component Id。


图 75节点颜色-Component Id
可以看到通过几个不同的色块,将一些连通性强的节点显示了出来,而且其他节点连通性相比较弱,为大面积的紫色。而中间连通性强的点,也是度较大的点,同时也是会发生拥堵的路段附近的公交站点。

  1. 进行Fruchterman Reingold布局。


图 76Fruchterman Reingold布局

  1. 进行Yifan Hu比例布局。


图 77Yifan Hu比例布局

  1. 进行Force Altas2布局。


图 78Force Altas2布局
3.7实验心得
通过这次的实验,主要让我了解了Gephi的使用,以及加深了对课程上所学知识的理解。对复杂网络的性质和指标有了更深层次的认识。同时,也掌握了在Gephi中构建复杂网络的能力,可以通过对网络的调整,布局逐步分析网络,发现网络的性质。同时与生活中的网络联系起来,解决实际问题,如这次选择的韶关公交站点线路网络;可以在网络分析的过程中分析韶关公交线路网络的性质,如关键站点;以及配合韶关交通态势图,对公交线路的相互影响。