- 1 -
中国科技论文在线
路径选择行为大数据采集系统建模#
朱小栋*
基金项目:教育部高等学校博士学科点基金项目(20123120120004);教育部人文社科青年基金
(12YJC870037)
作者简介:朱小栋(1981-),男,副教授,博士,硕士生导师,CCF 高级会员;研究方向:软件工程,数据
挖掘,电子商务
(上海理工大学管理学院,上海,200093)
5 摘要:伴随着汽车与日俱增,图形式可变情报板 GRIP 极大地促进了交通诱导和降低交通堵
塞风险。然而,面对 GRIP 板做出路径选择时,不同的驾驶员给出不同的反应。为深入挖掘
面向 GRIP 板的路径选择行为大数据里的规律和知识,利用统一建模语言 UML,设计面向
GRIP 板的路径选择行为大数据采集系统模型,详细地分析了系统的核心模块——经典交通
模型 METANET 驱动的 GRIP 板,使用 C#开发了一个原型系统验证模型的可行性。 10
关键词:软件工程;图形式可变情报板;统一建模语言;模型驱动架构;数据采集;交通模型
中图分类号:
Modeling Big Data Gathering System for Route Choice
Behavior 15
Zhu Xiaodong
(Business School,University of Shanghai for Science and Technology, Shanghai 200093)
Abstract: The Graphical route information panel GRIP appears more and more frequently, it benefits
transportation induction and alleviating metropolitan congestion. However, facing GRIP, different
people give different feedback. The route choice behavior when facing GRIP derives from many 20
factors. Considering little work paid on the motorists’ route choice behavior when facing GRIP, in this
paper, a big data gathering system for route choice behavior is modeling. The GRIP module in the
system is interpreted in detail. A prototype simulator system is also developed using C#. The result
indicates the system can simulate the route choice behavior of motorists correctly.
Key words: Software Engineering; Graphical Route Information Panel; Unitied Modeling Language; 25
Model Driven Architecture; Big Data Gathering; Traffic Model
0 引言
2010 年上海世博会的口号是“城市,让生活更美好”,建设一座美丽的城市离不开快
速发展的交通。伴随着国民经济的快速发展,城市车辆的与日俱增,健全发达的交通成为城30
市更美好生活的迫切需求。然而,交通拥挤和堵塞成为了许多城市困扰的问题。近几年,京
城北京道路拥堵现象常见,2011 年中秋节之夜的首都俨然成为一个“堵城”,有的驾驶员
甚至需要 6 个小时才能把汽车开到家。在上海世博会期间,上海虹桥实现了其庞大的综合交
通枢纽,提供了飞机、地铁、公交、的士等丰富、便捷换乘的交通服务。
人们在出行时感觉到便利。然而,人们常常困惑于选择何种合适的道路。对于机动车司35
机来说,尤其如此。我们知道,在知道目的地的情况下,出租车司机通常选择一条路程最近
的道路。但是,如果这条最近的道路上因发生交通事故而堵塞,他们将改变之前的道路选择
计划,转而选择具有最短时间的道路,即便这条道路要长很多。不过,这样的选择行为因人
而异。例如,一些出租车司机选择可替代的道路,另一些司机则会停在这条最近的道路上一
直等待直到通行。 40
图形式可变情报板 GRIP(Graphical route information panel)是一种在城市快速路上提
- 2 -
中国科技论文在线
供给驾驶员的一种新的 VMS(Variable Message Signs)技术,因为能反映实时的交通信息,
为城市的交通诱导和缓解交通堵塞发挥了重要的作用。GRIP 板上的可变信息是由城市多个
交通控制中心根据交通流数据,自动或半自动地更新发布。这种实时的、流式的、不断出现
的数据是典型的交通大数据。然而,不同的驾驶员在面对 GRIP 板时会做出不同的路径选择45
行为。
1 相关工作
传统的交通信息板包括简易的不可变的道路选择信息,我们称之为不变交通信息版,以
示区别。在近十年,图形式可变情报板 GRIP 在一些发达国家如德国、荷兰、美国、日本等
迅速发展,在中国一些大城市也出现了越来越多的 GRIP 板。图 1 是上海市高架快速路上的50
GRIP 板,图中绿色带反映了畅通的交通状况,黄色标示该区段出现了拥挤交通状况。如果
出现堵塞,则用红色区段来标示。GRIP 颜色变换是准确的,这是因为快速路上每隔一定区
段会在路面上铺设线圈,它可以采集快速路上车辆的流量、密度、速度等信息,并反馈到指
挥中心运算,并自动用 GRIP 板中合适的颜色来反映。本文并不研究 GRIP 板本身,而是研
究驾驶员面对 GRIP 板时的行为选择。 55
图 1 图形式路径可变情报板
相比传统的交通情报板,GRIP 板的图形化和可变两个特点提供非常直观的交通信息。
总的来说,GRIP 板包括能够反映畅通、拥挤、堵塞三种状态的可变颜色。在许多国家采用
这种三个颜色的模式,当然,也有部分国家采用的是两种颜色。 60
正是因为驾驶员面对 GRIP 做出的路径选择行为因人而异,研究驾驶员的行为成为近年
来一个重要的问题。在真实的条件下,很难采集到大量驾驶员面对 GRIP 板的行为选择。有
效的方法是设计并开发一个路径选择模拟器来获取驾驶员面对GRIP板时的行为选择。当前,
据我们所知,非常少的工作放在这种研究 GRIP 板下的驾驶员路径选择行为上。
在软件越来越复杂,软件自动化生产和软件重用要求越来越高的今天,统一建模语言65
UML 在软件开发的整个生命周期中发挥不可替代的作用。在这个研究中,我们使用 UML
来设计这个模拟器系统。
美国西北大学 Mahmassani 在解决城市交通拥堵问题上做了较多的理论贡献[1,2]。1991
年,Mahmassani 等人提出了模拟路径导流决策的有界理性转换规则[3]。Koutsopoulos 设计了
一个基于 PC 机的驾驶模拟器,用于在一个可控的环境下采集相关的数据[4]。然而,这些早70
期的研究没有涉及到 GRIP 板。因为 GRIP 板提供丰富得多的出行诱导信息,在近年也吸引
了许多的研究,这些研究从人因工程的角度来研究如何设计和布置 GRIP 板[5, 6]。在研究驾
驶员对 GRIP 信息做出的反映和路径选择决策问题上的研究较少[5, 7]。
UML 是一个面向对象软件工程领域里通用的标准的建模语言,对象管理组织 OMG1997
年首次推出 UML 标准,UML 在软件的需求、设计甚至代码生成中发挥重要作用。UML 语75
- 3 -
中国科技论文在线
言还可以应用到模型检测中以及早发现问题,节约开发的人力和物力[8]。在本研究中,使用
UML 可以便捷地设计我们需要的模拟器。
Ortis 使用 UML 设计了一个微型交通模拟器模型,他指出交通模拟软件的结构高度面向
对象性[9]。在最近几年,一些学者开始使用 UML 语言来构建交通模拟器[10-12]。
开发一个具有 GRIP 板信息的交通模拟器具有不少困难。一方面,真实世界的实时动态80
GRIP 信息是由交通控制中心提供。在这个模拟器中,GRIP 里的变化信息依赖于 METANET
交通模型产生的仿真实时交通信息[13]。在第 4 节,我们将解释 METANET 模型产生的 GRIP
模拟器。
笔者在前期相关研究中,将 UML 语言应用到路径选择系统的建模,将计算机建模方法
与交通理论结合,构建初步的仿真平台[14]。为深入挖掘面向 GRIP 情报板的路径选择行为85
数据里的规律和知识提供理论参考。这篇文章在前期研究基础上,进一步思考从大数据的角
度,对驾驶员路径选择行为的大数据进行采集处理,给出详细的仿真平台的 UML 图,相关
软件平台已经获得软件著作权[15]。
2 交通模型驱动的路径选择模拟器
总的来说,设计 GRIP-仿真器分为两个部分:一部分是提供给驾驶员使用的界面;另一90
部分是仿真器管理员使用的后台管理。在这节里,使用 UML 来设计前半部分。我们给出
GRIP 模拟器的界面设计,如图 2 所示。
在这个 UML 类图中,虚线箭头表示了两个类之间的依赖关系。空心箭头表示两个类之
间的继承关系,其中箭头的一侧是父类,另一侧是子类。实心菱形箭头和空心菱形箭头分别
表示两个类之间的组合关联关系和聚合关联关系。没有箭头的连线表示两个类之间的关联关95
系。
Map Information Grip and Choice
Basic Travel Information
Virtual Scenario
Choice Panel
Environment
Speed Panel Time Panel Mileage Panel
Panel
GRIP Panel
Dynamic Map Panel
Static Map Panel
Controler
Pavement
Virtual Travel Panel
Car
11
0..1
1
1
1
1
1
1
1 1
11
1
11
1
1
*
1
*
1..*
1
1..*
图 2 GRIP-模拟器类图
从图中可以看出,这个模拟器分为四个部分。我们用四个包来区分这四个部分。首先是
基础的出行信息面板(Basic Travel Information 包)。第二部分是虚拟场景面板(Virtual 100
Scenario 包)。第三部分是地图面板(Map Information 包),包括静态面板和动态地图面板。
最后是 GRIP 面板和选择面板(GRIP and Choice 包)。
这四部分解释如下:
(1)第一部分包括两个面板,静态地图面板和动态地图面板。首先,静态路径图装载
- 4 -
中国科技论文在线
到静态图面板中,动态图是静态地图的某个区域的放大,它将焦点放在一个黑色的控制块上,105
该控制块模拟驾驶员正在驾驶的汽车。这个动态图,类似于导航仪上的实时动态地图,跟随
着起着的前进,不断变换着方位和当前的区域地图。
(2)第二部分是 GRIP 板和选择面板。正如类图所演示的,GRIP 板依赖于动态图,选
择面板依赖于 GRIP 信息。通常地,在现实快速路中,一个 GRIP 板出现在分叉口之前一点
位置。 110
(3)速度面板,时间面板和里程面板是基本的出行信息面板,因此将他们放在一个面
板中现实,命名为基础出行信息。在出行过程中,里程和消耗的时间将显示在面板中,速度
面板就像真实生活中驾驶室里驾驶员前面的仪表盘一样。
(4)当点击“开始虚拟出行”按钮时,虚拟出行开始,黑色控制器不断向前运动,如
图 3 所示,它的位置不断的发生变化。因此,虚拟出行面板由汽车、控制器、路面和环境组115
成。当驾驶员开始出行,他/她不得不操作控制器,以确保控制器在褐黑色的汽车里。其它
红色汽车表示在一个大段内的小段上的状态。也就是说,当驾驶员进入到下一个节内,虚拟
出行面板将刷新状态。例如,在一个小段内,交通状态是堵塞,则红色汽车的数量饱和,如
图中 8 辆所示。虚拟场景用来产生不同类型的虚拟出行环境,如上下班高峰、燃油价格、约
会迟到等。 120
图 3 虚拟出行面板
3 后台管理
在整个 GRIP 模拟器的设计中,因为需要生成交通模型驱动的仿真路网大数据,后台管
理部分是最重要的。 125
交通模型驱动的虚拟出行数据产生器
METANET 模型由 Messmer 于 1990 年提出。它能够精确地描述快速路上的动态交通特
征,包括拥挤的出现和拥挤的消失。在我们的研究中,选择 METANET 作为交通流模型。
在文献[16]中,Kotsialos 详细地解释了交通流模型 METANET。限于篇幅,这里不做具体论
述。本文实现了 METANET 交通模型在 GRIP 模拟器中的应用。 130
选择行为记录器
图 4 设计了 GRIP 仿真器的用例图,图中驾驶员是唯一的参与者,数据库用于存储行为
大数据,记录器和数据产生器分别用于记录驾驶员信息和模拟产生交通信息。图中椭圆表示
系统中涉及的用例。
- 5 -
中国科技论文在线
Simulator
:Motorist
LogIn
Input Information
<<uses>>
Virtual Travel
Choose Route
Choose Scenario
<<uses>>
<<uses>>
<<uses>>
<<uses>>
Simulate RoadNet
:Generator
:DataBase
<<uses>>
Record Choice
<<uses>>
:Recorder
:Save Infomation
<<uses>>
135
图 4 GRIP-仿真器用例图
下面图 5 是模拟器的顺序图。这个顺序图步骤如下:首先,一个用户以驾驶员的身份登
录模拟器。第二,图中模拟器 Simulator 处理三个并发的活动。一方面,记录驾驶员基本的
信息,其二是通过交通模型 METANET 产生仿真路网信息。三是开始路网中的虚拟出行。
路网大数据也存储在数据库中。出行场景如天气、路面类型、个性化偏好等加在到虚拟出行140
场景中。第三、当遇到 GRIP 信息时,驾驶员不得不在选择面板中给出他的出行选择。最后,
路径选择行为大数据记录在数据库中。
:Motorist
:Simulator
1:Login
:Recorder
2:Record()
3:SaveInfo
4:Success
:Generator
5:Simulate()
6:Simulate RoadNet
7:DisplayRoadNet
8:ChooseRoute
:DataBase
9:RecordChoice()
10:RecordChoice
11:RecordSuccessfully
图 5 GRIP-仿真器顺序图
145
对于模拟器来说,记录选择行为的模拟器非常重要,需要详细地设计。因为真实路网中
面对 GRIP,存在大量的驾驶员。这个模拟器当然设计为一个多用户系统。因此,这个模拟
器可以部署到多个终端,然后数据库部署在服务器端。可以选择客户-服务器模式。下图 6
是用 UML 部署图来设计该系统。可以看出,改模拟器系统是由一个数据库和一些客户端组
- 6 -
中国科技论文在线
成。 150
(1)这个数据库服务器包括两个数据库组件。一个是用于保存 METANET 模型所产生
的虚拟出行数据的数据库。显示在客户端的连续不断的并且变化着的路面交通状况信息是由
这个数据库驱动的。另一个数据库用于存储驾驶员的路径选择行为大数据。数据流用双向箭
头表示。
(2)驾驶员,坐在客户端电脑前面,模拟驾驶出行。当他/她点击出发按钮,虚拟出行155
开始。在一些面板中变化着的信息是由服务器中的数据驱动的。其中一些参数是由模拟器管
理员预先设置。当他/她靠近十字路口,模拟器暂停,并弹出对话框,请求驾驶员做出选择。
(3)虚拟出行数据产生器产生的大数据是由交通流模型驱动的。基本的出行变量包括
交通密度、平均速度和交通流量。交通模型中所有的常量、参数在一个单独的文件中设置,
这样帮助控制由交通模型来控制数据。 160
Server
Client1
Road Networks Scenario Simulator
ClientN
Road Networks Scenario Simulator
-Server
1
-Client1
1..*
Database Administrator
Motorist1 MotoristN
-Server
1
-Client1
1..*
Virtual Transport Data Generator
Driver Behavior Database
图 6 GRIP-仿真器活动图部署图
(4)对于模拟器来说,驾驶员行为是最重要的。在开始虚拟出行之前,驾驶员需要输
入基本的个人资料信息和基本的车况信息。这样,在将来的数据分析中,这些数据可以结合
驾驶员的路径选择行为加以研究。 165
4 原型系统开发示例
上面两节使用 UML 设计了交通模型驱动的路径行为选择模拟器。这个系统的实现可以
使用面向对象的编程语言如 C#,Java 和 C++等。在这个研究中,我们在 Visual Studio 2010
中使用 C#语言开发了一个原型系统,SQL Server 2008 作为数据库管理工具[15]。
下表 1给出了代码中使用的参数。vf,m, cr,m 和 am所使用的值将产生一个 2000 veh/h/lane170
的容量。入口段容量设为 Q0 = 1500 veh/h/lane. 时间步长设为 T = 10s. 关于参数的详细解
释,可参考文献[14]。
表 1 METANET 交通模型参数集
Parameter v max mcr, mf , m
Value 18 40 60 180 110
Unit s veh/km/lane km
2
/h veh/km/lane veh/km/lane km/h
- 7 -
中国科技论文在线
175
表 2 起点信息
表 2所示为入口O1的车辆信息,由METANET模型产生。在这个表中,Occasion, Demand, 180
WaitNum 和 QueNum 分别表示了入口 O1 时间、入口车辆需求量, 车辆等待量,和车辆进
入量。
图 7 示出管理员界面运行前后对比图。该界面用于管理员对系统的一些参数进行设置,
并对整个交通模型 METANET 模型的运行情况进行查看,可以通过一些功能键对用户信息
进行管理,如添加,删除,修改等,对于交通模型 METANET 模型产生的各种数据进行查185
看。图 7 右边是设置参数并运行后的仿真结果。
图 7 管理员界面运行对比图
- 8 -
中国科技论文在线
190
图 8 GRIP-模拟器原型系统
GRIP 模拟器的界面如图 8 所示。首先,我们加载一个静态图到模拟器中,一个初始的
动态图即生成于起始点 O1 附近。动态图是由静态图驱动的。动态图中的虚线分隔路网中的
大段为小段。
如果没有 GRIP 信息出现,GRIP 面板是空的。当黑色车子接近一个十字路口,一个实195
时 GRIP 信息出现在 GRIP 面板中。然后,一个一个选择行为记录器弹出,黑色车子暂停。
模拟驾驶员不得不给出他/她的决定,并点击 OK 按钮。这一选择行为即被记录于数据库中。
下面图 9 给出了选择行为大数据库中的数据。表 Motorist 中包括四个属性,采集了 5 个
驾驶员的基本信息。表 Car 包括三个属性,它分别采集了这 5 个驾驶员的基本车况信息。表
GRIP Choice 采集了这 5 个驾驶员面对 GRIP 板时的行为选择数据。这些数据可以进一步进200
行数据分析和挖掘以发现潜在的模式和规则。例如,“age <=50” “choice = B”, 和“age =60”
“choice = B”可能是两条关联规则。这些选择行为可以再进一步用于改进交通诱导,并减
少拥堵。在下一步的工作中,我们将进一步研究如何应用数据挖掘的技术到驾驶员行为大数
据的分析。
id age gender experience
1 27 F 3
2 35 M 5
3 60 F 20
4 32 M 5
5 50 M 15
id color carAge
1 White 7
2 Black 5
3 White 6
4 Blue 3
5 White 4
Motorist Car
id choice
1 B
2 B
3 A
4 B
5 B
GRIP Choice
205
图 9 路径选择行为大数据
- 9 -
中国科技论文在线
5 结论
据我们所知,目前很少有工作放在研究驾驶员面向 GRIP 板的选择行为研究中,更少的
工作放在使用 UML 工具来设计面向 GRIP 板驾驶员选择行为的模拟器。这篇文章的主要工
作是运用 UML 设计了支持 GRIP 板实时显示交通信息的模拟器。GRIP 板中的实时动态交通210
流数据是由 METANET 交通流模型驱动。本文的研究成果有利于基于 UML 的 GRIP 模拟器
系列图的进一步开发。路径选择行为大数据可以进一步用于分析以发现潜在未知的知识和模
式。
致谢
感谢对本文投稿过程中提出过修改意见的学者。本论文是教育部高等学校博士学科点基215
金项目(20123120120004);教育部人文社科青年基金(12YJC870037)的研究成果。
[参考文献] (References)
[1] MAHMASSANI H S, SABERI M, ZOCKAIE A. Urban network gridlock: Theory, characteristics, and
dynamics [J]. Transportation Research Part C: Emerging Technologies, 2013, 36(11):480-497. 220
[2] Halat H, Saberi M, Frei C A, et al. Crime Statistics Impact on Travel Mode Choice: Case Study of the City of
Chicago[C]//Transportation Research Board 94th Annual Meeting. 2015 (15-5733).
[3] CHEN P S-T, MAHMASSANI H S. Dynamic Interactive Simulator for Studying Commuter Behavior Under
Real-time Traffic Information Supply Strategies [J]. Journal of the Transportation Research Record, 1993, (1413):
12-21. 225
[4] KOUTSOPOULOS H N, LOTAN T, YANG Q. A driving simulator and its application for modeling route
choice in the presence of information [J]. Transportation Research Part C: Emerging Technologies, 1994, 2(2):
91-107.
[5] GAN H. Graphical route information panel for the urban freeway network in Shanghai, China [J]. IET Intell
Transp Syst, 2010, 4(3): 212-20. 230
[6] ALKIM T, SCHENK B. Graphical route information [M]. 8th World Congress on Intelligent Transport
Systems Sydney, Australia 2001.
[7] ZOCKAIE A, NIE Y, WU X, et al. Impacts of correlations on reliable shortest path finding [J]. Transportation
Research Record, 2013, (2334): 1-9.
[8] ZHU X, HUANG Z, SHEN G. Description Logic based Consistency Checking upon Data Mining Metadata; 235
proceedings of the the third International Conference on Rough Sets and Knowledge Technology(RSKT 2008),
Chengdu, China, F, 2008 [C]. Springer-Verlag.
[9] ORTIS G. Design of a traffic microsimulation in UML [J]. Komunikacie, 2003, 5(Compendex): 92-6.
[10] JABRI S, EL KOURSI E M, BOURDEAUD'HUY T, et al. European railway traffic management system
validation using UML/Petri nets modelling strategy [J]. European Transport Research Review, 2010, 240
2(Compendex): 113-28.
[11] LI C-S, LIN F, CHAO H-C. Routing optimization over network mobility with distributed home agents as the
cross layer consideration [J]. Telecommunication Systems, 2009, 42(Compendex): 63-76.
[12] RADECKY M, GAJDO P. Intelligent agents for traffic simulation; proceedings of the 2008 Spring
Simulation Multiconference, SpringSim'08, April 14, 2008 - April 17, 2008, Ottawa, ON, Canada, F, 2008 [C]. 245
Association for Computing Machinery.
[13] MESSMER A, PAPAGEORGIOU M. METANET: A macroscopic simulation program for motorway
networks [J]. Traffic Engineering Control, 1990, 31(31):466-70, 549.
[14] X. Zhu, H. Gan, C. Liu, C. Fan, Modeling Traffic Model Driven Route Choice Simulator in UML,
International Journal of Digital Content Technology and its Applications (JDCTA), (5),141-149, 2012. 250
[15] 朱小栋. 可变情报板下路径选择仿真软件 [CP]. 中国版权保护中心. 软件登记号 2013SR024075.
2013.
[16] KOTSIALOS A, PAPAGEORGIOU M, MANGEAS M, et al. Coordinated and integrated control of
motorway networks via non-linear optimal control [J]. Transportation Research Part C: Emerging Technologies,
2002, 10(1): 65-84. 255