九九文秘网 - www.nagforex.cn 2024年05月21日 00:06 星期二
  • 热门搜索:
  • 当前位置 首页 >专题范文 > 公文范文 >

    海量综合交通信息OLAP系统研究与实现

    来源:网友投稿 发布时间:2022-10-30 13:12:02

    zoޛ)j馓��ii]5aK_<?i88v8v?i8888S��S�om,�剖析数据,使最终用户能从多个角度、多侧面地观察数据仓库中的数据,从而深入地了解包含在数据中的信息、内涵。OLAP分析方式迎合了人们的思维模式,因此减少了混淆并且降低了出现错误解释的可能性。OLAP分析的基本模式有[5-7]:

    (1)切片(Slice)

    定义:在多维数组的某一维上选定一维成员的动作成为切片,即在多维数组(维1,维2,…,维n,变量)中选一维,如维i,并取其一维成员(设为“维成员Vi”),所得的多维数组的子集(维1,…,维成员Vi,…,维n,变量)称为在维i上的一个切片。

    图2所示,是一个按时间维、地理维、速度维组织起来的多维数据集,按照速度等级进行切片,得到了速度级别为20km/h的一个切片。

    (2)切块(Dice)

    定义:在多维数组的某一维上选定某一区间的维成员的动作成为切块,即限制多维数组的某一维的取值区间。显然当这一区间只取一个维成员时,即得到一个切片。

    从另一角度来讲,切块可以看成是在切片基础上,进一步确定各个维成员的区间得到的片段体,即由多个切片叠合起来。在图2中,如果将时间维上的取值设定为一个区间(例如10:00~11:00),就可以得到一个关于1小时内的各地区车流量的切块。

    (3)旋转(Pivoting)

    旋转即改变一个报告或页面显示的维方向。例如,旋转可能包含交换行和列,或是把某一个行维移到列维中去,或是把页面显示中的一个维和页面外的维进行交换(令其成为新的行或列中的一个)。如图3所示,把一个横向为时间、纵向为地理交通信息报表,旋转成为横向为地理、纵向为时间的报表。

    图3 旋转模式

    (4)钻探(Drill)

    钻探模式是使用户在数据仓库的多层数据中能通过导航信息而获得更多的细节性数据。钻探一般是指向下钻探(Drill Down)。例如查看2007年4月9号的南北高架中断面的交通流数据。如下图4所示,显示出南北高架的卢湾区、闸北区、静安区和黄浦区的详细数据。

    图4 下钻南北高架的交通数据显示

    如需察看的南北高架卢湾区路段更细节的断面交通数据,可继续下钻,如下图5所示卢湾区路段各断面的交通流数据,由于所提供数据有限,且这里设置过滤器只显示速度等级20-40km/h的数据,所以有空的数据行。

    图5 下钻南北高架卢湾区路段的交通数据显示

    交通信息OLAP系统可以让用户钻探至一个数据集中有更好细节描述的数据层,可以让用户随处钻探,即除了一般往下钻探外,还包括向上钻探(Drill Up),即让用户查看一个数据集的粗视图,例如上例中相反的操作为上钻。钻探的深度与维度表所划分的层次对应,如上例中钻探的地理信息维度,包括三个层次:高架路、路段和断面。

    交通信息OLAP的数据来源于交通数据仓库。通过OLAP服务器,将这些数据抽取和转换为多维数据结构。通过交通信息OLAP分析系统对交通流数据从多个角度、多个侧面进行快速、一致和交互的存取,从而使交通管理和分析人员能够对交通流数据进行深入的分析和观察。

    2.3交通数据的多维计算[8,9]

    在交通信息多维数据集分析中,数据的多维计算是非常中要得部分,考虑下面这个多维模型:

    将时间、地点和车辆类型作为维度,将车流量和速度作为度量值会形成如下的模式:

    (Time. ⊗ Address. ⊗ VehicleType)~Volume,Speed

    ● 其中标点符号“.”表示维度中的每个不同的实例,标点符号“⊗”表示了维度之间的叉积,所以等式左边表示了时间、地点和车辆类型中所有实例的叉积。

    ● 操作符“~”表示等式左右两边的集合是一对一的关系。

    ● 不带有符号“.”的类型名表示该实体中的某些实例。

    在上面的模式中,时间、地点和车辆类型的叶子节点都是相连的,这个和其在源数据表中的情况类似。

    第一个内容公式,是从数据源表T3对应行的某些位置中获得车流量和速度(C4和C5),具体公式如下:

    Volume,L.leaf.<< T3C4 Row. (1)

    Speed,L.leaf.<< T3C5 Row. (2)

    下面来看第一个汇总公式;

    Volume,L.leaf.above.=Sum(Volume,L.leaf.) (3)

    用文字来描述,就是说叶子节点以上所有位置车流量的值就等于其下叶子节点所有车流量的汇总。

    笔者建议在编写方程式的时候,识别出和每个类型相关联的单元,然后除了在维度和变量定义空间之外,还需要记录方程式中每个术语的单元和相关的操作,然后验证方程式左边结果的单元是否和方程式右边结果的单元一致。

    3、OLAP系统的实例应用分析

    OLAP分析所使用的数据为地面环形线圈检测器所采集的交通信息;地理信息数据主要来自上海市地面交通网GIS系统,上海高架路包括:南北高架、沪闵高架、内环高架、延安高架、逸仙高架、中环高架等。

    应用城市交通拥堵分析系统的OLAP功能,分析上海市各高架路的拥堵状况,可提出以下分析模型:

    拥堵路段分析实例:

    地点:南北高架;

    日期范围:2014-04-09~2014-04-16;

    分析条件:平均车速<20km/h、占有率>40%;

    用交通信息OLAP系统进行交通拥堵路段分析条件配置,如下图6所示:

    图6 南北高架的拥堵路段及其指标

    OLAP系统的分析结果显示出2014年4月7日南北高架的拥堵路段及其指标。通过对车流量、平均车速、占有率车头时距等指标的分析,我们可以看到北京西路东行匝道出口—>新闸路东行匝道入口、天目中路上匝道、延安东路东行匝道入口—>威海路东行匝道入口、徐家汇东行匝道入口—>淮海中路东行匝道出口等路段拥堵严重。

    4、结论

    本文以海量综合交通数据为研究内容,结合数据仓库的关键技术,将各种交通数据以统一的格式,集成、存储在一起,根据主题通过专业模型对不同源数据库中的原始数据进行抽取和聚集,形成一个多维视角,从而为城市交通管理提供了一个适应决策分析的综合的、统一而全面的详尽数据环境,为交通数据平台的OLAP分析及挖掘提供了新途径。

    参考文献:

    [1]干炜,徐吉谦,杨涛.城市交通规划理论及其应用[M].南京:东南大学出版社,1998.

    [2]翟高寿.基于智能工程的城市交通控制系统的研究[D].[博士学位论文].北京:北方交通大学,2000.

    [3]谈晓洁,基于知识的交通拥堵疏导决策方法及系统研究[D].[博士学位论文].南京:东南大学,2005.

    [4] OLAP Council, http://www.olapcouncil.org/research/whtpaply.htm.

    [5]陈京民.数据仓库原理、设计与应用.北京:中国水利电力出版社,2004.3.

    [6]陈文伟,黄金才.数据仓库与数据挖掘.北京:人民邮电出版社,2004.1.

    [7]刘翔.数据仓库与数据挖掘技术.上海:上海交通大学出版社,2005.

    [8] Erik Thomsen. OLAP Solutions:Building Multidimensional Information Systems. 北京:电子工业出版社,2004.9.

    [9] Dan Bulos,Sarah Forsman. OlAP Database Design: Delivering On the Promise of the Data Warehouse. Morgan Kaufman Pub lnc, 2002:123-153P.

    推荐访问:海量 交通信息 研究 综合 系统

    Top