ZDNet至顶网软件频道消息: 大连现代高技术集团有限公司技术总监施宁在2014年大连软交会上的“大数据时代的智慧交通发上展论坛”演讲时表示,该公司在SAP的HANA平台上构建的大连市出租汽车服务管理系统,通过大数据分析减少了大连市的交通拥堵、促进减排、提升出租车司机的收入,提升了行业的整体服务水平。
大连现代高技术集团有限公司技术总监施宁(蒋湘辉 摄)
据悉,大连出租车2013年开始安装上GPS装置,一年产生的位置信息80亿笔左右,运营数据1.2亿笔左右,大连现代高技术集团在SAP的HANA平台上构建的大连市出租汽车服务管理系统不仅可以实时让司机看到拥堵路段,提前预判优先的路线,还可以让乘客方便地找到附近方便打车的最佳位置。此外,该系统还能帮助政府主管部门实时判断出租车运营价格调整前后的出租车司机收入增加的结果,以做出最佳决策。
图注:大连某一路段的24小时交通拥堵情况的热图分析。
以下是大连现代高技术集团有限公司技术总监施宁的演讲实录:
施宁:我今天要讲的是面向智慧交通的大数据应用,大数据这个概念,其实我感觉从今年年初开始便突然跑到我面前,之前到大学时还是停留在老师的课本上,今年过年的时候,中央电视台不遗余力的在大数据方面做了举例,比如什么样的出行方式,甚至多少电视节目有多少人看,我觉得这个还不算过瘾,很有幸大连现代高技术和大连理工大学和SAP公司,最近在大数据处理技术在智能交通方面有应用和一些案例,我给大家介绍一下。
城市对于大家的第一印象就是堵,我们觉得发展城市必然会带来道路的拥堵,解决这个问题的根本方法是什么呢?大家有一个共识,简单来讲,大家都来坐公交车,把公共运力发挥到极致是我们的想法。另外就是采取智能化或者智慧化的手段,提升我们的出行体验,这种手段我们称其为智慧交通。
在研究智慧交通的过程中,我们发现交通数据来源非常广泛,像我上面写的,我们很多出行数据来源于出租车、公交车、BRT,这些数据来源广、数据多,这就是好多人分析的大数据具有的4V特征,在解决交通问题的时候,是不是可以从大数据里面要一些东西,大连理工大学和SAP把大数据处理在智能交通领域做一些尝试,我们来看一下大数据大到什么程度?
举个例子,大连出租车2013年开始安装上GPS装置,一年产生的位置信息80亿笔左右,运营数据1.2亿笔左右,大连出租车仍然有部分在完善过程中,这个数据将持续性的增长,我们想建立一个智慧交通的大数据平台,辅助各个平台完成几项业务,我简要介绍一下,我们把它总结为一个中心和四个基本层次,一个中心是将现有的公交、BRT、快轨和出租车的平台集中到大数据平台,进行数据共享和平台处理。前三个层次从自己的平台处理没有太大区别,主要是智慧化层,有预测和预判的作用。
平台建设的构想是基于中国目前大家都在采用的ITS的架构,数据的传输、处理和大数据的深度挖掘是我们的核心。另一部分是大数据这部分,大数据实际我在这里没有讲实时处理的特征,其实并不是说大数据不能实现实时处理,而是关注点不同,我们的关注点是在普通交通信息基础上,技术集成、分析和处理,我们想建立成熟的预测、预判的系统。
我们所要建立的大数据平台的服务对象实际是四个,市民、交通从业者、企业和政府部门,这四个服务对象各自有不同需求,我会在下面以实例为大家简要介绍,就是以大连市出租车近半年来所获取的数据,大概有40亿笔的数据的分析。
市民的出行很简单,就是两句话,怎么走好,怎么好走,听起来有点怪,做一个举例,我制作这个PPT的时候不知道今天会下雨,否则会以今天的实际情况为大家做PPT,这是前几天的情况,从胜利广场到现在的位置附近,我有个同学聚会,晚上6:30时候我非常纠结,不知道坐公交车还是坐出租车好,6:30的时候,大家都知道,乘坐出租车大连的路段不是好走,乘坐公交车,我给同学带了点特产又不方便,我用了大数据的分析方式,对大连市近半年运营的数据进行了分析,为什么得出这样的乘坐路线图,出租车平时有服务特点,有20-24小时都在路上跑,我们通过速度信息基本可以得到大连市路网的拥堵情况,这里面蓝色部分代表了畅通,粉红色部分代表了拥堵,这张图有点小,不容易分辨,但是至少得出一个结论,我今天打车很容易,但是能不能打到车?大家不知道有没有亲身体验,站在一个路口半天,根本打不到任何车,但是转一个路口可能马上能打到车,或者到一个新的地方根本不知道交警是否允许你打车,所以我利用大数据平台的处理功能,在晚上6:30的时候,历史上周围半径500米容易打车的位置做一个预测,这里面除了预测容易打车的地点以外,还会将大连市正在规划的出租车站列举其中,在这张图上可以看到有8个位置可以打到车,但是这里还有一个原因,周围为什么可以聚集这么多出租车?这个地点是路面繁忙的地段,之前可以给出租车司机提供热点的预设服务,就是以大连市出租车近40亿笔的运营数据,在晚上6:30的时候进行了分析,大连市哪些地段是热点地段,我们鼓励这些出租车到这些地方去缓解当地的运营压力,我上车以后同样可以利用一张图,城市路况监控,出租车司机同样可以利用,在我到达目的地过程中,存在若干拥堵路段,出租车司机马上可以跟我讨论一下,走哪个路段好,出租车有评价器,我到了以后会对他进行评价,评价会作为数据的一部分,汇总到今后的大数据平台里面,对司机日常的管理和奖励有一定的作用,我在这里先卖个关子。出租车司机在我下车以后,也会根据热点预测分布,选择下一个热点服务区域,尽量减少空载率,提高自己的收入。
讲到收入看这张图,出租车坐起来都很舒适,出租车司机也有自己的收入压力,往往提出要求涨价,政府想象涨价需求的时候,怎么涨价?首先要了解大部分群体有什么样的收入水平,以前怎么做?都是处于抽样的方式,但是很多人觉得不准,比如今年年初的时候,国家统计局抽样了我们的工资水平,当时我觉得我拉后腿比较厉害,基于大数据方式有什么好处,目前出租车的每笔交易数据,都向我们的数据平台传,换句话说,可以知道出租车每天固定收到多少钱,这张图最左边是收入成本的构成图,分为固定成本和收益,收益是跑一天多少钱,固定成本是燃油成本和份子钱,燃油成本怎么算?出租车报我的位置信息,我会算出你的速度,根据出租车平常时候的平均能耗和平均油耗,再乘以运营时间,会得出成本。现在很多车辆模块会得到车辆发动机运行的数据,如果今后车辆装上这个模块,燃油成本会计算非常准确。以前是抽样,现在可以得到大量事近8000辆出租车平均的收入成本分析,我们看这张图上,最右边的部分有几个可调整的地方,比如白天起步价、夜间起步价,里程单价和等时费。这张图除了可以利用成本分析之外,如果是真实数据,是目前的出租车真实成本,如果要调整就是涨价策略,我们以大连市五一涨价为例,这张图是调价前的图,我们看白天起步价和夜间起步价,我们通过这个图,结合大连市的历史运营数据,看出租车司机一天可以多拿多少钱,在屏幕最左边绿色的部分可以看到,同前一个对比,之前一天309块钱左右,之后大约是408块钱,涨了100块钱,换句话说夜班司机和白班司机一天每人可以多收入50块钱,后来看我们的模拟还是非常成功的。
基于这个,政府今后进行出租车司机或者其他调价的时候,可以用大数据的手段。而且利用这种分析方法,我们也可以得到,当我们做出一种调价策略以后,若干时间以后可以反馈一下我们的调价策略是否成功,是否达到了我们的目的。
我坐出租车会评价,对出租车的贡献会做综合评判,加强企业对出租车的管理,出租车司机其实很不容易,不管什么样的天气都得在外面运营,传统的出租车企业是惩罚策略,这不是很好的策略,容易激起出租车司机反抗和对抗的心理,我们觉得有必要加入奖励的环节,但是惩罚环节和奖励环节不一样,惩罚需要单笔证据,但是如果是奖励必须获得全体的样本,才能保证这次评价的公正性和准确性。我们觉得不同的人,对司机的评价实际有自己不同的评判标准,我坐车希望快点到,不绕远,企业来说方便管理,政府来说,当遇到重大事件的时候,出租车可以及时出车,缓解交通压力,遵守交通规则。不同的人有不同的标准,运用历史数据对出租车司机的评价设五个指标的雷达图,实际可以看到存在五个不同的趋势,这五个指标是什么呢?简单讲一下,比如说运行的有效里程数,在重要的雨雪天气下是否正常出车了,比如政府可能有一些重大的活动,比如软交会、服装节、体育比赛,希望出租车到热点地区服务,快速疏散人群,这也是重要的评分标准,通过评价可以有综合的评判。可以把优的出租车司机,可以采用技术的手段,如果可以在明显的标准,让顾客和市民知道将为你服务的出租车司机是优秀出租车司机,很多人有选择情况下的时候,会选择优和良司机,有从另一方面增加了出租车司机的收入。
这张图是出租车单位时间收入和运营数据分析图,有纵坐标是周一到周日,横坐标是24小时,颜色代表这个小时收入多少,颜色越深代表这段时间收入越高,从这张图可以看到,夜间22点前出租车司机收入比较高,从一定程度上可以看出市民的出行习惯,可以指导出租车司机,在什么时刻把运力情况投入进去。在这里可以看到,从2点到5点时间里,出租车司机基本没有什么收入,晚班司机可以选择热点时间去服务,其他时间不要在路上空跑。下面是运力分析,不同时刻打车距离是多少,我们打车起步价在上班的时候一般10-20公里比较多,夜间长距离的比较多。
这张图和第一张图比较接近,绿色区域代表路段畅通,黄色区域代表路段拥堵,最重要的是下面的小图,从屏幕上可以看到,最下方有红色线和部分灰色区域,红色部分是我们根据历史的运营数据得到的大连市某一个路段,平均这段时间的运行速度是多少,灰色是这个路段上目前速度是多少,理论来讲,因为之前是平均的统计结果,他们两个是比较接近,如果我们发现灰色区域和红色线有比较大的差异,是因为什么呢?有异常事件发生,比如拥堵,这样我们可以给路政和行车人员提供参考信息,再发展一下,可以得到大连市任何一个重点区域运行的矩形图,横坐标仍然是24小时,纵坐标是一条道路上各个重要的路后,每个块代表这段运行的速度,可以重点观察一下红色部分,比较聚集的地方是道路比较拥堵,是常发性拥堵状况,如果部分路段出现偶发性的红色部门,是偶尔拥堵。这是一天的数据,如果再增加一下,可以看周二、周三、周四、周五的数据,其实我们看常发性拥堵数据没有什么变化。我们再看周六,周六改善了很多。可以得到大连市主要干道上是什么时候出现拥堵的,如果仅仅只是一条干道,如果把路段和矩形图结合在一起,立体分析,可以得到拥堵时间和空间的特征关系或者关联,可以针对某一时间短作出道路的疏散拥堵的策略。
大连市90126出租车平台建立有段时间了,手机软件也会用,但是其实真正有急事下,用出租车的时候打不到,大连市学习一下先进城市的经验,目前会投入400辆左右的电导车,只接受电招服务,不接受路边招车服务,带来一个问题是400辆车怎么停,放在什么路段,放多少辆,辐射多大区域,最长时间服务反应速度是多长,我到达地点以后如何保证下一个停车地点,需要有综合性的数据来支持,我们建立这样一个模型,是以一个区域内,打车的次数和及时到达的时间为两个参数,制定了这样一个模型,我们首先来分析一下大连市分成34个不同的区域,通过大数据分析,可以得到大约的等待时间是100秒,如果分成8个,时间很显著的延长,是200多秒会打到车,如果进一步把扬招区域增加,等待时间会减少。但是,是否会无限度的增加呢?不可能的,因为大连市寸土寸金。因此,我们给出租车的推荐是建立34个左右的停车位置,平均打一个电话,100秒之内会得到服务,目前正在在服务中加入更多的要素,比如建立模型的时候可以加入手机大车的需求,现在正在进一步精确模型,以期待为政府这部分决策提供更多详实的数据依据。
我这个动画可以表示出某一个区域到大连市其他区域之间,行车进有多少,出有多少啊,蓝色点代表进的车辆,红色点代表出的车辆。因为它可以分析出大连市不同的区域和不同区域之间的联系,可以知道在某一个时刻的时候,这个最后面还会得到一个关键路径,我们讲高新园区同甘井子之间是什么样的关键路径,我解决了关键路径问题,可以进一步让交通更加畅通。
我今天的介绍就这么多,谢谢大家。
好文章,需要你的鼓励
后来广为人知的“云上奥运”这一说法,正是从这一刻起走上历史舞台。云计算这一概念,也随之被越来越多的人所熟知。乘云科技CEO郝凯对此深有感受,因为在2017年春节过后不久,他的公司开始成为阿里云的合作伙伴,加入了滚滚而来的云计算大潮中。同一年,郝凯带领团队也第一次参加了阿里云的“双11”活动,实现了800万元的销售业绩。
随着各行各业数字化变革的不断深入,人类社会正加速迈向智能化。作为智能世界和数字经济的坚实底座,数据中心也迎来了蓬勃发展。面