基于区域划分的出租车统一推荐算法(3)
时间:2016-10-04 13:54
来源:发表吧
作者:吕红瑾等
点击:
次
3.2.2区域时间
首先通过Map阶段完成对相同车牌号的GPS数据进行分类,并输出。在Reduce阶段,循环遍历特定车牌号所有GPS数据,驶出区域时间减去驶入区域时间,得到此时刻的区域时间。之后对某区域特定时间段的区域时间求平均值,最终获得此区域特定时间段的时间消耗。
3.2.3绕远时间比例计算
当用户以起点区域和目的地区域作为基础信息提出搭乘出租车请求时,推荐算法根据实时数据,找到周围出租车信息和起点区域。并根据出租车起点区域和用户起点区域推算可能的目的地区域集合。之后对于三种不同模式大体步骤相同,如下所述:
1)缩减可能目的地集合:根据不同模式的要求在Map阶段,筛选出满足模式要求的可能目的地,去除不满足的目的地。
2)计算:在Reduce阶段计算所有满足条件目的地的绕远时间比例,平均分配概率,计算该出租车对应的绕远时间比例。
3.2.4在线推荐
计算出多个实时出租车的绕远时间比例后,进行比较,选出绕远时间比例最小的出租车推荐给乘客,完成本次推荐任务。
4算法测试与评估
为了检测算法的性能,本文采用了14727台出租车组成的1.74GB出租车数据进行检测,其中包含了450万条GPS原始数据集合[14]。在使用此GPS数据集合进行测试时,会出现诸如出租车速度不为0但经纬点对无变化等错误情况,这些现象可能由于设备故障、传输失真、人为因素等产生,在对数据处理之前需要对这些不合理现象进行处理,提高实验结果的准确性。
4.1测试综述
算法将原始GPS数据分为五份,其中一份作为实时数据,从中提取出的旅程信息作为用户的请求,例如某次旅程在X0时刻Y0区域开始,在X1时刻Y1区域结束,那么此次旅程可以转化为一次从X0时刻Y0区域到X1时刻Y1区域的用户搭乘请求。根据请求信息,算法首先在实时数据集合中找到周围的实时出租车,根据出租车起点区域和用户的起点区域Y0找到可能的目的地区域集合,之后根据不同模式的要求筛选满足条件的可能目的地,并进行计算推荐操作。
测试时采用两种性能进行评测:一个是绕远时间比例,算法会将绕远时间比例最小的出租车推荐给乘客;第二个是减少的里程数。随着汽车的增多,空气污染越来越严重,与分别送两名乘客到达目的地的总里程数相比,拼车服务送达两名乘客会减少出租车所走的总里程数,减少汽车尾气的排放,对环境保护有极大的推动作用。
4.2具体测评
4.2.1绕远时间比例
本部分对在算法进行测试时,24h不同时段三种不同模式绕远时间比例的变化情况进行说明解释。图7、8中横轴刻度代表某一时间段,如刻度6,表示6:00:00—6:59:59时间段的平均属性。
从图7中可知,在一天24h内,模式1与模式2的绕远时间比例都远远大于模式3,因为相比模式1和模式2,模式3的筛选更加准确所以产生更小的绕远时间消耗。在早高峰时间段(7:00—9:00)由于乘客的需求规律性不高,乘客目的地为分布于整个城市的各个工作地点,所以此时进行拼车具有较大的时间消耗;在晚高峰时间段(18:00—21:00),此时大多数的居民结束一天的工作正是下班高峰期,拼车去往较为集中的居住地与娱乐场所的乘客需求较多,所以此时拼车算法表现最为良好。
4.2.2减少的公里数
本部分主要从减少里程数的角度对三种不同的模式进行测试评估。
从图8中可知:无论是哪种模式都可以较为明显地减少总共的里程数,且基本都达到15%以上,三种模式在减少里程数上具有相同的变化情况。在早高峰与晚高峰时间段,搭乘出租车的旅程较多,所以减少的里程数相比其他时间段更加明显,达到30%以上;在凌晨阶段,由于乘客的目的地随机性较大,所以减少的里程数相比于其他时间段比例较小。
具有相同目的(即减少出租车总里程数)的CallCab系统[15]在减少的总里程数上具有良好的表现,在繁忙时间段(7:00—9:00)甚至达到50%以上。相比CallCab,本文算法将区域时间作为基本点,更关注用户到达目的地的时间消耗,最终目的是为了更快速地将用户送达目的地,尽可能地减少拼车造成的时间消耗,所以相比基于距离的CallCab系统,会产生更少的时间消耗,但相对而言减少的总里程数效果会稍差。
5结语
本文分析、设计并且评估了基于区域划分的出租车推荐算法,针对在极端天气或交通繁忙时乘客无法快速搭乘出租车到达目的地的问题,以降低乘客拼车时间消耗为着重点,为用户推荐时间消耗最小的出租车。经过实验验证,每次拼车平均只需要多花费6%的时间,且降低的送达乘客总里程数达到30%,不仅能大幅度减少汽车尾气的排放,同时在用户更加关注的时间消耗方面的表现也更佳。
本文算法通过挖掘海量历史GPS信息来获取各个区域时间,然后为用户推荐具有较短时间消耗的出租车,但对于GPS数据的挖掘依旧不够充分,这将在以后的工作当中进行深入研究。
参考文献:
[1]Taxi of tomorrow survey [EB/OL]. [2015-11-16]. http://www.nyc.gov/html/tlc/downloads/pdf/tot_survey_results_02_10_11.pdf.
[2]The New York city taxicab fact book [EB/OL]. [2015-11-16]. http://www.schallerconsult.com/taxi/taxifb.pdf.
[3]BALAN R K, NGUYEN K X, JIANG L. Real-time trip information service for a large taxi fleet [C]// MobiSys 11: Proceedings of the 9th International Conference on Mobile Systems. New York: ACM, 2011: 99-112.
(www.fabiaoba.com),是一个专门从事期刊推广期刊发表、投稿辅导、发表期刊的网站。
本站提供如何投稿辅导、发表期刊,寻求论文刊登合作,快速投稿辅导,投稿辅导格式指导等解决方案:省级论文刊登/国家级论文刊登/
CSSCI核心/医学投稿辅导/职称投稿辅导。
投稿邮箱:fabiaoba365@126.com
在线咨询:
275774677、
1003180928
在线咨询:
610071587、
1003160816
联系电话:18796993035