买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于旅客出行多元数据分析的空铁联程中转地点确定方法_东南大学_201911069463.2 

申请/专利权人:东南大学

申请日:2019-11-05

公开(公告)日:2020-12-29

公开(公告)号:CN110879866B

主分类号:G06F16/9535(20190101)

分类号:G06F16/9535(20190101);G06F16/9537(20190101);G06F16/906(20190101);G06Q10/04(20120101);G06Q50/30(20120101)

优先权:

专利状态码:有效-授权

法律状态:2020.12.29#授权;2020.04.07#实质审查的生效;2020.03.13#公开

摘要:本发明公开了一种基于旅客出行多元数据分析的空铁联程中转地点确定方法,该方法包括了分类预测模型多源数据采集、多元数据分类、旅客出行方式选择时最大影响因素的预测、空铁联程出行信息采集、出行方案排序及生成以及中转地点的确定六大步骤。本发明方法通过对旅客一年中的出行频率、旅客一年中出行的主要目的、旅客一年中一次出行的平均距离、旅客一年中一次出行的平均花费等数据的分类预测出不同旅客出行方式选择时影响最大的因素,为旅客的空铁联程出行提供最符合个人偏好的中转地点选择以及个性化的出行方案推荐。

主权项:1.基于旅客出行多元数据分析的空铁联程中转地点确定方法,其特征在于,该方法包括如下步骤:1分类预测模型多源数据采集,包括:采集N名旅客的多元数据,用于分类预测模型的构建,所述第i名旅客的多源数据Xi,i=1,2,3…,N包括旅客一年中的出行频率Ai、旅客一年中出行的主要目的Bi、旅客一年中一次出行的平均距离Ci、旅客一年中一次出行的平均花费Di、旅客出行方式选择时影响最大的因素Ei;所述第i名旅客一年中的出行频率Ai的取值范围是1至5的五个自然数,其中Ai=1表示出行频率小于3次,Ai=2表示出行频率3-6次,Ai=3表示出行频率7-10次,Ai=4表示出行频率11-14次,Ai=5表示出行频率15次以上;所述旅客一年中出行的主要目的Bi的取值范围是1至5的五个自然数,其中Bi=1表示出行目的为公务出行,Bi=2表示出行目的为探亲访友,Bi=3表示出行目的为回家,Bi=4表示出行目的为旅游,Bi=5表示出行目的为上学;所述旅客一年中一次出行的平均距离Ci的取值范围是1至4的四个自然数,其中Ci=1表示平均出行距离小于500公里,Ci=2表示平均出行距离500-1000公里,Ci=3表示平均出行距离1000-1500公里,不包括1000公里,Ci=4表示平均出行距离大于1500公里;所述旅客一年中一次出行的平均花费Di的取值范围是1至4的四个自然数,其中Di=1表示平均花费小于500元,Di=2表示平均花费500-800元,Di=3表示平均花费800-1100元,不包括800元,Di=4表示平均花费大于1100元;所述旅客出行方式选择时影响最大的因素Ei的取值范围是集合{F,T,S}中的一个元素,其中Ei=F表示因素为出行费用的高低,Ei=T表示因素为出行时间的长短,Ei=S表示因素为出发时刻表;2多元数据分类,包括:创建分类模型,将所述步骤1中的N名旅客多源数据Xi,i=1,2,3…,N划分成训练旅客数据和检验旅客数据两类,训练旅客数据的个数为N1,其取值是N1=0.8×N取整后的数值,检验旅客数据的个数为N2,其取值是N2=N-N1;对于任意一个训练旅客数据utrain=1,2,3,4,…,N1包含旅客一年中的出行频率为一年中出行的主要目的为一年中一次出行的平均距离为一年中一次出行的平均花费为出行方式选择时影响最大的因素为对于任意一个检验旅客数据vtest=1,2,3,4,…,N2包含旅客一年中的出行频率为一年中出行的主要目的为一年中一次出行的平均距离为一年中一次出行的平均花费为出行方式选择时影响最大的因素为采用KNN算法对数据进行分类,将旅客的一年中的出行频率Ai、旅客一年中出行的主要目的Bi、旅客一年中一次出行的平均距离Ci、旅客一年中一次出行的平均花费Di这四项作为模型的自变量,分别以向量的形式表示;将旅客出行方式选择时影响最大的因素Ei作为模型的因变量,以向量的形式表示,通过寻找因变量与自变量的关系从而构建分类模型,寻找过程包括:首先进行外部循环,设定一个数值K,K的初始值为1,进行下一次外部循环时K的数值增加1,K的上限为对每一个检验旅客数据vtest=1,2,3,4,…,N2进行内部的嵌套循环,内部循环中依次计算检验数据与所有的训练数据之间的距离d, 按照距离d的递增关系进行排序,找出与该检验数据距离d最小的K个训练数据,确定K个数据中各个因变量E的出现次数,将出现次数最高的因变量E作为检验数据的分类,从而找到;对于所有的检验数据判断分类模型预测得到的旅客因变量E与该名旅客实际出行方式选择时影响最大的因素E是否一致,一致的因变量个数记为M,准确率若准确率δ高于90%,则认为分类效果较好,跳出内部循环和外部循环,整个循环结束,输出此时的K的数值;若测试的准确率δ低于90%时,则认为分类效果不理想,跳出内部循环进行下一次的外部循环,直至准确率δ高于90%为止;循环结束后,将输出的K值作为KNN算法用于分类类别预测的K值,对于任意一个新的数据,输入其四个自变量A、B、C、D的数值,计算其与各个训练数据之间的距离d,按照距离d的递增关系进行排序,找出距离d最小的K个训练数据确定K个数据中各个因变量E的出现次数,将出现次数最高的因变量E作为该新数据的预测分类值;3旅客出行方式选择时最大影响因素的预测,包括:对于任意一名需要分类预测的旅客L,获得其历史信息中一年中的出行频率Al、旅客一年中出行的主要目的Bl、旅客一年中一次出行的平均距离Cl、旅客一年中一次出行的平均花费Dl四个自变量数据,通过步骤2中的分类模型预测其因变量旅客出行方式选择时影响最大的因素El;4空铁联程出行信息采集,包括:设置旅客L的出发城市为P,目的地城市为Q,其他同时具有高铁站和机场的城市为Oi,i依次为各个满足要求的城市;获取P-Oi和Oi-Q的机票价格、高铁价格、航空的飞行时长、高铁的时长、航班到发时刻表、高铁到发时刻表;5出行方案排序及生成,包括:若旅客出行是飞机换乘高铁,则P-Q的出行费用为P-Oi的机票价格和Oi-Q的高铁价格的求和,P-Q的出行时长为P-Oi的航空飞行时长和Oi-Q的高铁时长的求和,P-Q的出发时间是P-Oi的航班和与之衔接的Oi-Q的高铁班次;按照P-Q出行费用从低到高、出行时长从低到高、出发时刻从早到晚三种方法将P-Q进行排序,形成按照费用、出行时长以及出发时刻三种形式划分的行方案;6中转地点的确定,包括:根据所预测得到的旅客出行方式选择时考虑的最大因素El在步骤5中的空铁联程信息寻找对应的出行方案,选出旅客出行P-Q路线上最符合旅客在出行方式选择时考虑的最大因素E的出行方案,从而确定空铁联程中转地点Oi。

全文数据:

权利要求:

百度查询: 东南大学 基于旅客出行多元数据分析的空铁联程中转地点确定方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。