买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】地址信息处理方法及装置_北京星选科技有限公司_201711436074.X 

申请/专利权人:北京星选科技有限公司

申请日:2017-12-26

公开(公告)日:2020-06-30

公开(公告)号:CN108197188B

主分类号:G06F16/2458(20190101)

分类号:G06F16/2458(20190101);G06F16/2453(20190101)

优先权:

专利状态码:有效-授权

法律状态:2020.06.30#授权;2018.07.17#实质审查的生效;2018.06.22#公开

摘要:本发明实施例提供一种地址信息处理方法及装置,涉及数据挖掘领域。其中,所述方法包括:获取地址信息;根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件;根据所述匹配结果确定所述地址信息所属的地址类型。本发明实施例提供的技术方案能够自动且准确地确定地址类型。

主权项:1.一种地址信息处理方法,其特征在于,包括:获取地址信息;根据所述地址信息和设定的正则表达式进行匹配处理,其中,根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;根据匹配结果确定所述地址信息所属的地址类型。

全文数据:地址信息处理方法及装置技术领域[0001]本发明实施例涉及数据挖掘领域,尤其涉及一种地址信息处理方法及装置。背景技术[0002]互联网技术的不断发展已经大大改变了人们的生活方式,比如人们的出行方式、购物方式、配送方式等都在发生巨大变化,为满足用户的各种需求,开发出了各种相应的应用Application,简称APP。[0003]随着个性化推荐技术的发展,在例如以外卖场景为例的多种场景下,各种应用需要根据用户地址进行个性化推荐服务。然而,现有技术环境下通常由用户指定用户地址相关的信息(例如,地址类型),却未意识到用户指定所存在的局限性已经难以满足用户日益提高的体验要求,并且,也无法满足信息处理自动化的需求。发明内容[0004]本发明实施例提供一种地址信息处理方法及装置,用以解决现有技术用户体验差、无法自动且准确地确定地址类型的技术问题。[0005]第一方面,本发明实施例中提供了一种地址信息处理方法,包括:[0006]获取地址信息;[0007]根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;[0008]根据所述匹配结果确定所述地址信息所属的地址类型。[0009]结合第一方面,本发明在第一方面的第一种实现方式中,所述方法还包括:[0010]根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。[0011]结合第一方面或第一方面的第一实现方式,本发明在第一方面的第二种实现方式中,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:[0012]将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。[0013]结合第一方面或第一方面的第一实现方式,本发明在第一方面的第三种实现方式中,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:[0014]将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。[0015]结合第一方面的第三种实现方式,本发明在第一方面的第四种实现方式中,所述根据所述匹配结果确定所述地址信息所属的地址类型,包括:[0016]根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。[0017]第二方面,本发明实施例提供了一种地址信息处理装置,包括:[0018]获取模块,用于获取地址信息;[0019]匹配模块,用于根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;[0020]确定模块,用于根据所述匹配结果确定所述地址信息所属的地址类型。[0021]结合第二方面,本发明在第二方面的第一种实现方式中,所述装置还包括:[0022]信息处理模块,用于根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。[0023]结合第二方面或第二方面的第一种实现方式,本发明在第二方面的第二种实现方式中,所述匹配模块包括:[0024]第一匹配子模块,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。[0025]结合第二方面或第二方面的第一种实现方式,本发明在第二方面的第三种实现方式中,所述匹配模块包括:[0026]第二匹配子模块,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。[0027]结合第二方面的第三种实现方式,本发明在第二方面的第四种实现方式中,所述确定模块具体用于:[0028]根据地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。[0029]第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器;其中,[0030]所述存储器用于存储一条或多条计算机指令,所述一条或多条计算机指令供所述处理器调用执行;[0031]所述处理器用于执行所述一条或多条计算机指令从而实现如前述第一方面或其实现方式提供的地址信息处理方法。[0032]第四方面,本发明实施例提供了一种计算机存储介质,所述计算机存储介质存储有一条或多条计算机指令,所述计算机指令被执行时实现如前述第一方面或其实现方式提供的地址信息处理方法。[0033]本发明实施例能够自动、准确地确定地址类型。[0034]本发明的这些方面或其他方面在以下实施例的描述中会更加简明易懂。附图说明[0035]为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。[0036]图1示出了根据本发明一个实施例的地址信息处理方法的流程示意图;[0037]图2示出了根据本发明另一个实施例的地址信息处理方法的流程示意图;[0038]图3示出了根据本发明再一个实施例的地址信息处理方法的流程示意图;[0039]图4示出了根据本发明一个实施例的地址信息处理装置的框图;[0040]图5示出了图4所示地址信息处理装置的匹配模块的框图的一例;[0041]图6示出了根据本发明另一个实施例的地址信息处理装置的框图;[0042]图7示出了图6所示地址信息处理装置的匹配模块的框图的一例;[0043]图8示出了根据本发明一个实施例的电子设备的框图。具体实施方式[0044]为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。[0045]在本发明的说明书和权利要求书及上述附图中的描述的一些流程中,包含了按照特定顺序出现的多个操作,但是应该清楚了解,这些操作可以不按照其在本文中出现的顺序来执行或并行执行,操作的序号如101、102等,仅仅是用于区分开各个不同的操作,序号本身不代表任何的执行顺序。另外,这些流程可以包括更多或更少的操作,并且这些操作可以按顺序执行或并行执行。需要说明的是,本文中的“第一”、“第二”等描述,是用于区分不同的消息、设备、模块等,不代表先后顺序,也不限定“第一”和“第二”是不同的类型。[0046]下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例所获得的所有其他实施例,都属于本发明保护的范围。[0047]图1是根据本发明一个实施例的地址信息处理方法的流程示意图,参照图1,所述方法包括:[0048]100:获取地址信息。[0049]在本发明中,所述地址信息可以是文字,也可以是具有文字含义的字符、符号等。[0050]102:根据所述地址信息和设定的正则表达式进行匹配处理。其中,所述正则表达式包含地址类型及其判定条件。所述判定条件包括满足所述地址类型的地址信息应当包含的信息,包括文字、数字或文字与数字的组合方式。[0051]104:根据所述匹配结果确定所述地址信息所属的地址类型。[0052]采用本实施例提供的方法,通过正则表达式对地址信息进行匹配处理进而确定地址类型,有利于自动且准确地确定地址类型。[0053]可选地,在本实施例的一种实现方式中,所述处理102采用以下方式实现:将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。其中,所述一个与所述地址信息匹配的地址类型即后续在104中确定的所述地址信息所属的地址类型。[0054]可选地,在本实施例的一种实现方式中,所述处理102采用以下方式实现:将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。所述地址类型集包括一个或一个以上的地址类型。在所述地址类型集仅包含一个地址类型时,则在处理104中,该一个地址类型即所述地址信息所属的地址类型;在所述地址类型集仅包含一个以上地址类型时,在处理104中,根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。[0055]可选地,在本实施例的一种实现方式中,不对所述地址信息进行诸如分词、切词等处理,降低数据处理量。[0056]图2示出了根据本发明一个实施例的地址信息处理方法的流程示意图,参照图1,所述方法包括:[0057]200:获取地址信息。[0058]在本发明中,所述地址信息可以是文字,也可以是具有文字含义的字符、符号等。[0059]202:根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息。[0060]204:根据所述部分地址信息和设定的正则表达式进行匹配处理。其中,所述正则表达式包含地址类型及其判定条件。所述判定条件包括满足所述地址类型的地址信息应当包含的信息,包括文字、数字或文字与数字的组合。[0061]206:根据所述匹配结果确定所述地址信息所属的地址类型。[0062]采用本实施例提供的方法,通过正则表达式对地址信息进行匹配处理进而确定地址类型,有利于自动且准确地确定地址类型。并且,通过根据方位词选取部分地址信息进行处理,有利于提高处理效率。[0063]可选地,在本实施例的一种实现方式中,在处理202中,方位词包括:“旁边”、“附近”、“对面”等。所述部分地址信息为所述地址信息中位于所述方位词后面的部分。[0064]可选地,在本实施例的一种实现方式中,所述处理204采用以下方式实现:将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。其中,所述一个与所述地址信息匹配的地址类型即后续在206中确定的所述地址信息所属的地址类型。[0065]可选地,在本实施例的一种实现方式中,所述处理204采用以下方式实现:将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。所述地址类型集包括一个或一个以上的地址类型。在所述地址类型集仅包含一个地址类型时,则在处理206中,该一个地址类型即所述地址信息所属的地址类型;在所述地址类型集仅包含一个以上地址类型时,在处理206中,根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。[0066]可选地,在本实施例的一种实现方式中,除了选取部分地址信息之外,不对所述地址信息进行诸如分词、切词等处理,降低数据处理量。[0067]图3示出了根据本发明一个实施例的地址信息处理方法的流程示意图。参照图3,所述方法包括:[0068]300:划分地址类型。[0069]具体而言,在本实施例中,将用户地址类型划分为:办公场所、住宅、学校、医院、酒店、娱乐场所、其他这七大类。具体描述如下表1所示。[0071]在本实施例,通过正则匹配的方式来识别地址,即通过定义每个地址类型的正则表达式,然后通过正则表达式来匹配地址类型,其中,正则表达式可以看做是查找串。[0072]302:确定每个地址类型的正则表达式。[0073]令RepX表示X的正则表达式,根据现有地址数据,将上述六种地址类型的正则表示式确定如下:[0074]Rep办公场所)=大厦I商厦I写字楼I办公楼I公司I银行I.座I集团I软件园I研究院I产业园I.店I.中心[0075]Rep住宅)=住宅I小区I家园I嘉园I家苑I家属院I区I园I苑)·+号楼I栋I幢排)I单元I公寓I嘉苑[0076]Rep学校)=学校I大学I宿舍I学院I中学I小学I校区I教学楼I学生公寓I幼儿园[0077]Rep医院)=医院I门诊I附属医院I护士站I手术室I急诊I放射I妇I内I外I产I儿骨I检验科I住院部I病区I医生I住院楼I护理I手术室I病房[0078]Rep娱乐场所)=网吧I网咖IktvI酒吧I酒楼I洗浴[0079]Rep酒店)=酒店I宾馆I旅馆I旅店[0080]正则表达式的具体含义如下:[0081]I表示或,如:RepX=大厦I商厦表示匹配到大厦或者商厦。[0082].表示匹配到任何文字。[0083]+表示匹配到前面的文字一次或无限次,[0084]如:RepX=区I园I苑).+号楼I栋I幢I排)表示匹配到XX区XX栋或者XX园XX号楼等文字模式。[0085]304:确定分类候选集合C。[0086]对每一个收餐地址,先判定地址中是否有旁边、对面、附近这三个词,如果有,则截取这三个词后面的词作为收餐地址,(如收餐地址为湖南大学对面的7天酒店,则选择7天酒店作为地址),然后循环判定是否匹配步骤302中的六个正则表达式,每匹配到一个,则将对应分类加入候选集合C中。如C的可能取值为【办公场所、学校】,这表示用户的地址同时满足正则表达式R印办公场所和R印学校)。[0087]306:从候选集C中选择优先级较高的分类作为地址类型。[0088]可选地,在本实施例中,各地址类型的优先级顺序如下:[0089]娱乐场所〉酒店〉医院〉学校〉办公场所〉住宅〉其他[0090]如C=【办公场所、学校】,则将该地址类型定为学校。[0091]如上,对本发明各种实施例及其实现方式进行了详细说明。为了验证本发明的效果,发明人随机从采用本发明各实施例提供的方法所判定的订单中抽取200个地址进行人工判定,其中正确分类的地址数为185个,正确率达到92.5%。因此,采用本发明各实施例或其实现方式所提供的方法,能够高效、自动且准确地确定地址类型。[0092]图4是根据本发明一个实施例的地址信息处理装置的框图。参照图4,地址信息处理装置包括获取模块40、匹配模块42和确定模块44。下面进行详细说明。[0093]在本实施例中,获取模块40用于获取地址信息。[0094]其中,所述地址信息可以是文字,也可以是具有文字含义的字符、符号等。[0095]在本实施例中,匹配模块42用于根据所述地址信息和设定的正则表达式进行匹配处理。其中,所述正则表达式包含地址类型及其判定条件。所述判定条件包括满足所述地址类型的地址信息应当包含的信息,包括文字、数字或文字与数字的组合。[0096]在本实施例中,确定模块44用于根据所述匹配结果确定所述地址信息所属的地址类型。[0097]采用本实施例提供的装置,通过正则表达式对地址信息进行匹配处理进而确定地址类型,有利于自动且准确地确定地址类型。[0098]可选地,在本实施例的一种实现方式中,如图5所示,所述匹配模块42包括第一匹配子模块420,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。其中,所述一个与所述地址信息匹配的地址类型即后续由确定模块44确定的所述地址信息所属的地址类型。[0099]可选地,在本实施例的一种实现方式中,如图5所示,所述匹配模块42包括第二匹配子模块422,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。在所述地址类型集仅包含一个地址类型时,则确定模块44将该一个地址类型确定为所述地址信息所属的地址类型;在所述地址类型集仅包含一个以上地址类型时,则确定模块44根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。[0100]图6是根据本发明一个实施例的地址信息处理装置的框图。参照图6,地址信息处理装置包括获取模块60、信息处理模块61、匹配模块62和确定模块64。下面进行详细说明。[0101]在本实施例中,获取模块60用于获取地址信息。[0102]其中,所述地址信息可以是文字,也可以是具有文字含义的字符、符号等。[0103]在本实施例中,信息处理模块61用于根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。示例性地,所述方位词包括“对面”、“附近”等,所述部分地址信息为所述方位词后面的信息。[0104]在本实施例中,匹配模块62用于根据所述部分地址信息和设定的正则表达式进行匹配处理。其中,所述正则表达式包含地址类型及其判定条件。所述判定条件包括满足所述地址类型的地址信息应当包含的信息,包括文字、数字或文字与数字的组合。[0105]在本实施例中,确定模块64用于根据所述匹配结果确定所述地址信息所属的地址类型。[0106]采用本实施例提供的装置,通过正则表达式对地址信息进行匹配处理进而确定地址类型,有利于自动且准确地确定地址类型。[0107]可选地,在本实施例的一种实现方式中,如图7所示,所述匹配模块62包括第一匹配子模块620,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。其中,所述一个与所述地址信息匹配的地址类型即后续由确定模块64确定的所述地址信息所属的地址类型。[0108]可选地,在本实施例的一种实现方式中,如图7所示,所述匹配模块62包括第二匹配子模块622,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。在所述地址类型集仅包含一个地址类型时,则确定模块64将该一个地址类型确定为所述地址信息所属的地址类型;在所述地址类型集仅包含一个以上地址类型时,则确定模块44根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。[0109]图8示出了根据本发明一个实施例的电子设备例如,计算机等的框图。参照图8,所述电子设备包括一个或多个存储器80和一个或多个处理器82。其中,所述一个或多个存储器80用于存储一条或多条计算机指令;所述一个或多个处理器82用于调用和执行所述一条或多条计算机指令从而实现本发明各个实施例或其实现方式所提供的地址信息处理方法。[0110]可选地,在本实施例的一种实现方式中,如图8中虚线框所示,所述电子设备还包括用于进行数据通信的输入输出接口。[0111]除了以上所述的实施例之外,本发明的一种实施例还提供一种计算机存储介质,存储有一条或多条计算机指令,所述一条户多条计算机指令被执行时实现本发明各个实施例或其实现方式所提供的地址信息处理方法。[0112]所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。[0113]以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。[01M]通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如R0MRAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备可以是个人计算机,服务器,或者网络设备等执行各个实施例或者实施例的某些部分所述的方法。[0115]最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。[0116]本发明公开Al.—种地址信息处理方法,包括:[0117]获取地址信息;[0118]根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;[0119]根据所述匹配结果确定所述地址信息所属的地址类型。[0120]A2.如Al所述的方法,所述方法还包括:[0121]根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。[0122]A3.如Al或A2所述的方法,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:[0123]将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。[0124]A4.如Al或A2所述的方法,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:[0125]将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。[0126]A5.如A4所述的方法,所述根据所述匹配结果确定所述地址信息所属的地址类型,包括:[0127]根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。[0128]本发明还公开B6.—种地址信息处理装置,包括:[0129]获取模块,用于获取地址信息;[0130]匹配模块,用于根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;[0131]确定模块,用于根据所述匹配结果确定所述地址信息所属的地址类型。[0132]B7.如B6所述的装置,所述装置还包括:[0133]信息处理模块,用于根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。[0134]B8.如B6或B7所述的装置,所述匹配模块包括:[0135]第一匹配子模块,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。[0136]B9.如B6或B7所述的装置,所述匹配模块包括:[0137]第二匹配子模块,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。[0138]B10.如B9所述的装置,所述确定模块具体用于:[0139]根据地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。[0140]本发明还公开CU.—种计算机存储介质,存储有一条或多条计算机指令,所述一条或多条计算机指令被执行时实现如A1-A5中任一项所述的方法。[0141]本发明还公开D12.—种电子设备,包括:[0142]—个或多个存储器,用于存储一条或多条计算机指令;[0143]一个或多个处理器,用于调用和执行所述一条或多条计算机指令,从而实现如Al-A5中任一项所述的方法。

权利要求:1.一种地址信息处理方法,其特征在于,包括:获取地址ί目息;根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;根据所述匹配结果确定所述地址信息所属的地址类型。2.如权利要求1所述的方法,其特征在于,所述方法还包括:根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。3.如权利要求1或2所述的方法,其特征在于,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。4.如权利要求1或2所述的方法,其特征在于,所述根据所述地址信息和设定的正则表达式进行匹配处理包括:将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。5.如权利要求4所述的方法,其特征在于,所述根据所述匹配结果确定所述地址信息所属的地址类型,包括:根据所述地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。6.—种地址信息处理装置,其特征在于,包括:获取模块,用于获取地址信息;匹配模块,用于根据所述地址信息和设定的正则表达式进行匹配处理,其中,所述正则表达式包含地址类型及其判定条件,所述判定条件包括满足所述地址类型的地址信息应当包含的文字、数字或文字与数字的组合方式;确定模块,用于根据所述匹配结果确定所述地址信息所属的地址类型。7.如权利要求6所述的装置,其特征在于,所述装置还包括:信息处理模块,用于根据所述地址信息中的方位词,从所述地址信息中选取部分地址信息进行所述匹配处理。8.如权利要求6或7所述的装置,其特征在于,所述匹配模块包括:第一匹配子模块,用于将所述地址信息按序与基于优先级排列的多个正则表达式进行所述匹配处理,直至得到一个与所述地址信息匹配的地址类型,或,直至确定没有与所述地址信息匹配的地址类型。9.如权利要求6或7所述的装置,其特征在于,所述匹配模块包括:第二匹配子模块,用于将所述地址信息与多个正则表达式进行所述匹配处理,得到与所述地址信息匹配的地址类型集。10.如权利要求9所述的装置,其特征在于,所述确定模块具体用于:根据地址类型的优先级从所述地址类型集中选取优先级最高的地址类型作为所述地址信息所属的地址类型。

百度查询: 北京星选科技有限公司 地址信息处理方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。