申请/专利权人:北京四维图新科技股份有限公司
申请日:2019-11-12
公开(公告)日:2024-04-02
公开(公告)号:CN112861532B
主分类号:G06F40/295
分类号:G06F40/295;G06F16/387;G06F16/35;G06F16/33
优先权:
专利状态码:有效-授权
法律状态:2024.04.02#授权;2021.06.15#实质审查的生效;2021.05.28#公开
摘要:本公开披露一种地址标准化处理方法及装置,该方法包括:对待处理的地址数据进行数据处理,得到待处理的地址数据对应的第一字符串。从第一字符串中提取与预设的地址类型词所对应的地址实体词。根据预设的地址类型词和地址实体词,采用游标式边界策略获取标准化的地址数据,标准化的地址数据中包括预设的地址类型词和地址实体词。通过从数据处理后的第一字符串中提取预设的地址类型词所对应的地址实体词,以根据地址类型词和地址实体词得到标准化的地址数据,从而能够针对不同的地址数据分别得到各自对应的标准化地址,避免了根据兴趣点的地址进行匹配所导致的地址标准化存在较大局限性的问题。
主权项:1.一种地址标准化处理方法,其特征在于,包括:对待处理的地址数据进行数据处理,得到所述待处理的地址数据对应的第一字符串;从所述第一字符串中提取与预设的地址类型词所对应的地址实体词,其中,地址类型词为用于表示地址要素的词,地址实体词为用于表示地址名称的词;根据所述预设的地址类型词和所述地址实体词,采用游标式边界策略获取标准化的地址数据;所述从所述第一字符串中提取与预设的地址类型词所对应的地址实体词,进一步包括:从所述第一字符串的第一位置开始,查找与所述预设的地址类型词对应的第一字符单元;将所述第一字符单元在所述第一字符串中的位置确定为第一地址实体词的右边界;在所述右边界和所述第一字符串的第一位置之间,查找所述第一地址实体词的左边界;将所述第一地址实体词的右边界和第一地址实体词的左边界中所包括的字符单元确定为第一地址实体词;将所述第一字符单元之后邻近的空格符号和或第二预设符号在所述字符串中的位置确定为所述第一字符串的第一位置。
全文数据:
权利要求:
百度查询: 北京四维图新科技股份有限公司 地址标准化处理方法、装置、设备及在线搜索系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。