买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于词向量表达和余弦相似度的银行全称快速匹配方法_民生科技有限责任公司_201910851391.0 

申请/专利权人:民生科技有限责任公司

申请日:2019-09-10

公开(公告)日:2022-05-10

公开(公告)号:CN110598066B

主分类号:G06F16/903

分类号:G06F16/903;G06Q40/02

优先权:

专利状态码:有效-授权

法律状态:2022.05.10#授权;2020.01.14#实质审查的生效;2019.12.20#公开

摘要:本发明提供了一种基于词向量表达和余弦相似度的银行名称快速匹配方法,所述快速匹配方法将银行名称库作为训练集,通过对训练集进行训练,获取词向量矩阵和训练模型,随后对需要匹配的银行名称进行切分和词向量处理,最后基于余弦相似度的计算方法,将需要检索的词向量处理结果与词向量矩阵转置相乘,以相乘后的矩阵每一行最大值结果,结合检索的词与训练模型中的比对结果,获取银行名称,为了提高速度,转化成矩阵相乘与2进程同时计算,最终可以达到2000条2s的速度;每一行为一个输入与银行库中记录的结果,词向量之间的余弦相似度,通过矩阵运算,大大减小了使用循环的速度。

主权项:1.一种基于词向量表达和余弦相似度的银行全称快速匹配方法,其特征在于,所述快速匹配方法将银行全称库处理,得到训练集,通过对训练集进行训练,获取词向量矩阵和训练模型,随后对需要匹配的银行全称进行切分和词向量处理,最后基于余弦相似度的计算方法,将需要检索的词向量处理结果与词向量矩阵转置相乘,以相乘后的矩阵每一行最大值结果,结合匹配的银行全称与训练模型中的比对结果,获取银行全称;所述快速匹配方法包括:S1:对银行全称库进行去词、切分和组合处理,获取训练集;S2:对训练集进行词向量处理,获取训练集的tf-idf词向量矩阵,并每行做标准化处理,同时保存tf-idf词向量矩阵和训练模型;S3:输入需要匹配的银行全称并对其进行去词、切分和组合处理,获得多个“2字词组”,并将去词、切分和组合处理后的银行全称以及多个“2字词组”转换为一个字符串,最后将字符串转化成tf-idf词向量;S4:将S3中转化的tf-idf词向量与S2中训练集的tf-idf词向量矩阵的转置相乘,根据相乘后的矩阵结果,选择每一行中最大值的位置对应的银行全称作为输出最终结果。

全文数据:

权利要求:

百度查询: 民生科技有限责任公司 基于词向量表达和余弦相似度的银行全称快速匹配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。