买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于人工智能的短文本匹配方法、装置、设备及存储介质_中国平安财产保险股份有限公司_202010930286.9 

申请/专利权人:中国平安财产保险股份有限公司

申请日:2020-09-07

公开(公告)日:2024-04-26

公开(公告)号:CN112085091B

主分类号:G06F18/22

分类号:G06F18/22;G06F40/30;G06F40/194;G06F40/216;G06N3/0455;G06N3/088

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2021.10.01#实质审查的生效;2020.12.15#公开

摘要:本申请涉及人工智能技术领域,揭露一种基于人工智能的短文本匹配方法、装置、设备及存储介质,其中方法包括将获取的第一短文本和第二短文本进行拼接,得到初始文本,并通过BERT模型对初始文本进行编码,得到初始向量,然后通过初始向量降维处理,得到目标向量,再通过计算第一短文本和第二短文本的文本相似度;再将目标向量和文本相似度值进行拼接,得到新的向量,并将其输入到DCN模型进行训练,对训练结果进行概率计算,得到预测概率;若预测概率大于预设阈值,则确认第一短文本和第二短文本的短文本语义匹配成功。本申请还涉及区块链技术,初始文本存储于区块链中。本申请通过对短文本进行精准分析,以提高短文本语义匹配的准确度。

主权项:1.一种基于人工智能的短文本匹配方法,其特征在于,包括:获取第一短文本和第二短文本,将所述第一短文本和所述第二短文本进行拼接,得到初始文本;通过BERT模型对所述初始文本进行编码,得到所述初始文本的初始向量;采用深度神经网络对所述初始向量进行降维处理,得到目标向量;通过预设的相似度计算方式,计算所述第一短文本和所述第二短文本的文本相似度,得到文本相似度值,所述文本相似度值包括第一文本相似度值、第二文本相似度值以及第三文本相似度值;将所述目标向量和所述文本相似度值进行拼接,得到新的向量,并将所述新的向量输入到DCN模型进行向量计算,得到输出向量;对所述输出向量进行加权求和,得到结果向量,并对所述结果向量进行Sigmoid函数计算,得到预测概率;若所述预测概率大于预设阈值,则确认所述第一短文本和所述第二短文本的短文本语义匹配成功;所述通过预设的计算方式,计算所述第一短文本和所述第二短文本的文本相似度,得到文本相似度值的步骤,具体包括:对所述第一短文本和第二短文本进行分词处理,得到第一分词和第二分词;统计所述第一分词和第二分词的词频,得到第一分词频率和第二分词频率;对所述第一分词频率和所述第二分词频率进行向量化处理,得到第一分词向量和第二分词向量;计算所述第一分词向量和所述第二分词向量的余弦相似度值,得到所述第一文本相似度值;对所述第一短文本和所述第二短文本进行分词处理,并删除分词处理后第一短文本和第二短文本的停用词,得到第三分词和第四分词;统计第三分词和第四分词的转移代价,并将所述转移代价进行累加,得到累加值,其中,转移代价为分词的向量距离乘以分词的移动距离;将数值最小的累加值作为所述第二文本相似度值;对所述第一短文本进行分词处理,得到第五分词,并对所述第五分词进行语素分析,得到每个第五分词的语素;通过对所述每个第五分词的语素添加预设权重,并按照所述预设权重,计算所述每个第五分词与所述第二短文本的相关性得分;将所述相关性得分进行加权求和后,得到所述第三文本相似度值。

全文数据:

权利要求:

百度查询: 中国平安财产保险股份有限公司 基于人工智能的短文本匹配方法、装置、设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。