【发明授权】不同文档中相关句子的匹配方法、系统和计算机可读存储介质_达观数据有限公司_202010559644.X

申请/专利权人：达观数据有限公司

申请日：2020-06-18

公开（公告）日：2024-05-17

公开（公告）号：CN112380830B

主分类号：G06F40/194

分类号：G06F40/194;G06F40/216

优先权：

专利状态码：有效-授权

法律状态：2024.05.17#授权;2024.04.23#著录事项变更;2021.03.09#实质审查的生效;2021.02.19#公开

摘要：本发明公开了一种不同文档中相关句子的匹配方法，用于将基准文档中的基准句子和比对文档中的候选句子进行匹配，所述匹配方法包括：在浅层语义、统计信息、深层语义三个层面上，计算候选句子相对于基准句子的表示匹配程度的浅层分数、统计分数、深层分数；基于线性回归模型拟合所述浅层分数、统计分数和深层分数，获得用来表示所述候选句子相对于基准句子的匹配度的最终分数。本发明提高文档匹配准确性。

主权项：1.一种不同文档中相关句子的匹配方法，用于将基准文档中的基准句子和比对文档中的候选句子进行匹配，其特征在于，所述匹配方法包括：在浅层语义、统计信息、深层语义三个层面上，计算候选句子相对于基准句子的表示匹配程度的浅层分数、统计分数、深层分数；基于线性回归模型拟合所述浅层分数、统计分数和深层分数，获得用来表示所述候选句子相对于基准句子的匹配度的最终分数；所述浅层语义的获取包括三个平行指标的获取，所述平行指标分别为：字符、分词、主干成分；所述浅层分数的计算方法包括：分别获取基准句子中的字符、分词、主干成分在候选句子中的召回率；以召回率构成第一向量作为浅层分数。

全文数据：

权利要求：

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：灰度图像映射的恶意代码检测方法、系统、存储介质及计算机设备_三六零数字安全科技集团有限公司_202211559178.0

下一篇：多体制兼容调制发射装置_中国科学院上海光学精密机械研究所_202410054196.6

相关技术

灰度图像映射的恶意代码检测方法、系统、存储介质及计算机设备_三六零数字安全科技集团有限公司_202211559178.0

多体制兼容调制发射装置_中国科学院上海光学精密机械研究所_202410054196.6

一种捕获大气中二氧化碳的气肥增施变电吸附组件及其应用_大连理工大学_202410350057.8

一种石化储油罐安装过程防漏检测方法、介质及系统_中建安装集团有限公司_202410282425.X

一种用于缝纫机梭芯套的表面打磨工艺_宁波鸿云精密机械有限公司_202210483579.6

图像处理方法、图像处理装置、电子设备及存储介质_OPPO广东移动通信有限公司_202211552155.7

训练数据的生成方法、装置、电子设备和存储介质_OPPO广东移动通信有限公司_202211499299.0

一种地参咀嚼片及其制备方法_贵州食品工程职业学院_202410334993.X

一种类风湿性关节炎的评价方法及其应用_成都华西海圻医药科技有限公司_202311808485.2

高固含量氧化铝陶瓷造粒粉及其制备方法_重庆臻宝科技股份有限公司_202410217766.9

一种二维材料的介孔包覆壳层构筑方法_同济大学_202410220352.1

一种基于RTP的数据传输方法、装置、设备和介质_深圳智慧林网络科技有限公司_202210520562.3

相关技术

相关技术

相关技术

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】不同文档中相关句子的匹配方法、系统和计算机可读存储介质_达观数据有限公司_202010559644.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务