【发明公布】一种结合噪声过滤和分治策略的长文本匹配方法_中国科学院深圳先进技术研究院_202311202254.7

申请/专利权人：中国科学院深圳先进技术研究院

申请日：2023-09-18

公开（公告）日：2023-12-12

公开（公告）号：CN117216189A

主分类号：G06F16/33

分类号：G06F16/33;G06F18/22;G06F40/289;G06F40/30;G06F18/214

优先权：

专利状态码：在审-实质审查的生效

法律状态：2023.12.29#实质审查的生效;2023.12.12#公开

摘要：本发明公开了一种结合噪声过滤和分治策略的长文本匹配方法。该方法包括：构建长文本匹配模型，所述长文本匹配模型包含关键词抽取层、关联抽取层和过滤层，其中关键层抽取层用于提取文本中的关键词，过滤层用于基于句子之间的相似度过滤文本中的噪声，获得去噪的文本序列，关联抽取层用于从去噪的文本序列中再去除关键词，获得剩余的关联文本；以设定的总体损失函数最小化作为优化目标训练所述长文本匹配模型，所述损失函数反映全局匹配分布并联合了关键词与关联匹配分布；针对目标文本，利用经训练的所述长文本匹配模型进行实时的文本匹配。本发明提升了文本匹配的泛化能力和精确度。

主权项：1.一种结合噪声过滤和分治策略的长文本匹配方法，包括以下步骤：构建长文本匹配模型，所述长文本匹配模型包含关键词抽取层、关联抽取层和过滤层，其中关键层抽取层用于提取文本中的关键词，过滤层用于基于句子之间的相似度过滤文本中的噪声，获得去噪的文本序列，关联抽取层用于从去噪的文本序列中再去除关键词，获得剩余的关联文本；以设定的总体损失函数最小化作为优化目标训练所述长文本匹配模型，所述损失函数反映全局匹配分布并联合了关键词与关联匹配分布；针对目标文本，利用经训练的所述长文本匹配模型进行实时的文本匹配。

全文数据：

权利要求：

百度查询：中国科学院深圳先进技术研究院一种结合噪声过滤和分治策略的长文本匹配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于红外检测技术的探测装置及使用方法_黎明职业大学_201911007934.7

下一篇：基于对抗样本的人体康复运动数据增强方法_大连海事大学_202110864746.7

相关技术

一种基于红外检测技术的探测装置及使用方法_黎明职业大学_201911007934.7

基于对抗样本的人体康复运动数据增强方法_大连海事大学_202110864746.7

一种弱监督云检测方法_安徽大学_202310764234.2

具有高吞吐量的多反射质谱仪_莱克公司_202011284023.1

一种基于动网格模拟隧道列车运动的结构网格划分方法_天津大学_202111426137.X

一种降低冷轧轧制力的方法_首钢智新迁安电磁材料有限公司_202111360250.2

一种焊枪铜线的自动夹扣装置_温州技师学院_201910988267.9

RS485总线中多传感器编址方法、数据采集设备和系统_广州鲁邦通物联网科技股份有限公司_202011486283.7

一种乘用车极限强度冲击试验平台辅助装置_中汽研汽车试验场股份有限公司_201911236112.6

一种带有环状槽的齿轮制备模具_蓝山县金山川粉末冶金有限公司_202111384059.1

基于无监督学习的多视角显著性估计方法_西北工业大学_202011250827.X

移动式组合盐水分离系统_大连盐化集团有限公司_202111204431.6

龙图腾网&IPTOP

【发明公布】一种结合噪声过滤和分治策略的长文本匹配方法_中国科学院深圳先进技术研究院_202311202254.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务