【发明公布】一种基于语义分析的海量文本检索匹配方法_浙江大学_202410386961.4

导航：龙图腾网> 最新专利技术> 一种基于语义分析的海量文本检索匹配方法_浙江大学_202410386961.4

申请/专利权人：浙江大学

申请日：2024-04-01

公开（公告）日：2024-05-03

公开（公告）号：CN117972025A

主分类号：G06F16/33

分类号：G06F16/33;G06F40/30;G06F16/35;G06F18/22

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.21#实质审查的生效;2024.05.03#公开

摘要：本发明属于文本检索匹配技术领域，具体涉及一种基于语义分析的海量文本检索匹配方法，通过从检索平台的关联知识库中筛选出符合当前输入请求问题主题词的备选文本数据，并对备选文本数据按照共性进行组集划分，进而依据共性特征分组进行文本预处理，实现了将海量文本检索效率提升落脚在文本预处理上，由此借由提高文本预处理效率来提高信息检索效率，并在预处理后对文本数据进行层级类型解析，进而依据层级类型选择适配相似度算法，从而由适配相似度算法对文本数据进行语义匹配，实现了文本匹配的针对性操作，不仅能够提高匹配准确性和适应性，还有助于提高匹配的效率和性能，并减少计算资源的消耗。

主权项：1.一种基于语义分析的海量文本检索匹配方法，其特征在于，包括以下步骤：S1、接收检索指令，并提取检索平台内当前输入的请求问题，并对请求问题进行主题词提炼；S2、将检索平台关联知识库中存储的各条文本数据标记的主题与请求问题的主题词进行比对，从中筛选出符合请求问题主题词的文本数据，作为备选文本数据；S3、将备选文本数据进行分组，得到若干组集，并对各组集进行共性特征标识；S4、按照各组集对应的共性特征对相应组集内的备选文本数据进行预处理，得到处理后各组集对应的备选文本数据；S5、获取各组集内各备选文本数据对应的内容可信性、上传时间和历史访问频繁度，由此确定各组集的文本匹配顺序；S6、对各组集内对应的备选文本数据进行层级类型解析，得到各条备选文本数据对应的层级类型；S7、基于各条备选文本数据对应的层级类型选取适配相似度算法；S8、依据各组集的文本匹配顺序依次调取相应组集内的备选文本数据，并将调取的备选文本数据利用适配相似度算法与请求问题进行文本匹配，得到各备选文本数据的语义相似度；S9、基于各组集内各备选文本数据的语义相似度选取请求问题对应的检索结果，并在检索输出框进行输出显示。

全文数据：

权利要求：

百度查询：浙江大学一种基于语义分析的海量文本检索匹配方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于扩散模型的图像版权保护方法_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202410287598.0

下一篇：焦化废水处理设备_河北协同水处理技术有限公司_202410304587.9

相关技术

一种基于扩散模型的图像版权保护方法_哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院)_202410287598.0

焦化废水处理设备_河北协同水处理技术有限公司_202410304587.9

一种基于改进卷积神经网络的多源卫星有效波高融合方法_南京信息工程大学_202410587251.8

一种评价输电线路钢管杆内部腐蚀行为的实验装置及方法_国网江苏省电力有限公司无锡供电分公司_202410305270.7

一种石英晶格杂质迁移路径和迁移速率的计算方法_武汉理工大学_202410307252.2

一种半球状钛合金工件内表面的激光加工方法及装置_华南理工大学_202410421480.2

一种适用于浆液输送的隔膜阀_蚌埠丹普新材料科技有限公司_202410440290.5

一种近场分层三维波束训练方法、系统、设备及存储介质_清华大学_202410230856.1

可灵活调节开度的套筒控制阀阀芯组件及开度调节方法_浙江大学_202410416156.1

核电厂中燃料相关组件的倒换序列确定方法、装置和设备_中广核核电运营有限公司_202410305204.X

一种层状双金属氢氧化物中空纳米笼催化剂及其制备方法和应用_中国科学院化学研究所_202410349525.X

一种FRP筋扩大锚固端头的现场成型装置及成型方法_长安大学_202410409745.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于语义分析的海量文本检索匹配方法_浙江大学_202410386961.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务