【发明授权】一种基于深度学习语义蕴含的商品检索方法及存储介质_福建博思软件股份有限公司_202210100876.8

申请/专利权人：福建博思软件股份有限公司

申请日：2022-01-27

公开（公告）日：2023-08-29

公开（公告）号：CN114510559B

主分类号：G06F16/332

分类号：G06F16/332;G06F18/2411;G06Q30/0601

优先权：

专利状态码：有效-授权

法律状态：2023.08.29#授权;2022.06.03#实质审查的生效;2022.05.17#公开

摘要：本发明涉及一种基于深度学习语义蕴含的商品检索方法及存储介质，包括以下步骤：对已经标注的商品信息进行数据规范化，得到商品信息的四元组信息；根据商品信息中的标题数据进行训练引入文本生成的商品检索模型；根据商品信息的四元组信息进行训练得到商品信息蕴含模型；对待检索商品通过商品检索模型进行商品召回，得到候选商品列表；将候选商品列表中的候选商品通过商品信息蕴含模型进行蕴含度计算，根据候选商品的蕴含度对候选商品进行排序。解决了双塔式模型缺少商品信息间交互的弊端，进一步提升了相似商品排序的精度，同时由于双塔式模型的召回，节省了大量的模型计算时间与设备成本。具有更好的鲁棒性、更快的速度以及更高的精度。

主权项：1.一种基于深度学习语义蕴含的商品检索方法，其特征在于，包括以下步骤：对已经标注的商品信息进行数据规范化，得到商品信息的四元组信息，所述四元组信息包括标题信息、属性信息、品牌信息及型号信息；根据商品信息中的标题数据进行训练引入文本生成的商品检索模型；根据商品信息的四元组信息进行训练得到商品信息蕴含模型；对待检索商品通过商品检索模型进行商品召回，得到候选商品列表；将候选商品列表中的候选商品通过商品信息蕴含模型进行蕴含度计算，根据候选商品的蕴含度对候选商品进行排序；所述步骤“对已经标注的商品信息进行数据规范化，得到商品信息的四元组信息”具体包括以下步骤：抽取已经标注的商品信息中的四元组信息作为训练数据；删除四元组信息中的无效字符，并将四元组信息的全角符号转换为半角符号，及大写字母转换为小写字符；按照预设概率删除商品信息中的属性信息中的品牌属性和型号属性；将不同来源的同一商品的四元组信息形成商品簇，所述商品簇的个数为商品的种类个数；所述步骤“根据商品信息中的标题数据进行训练引入文本生成的商品检索模型”具体包括以下步骤：商品检索模型使用第一语义表征模型作为第一主干网络，选取预设个数商品簇，从选取的每个商品簇内随机得到两个标题信息作为商品检索模型的输入；将选取的每个商品簇内的两个标题信息以不同的顺序送入第一主干网络中，训练seq2seq任务；提取第一主干网络的整个Batch的所有标识向量，并做L2归一化处理，接着将提取的所有标识向量进行两两做内积，训练分类任务；将seq2seq任务部分和分类任务部分的交叉熵求和作为总的损失函数，在第一主干网络的每个步骤中更新参数；所述步骤“根据商品信息的四元组信息进行训练得到商品信息蕴含模型”具体包括以下步骤：商品信息蕴含模型以第二语义表征模型作为第二主干网络，训练蕴含任务；在每个商品簇内重复随机选取成对的第一商品和第二商品，将第一商品的四元组信息和第二商品的四元组信息进行组合得到作为训练数据的第一正例数据；对第一正例数据进行数据增强得到第二正例数据；从不同的商品簇内随机选择第三商品和第四商品，将第三商品的四元组信息和第四商品的四元组信息进行组合得到作为训练数据的第一负例数据；对第一正例数据、第二正例数据及第一负例数据进行数据增强得到第二负例数据；通过将第一正例数据和第二正例数据的标签为1，第一负例数据和第二负例数据的标签为0，通过交叉熵损失训练二分类任务。

全文数据：

权利要求：

百度查询：福建博思软件股份有限公司一种基于深度学习语义蕴含的商品检索方法及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于公路施工的防撞装置_江苏常鑫路桥集团有限公司_202322375940.6

下一篇：一种用于UV打印机的厚度调节机构_江苏绘智数码科技有限公司_202322395411.2

相关技术

一种用于公路施工的防撞装置_江苏常鑫路桥集团有限公司_202322375940.6

一种用于UV打印机的厚度调节机构_江苏绘智数码科技有限公司_202322395411.2

一种机制砂破碎设备_河北雄安安好信息科技有限公司_202322563163.8

一种新型岩土岩溶处理注浆装置_中建二局土木工程集团有限公司_202322517352.1

一种房屋建设排水结构_安徽春源建设工程有限公司_202322621808.9

一键式智能配茶机_上海嘻粒粒食品科技有限公司_202322460102.9

微光与长波红外双波段共口径光学系统_烟台艾睿光电科技有限公司_202322432284.9

一种畜牧用定量自动配比喂料装置_金阳县农业农村局_202322376066.8

一种水泥搅拌机防尘装置_安徽卓恰建筑科技有限公司_202322417695.0

一种熔体滤芯圆周端面焊接装置_河南省菲优特过滤设备有限公司_202322606165.0

一种废钢回收筛选设备_十堰市再生资源有限公司_202322399164.3

一种用于IGBT焊接的移动载具_无锡骄成智能科技有限公司_202322451811.0

商品相关技术

商品采购的动态调整方法、装置和存储介质_武汉市驿宝通网络科技有限公司_202410171078.3

商品管控方法、装置、电子设备及介质_杭州海亮优教教育科技有限公司_202310882532.1

一种干商品砼的拌制装置_宜昌鑫之润新型材料有限公司_202322519438.8

一种大宗商品外部风险评估方法_中国科学院城市环境研究所_202410259590.3

一种定量包装商品称重装置_山东省计量科学研究院_202322709646.4

一种二手商品集散系统、方法、计算设备及存储介质_转转一零二四(北京)科技有限公司_202310118097.5

一种C30商品混凝土快速浇筑平台_佛山市新利海混凝土有限公司_202322570318.0

基于遗传算法的加氢站备件商品陈列方法及存储介质_陕西黑石绿能能源科技有限公司_202410354053.7

一种基于节点类型交互的商品推荐方法及系统_山东大学_202210674885.8

一种C50商品混凝土抗折试验机_佛山市新利海混凝土有限公司_202322704187.0

蕴含相关技术

用于解决多轮对话中训练数据蕴含实体标注冲突的方法_神思电子技术股份有限公司_202311740183.6

动词短语蕴含图谱的构建方法及相关设备_腾讯科技(深圳)有限公司_202011083727.2

一种多模态双向蕴含社交网络虚假消息验证的方法及装置_之江实验室_202311656866.3

一种基于词典的文本蕴含式生物医学命名实体识别方法_杭州电子科技大学_202311018938.1

一种蕴含多主体的关联风险识别方法及装置_中科智禾数字科技(山东)有限公司_202311033663.9

基于文本蕴含的无触发词文本事件检测方法及系统_内蒙古大学_202211381659.7

一种基于文本蕴含的跨域新闻推荐系统及推荐方法_人民网股份有限公司_202310718242.3

一种基于文本蕴含识别模型的零样本事件检测方法_华南理工大学_202310611910.2

基于蕴含逻辑的自容错忆阻存储器单元纠错方法_苏州大学_202011228067.2

一种基于深度学习语义蕴含的商品检索方法及存储介质_福建博思软件股份有限公司_202210100876.8

检索相关技术

基于注释的视频检索方法、装置、系统及介质_江苏瑞宁信创科技有限公司_202410112318.2

图像检索方法、装置、存储介质及电子设备_深圳TCL新技术有限公司_202410222358.2

一种代码依赖的检索方法_佛山科学技术学院_202410169022.4

一种文档检索方法、装置及相关设备_北京中关村科金技术有限公司_202410068758.2

医疗数据检索方法、装置及相关设备_吉林大学第一医院_202410282995.9

基于AIGC的检索引导方法及装置_广东省电信规划设计院有限公司_202410032623.0

文档检索方法以及自动问答方法_阿里云计算有限公司_202410050556.5

一种基于人工智能的组合检索优化方法及系统_广州敏行数字科技有限公司_202410125203.7

生成倒排索引和用倒排索引检索的方法、系统及存储介质_北京小度互娱科技有限公司_201810813522.1

一种目标检索方法、装置、终端及计算机可读存储介质_浙江大华技术股份有限公司_202410006474.0

龙图腾网&IPTOP

【发明授权】一种基于深度学习语义蕴含的商品检索方法及存储介质_福建博思软件股份有限公司_202210100876.8

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务