【发明授权】一种融合多层次信息的海关同义词识别方法_大连大学_202111045198.1

导航：龙图腾网> 最新专利技术> 一种融合多层次信息的海关同义词识别方法_大连大学_202111045198.1

申请/专利权人：大连大学

申请日：2021-09-07

公开（公告）日：2024-02-13

公开（公告）号：CN113779196B

主分类号：G06F16/33

分类号：G06F16/33;G06F40/211;G06F40/247;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.02.13#授权;2021.12.28#实质审查的生效;2021.12.10#公开

摘要：本发明公开了一种融合多层次信息的海关同义词识别方法，包括：步骤1：将相同商品的所述要素短语作为同义词集合，获取多组同义词集合形成同义词识别的数据集；步骤2：将同义词集合进行向量编码转换，采用word2vec模型提取所述数据集中同义词的词向量特征，通过sentence‑BERT模型提取所述数据集中同义词的句向量特征；步骤3：把词向量特征和所述句向量特征分别送入双通道CNN层中进行特征提取，同时利用BiLSTM+attention网络提取所述同义词的语序信息和关键词信息；步骤4：将语序信息和关键词信息对应的特征进行拼接，再与BiLSTM+attention网络的输出层拼接，送入softmax层进行训练分类，得到同义词类别。本发明解决了同类商品要素短语稀疏造成的同义词识别困难问题，提高了同义词识别的准确率。

主权项：1.一种融合多层次信息的海关同义词识别方法，其特征在于，包括：步骤1：从海关进出口商品申报文本中提取描述商品属性的要素短语，将相同商品的所述要素短语作为同义词集合，获取多组所述同义词集合形成同义词识别的数据集；步骤2：将所述同义词集合进行向量编码转换，采用word2vec模型提取所述数据集中同义词的词向量特征，通过sentence-BERT模型提取所述数据集中同义词的句向量特征；步骤3：把所述词向量特征和所述句向量特征分别送入双通道CNN层中进行特征提取，同时利用BiLSTM+attention网络提取所述同义词的语序信息和关键词信息；步骤4：将所述语序信息和关键词信息对应的特征进行拼接，再与BiLSTM+attention网络的输出层拼接，送入softmax层进行训练分类，得到同义词类别；所述步骤2具体实现方式包括：步骤21.对所述同义词集合进行预处理，包括：去除特殊字符、停用词、否定词、异义词和全角半角转换；步骤22.制作句向量sentence-BERT的训练集；步骤23.采用中文预训练模型作为编码器构建sentence-BERT模型，设置最大句长为256维，超过部分将被截断，在池化层mean-pooling后加入一个512维的全连接层用来微调fine-tune，损失函数为Tanh，所述sentence-BERT模型训练输入两个句子，并根据实际两个句子的接近程度输出两个句向量表示，采用均方误差作为损失函数如公式1所示：其中，yi是预测标签，是实际标签，N为总样本数；其次将同义词批量送入word2vec模型进行训练；故分别生成sentence-BERT同义词句向量信息和word2vec词嵌入信息；所述步骤3具体实现方式包括：步骤31.将sentence-BERT同义词句向量信息和word2vec词嵌入信息分别输入到textCNN两个通道作为输入，每个通道包含了3组不同大小的卷积核，计算公式如2所示；其中，表示网络l层对第j个神经元的激活值，f为激活函数relu，为第i个特征值和当前层第j个特征值的卷积核，Mj为前一层特征数据集合，Bl为偏置项；所述步骤4具体实现方式包括：步骤41.BiLSTM+attention网络输出后的向量与通道卷积处理后的隐藏层向量进行拼接，构成了融合多层次信息的特征表示；如公式6所示，BiLSTM模型提取同义词的语序信息，输出的隐藏层向量经过attention层提取关键特征，输出后的向量w3与双通道卷积处理后的w2v、sber的隐藏层向量w1、w2进行拼接，送入到分类器softmax之前，经过dropout层随机遮盖10％的数值，得到最终融合三组特征向量的特征D；步骤42.将拼接后的特征D送入全连接层进行分类。

全文数据：

权利要求：

百度查询：大连大学一种融合多层次信息的海关同义词识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：智能手表的数据防丢失方法及装置_深圳叩鼎科技有限责任公司_202410121084.8

下一篇：一种数据传输系统及方法、电子设备和存储介质_摩尔线程智能科技(北京)有限责任公司_202410338917.6

相关技术

智能手表的数据防丢失方法及装置_深圳叩鼎科技有限责任公司_202410121084.8

一种数据传输系统及方法、电子设备和存储介质_摩尔线程智能科技(北京)有限责任公司_202410338917.6

车辆管理系统_日立建机株式会社_202280061821.9

一种新型大流量流量计设备_江苏沃得高新农业装备有限公司_202311847728.3

用于UV上光机网纹辊的均料装置_本溪九星印刷包装有限公司_202410212043.X

可变焦透镜控制装置、眼用透镜装置、眼镜、控制方法_威科申株式会社_202280061482.4

一种预制花瓶墩模板吊装装置及吊装方法_云南渝霖模板制造有限公司_202410341063.7

数据传输方法、装置以及系统_华为技术有限公司_202180102041.X

罗汉果植物类功能饮料及制备方法_益阳龙果饮料有限公司_202410193846.5

数据存储方法、装置、计算机设备和存储介质_腾讯科技(深圳)有限公司_202211239992.4

一种利用滇黄精薄层细胞的组织培养方法及其应用_中国科学院昆明植物研究所_202410024960.5

搪瓷搅拌釜修补方法及搪瓷搅拌釜_中国石油化工股份有限公司_202211253080.2

信息相关技术

信息处理装置，信息处理方法和程序_索尼公司_201880088308.2

信息加密、信息解密方法、装置、设备及存储介质_北京梧桐车联科技有限责任公司_202210185272.8

信息处理装置、以及信息处理方法_丰田自动车株式会社_202311377494.0

信息处理装置及信息处理方法_八乐梦床业株式会社_201980028963.3

信息上报方法、信息接收方法及相关设备_维沃移动通信有限公司_202010785776.4

信息处理装置、信息处理方法和程序_索尼集团公司_202280060724.8

信息处理装置、信息处理方法及程序_富士胶片株式会社_202280062805.1

信息处理装置、信息处理方法以及程序_索尼公司_201880088237.6

信息处理装置、信息处理方法和程序_索尼公司_201980072799.6

车载信息系统_本田技研工业株式会社_202110089091.0

同义词相关技术

关键词挖掘方法、装置、设备及存储介质_北京奇虎科技有限公司_202211268865.7

文本关键词扫描方法、装置、设备及计算机可读存储介质_深圳市房多多网络科技有限公司_202110038882.0

一种敏感词纠正方法、电子设备及存储介质_每日互动股份有限公司_202410104214.7

基于亚马逊平台关键词搜索广告排名监测的工具及方法_上海邑码信息科技有限公司_202410068899.4

一种用于图像中定位关键词的文本排序方法_广东西克智能科技有限公司_202310834541.3

搜索词包确定方法、装置、电子设备及存储介质_小红书科技有限公司_202410075515.1

基于关键词结构编码的涉案微博评价对象抽取方法_昆明理工大学_202111084571.4

基于布隆过滤器的模糊关键词公共审计方法_西南石油大学_202210924635.5

一种电商平台关键词搜索广告排名锁定系统及方法_上海邑码信息科技有限公司_202410068918.3

基于同态加密的多关键词匿踪查询方法、装置及系统_云阵(杭州)互联网技术有限公司_202410045962.2

海关相关技术

用于海关口岸的象牙及其制品快速初筛鉴定方法和系统_中国海关科学技术研究中心_202410184169.0

管理基于区块链的海关清关服务的用户权限_支付宝实验室(新加坡)有限公司_202080002161.8

海关视频监控自动化巡检方法_宁波北仑第三集装箱码头有限公司_202410126627.5

一种海关进出通道认证识别装置_扬州玖光软件开发有限公司_202322518449.4

一种海关核放单关联处理方法、装置及其存储介质_上海戊禾信息技术有限公司_202311848177.2

一种海关卫生检疫查验工作箱_常熟海关综合技术服务中心_202322382143.0

海关报关单的分类方法、装置、设备及存储介质_深圳市明心数智科技有限公司_202410226924.7

海关安检系统_同方威视技术股份有限公司_202311830286.1

一种海关用智慧仓储管理系统和方法_博诚经纬软件科技有限公司_202410190178.0

一种海关智能卡口设备_覃连备_202322272466.4

龙图腾网&IPTOP

【发明授权】一种融合多层次信息的海关同义词识别方法_大连大学_202111045198.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务