买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种面向英文写作辅助的语义匹配方法及装置_兰雨晴_201911063163.3 

申请/专利权人:兰雨晴

申请日:2019-10-31

公开(公告)日:2024-05-03

公开(公告)号:CN112749566B

主分类号:G06F40/30

分类号:G06F40/30;G06F18/214;G06F18/22;G06N3/0442;G06N3/0985

优先权:

专利状态码:有效-授权

法律状态:2024.05.03#授权;2021.06.04#实质审查的生效;2021.05.04#公开

摘要:本发明涉及一种面向英文写作辅助的语义匹配方法及装置,所述匹配方法包括如下步骤:步骤S1:构建例句语料库;步骤S2:构建语义匹配模型训练数据集;步骤S3:构建多视角注意力机制的语义匹配模型;步骤S4:训练语义匹配模型。本发明提供的面向英文写作辅助的语义匹配方法及装置,在几个公开语义匹配数据集上均取得显著效果,能够提取更丰富交互匹配信息,更好的捕捉句子对之间联系与区别,更好地得到全局匹配信息,在文本匹配相关领域有很大的应用前景。

主权项:1.一种面向英文写作辅助的语义匹配方法,其特征在于,包括如下步骤:步骤S1:构建例句语料库;步骤S2:构建语义匹配模型训练数据集;步骤S3:构建多视角注意力机制的语义匹配模型;步骤S4:训练语义匹配模型;所述步骤S3包括:步骤S31:构建字符映射转换表,建立每个单词或标点符号与数字ID的对应关系;步骤S32:利用映射转换表将输入的字符转化为对应的数字ID;步骤S33:利用数字ID得到每个单词的词向量,将两个句子以二维张量表示;步骤S34:使用一个共享权重的双向LSTM对两个句子分别进行编码,利用上下文信息将两个句子映射到相同向量空间,从而得到更准确的词向量表示;步骤S35:利用精确匹配信号、原始词向量以及编码之后的词向量构建句子对的匹配矩阵;原始词向量匹配矩阵与编码后的词向量匹配矩阵均使用两个语句各个位置词向量进行点乘运算,用来衡量语义相似;之后,利用1x1卷积运算将三个匹配矩阵作为三个输入通道对特征进行整合,相当于对每种类型的词匹配信息进行加权,通过多个视角得到最终的匹配矩阵;将匹配矩阵的值作为表示词重要性的权重,利用基于注意力机制的软对齐方法,将两个句子分别表示为与另一个句子等长的二维张量,即利用q通过注意力加权得到利用p通过注意力加权得到然后分别对得到的两对等长二维张量通过向量减法和按元素相乘提取匹配特征;具体公式如下:其中,公式1表示向量点乘生成注意力权重;公式2,3表示利用基于注意力机制的软对齐方法,将两个句子分别表示为与另一个句子等长的二维张量;公式4,5表示对得到的两对等长二维张量通过向量减法和按元素相乘提取匹配特征; 其中,e表示对应位置的注意力权重,利用softmax函数对权重进行归一化,变为概率形式;和表示基于注意力机制生成的软对齐向量,mp,mq表示提取的匹配特征,⊙表示Element-WiseMultiplication运算;表示将前向及后向拼接得到的时间步i最终向量表示;表示对输入q采取的同样操作;步骤S36:利用双向LSTM对两对匹配特征不同位置的特征结合上下文进行编码分别得到vp和vq,然后利用最大池化和注意力加权池化对特征进行融合;将两部分匹配特征按相同维度拼接合并到一起;如下公式表示利用最大池化提取特征: 注意力加权池化的计算过程如下:其中,W为可学习参数, 对于输入q,采用相同的注意力加权池化得到vq,attn;下式表示匹配特征拼接过程:v=[vp,max,;vp,attn;vq,max;vq,attn]9步骤S37:利用多层感知机MLP对特征进一步编码整合,输出最终的语义匹配结果。

全文数据:

权利要求:

百度查询: 兰雨晴 一种面向英文写作辅助的语义匹配方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。