【发明授权】利用局部多头注意力机制融合词-音节对的泰文和缅甸文词性标注方法_昆明理工大学_202111078804.X

申请/专利权人：昆明理工大学

申请日：2021-09-15

公开（公告）日：2022-12-13

公开（公告）号：CN113901210B

主分类号：G06F16/35

分类号：G06F16/35;G06F40/284;G06N3/04;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2022.12.13#授权;2022.01.25#实质审查的生效;2022.01.07#公开

摘要：本发明涉及利用局部多头注意力机制融合词‑音节对的泰文和缅甸文词性标注方法，属自然语言处理领域。本发明包括：预处理泰文或者缅甸文文本数据集；使用窗口化的方式选择词语‑音节对特征作为模型输入；之后利用局部多头注意力机制从词语‑音节对序列中学习上下文特征；最后通过条件随机场建模词性依赖关系，进行词性标签的预测。针对泰文和缅甸文词性标注数据集的实验结果表明，与当前最优模型相比，本发明将音节作为词语的形态学特征进行融入，有助于学习未知词的上下文特征，缓解未知词错误标注对模型性能的影响。并且本发明采用局部多头自注意力机制可以使模型获取更丰富的局部依赖特征，在词性标注任务中取得更好的标注结果。

主权项：1.利用局部多头注意力机制融合词-音节对的泰文和缅甸文词性标注方法，其特征在于：所述方法的具体步骤如下：Step1、对泰文文本数据集或者缅甸文数据集进行文本预处理，通过对句子中的每个词语进行音节切分找到词语中潜在的词缀信息，从而将单词序列扩展为词-音节对的序列；Step2、通过滑动窗口的方式从经过Step1预处理过的数据中依次得到包含n个词语-音节对信息的输入，利用局部多头注意力机制对词语-音节对进行特征编码，然后通过拼接Transformer编码器的输出特征和音节嵌入得到输入的n-gram的预测的共享特征；Step3、最后通过条件随机场建模词性依赖关系，进行词性标签的预测；所述步骤Step1的具体步骤为：Step1.1、根据泰文文本中用“\n”划分的词汇，针对训练集构建词语字母表和词性标签字母表；Step1.2、调用泰文或者缅甸文音节切分器对文本中的词语进行音节切分，构建音节字母表；Step1.3、随后，对于每一个词语，为它分配它所包含的音节；其中对于音节，只截取组成每个单词的前缀音节和后缀音节作为输入；如果存在某些由单音节构成的单词，那么将对该音节进行”PAD”操作作为补充，使输入的音节向量完整；所述步骤Step2的具体步骤如下：Step2.1、编码层将n-gram的单词嵌入和它相对应的音节嵌入的拼接作为编码器的输入，输入的n-gram矩阵表示为： Step2.2、编码器的多头注意力层将查询和一组键值对映射到输出；给定一个序列的向量单头注意力将X投影到三个不同的矩阵：Q矩阵为K矩阵为V矩阵为注意力权值是通过计算句子中每个单词的点积注意力得到的，最后的分数是这些值的加权和；Q,K,V＝XWQ,XWK,XWV2 其中矩阵是可学习的参数，dk为模型的嵌入层的输出向量的维度大小，该因子是为了调节Q和KT的内积大小，以防止过大的内积经过softmax后向量分布不均匀；softmax使比例值归一化；Step2.3、多头注意力层Multi-Head是由多个注意力层拼接组成；MultiHeadQ,K,V＝[Att1,Att2,...,Atth]，4Step2.4、前馈神经网络层是由两个线性层串行连接而成，线性层它们具有独立的权重和偏差，而且维度也不相同，能够进一步提取语义信息；Z＝layer-normX+MultiHeadX，5FFNZ＝ReLUW1Z+b1W2Z+b2，6其中的layer-norm·表示归一化层，FFN表示FeedForwardNetwork层，W1,b1,W2,b2是投影参数，Z表示的是归一化层的输出；Step2.5、在前馈神经网络层之后再使用归一化层得到编码器块的输出oi；然后通过拼接Transformer编码器的输出特征和音节嵌入得到输入的n-gram的预测的共享特征，最后经过多层感知机MLP得到一个向量

全文数据：

权利要求：

百度查询：昆明理工大学利用局部多头注意力机制融合词-音节对的泰文和缅甸文词性标注方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种试管收纳装置_重庆优希贝乐生物科技有限公司_202322397939.3

下一篇：一种污水处理用药剂投放机_常州市尚明环保科技有限公司_202322438903.5

相关技术

一种试管收纳装置_重庆优希贝乐生物科技有限公司_202322397939.3

一种污水处理用药剂投放机_常州市尚明环保科技有限公司_202322438903.5

一种橡胶注射成型机_航大电气有限公司_202322534855.X

硅片切割液用灌装装置_常州高特新材料股份有限公司_202322580218.6

一种新型船舶热交换器_南通海利源船舶设备工程有限公司_202322457448.3

一种沙发布料裁剪台_阜阳市坤森特家居有限公司_202322416271.2

一种建筑施工场地用废水处理装置_合肥翊安建筑工程有限公司_202322586658.2

一种具有伸缩式笔盖功能的硅胶笔_富东新材料科技(东莞)有限公司_202322580378.0

一种提高密封性能的轴承_杭州星淼机械有限公司_202322592333.5

微光与长波红外双波段共口径光学系统_烟台艾睿光电科技有限公司_202322432284.9

一种面膜膜袋压爆检测机构_苏州安特化妆品股份有限公司_202322566136.6

一种基于电调滤波器结构的增强型数字调频接收机电路_四川九洲电器集团有限责任公司_202322634610.4

机制相关技术

一种机制砂生产系统_云南凯瑞特工程机械设备有限公司_202311363882.3

一种机制砂破碎设备_河北雄安安好信息科技有限公司_202322563163.8

多功能制粒机制粒辊_辽宁新牧源农业装备机械有限公司_202410278084.9

具有安全机制的设备及其操作方法_美光科技公司_202010631465.2

一种机制砂泡沫混凝土及其制备方法_中建西部建设新疆有限公司_202410104147.9

一种机制沙翻沙装置_靖安县宏发石料有限责任公司_202410180562.2

滚筒式高品质机制砂整形机_浙江沙王建材有限公司_202322566068.3

一种基于引导机制的二阶段局部生成式摘要方法_西南石油大学_202410348190.X

自触发采样机制下的高速列车扩展耗散性能分析方法_西南交通大学_202311686062.8

基于DPoS共识机制与秘密共享的多方监管系统_重庆邮电大学_202410041345.5

缅甸相关技术

基于RPA技术检测缅甸蟒的引物探针组合、试剂盒及方法_上海海洋大学_202311710140.3

基于缅甸语字符簇特征的缅甸语文本图像识别方法及装置_小语智能信息科技(云南)有限公司_202311220038.5

缅甸语语音识别纠错方法与装置_昆明理工大学_202311148154.0

基于缅甸语字符簇特征的缅甸语文本图像识别方法及装置_小语智能信息科技(云南)有限公司_202311220038.5

融合双重注意力机制的缅甸语图像文本识别方法及装置_小语智能信息科技(云南)有限公司_202211242041.2

一种促进缅甸树萝卜扦插生根的方法_中国科学院西双版纳热带植物园_202211248374.6

融合双重注意力机制的缅甸语图像文本识别方法及装置_小语智能信息科技(云南)有限公司_202211242041.2

利用局部多头注意力机制融合词-音节对的泰文和缅甸文词性标注方法_昆明理工大学_202111078804.X

基于知识蒸馏的缅甸语OCR方法_昆明理工大学_202010978722.X

基于多解码器联合学习的缅甸语图像文本识别方法及装置_小语智能信息科技(云南)有限公司_202111214739.9

泰文相关技术

一种文创产品的展示装置_张慧_202322594673.1

一种轴向文丘里阀_弗勒锑克(广东)工程设备有限公司_202322635317.X

一种文氏管旋流塔_新疆天骏能源发展有限公司_202322332114.3

一种三文鱼加工柔性智能生产线_新疆天蕴有机农业有限公司_202211265090.8

基于LWR的无密文扩展的多密钥全同态加密方法及系统_重庆大学_202410112370.8

冰鲜三文鱼去内脏原鱼制备及其保鲜技术_新疆天蕴有机农业有限公司_202211265089.5

一种文丘里式二氧化碳辅助飞灰脱氯装置_江苏省环境工程技术有限公司_202322577514.0

基于同态加密和树结构的多关键词密文搜索方法及系统_山东大学_202310123303.1

一种语义理解的密文空间关键字检索方法及系统_西安电子科技大学_202011135390.5

用于治疗克莱恩-莱文综合症的贝尼丁，哌啶，2-二苯甲基-3-羟基-N-甲基-，盐酸盐及其衍生物_NLS制药股份公司_202280058072.4

龙图腾网&IPTOP

【发明授权】利用局部多头注意力机制融合词-音节对的泰文和缅甸文词性标注方法_昆明理工大学_202111078804.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务