【发明公布】一种藏文分词与词性标注一体化方法及系统_西藏大学_202310921083.7

导航：龙图腾网> 最新专利技术> 一种藏文分词与词性标注一体化方法及系统_西藏大学_202310921083.7

申请/专利权人：西藏大学

申请日：2023-07-26

公开（公告）日：2024-02-13

公开（公告）号：CN117556814A

主分类号：G06F40/284

分类号：G06F40/284;G06F40/242;G06N3/08

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.03.01#实质审查的生效;2024.02.13#公开

摘要：本发明提出了一种藏文分词与词性标注一体化方法及系统，涉及电子信息领域。本发明提供的方法，通过获取用户输入藏文文本信息，调用一体化模型并切分藏文音节以及非藏文字符块，进行CRF预测，得到最优的标签预测，根据标签预测的结果整理各藏文音节的书写形式得到对应的标注结果。本申请中通过提出了建立对应的一体化模型，从而基于相应的一体化网络进行藏文分词和词性标注，与以往的方案相比，由于本申请中引入的一体化模型的整体性，因此避免了由于领域分词和词性标注任务按照两阶段执行，使得分词错误导致词性标注错误累加的问题，能更准确处理对应的藏文分词和词性标注，进一步增加了方案的实用性。

主权项：1.一种藏文分词与词性标注一体化方法，其特征在于，包括以下步骤：获取用户输入的待分词的藏文文本信息，并获取所述藏文文本信息每个藏文音节及对应的标签；调用一体化模型并采用音节点和Unicode编码切分所述藏文音节以及非藏文字符块并进行排序得到藏文序列，所述一体化模型为预先基于Conformer进行建立的藏文分词与词性标注学习模型；调取所述一体化模型对所述藏文序列以及对应的标签进行CRF预测，得到所述藏文序列中的各个藏文音节之间对应所述预测标签序列；根据所述预测标签序列整理各所述藏文音节的书写形式得到对应的标注结果。

全文数据：

权利要求：

百度查询：西藏大学一种藏文分词与词性标注一体化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：具有高吞吐量的多反射质谱仪_莱克公司_202011284023.1

下一篇：验证转化回传数据方法、装置、计算机设备和存储介质_上海数禾信息科技有限公司_202311042515.3

相关技术

具有高吞吐量的多反射质谱仪_莱克公司_202011284023.1

验证转化回传数据方法、装置、计算机设备和存储介质_上海数禾信息科技有限公司_202311042515.3

一种多功能模块化农村生活污水处理设备及处理方法_江苏大学_202211232661.8

一种焊剂片约束电弧焊焊接T型接头的夹具_兰州理工大学_201910643137.1

帏中香风味纸张的制备方法_扬州市祥华新材料科技有限公司_202211345365.9

一种降低冷轧轧制力的方法_首钢智新迁安电磁材料有限公司_202111360250.2

刷新注册的容错处理方法、装置、CSCF以及介质_中国电信股份有限公司_202010967419.X

一种含氟塑料加工助剂及其制备工艺_稷昶新材料科技(上海)有限公司_202311471760.6

一种带角度弹性垫圈的热处理方法及热处理装置_贵州航天精工制造有限公司_202111464284.6

用于控制空调的方法及装置、空调_青岛海尔空调电子有限公司_202210048335.5

一种基于计算机视觉的肺区区域分割系统_东莞理工学院_202210022595.5

面向建筑工地具体作业场景的施工适宜度气象预报方法_广东省气象服务中心(广东气象影视宣传中心)_202311186968.3

龙图腾网&IPTOP

【发明公布】一种藏文分词与词性标注一体化方法及系统_西藏大学_202310921083.7

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务