【发明授权】针对多语种的语句困惑度获取方法、系统及相关设备_粤港澳大湾区数字经济研究院(福田)_202211131283.4

申请/专利权人：粤港澳大湾区数字经济研究院(福田)

申请日：2022-09-16

公开（公告）日：2023-07-18

公开（公告）号：CN115587589B

主分类号：G06F40/289

分类号：G06F40/289;G06F40/242;G06F16/31;G06N3/048;G06N3/0455;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2023.07.18#授权;2023.01.31#实质审查的生效;2023.01.10#公开

摘要：本发明公开了针对多语种的语句困惑度获取方法、系统及相关设备，其中，上述方法包括：获取待计算语句，其中，待计算语句所对应的语种是预设的多种语种中的至少一种；根据已训练的分词模型和多语种词典获取待计算语句对应的基元序列；在基元序列的首位添加目标语种令牌以获得目标序列，其中，目标语种令牌是多语种词典中与待计算语句的语种所对应的语种标识的位置索引；根据目标序列，通过已训练的多语种困惑度计算模型获取待计算语句对应的语句困惑度，其中，已训练的多语种困惑度计算模型根据预设的多种语种对应的多语种语料集训练获得。本发明有利于在多语种场景下提高获取的语句困惑度的准确性。

主权项：1.一种针对多语种的语句困惑度获取方法，其特征在于，所述针对多语种的语句困惑度获取方法包括：获取待计算语句，其中，所述待计算语句所对应的语种是预设的多种语种中的至少一种；根据已训练的分词模型和多语种词典获取所述待计算语句对应的基元序列，其中，所述基元序列中的各个元素分别与所述多语种词典中一个位置索引所指示的值相同；在所述基元序列的首位添加目标语种令牌以获得目标序列，其中，所述目标语种令牌是所述多语种词典中与所述待计算语句的语种所对应的语种标识的位置索引；根据所述目标序列，通过已训练的多语种困惑度计算模型获取所述待计算语句对应的语句困惑度，其中，所述已训练的多语种困惑度计算模型根据所述预设的多种语种对应的多语种语料集训练获得。

全文数据：

权利要求：

百度查询：粤港澳大湾区数字经济研究院(福田) 针对多语种的语句困惑度获取方法、系统及相关设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：设备控制方法、装置、配电设备及存储介质_深圳市正浩创新科技股份有限公司_202410171534.4

下一篇：一种果树吊枝方法_上海市农业科学院_202410367417.5

相关技术

设备控制方法、装置、配电设备及存储介质_深圳市正浩创新科技股份有限公司_202410171534.4

一种果树吊枝方法_上海市农业科学院_202410367417.5

一种处理安全漏洞的方法及装置、系统、计算机程序产品_上海商米科技集团股份有限公司_202410155802.3

一种探测烟雾粒度及浓度的方法_烟台创为新能源科技股份有限公司_202410159903.8

POCT血细胞分析仪_深圳市帝迈生物技术有限公司_202410426762.1

一种靶向性介孔聚多巴胺纳米颗粒及其制备方法和应用_中国药科大学_202410163612.6

一种脑膜炎球菌发酵培养基及其制备方法和应用_成大生物(本溪)有限公司_202410343870.2

电池模组和电池包_浙江晶科储能有限公司_202410338036.4

供电系统、功率变换器以及功率变换电路的控制方法_华为数字能源技术有限公司_202410139301.6

一种炮孔自动填塞机_新疆天河爆破工程有限公司_202410337157.7

一种中心静脉压手动测量装置_中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)_202410152192.1

一种海底设施多关节柔性智能体的控制方法及系统_同济大学_202410164319.1

龙图腾网&IPTOP

【发明授权】针对多语种的语句困惑度获取方法、系统及相关设备_粤港澳大湾区数字经济研究院(福田)_202211131283.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务