申请/专利权人:阿里巴巴新加坡控股有限公司
申请日:2021-07-12
公开(公告)日:2023-01-17
公开(公告)号:CN115618854A
主分类号:G06F40/263
分类号:G06F40/263;G06F40/284
优先权:
专利状态码:在审-实质审查的生效
法律状态:2023.02.10#实质审查的生效;2023.01.17#公开
摘要:本申请实施例提供了一种语种识别中的特征融合方法、装置及计算机存储介质。根据本申请实施例提供的特征融合方案,获取待识别文本,确定所述待识别文本中所包含字符的字符顺序和文本长度,分别生成所述待识别文本的字符时序特征、编码区间特征、单词特征和字符特征,其中,所述字符时序特征、编码区块特征、单词特征和字符特征中所包含的特征单元的顺序与所述字符顺序相同,所述字符时序特征、编码区块特征、单词特征和字符特征的长度与所述文本长度相同;融合所述字符时序特征、编码区块特征、单词特征和字符特征生成多特征表示向量,实现对待识别文本从字符、单词、编码区间、字符时序四个维度进行特征提取和融合。
主权项:1.一种语种识别中的特征融合方法,包括:获取待识别文本,确定所述待识别文本中所包含字符的字符顺序和文本长度;分别生成所述待识别文本的字符时序特征、编码区间特征、单词特征和字符特征,其中,所述字符时序特征、编码区块特征、单词特征和字符特征中所包含的特征单元的顺序与所述字符顺序相同,所述字符时序特征、编码区块特征、单词特征和字符特征的长度与所述文本长度相同;融合所述字符时序特征、编码区块特征、单词特征和字符特征生成多特征表示向量。
全文数据:
权利要求:
百度查询: 阿里巴巴新加坡控股有限公司 一种语种识别中的特征融合方法、装置及计算机存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。