申请/专利权人:北京声智科技有限公司
申请日:2020-02-12
公开(公告)日:2024-04-12
公开(公告)号:CN111415655B
主分类号:G10L15/18
分类号:G10L15/18;G10L15/183;G10L15/26;G06F40/211
优先权:
专利状态码:有效-授权
法律状态:2024.04.12#授权;2020.08.07#实质审查的生效;2020.07.14#公开
摘要:本公开揭示了一种语言模型构建方法、装置及存储介质,所述方法包括:通过获取的至少一个句式框架,确定框架模型,其中句式框架中包含至少一个变量元素和至少一个恒量元素,框架模型用来指示句式框架对应的语言模型,然后,根据获取的变量元素对应的数据,确定变量模型,其中变量模型用来指示变量元素对应的语言模型,最后将框架模型和变量模型进行结合,确定第一语言模型。通过上述方案,服务器可以通过构建框架模型和数据模型,组合得到第一语言模型,从而在保证了语料的全面性的前提下,提高了构建语言模型的效率。
主权项:1.一种语言模型构建方法,其特征在于,所述方法包括:通过接收语音识别的句式,获取至少两个句式框架;所述句式框架中包含至少一个变量元素和至少一个恒量元素,所述至少两个句式框架的含义相同;根据所述至少两个句式框架,确定框架模型,所述框架模型用来指示所述句式框架对应的语言模型;获取所述句式框架中的变量元素的位置需要的数据类型,根据所述数据类型获取满足所述数据类型的数据,生成至少一个数据文本;根据N-Gram语言模型算法,将所述数据文本对应的所述语言模型确定为变量模型;将所述变量模型转换成变量模型的有限状态传感器FST图;将所述变量模型的FST图添加在所述框架模型的FST图中变量元素的位置,得到第一语言模型的FST图,其中,所述变量模型添加到所述框架模型中时,继承所述变量模型和所述框架模型的原权重。
全文数据:
权利要求:
百度查询: 北京声智科技有限公司 语言模型构建方法、装置及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。