买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】韵律层级划分方法、装置、计算机设备和存储介质_平安科技(深圳)有限公司_202011339547.6 

申请/专利权人:平安科技(深圳)有限公司

申请日:2020-11-25

公开(公告)日:2024-03-19

公开(公告)号:CN112463921B

主分类号:G06F16/33

分类号:G06F16/33;G06F40/211;G06F40/216;G06F40/289;G06F18/214;G06N3/02

优先权:

专利状态码:有效-授权

法律状态:2024.03.19#授权;2021.12.14#实质审查的生效;2021.03.09#公开

摘要:本申请涉及人工智能技术领域,提供了一种韵律层级划分方法、装置、计算机设备和存储介质,获取待划分韵律层级的文本;对所述文本进行词性识别,得到所述文本中每个词的词性;将词性识别后的所述文本输入至预设的条件随机场模型中,得到所述文本的每个词的韵律层级标签;基于该条件随机场模型中包括的特征函数,所述特征函数用于分别统计每个词的上下文的词性结构、文本结构,根据所述词性结构、文本结构确定每个词的韵律层级标签。本申请采用上述条件随机场模型,结合文本中每个词的词性,并结合考虑上下文的词性结构,对文本进行韵律层级划分,避免了目前只考虑词性进行韵律层级划分时粒度过细的缺陷。

主权项:1.一种韵律层级划分方法,其特征在于,包括以下步骤:获取待划分韵律层级的文本;对所述文本进行词性识别,得到所述文本中每个词的词性;将词性识别后的所述文本输入至预设的条件随机场模型中,得到所述文本的每个词的韵律层级标签;其中,所述条件随机场模型中包括特征函数,所述特征函数用于分别统计每个词的上下文的词性结构、文本结构,根据所述词性结构、文本结构确定每个词的韵律层级标签;根据所述文本中每个词的韵律层级标签对所述文本进行韵律层级划分;所述获取待划分韵律层级的文本的步骤之前,包括:获取训练数据集;其中,所述训练数据包括多个训练文本,所述训练文本携带有训练文本中每个词的词性,以及每个词的韵律层级标签;将所述训练文本输入至初始条件随机场模型中进行训练,得到所述预设的条件随机场模型;其中,所述初始条件随机场模型中包括特征模板,所述特征模板用于分别统计所述训练文本中每个词的上下文的词性结构、文本结构,并根据所述词性结构、文本结构以及训练样本中每个词的韵律层级标签,确定所述特征模板中的模型参数,以得到所述特征函数;所述训练文本包括三列:其中,第一列为所述训练文本中每个词的竖向排列,第二列为所述训练文本每个词对应的词性,第三列为所述训练文本中每个词对应的韵律层级标签;所述初始条件随机场模型中包括的特征模板为:123其中,xi,1表示训练样本中第i行第2列的数据,wi-a表示对应的词性,mi-a表示对应的文本;a、b分别表示上下文文字的范围;n为预设的超参数,yi为文字对应的韵律层级标签。

全文数据:

权利要求:

百度查询: 平安科技(深圳)有限公司 韵律层级划分方法、装置、计算机设备和存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。