申请/专利权人:深圳价值在线信息科技股份有限公司
申请日:2020-03-27
公开(公告)日:2024-03-22
公开(公告)号:CN111460800B
主分类号:G06F40/258
分类号:G06F40/258;G06F40/216;G06N3/0455;G06N3/09;G06N3/044
优先权:
专利状态码:有效-授权
法律状态:2024.03.22#授权;2020.08.21#实质审查的生效;2020.07.28#公开
摘要:本申请实施例适用于信息技术领域,提供了一种事件生成方法、装置、终端设备及存储介质,所述方法包括:获取待处理的文本标题,所述文本标题包括多个标题字符;分别将每个标题字符转换为输入向量;根据转换后得到的每个标题字符的输入向量,确定与所述文本标题相对应的目标输入向量;对所述目标输入向量进行编解码处理,输出待生成事件中每个字符位的候选字符以及所述候选字符的概率值;根据所述每个字符位的候选字符以及所述候选字符的概率值,生成事件。采用上述方法生成的事件,不仅概括性强,可以完整地表示文本内容,而且语法连贯性也较佳,具有较高的可读性。
主权项:1.一种事件生成方法,其特征在于,包括:获取待处理的文本标题,所述文本标题包括多个标题字符;分别将每个标题字符转换为输入向量;根据转换后得到的每个标题字符的输入向量,确定与所述文本标题相对应的目标输入向量;将所述目标输入向量输入预设的双向变压器预训练语言模型BERT中,采用BERT模型对所述目标输入向量进行编解码处理,输出待生成事件中每个字符位的候选字符以及所述候选字符的概率值;所述BERT模型包含多层变压器;所述变压器包含多个解码器和多个编码器所述BERT模型由掩码语言模型生成的注意力矩阵训练而成;根据所述每个字符位的候选字符以及所述候选字符的概率值,生成事件;所述分别将每个标题字符转换为输入向量,包括:基于预设字典确定与每个标题字符相对应的字典值,所述预设字典包括多个字符,每个字符分别具有相应的字典值;根据每个标题字符对应的字典值,将所述每个标题字符转换为输入向量;所述根据所述每个字符位的候选字符以及所述候选字符的概率值,生成事件,包括:确定待生成事件的字符数最大值;根据所述候选字符的概率值,从当前字符位的多个候选字符中提取多个当前候选字符;分别计算与每个当前候选字符相匹配的下一候选字符的概率值,根据所述下一候选字符的概率值确定多个组合文本;重复执行所述分别计算与每个当前候选字符相匹配的下一候选字符的概率值,根据所述下一候选字符的概率值确定多个组合文本的步骤,直到组合方案中的字符个数等于所述字符数最大值;提取组合概率值最大值对应的组合文本生成事件,所述组合概率值为对应的组合文本中每个字符的概率值之和。
全文数据:
权利要求:
百度查询: 深圳价值在线信息科技股份有限公司 一种事件生成方法、装置、终端设备及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。