申请/专利权人:北京点聚信息技术有限公司
申请日:2024-01-30
公开(公告)日:2024-04-09
公开(公告)号:CN117669566B
主分类号:G06F40/289
分类号:G06F40/289;G06F40/30;G06F40/211;G06F18/2433
优先权:
专利状态码:有效-授权
法律状态:2024.04.09#授权;2024.03.26#实质审查的生效;2024.03.08#公开
摘要:本发明版式文件数据处理技术领域,具体涉及一种版式文件的实时数据在线智能处理方法,该方法包括:获取版式文本数据,计算各情感词语的关联情感极性词语;对于每种名词,计算第k种名词的各种情感类型的全文情感特征倾向及情感转化混乱度;构建每个第k种名词的各种情感类型的局部情感特征倾向;根据名词在文本数据集合中的词语位置构建每个第k种名词的位置变异指数;计算每个第k种名词在各种情感类型上的情感逻辑特征异常变化值,进而计算每个第k种名词在第t种情感类型上的内部情感逻辑混乱系数;结合LOF异常检测算法对文本数据集合进行智能处理。本发明准确分析版式文件中逻辑错误的名词,保证数据处理效果。
主权项:1.一种版式文件的实时数据在线智能处理方法,其特征在于,该方法包括以下步骤:获取版式文本数据分词处理得到分词数据集合,相同的分词为同一种类词语;提取分词数据集合中的名词、情感词语及对应情感类型和情感强烈程度、情感极性词语及对应的极性值;提取各情感词语的关联情感极性词语;对于每种名词,根据第种名词所在句子中各种情感类型的情感词语的情感强烈程度、关联情感极性词语的极性值以及与第种名词之间的词语间隔得到第种名词的各种情感类型的全文情感特征倾向;根据第种名词所在句子中各种情感类型的全文情感特征倾向得到第种名词的各种情感类型的情感转化混乱度;根据文本数据集合中出现的每个第种名词所在句子中各种情感类型的各情感词语的情感强烈程度、关联情感极性词语的极性值以及与第种名词的词语间隔构建每个第种名词的各种情感类型的局部情感特征倾向;根据所述每个第种名词在文本数据集合中的词语位置构建每个第种名词的位置变异指数;根据位置变异指数、局部情感特征倾向、全文情感特征倾向以及情感转化混乱度构建每个第种名词在各种情感类型上的情感逻辑特征异常变化值;根据各句子中各名词的各种情感类型的全文情感特征倾向、局部情感特征倾向以及各名词的信息量得到各句子的内部情感逻辑混乱度;根据第种名词所在的各句子的内部情感逻辑混乱度、每个第种名词的各种情感类型的全文情感特征倾向、局部情感特征倾向得到每个第种名词在第种情感类型上的内部情感逻辑混乱系数;根据情感逻辑特征异常变化值以及内部情感逻辑混乱系数得到每个第种名词的各种情感类型混乱度,结合LOF异常检测算法对文本数据集合进行智能处理。
全文数据:
权利要求:
百度查询: 北京点聚信息技术有限公司 一种版式文件的实时数据在线智能处理方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。