买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于人工智能的文本课件的内容抽取方法及相关设备_平安国际智慧城市科技股份有限公司_202110839260.8 

申请/专利权人:平安国际智慧城市科技股份有限公司

申请日:2021-07-23

公开(公告)日:2024-04-16

公开(公告)号:CN113468288B

主分类号:G06F16/31

分类号:G06F16/31;G06F16/33;G06F16/35;G06F40/14;G06F40/30;G06F40/205;G06N3/042;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2021.10.26#实质审查的生效;2021.10.01#公开

摘要:本发明涉及人工智能,提供一种基于人工智能的文本课件的内容抽取方法及相关设备,在提取课件页面中的实体及实体的属性值后,搜索每个实体的最近邻实体,在实体与最近邻实体之间生成实体边,根据属性值计算每个实体边的边特征,从而得到实体网络结构图,利用图卷积神经网络基于预设线性约束对实体网络结构图进行预测,得到实体边的类别,通过设置线性约束能够有效的保证预测结果的准确性;在得到图卷积神经网络的目标层的各个节点的隐藏状态之后,对隐藏状态进行最大池化处理,最大池化可以将参数隐藏状态中的参数极大地缩小,减少了信息的冗余度,提高了全局嵌入表示的效率和文字描述的生成效率,进而提高了课件语义结构树的生成效率。

主权项:1.一种基于人工智能的文本课件的内容抽取方法,其特征在于,所述方法包括:获取文本课件中的多个课件页面,并提取每个所述课件页面中的多个实体;提取每个所述实体的属性值;对于每个所述课件页面,搜索每个所述实体的多个最近邻实体,在每个所述实体与每个所述最近邻实体之间生成实体边,其中,所述搜索每个所述实体的多个最近邻实体包括:根据所述实体的属性值确定所述实体的位置坐标;根据所述位置坐标确定多个搜索方向;在每个所述搜索方向上搜索一个实体,作为所述搜索方向上的最近邻实体,并根据所述属性值计算每个所述实体边的边特征,得到每个所述课件页面的实体网络结构图,其中,所述根据所述属性值计算每个所述实体边的边特征包括:根据所述实体的属性值中的第一属性值及每个所述最近邻实体的属性值中的第一属性值计算距离边特征;根据所述实体的属性值中的第二属性值及每个所述最近邻实体的属性值中的第二属性值计算内容边特征;拼接所述距离边特征及对应的所述内容边特征得到所述实体边的边特征;调用预先训练的图卷积神经网络基于预设线性约束对每个所述实体网络结构图进行预测,得到每条实体边的分类概率,并根据所述分类概率确定所述实体边的类别,其中,所述预设线性约束包括: ce,i∈{0,1}, 其中,pe,i为实体边e为第i分类的概率,ce,i为选择实体边e的类别为第i类的指示变量, 是指每条实体边上必须有一个且只有一个类别, 是指每个节点最多只有一个父亲或文本合并目标;获取所述图卷积神经网络的目标层的各个节点的隐藏状态,对所述隐藏状态进行最大池化,得到全局嵌入表示,根据所述全局嵌入表示生成文字描述,其中,所述对所述隐藏状态进行最大池化包括:根据池化滤波器的大小对所述隐藏状态进行区块分割;选择每个所述区块中的最大值作为特征值;将所述特征值按照顺序进行拼接得到全局嵌入表示;根据每个所述实体网络结构图中所述实体边的类别及对应的所述文字描述生成课件语义结构树。

全文数据:

权利要求:

百度查询: 平安国际智慧城市科技股份有限公司 基于人工智能的文本课件的内容抽取方法及相关设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。