买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】图片信息抽取方法、装置、计算机设备及存储介质_中国平安人寿保险股份有限公司_202111013065.6 

申请/专利权人:中国平安人寿保险股份有限公司

申请日:2021-08-31

公开(公告)日:2024-04-02

公开(公告)号:CN113688268B

主分类号:G06F16/583

分类号:G06F16/583;G06F16/55;G06V20/62;G06V30/19;G06V30/18;G06N3/0442;G16H50/30

优先权:

专利状态码:有效-授权

法律状态:2024.04.02#授权;2021.12.10#实质审查的生效;2021.11.23#公开

摘要:本申请实施例属于人工智能领域,应用于医疗领域中,涉及一种图片信息抽取方法,包括获取待处理图片,对待处理图片进行文本识别,得到待处理文本;根据预设词袋模型对待处理文本进行特征提取,得到特征数据,基于特征数据对待处理图片进行分类;在图片类型为非制式文件类型时,输入特征数据至预设抽取器,得到第一抽取文本,输入特征数据至目标抽取模型,得到第二抽取文本;对第一抽取文本和第二抽取文本进行文本筛选,得到目标抽取文本,输入目标抽取文本至目标知识库,生成结构化数据。本申请还提供一种图片信息抽取装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,结构化数据可存储于区块链中。本申请实现了对图片信息的高效抽取。

主权项:1.一种图片信息抽取方法,其特征在于,包括下述步骤:获取待处理图片,对所述待处理图片进行文本识别,得到待处理文本;获取预设词袋模型,根据所述预设词袋模型对所述待处理文本进行特征提取,得到特征数据,基于所述特征数据对所述待处理图片进行分类,确定所述待处理图片的图片类型;在所述图片类型为非制式文件类型时,输入所述特征数据至预设抽取器,抽取得到第一抽取文本,输入所述特征数据至目标抽取模型,抽取得到第二抽取文本;对所述第一抽取文本和所述第二抽取文本进行文本筛选,得到目标抽取文本,输入所述目标抽取文本至目标知识库,生成所述待处理图片对应的结构化数据;所述输入所述特征数据至预设抽取器,抽取得到第一抽取文本的步骤包括:根据所述预设抽取器将所述特征数据与预设的标准关键词对应的词向量进行匹配,得到所述待处理文本中与所述标准关键词匹配的命中关键词;对所述命中关键词进行邻域搜索,得到所述第一抽取文本;所述输入所述特征数据至目标抽取模型,抽取得到第二抽取文本的步骤包括:所述目标抽取模型包括双向长短期记忆网络和条件随机场模型,输入所述特征数据至所述双向长短期记忆网络,计算得到所述待处理文本的特征向量;根据所述条件随机场模型对所述特征向量进行计算,得到所述特征向量对应的实体信息,确定所述实体信息为所述第二抽取文本;所述对所述第一抽取文本和所述第二抽取文本进行文本筛选的步骤包括:获取所述第一抽取文本和所述第二抽取文本分别对应的置信度;根据所述置信度对所述第一抽取文本和所述第二抽取文本进行排序,按照所述置信度从高到低选取预设个数的文本为所述目标抽取文本。

全文数据:

权利要求:

百度查询: 中国平安人寿保险股份有限公司 图片信息抽取方法、装置、计算机设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。