买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于自然语言处理的技术文档自动生成系统及生成方法_达观数据有限公司;上汽通用汽车有限公司_201911057792.5 

申请/专利权人:达观数据有限公司;上汽通用汽车有限公司

申请日:2019-11-01

公开(公告)日:2024-03-22

公开(公告)号:CN110795923B

主分类号:G06F40/186

分类号:G06F40/186;G06F16/36

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2024.02.23#著录事项变更;2020.03.10#实质审查的生效;2020.02.14#公开

摘要:本发明涉及到一种基于自然语言处理的技术文档自动生成系统,属于智能文本处理领域,该系统包括有平级关系的BOE子系统、SOW子系统和权限子系统:所述的BOE子系统包括有NLP平台和数据管理模块,所述的SOW子系统包括有SOW模板生成模块和模板管理模块,所述的权限管理子系统设有三级权限管理;还提出一种基于自然语言处理的技术文档自动生成方法,该方法结合业务与人工智能,满足基于知识经验的数字化管理需求,利用自然语言处理技术及知识图谱技术建立设备技术规范知识库,通过智能文本处理技术实现文档的自动生成。本发明的系统和方法应用知识图谱及智能文本处理技术,实现技术文本文档的智能化抽取,一键式生成,提高项目规划效率和质量。

主权项:1.一种基于自然语言处理的技术文档自动生成系统,其特征在于,该系统包括有BOE子系统、SOW子系统和权限管理子系统,分管不同功能的三个子系统为平级关系:所述的BOE子系统包括有NLP平台和数据管理模块,所述的NLP平台用于将BOE文档利用NLP技术进行标注与抽取,再结合KG技术建立数据与标签的映射关系,形成BOE知识库,所述的数据管理模块用于BOE知识库的可视化数据管理,并提供增删改功能,为后续的技术文档自动生成提供数据源;所述的NLP平台包含基于NLP算法的标注与抽取模块和知识图谱模板,所述的标注与抽取模块用于前期BOE文档的数据导入工作,知识图谱模板用于建立文件数据与定义标签的映射关系;所述的标注与抽取模块中包括有序列标注技术,该序列标注技术是包含HMM隐马尔可夫模型、CRF条件随机场和RNN循环神经网络在内基础的序列标注模型,运用序列标注技术从带标注的文本数据中抽取特性训练序列标注模型,用于从连续文本数据中抽取指定意义的文本片段,运用文本分类、深度学习和字符串算法来提取海量文本数据潜在特征,再结合传统n-gram特征,使用表示学习优化特征提取,再使用增强学习方式,结合标注训练数据提升模型效果,在标注工作完成后,进行文档数据的抽取以用于之后的导入;所述的SOW子系统包括有SOW模板生成模块和模板管理模块,所述的SOW模板生成模块连接用户交互界面,用户在用户交互界面选择好的信息,自动将用户选取的信息和从BOE子系统中的BOE知识库内抽取的相应信息自动填充到SOW模板里,以自动生成一份新的SOW,所述的模板管理模块对SOW模板内与BOE非相关的标签数据进行增删;所述的权限管理子系统设有三级权限管理,分别为使用权限、更改权限和SOW模板管理及审批权限,使用权限为只读的日常使用,更改权限为BOE知识库管理,包括增删改操作,SOW模板管理及审批权限是对BOE知识库和SOW模板更新进行审批。

全文数据:

权利要求:

百度查询: 达观数据有限公司;上汽通用汽车有限公司 基于自然语言处理的技术文档自动生成系统及生成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。