买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种文本撰写质量监控方法与系统_北京天方智力知识产权代理有限公司_202310134696.6 

申请/专利权人:北京天方智力知识产权代理有限公司

申请日:2023-02-20

公开(公告)日:2024-01-16

公开(公告)号:CN116128364B

主分类号:G06Q10/0639

分类号:G06Q10/0639;G06F40/186;G06Q50/18

优先权:

专利状态码:有效-授权

法律状态:2024.01.16#授权;2023.06.02#实质审查的生效;2023.05.16#公开

摘要:本发明提供了一种文本撰写质量监控方法与系统,解决现有技术类制式文本的撰写质量缺乏量化监督的技术问题。方法包括:形成文本撰写环境中对文本输入行为进行量化的行为采集框架;通过行为采集框架在撰写环境中记录文本输入行为形成撰写日志;根据撰写日志形成对文本创作的有效输出评估;根据撰写日志形成对文本的有效信息承载量评估;根据撰写日志形成对文本的信息完整度评估。形成贯穿撰写过程的时间成本、人员素质和文本质量的层次监控机制。监控过程的评估数据为技术领域撰写者例如专利代理领域中撰写者提供了个人职业素质、技术素养与代理案件技术方案和确稿文本间的评估依据,为以人力资源投入为主的行业提供资源优化的量化基础。

主权项:1.一种文本撰写质量监控方法,其特征在于,包括:形成文本撰写环境中对文本输入行为进行量化的行为采集框架,用于在撰写环境承接文本输入的过程中提供量化文本输入行为的自动度量工具,包括时序性度量工具、文本分词工具、技术词汇资源、词汇特征量化工具和词汇分布特征量化工具;通过行为采集框架在撰写环境中记录文本输入行为形成撰写日志;根据撰写日志形成对文本创作的有效输出评估,撰写日志中包括的输入行为的关联数据对文本内容输入告一段落时的阶段性时序性特征、文本积累速率、文本修改变化尺度进行量化,对文本撰写效率进行有效评估;根据撰写日志形成对文本的有效信息承载量评估;根据撰写日志形成对文本的信息完整度评估;所述形成撰写日志,包括:在当前初始文本输入过程告一段落或终止时,整理缓冲中初始文本输入键值对形成与初始文本阶段输入对应的时序日志片段,追加在撰写时序日志的一次成稿区段,同时在一次成稿时间序列中追加时序节点;所述初始文本输入包括在文本模板形成的撰写文件中,在已有输入文本的尾部或新建文档开始处顺序增加的文本内容;所述一次成稿时间序列根据初始文本输入的终止标记形成;所述时序节点利用撰写告一段落时间形成;所述初始文本输入键值对,用于缓存当前初始文本输入过程的图文对象状态,初始文本输入键值对结构为:文本编辑系统时间=图文对象内部标识序列,编辑状态;所述文本编辑系统时间是指在撰写环境中接续已有撰写文本尾部,进行单一字符、一次录入字符串片段或插入图文对象的系统时间;所述图文对象内部标识是指文本或图文对象被撰写环境赋予的唯一性内部标识;文本内容包括文字、句读标点和段落符号,图文对象包括嵌入对象;编辑状态是指内部标识序列对应的图文对象的当前状态,包括新建、插入和删除中一种确定状态;在二次编辑过程告一段落时,将二次编辑键值对形成文本二次编辑的时序日志片段,追加在撰写时序日志的二次成稿区段;所述二次编辑键值对,用于缓存对撰写文本进行二次编辑过程的图文对象状态,二次编辑键值对结构为:文本编辑系统时间=图文对象内部标识序列,编辑状态,参考时序节点区间的编辑位置;在撰写文本告一段落或终止时,通过调用系统分词服务将对应撰写时序日志的撰写文本进行分词,将分词结果通过分词键值对结构顺序存储在撰写分词日志中;所述分词键值对,用于存储分词结果,分词键值对结构为:词语内部标识序列=分词词语,词语技术属性,关联词语词语内部标识序列关联顺序标记;所述词语内部标识序列与分词词语对应;所述分词词语记载分词文本,所述词语技术属性记载分词文本与技术领域专业词库的匹配标记,匹配标记为二值标记;所述关联词语为根据系统分词服务获取的关联分词文本;所述关联顺序标记是与分词词语关联距离的量化标记;在撰写文本告一段落或终止时,根据分词结果、预置区域撰写基准和段落撰写基准通过技术词语向量键值对结构建立技术词语的区域向量和局部向量,存储在撰写向量日志中;所述预置区域撰写基准根据制式文本的固定撰写模板内固定预置区域对应的撰写区域的标签标记,以起始或终止标签作为所述预置区域撰写基准,以每个段落起点作为段落内词语的所述段落撰写基准;所述技术词语向量键值对结构为:技术词语内部标识序列=技术词语,距离预置区域撰写基准的字符数,技术词语所在段落编号,距离所在段落撰写基准的字符数;所述技术词语内部标识序列与分词结果的分词技术词语对应;所述技术词语记载词语文本;利用距离预置区域撰写基准的字符数建立每个技术词语在预置区域中的区域向量;利用所在段落编号和距离所在段落撰写基准的字符数建立每个技术词语在预置区域中相对区域内的局部向量;在撰写文本告一段落或终止时,在技术词语的向量化基础上,针对相同的技术词语通过技术词语分布键值对结构建立技术词语分布特征存储在撰写向量日志中;所述技术词语分布键值对,用于针对相同的技术词语建立技术词语分布特征,技术词语分布键值对结构为:单一技术词语=单一技术词语每次出现时的区域向量和局部向量的序列;所述单一技术词语是指文本一致的技术词语。

全文数据:

权利要求:

百度查询: 北京天方智力知识产权代理有限公司 一种文本撰写质量监控方法与系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。