买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种识别试卷中包含AI生成文字的方法、介质及系统_北京信诺软通信息技术有限公司_202311300984.0 

申请/专利权人:北京信诺软通信息技术有限公司

申请日:2023-10-09

公开(公告)日:2024-04-16

公开(公告)号:CN117113977B

主分类号:G06F40/216

分类号:G06F40/216;G06F40/253;G06F40/289;G06F18/24;G06F18/22

优先权:

专利状态码:有效-授权

法律状态:2024.04.16#授权;2023.12.12#实质审查的生效;2023.11.24#公开

摘要:本发明提供了一种识别试卷中包含AI生成文字的方法、介质及系统,包括对输入的答题文本进行词频统计,得到答题文本的词性分布向量;统计答题文本中句子的字数分布情况,得到句长特征向量;计算答题文本中相邻单词、相邻句子之间的重复率、相似率,得到词与词、句与句的逻辑关系向量;对答题文本进行编码,得到多组语言模型的语义特征矩阵;将得到的各向量以及语义特征矩阵,输入到对应的大语言基座模型,得到AI特征矩阵;根据AI特征矩阵整合计算得到AI生成文字概率;设定阈值,判定答题文本是否为AI生成;本发明能够识别一篇文本是否包含AI生成的内容,降低判别难度。

主权项:1.一种识别试卷中包含AI生成文字的方法,其特征在于,包括以下步骤:S10、对输入的答题文本进行词频统计,得到答题文本的词性分布向量,所述词性为答题文本中的名词、动词、形容词、副词;S20、统计答题文本中句子的字数分布情况,得到句长特征向量;S30、计算答题文本中相邻单词、相邻句子之间的重复率、相似率,得到词与词、句与句的逻辑关系向量;S40、基于多个大语言基座模型,分别对答题文本进行编码,得到多组语言模型的语义特征矩阵;S50、将上述得到的词性分布向量、句长特征向量、逻辑关系向量以及语义特征矩阵,输入到对应的大语言基座模型作为基础的微调AI文本判别模型中,得到每个微调AI文本判别模型输出的AI特征矩阵,所述AI特征矩阵中的每个元素表示对应的语义特征矩阵中每个元素是否AI生成,1表示AI生成,0表示非AI生成;S60、根据每个微调AI文本判别模型输出的AI特征矩阵整合计算得到AI生成文字概率;S70、将AI生成文字概率与预设阈值进行比较,若大于阈值则判定答题文本包含AI生成文字,否则判定答题文本不包含AI生成文字。

全文数据:

权利要求:

百度查询: 北京信诺软通信息技术有限公司 一种识别试卷中包含AI生成文字的方法、介质及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。