【发明授权】一种智能化的在线教学资源知识点概念实体链接方法_西北大学_202210018754.4

导航：龙图腾网> 最新专利技术> 一种智能化的在线教学资源知识点概念实体链接方法_西北大学_202210018754.4

申请/专利权人：西北大学

申请日：2022-01-09

公开（公告）日：2024-04-09

公开（公告）号：CN114443813B

主分类号：G06F16/33

分类号：G06F16/33;G06F16/36;G06F40/216;G06F40/295;G06F40/30;G06F18/24;G06N3/0455;G06N3/0442;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.04.09#授权;2022.05.24#实质审查的生效;2022.05.06#公开

摘要：一种智能化的在线教学资源知识点概念实体链接方法，知识点概念实体识别模型和知识点概念链接模型，由于应用场景主要面向国内在线学习平台中的教学资源组织管理，国内的教学基本为中文教学，因此仅适用于中文语言文本，兼容部分英文文本。知识点概念实体识别是要从教学资源文本中抽取出包含的知识点概念实体词汇，学科、专业术语和历史事件等，抽取出的知识点概念实体称之为知识点提及；知识点概念关联指，根据所抽取出的知识点概念提及以及其所处的上下文语境，从知识库中找出语义相似度最高的概念知识，进行关系。通过知识点概念实体识别和知识点概念链接，实现教学资源之间与知识点概念之间的关联，达到了构建以概念知识为核心的教学资源组织体系目的。

主权项：1.一种智能化的在线教学资源知识点概念实体链接方法，其特征在于，包括以下步骤：1首先对字符串进行字符串清洗的预处理过程，字符串清洗主要是判断一个字符是否是为中文、数字和英文字符集，若不在该字符集中，则将该字符移除；2模型需要对清洗后的字符串C＝{c1，c2，......，cl}中的各个元素通过”BIO”标注机制进行序列标注，当一个字符ci被标注为”B”时，代表字符ci为某个知识点概念词汇实体的首个字符，”I”为个知识点概念词汇实体的中间字符，”O”为非知识点概念词汇字符，最终得到文本数据；3文本数据增强通过知识库中的知识点词条名词及其别名构建知识点概念词典Dict，使用最大双向匹配算法BiDirectionalMaximumMatchingalgorithm对字符串C进行匹配，找出字符串中包含的词典词汇，所匹配到的字符子串均以“BIEO”机制进行标注，即若匹配到的字符子串为Csub＝{ci，ci+1，......，ci+m}，Csub∈Dict，对子串中的起始字符ci标注为“B”，结束字符ci+m标注为“E”，起始字符ci和结束字符ci+m之间的字符串{ci+1，ci+2，......，ci+m-1}包含的字符全部标注为”I”，未匹配到的其它字符标注为“O”，通过这种机制，可以得到一串带标注的字符串同时添加起始字符“[CLS]”和结束字符“[SEP]”，S＝{s[CLS]，s1，s2，......，sl，S[SEP]}，其中每个元素si由字符串C中相应索引位置的字符ci和标注字符组成；4将上述得到带标注的字符串S进行向量空间嵌入操作EmbeddingS，即将S中的每个元素si表征为一个维度为ds的高维向量，其向量中的数值均使用KaiMing分布随机初始化，嵌入后的序列向量为5通过上述操作得到的序列向量ES包含了知识点概念词汇的边界信息，将对字符串C中所包含的上下文语义信息进行表征，使用的是预训练的神经网络语言模型Bert，预训练模型指已在大规模通用文本数据训练后的模型，将预训练的语言模型Bert作为语义编码器，能够有效地将文本序列表征为高维向量，将清洗后的字符串C作为预训练Bert语言模型的输入，Bert模型是以字符为单位对字符串C进行计算，对于输入的字符串C＝{c1，c2，......，cl}，Bert模型会首先在字符串的起始位置之前和末尾位置之后分别插入标识符”[CLS]”和”[SEP]”，即字符串{″[CLS]″，c1，c2，......，cl，″[SEP]″}作为模型的计算数据；6通过上述Bert模型的得到的输出向量F即为字符串C的编码向量，接下来将结合带有概念知识点词汇边界信息的序列向量ES，并通过LSTM模型和条件随机场CRF从字符串C中抽取候选概念知识点实体；将预测标签序列上相应的子串进行提取，可以得到知识点概念提及实体；7知识点概念实体链接模型是将抽取出的知识点概念提及实体M＝{m1，m2，......，mk}与知识库中的知识点实体进行匹配和关联，基于LevenshteinDistance字符串模糊匹配算法的候选知识点概念实体生成，将当前的提及实体mi与知识库中的知识点概念词汇进行模糊匹配，通过设定模糊匹配算法中的编辑距离参数Distance，将匹配到的编辑距离大于Distance的知识点概念词汇进行过滤，生成候选知识点概念实体集8通过上述介绍的预训练Bert模型对每个候选知识点概念实体的摘要文本描述进行编码，获取用于表征候选知识点概念实体的向量，对于一个候选知识点概念实体entityi，其相应的摘要描述为字符串作为Bert模型的输入，Bert模型编码后的输出向量为将标识符”CLS”相应的隐含向量hcls，通过激活函数为tanh的全连接层，得到输出向量作为候选知识点概念实体的表征向量，即通过这种方式，可以获得候选知识点概念实体集的表征向量集合9对于每个提及知识点概念mi的表征，首先通过预训练Bert模型对提及知识点概念所位于的课程文本C＝{c1，c2，......，cl}进行编码，获取课程文本的表征向量VC，获取表征向量VC的方式与候选知识点概念实体的表征向量方法相同；10课程文本中每个字符通过Bert模型计算后的编码向量为HC＝{hcls，h1，h2，......，hl，hsep}，对于所抽取的提及知识点概念mi，其表示的明文子串在课程文本C的索引位置可以表示为一个二元组其中，beg表示子串在C中的起始位置索引，end表示子串在C中的结束位置索引，将编码向量HC中提取中起始位置索引beg与结束位置索引end之间的编码向量，表示为将通过文本卷积网络TextCNN，得到提及知识点概念实体的表征向量TextCNN模型对于输入的计算，将课程文本的表征向量VC与提及知识点概念实体的表征向量进行Concatenate拼接操作，并经过一个激活函数为tanh的全连接层，得到输出向量即11将提及知识点概念实体的输出向量与候选知识点概念实体集的表征向量集合中的每个向量进行cos相似度计算，即从候选知识点概念实体集选择选择相似度最高的知识点概念与提及知识点概念进行关联，即最后的关联结果可以表示为一个二元组12输入课程文本中所包含的知识点概念链接结果为完成对教学资源之间与知识库中知识点概念之间的关联。

全文数据：

权利要求：

百度查询：西北大学一种智能化的在线教学资源知识点概念实体链接方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

下一篇：电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

相关技术

一种用于污水处理的自动化污水处理设备_江苏欧跃环保科技有限公司_202322615536.1

电机转子定位工装_洛阳航特机电技术有限公司_202322258362.8

无线遥控理疗床_泰安市迈迪医疗电子有限公司_202322303870.3

一种无人机使用高清摄像模组_陕西泰沃云科技有限公司_202322392870.5

一种洗涤设备_重庆海尔洗衣机有限公司_202321535727.0

一种带防撞装置的压力机工作台_扬州蔚来机械装备制造有限责任公司_202322611255.9

一种可收集粉尘的切割机_安徽楚风建设有限公司_202321187487.X

一种特殊持力层道路施工结构_中建六局土木工程有限公司_202023112178.5

一种新型带束层鼓防错灯标装置_赛轮(沈阳)轮胎有限公司_202322401683.9

一种偏摆检查仪_长春一东离合器股份有限公司_202420407178.7

一种英语听力训练用耳机_大同师范高等专科学校_202322527447.1

一种LED灯珠生产用烘箱_深圳市立彩光电科技有限公司_202322576244.1

知识点相关技术

融合试题数据和解答数据的多知识点标注方法和系统_华中师范大学_202011282980.0

知识点的处理方法、视频处理方法、装置及电子设备_腾讯科技(深圳)有限公司_202111629123.8

一种企业知识产权维度评审系统_北京中知智慧科技有限公司_202310832158.4

量子点层的形成方法、量子点层、光学元件、发光器件_夏普显示科技株式会社_202180101838.8

一种手持点餐机_珠海市巧晟科技有限公司_202322674709.7

一种隔离点专用门铃_深圳市第二人民医院(深圳市转化医学研究院)_202322501150.8

一种用于知识图谱嵌入模型的负采样方法_电子科技大学_202211455237.X

一种基于知识增强神经网络模型的讽刺检测方法及系统_广东外语外贸大学_202311374400.4

自动接入点布置系统和方法_思科技术公司_202080056513.8

一种卤水豆腐的点浆装置_蒙林_202322266427.3

概念相关技术

一种基于图像的车身结构概念模型自动建模方法_大连理工大学_202110521518.X

基于无环知识概念间关系图的认知诊断方法及系统_陕西师范大学_202410151216.1

一种概念漂移数据流集成分类方法_厦门大学_202410056772.0

基于概念模型的SCA通信架构设计方法_成都谐盈科技有限公司_202410270087.8

一种知识图谱本体中概念构建方法、装置、介质及设备_之江实验室_202410287647.0

一种基于概念-数据驱动耦合的洪水智能预报方法、系统、装置及介质_中国电建集团华东勘测设计研究院有限公司_202311676757.8

一种基于FBS理论的人机协同概念设计生成方法及系统_浙江大学_202311748584.6

一种基于定义的学科概念知识体系自动构建方法与系统_南京师范大学_202410256766.X

一种智能化的在线教学资源知识点概念实体链接方法_西北大学_202210018754.4

一种基于无监督学习的概念漂移缓解方法及装置_浙江大学嘉兴研究院_202311825338.6

资源相关技术

与带宽部分相对应的资源_联想(新加坡)私人有限公司_201980009766.7

用于更新资源类型的方法和装置_高通股份有限公司_201980070877.9

带宽部分的共享资源配置_瑞典爱立信有限公司_201880096599.X

一种生活污水资源化碳汇系统_河北雄安德荫源环境科技有限公司_202311803742.3

一种资源处理方法、装置及其设备_阿里巴巴集团控股有限公司_201810904788.7

一种渔业资源调查采集装置_生态环境部华南环境科学研究所(生态环境部生态环境应急研究所)_202311097245.6

用户资源信息的确定方法及装置、计算机存储介质、终端_北京水滴科技集团有限公司_202110274941.4

基于多策略原型生成的低资源神经机器翻译方法_昆明理工大学_202210293213.2

一种虚拟化资源的管理方法、设备及存储介质_联想(北京)有限公司_201911395689.1

用于在NR V2X中配置PSFCH资源的方法和设备_LG电子株式会社_202180018258.2

龙图腾网&IPTOP

【发明授权】一种智能化的在线教学资源知识点概念实体链接方法_西北大学_202210018754.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务