买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于大数据的教辅热点数据智能分析系统_山东接力教育集团有限公司_202311532575.3 

申请/专利权人:山东接力教育集团有限公司

申请日:2023-11-17

公开(公告)日:2024-01-30

公开(公告)号:CN117271710B

主分类号:G06F16/33

分类号:G06F16/33;G06F16/335;G06F16/35;G06F40/169;G06F40/242;G06F40/279;G06Q50/20

优先权:

专利状态码:有效-授权

法律状态:2024.01.30#授权;2024.01.09#实质审查的生效;2023.12.22#公开

摘要:本发明公开了一种基于大数据的教辅热点数据智能分析系统,具体涉及数据分析技术领域,包括数据采集模块、数据预处理模块、数据处理模块、数据分析模块、教学评估模块,以及教学方案调整模块;通过数据处理模块提取主题信息,根据主题信息将数据进行划分,并从每个子集中抽取适量的样本,从而减小数据集规模;通过数据分析模块,利用多核或分布式处理的能力,将数据划分成多个小批次,并使用多个处理单元同时进行相关参数计算,提高处理速度;通过教学评估模块,收集学生的相关数据,计算教学质量指数,用于评估教学效果和满意度;通过教学方案调整模块,基于评估结果实现教学方案动态调整,为用户提供有针对性的教学资源。

主权项:1.一种基于大数据的教辅热点数据智能分析系统,其特征在于:包括:数据采集模块:用于收集教辅热点数据、用户的评论和社交媒体帖子;所述教辅热点数据包括教材、教辅书和网络资源;数据预处理模块:用于对收集到的数据进行清洗、去重和分词预处理操作;数据处理模块包括主题信息提取单元和用户情感得分计算单元;所述主题信息提取单元用于利用自然语言处理技术,对预处理后的教辅热点数据进行主题信息提取;所述用户情感得分计算单元,用于利用情感分析算法对预处理后的用户的评论和社交媒体帖子进行处理,计算用户情感得分;数据分析模块:用于利用统计方法,对主题信息进行分析,计算话题热门指数、公众舆情影响系数,将其传输至教学评估模块;教学评估模块:基于学生的考试成绩和日志记录,计算教学质量指数,用于评估教学效果和满意度;教学方案调整模块:基于评估结果实现教学方案动态调整,为用户提供有针对性的教学资源;所述主题信息提取单元的处理过程如下:B1、应用主题建模算法,从教辅热点数据中提取主题信息;B2、根据主题信息将数据进行划分,并从每个子集中抽取适量的样本;所述应用主题建模算法,从教辅热点数据中提取主题信息;其处理过程如下:B11、将对预处理后的教辅热点数据转化为字符串格式,对字符串进行遍历,将每个字符作为一个单独的元素,存储到数据集中;B12、计算数据集中各字符的权重因子;所述权重因子μ的计算公式为:,其中α表示某字符在文档中出现的次数,n表示总字数,Tp表示文档总数,Tq表示包含该字符的文档数;B13、将各字符的权重因子μ和预先设定的权重因子阈值μ阈进行判断对比,若μ≥μ阈则将该字符筛选出来,作为数据集中的关键字,反之则为数据集中的非关键字;B14、将筛选出来的关键字,根据系统预先定义的组合规则将其重新组合成关键词,和词库进行对比分析;所述词库包含相关知识领域的专业术语、常用词汇,以及其他与教辅热点数据相关的关键词;B15、依据关键词权重因子大小进行降序排序,确定与教辅热点数据相关的关键词,将其作为主题信息;所述关键词权重因子计算公式为:,其中s表示关键词中关键字的总数量,表示关键字的权重因子。

全文数据:

权利要求:

百度查询: 山东接力教育集团有限公司 一种基于大数据的教辅热点数据智能分析系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。