买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:青软创新科技集团股份有限公司
摘要:本发明涉及人物画像构建技术领域,具体地说,涉及一种基于大数据数仓技术的学生画像挖掘实现方法。包括搭建系统网络架构、数据采集、数据加工处理、数据标签化、构建画像、画像的应用分析、对异常进行检测分析、根据画像进行教学工作安排等步骤。本发明设计可以更好地对海量的学生行为数据进行加工及分类存储,便于快速查询调用,从而提高搭建学生画像的工作效率;可以深度挖掘学生的个性特征并较为准确地为其打上对应标签,可以更好实现在智慧校园中构建学生画像;有利于教育工作者、家长及学生本身更好地了解学生,便于及时发现学生日常学习行为中存在的不足,以便纠正、改善,从而可以更好地为学生量身定制对应的培养方案,提升教育水平。
主权项:1.一种基于大数据数仓技术的学生画像挖掘实现方法,其特征在于:包括如下步骤:S1、搭建学生画像挖掘系统网络架构,并连接智慧校园信息管理平台;S2、从多方面进行学生日常行为信息的数据采集;S3、以数据仓库技术为基础对数据进行加工处理,并搭建数据的分层模型;具体包括:S3.1、获取学生的各方面行为信息,包括日常作息时间、课堂出席及表现情况、上网情况、校园门禁信息、饮食情况、消费情况;S3.2、搭建三层的数据仓库模型;S3.3、对海量的学生校园生活数据进行清洗,完成异构多数据源的数据整合,形成统一数据库存储于数据仓库中,并补插不完整的数据;S3.4、对清洗后的数据进行提炼,深度挖掘出所需的信息;S3.5、通过聚类算法,对提炼出的学生特征信息进行聚类分析;S4、对学生数据进行标签化;S5、构建学生的综合行为画像;具体包括:S5.1、遵循朴素的行为特征表现规律,依据现实,建立学生特征模型;S5.2、通过符号化抽象成学生特征的符号标签;S5.3、对综合行为画像特征标签进行数据归一化处理;S6、学生综合行为画像的应用分析;具体包括:S6.1、通过对学生的准点率、出勤率、成绩项目数据进行加权求和,对函数进行归一化,依此反映学生的学习基础与学习态度,对学生的学习特征进行评价分级并打上标签;S6.2、按照饮食指数设定等级,表示学生的三餐习惯,并给予评价;S6.3、根据睡眠时长、入眠时间和起床时间计算表示学生的作息习惯规律,设定作息习惯等级,并进行作息习惯评价;S6.4、收集并计算学生与同学之间出现共现对的次数,通过Louvain社区发现算法识别学生的关系群体,以便发现社群中离群索居的学生;S6.5、通过学生日均消费金额计算消费力指数,结合学生消费场所、位置,对学生的消费行为及消费水平进行评价;S6.6、以日均上网时长为主要计算因素,通过线性相关性判断学生的网络成瘾程度,并依此评价学生的上网健康情况;即通过归一化函数分别从学习、三餐习惯、作息习惯、消费水平、上网习惯方面的评估维度进行评估,其计算表达式如下:学习指数:L=fs,其中,fs为归一化函数,式中s为各个指标的评价值;三餐习惯指数: 式中Y为三餐习惯指数,pm为早餐评价,td为用餐标准差评价,pn为夜宵评价,s为消费差评价,即午餐和晚餐的日均消费金额之间的差值;作息习惯指数: 式中S为作息习惯指数,tc为睡眠时长评价,tu为入睡时间评价,ti为起床时间评价;消费水平指数:Sp=fc,式中c为学生日均消费金额;上网习惯指数:N=f1.725+0.321t,式中t为学生日均上网时间;S7、通过学生综合画像,对异常的学生行为进行检测分析;具体包括:S7.1、以班级、组别或宿舍为单位构建多个学生画像,每个学生画像应包括至少两个方面的评估维度,构建学生画像后对全部学生画像进行归一化处理;S7.2、根据全方面的评估维度构建分析空间,每个方面的评估维度作为分析空间的一个坐标轴;S7.3、将每个学生的画像映射到分析空间;S7.4、在分析空间中,分布于单个学生画像预设距离范围内的学生画像为邻近学生画像,计算单个学生画像的近邻学生画像的数量,依此分析单个学生画像与其他学生画像的位置分布情况,得出相似性;S7.5、将学生画像输入时间序列模型,得到预测学生画像,以分析单个预测学生画像与其他预测学生画像的偏离程度,从而发现存在异常的学生;S8、教育工作者或教师,根据反馈的学生画像进行教学工作安排,并对存在异常行为的学生进行修正引导。
全文数据:
权利要求:
百度查询: 青软创新科技集团股份有限公司 一种基于大数据数仓技术的学生画像挖掘实现方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。