买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于网络爬虫的软件满意度评价方法_武汉数据智能研究院_202311832384.9 

申请/专利权人:武汉数据智能研究院

申请日:2023-12-28

公开(公告)日:2024-04-19

公开(公告)号:CN117909225A

主分类号:G06F11/36

分类号:G06F11/36;G06F16/35;G06Q30/0201;G06F16/215;G06F40/247

优先权:

专利状态码:在审-实质审查的生效

法律状态:2024.05.07#实质审查的生效;2024.04.19#公开

摘要:本发明提供了一种基于网络爬虫的软件满意度评价方法,包括以下步骤:1利用网络爬虫程序对目标软件的评论数据进行爬取,并对获取的评论数据进行预处理;2提取预处理后评论数据中的关键词和或短语,构建情感词库分值表ST,进而构建评价系统;3构建参考值系统,包括文本参考值TR、文件参考值PR以及版本参考值VR;4计算当前评论的评价值Ei,并结合对应评论的参考值Ai得出该评论综合得分,最后算出软件满意度得分本专利中能够对软件评论的参考度和情感评价进行综合评估,评估准确,考虑因素全面,能够供其他用户参考。

主权项:1.一种基于网络爬虫的软件满意度评价方法,其特征在于包括以下步骤:1在不同的应用商店和或网站,利用网络爬虫程序对目标软件的评论数据进行爬取,并对获取的评论数据进行预处理,对预处理后评论数据进行本地存储;2提取预处理后评论数据中的关键词和或短语,构建情感词库分值表ST,类别Pi分为积极、较积极、中性、较消极和消极五类,给每一类别分配分值IS;对关键词和或短语进行分析,判断其情感倾向对应类别,得出筛选后评价词列表WL,最后根据评价词列表WL来计算评价值E,并根据评价值E的范围划分对应的评论得分CS;3构建参考值系统3.1对预处理后评论数据中的评论文本长度CL进行提取,并通过爬取计算出评论文本平均长度根据评论文本长度CL和评论文本平均长度计算文本倍值TT,并根据文本倍值TT的范围划分对应的文本参考值TR;3.2对预处理后评论数据中的图片和视频文件进行提取,识别图像中的关键特征,推算出图片文件Pi内容与被评价软件的相关度RRi,并统计累计图片文件出现次数PN;通过出现次数PN计算图片上传值PU;读取视频信息获取时评时长,并加以累计得出所有视频总时长VT,将所有视频文件整合至一个视频文件,对视频内容识别得出内容与该软件相关度Vl;通过视频总时长VT计算视频上传值VU;利用相关度RRi和Vl,以及图片上传值PU和视频上传值VU计算出文件参考值PR;3.3获取版本日志列表标签以及版本日期列表,将版本Vi共分为大版本、小版本和补丁三种,根据当前评论发布时间得出评论时的版本VO,与最新版本VN求差值,根据版本差值计算补丁差P,并根据补丁差P的范围划分对应的版本参考值VR;3.4分别向文本参考值TR、文件参考值PR以及版本参考值VR赋予不同的权重,并叠加计算当前评论参考值A;4用步骤3中参考值系统对爬取的评论进行参考值计算,预设C为参考值条件,筛选参考值A大于等于C的评论FC;使用步骤2中评价系统对筛选后评论FC进行评价值计算当前评论的评价值Ei,并结合对应评论的参考值Ai得出该评论综合得分,最后算出软件满意度得分软件满意度得分越高时用户满意度越高,反之越低,最后根据软件满意度得分的范围划分对应的评价状况。

全文数据:

权利要求:

百度查询: 武汉数据智能研究院 一种基于网络爬虫的软件满意度评价方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。