买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】垃圾危机转化智能管理方法_武汉理工大学_202010005056.1 

申请/专利权人:武汉理工大学

申请日:2020-01-03

公开(公告)日:2024-03-01

公开(公告)号:CN111223026B

主分类号:G06Q50/26

分类号:G06Q50/26;G06F18/2415;G06F18/22;G06F16/951;G06F16/957

优先权:

专利状态码:有效-授权

法律状态:2024.03.01#授权;2020.06.26#实质审查的生效;2020.06.02#公开

摘要:本发明公开了一种垃圾危机转化智能管理方法,包括:对网络数据库进行数据爬取;对步骤一中爬取到的文档进行超文本标记语言处理、词法相似度分析和词表频度处理;运用FCM聚类算法对步骤二中已经完成数据清洗和相似词替换的案例向量化数据进行分析,将案例分成四类,构成名利空间下的决策支持模型;对归类的数据进行余弦相似度分析,根据贝叶斯网络模型对当前案例结构进行优化,演化出每一类的最优贝叶斯结构。本发明应用数据抓取、数据清洗和数据分析方法,交互友好,综合运用人工智能的相关方法,文本处理过程流畅,为垃圾“邻避”事件的解决提供了新的思路和参考建议,降低了决策难度,有很强的可行性。

主权项:1.一种垃圾危机转化智能管理方法,其特征在于,包括:步骤一,对网络数据库进行数据爬取;步骤二,对步骤一中爬取到的文档进行超文本标记语言处理、词法相似度分析和词表频度处理;步骤三,运用FCM聚类算法对步骤二中已经完成数据清洗和相似词替换的案例向量化数据进行分析,将案例分成四类,构成名利空间下的决策支持模型;对归类的数据进行余弦相似度分析,根据贝叶斯网络模型对当前案例结构进行优化,演化出每一类的最优贝叶斯结构;所述步骤一对网络数据库进行数据爬取包括:使用Python在网络数据库爬取文件,基于关键词表和停用词表的标题分词进行筛选,最后再通过超文本标记语言HTML结构筛选算法进行筛选,获取作为本决策支持系统的案例库;Python使用的相关库包括scrapy、jieba、BeautifulSoup和chardet;超文本标记语言HTML结构筛选算法进行筛选的方法包括:先定义处理后的文档的路径,读取内容过滤词的文件,并写入contentfilter_list过滤词列表,完成数据初始化;去除网页中的脚本编程语言JavaScript和层叠样式表链接,提取网页中其它标签的文本,完成超文本标记语言HTML结构处理;对每个标签中的文本进行判断,如果文本的长度小于设定长度或者文本中有contentfilter_list过滤词列表的字符串就不取,否则添加进write_list列表;将每个html文件的write_list写入txt文件中;词法相似度分析的方法包括:利用Python的jieba库对超文本标记语言HTML文件处理后的txt文件进行分词并统计出现频度最高的15个词获取需要比较的词语、关键字;调用并初始化云AI平台自然语言处理应用程序接口;利用自然语言处理应用程序接口相似度计算算法得到关键字与需要比较的词汇的相似度,对所述相似度进行排序;把关键字和需要比较的词的相似度写入csv文件中;构建邻避CRN网络进行词表频度处理,具体方法包括:对超文本标记语言HTML处理后的txt文件进行依次读取,利用jieba对文本进行分词处理,写入csv文件中;把词法相似度分析中读取的所有词的词频全部写入一个csv文件中;利用词法相似度表的数据对全部词频的csv文件进行词汇的替换;将词频矩阵进行奇异值分解得到每个词的奇异值和每个文本对应的奇异向量,得到关键词-关键词语义距离表表和文本-关键词语义距离表。

全文数据:

权利要求:

百度查询: 武汉理工大学 垃圾危机转化智能管理方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。