买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】基于云算力和大数据技术的知识图谱海量非结构化集成方法_联通沃音乐文化有限公司_202311365109.0 

申请/专利权人:联通沃音乐文化有限公司

申请日:2023-10-20

公开(公告)日:2024-04-09

公开(公告)号:CN117093718B

主分类号:G06F16/35

分类号:G06F16/35;G06F40/30;G06N3/042;G06N5/02;G06F16/36

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2023.12.08#实质审查的生效;2023.11.21#公开

摘要:本申请提供基于云算力和大数据技术的知识图谱海量非结构化集成方法,包括:筛选出含有歌词或评论的文本,并运用情感分析模块进行情感打分;在云服务器对获取到的数据进行识别,筛选出与情感相关的歌词或音乐元素;形成情感标签‑元素对,并将相似或相关的标签进行合并和统一,以降低知识图谱的复杂度;使用数据集成引擎将统一后的标签‑元素对整合到一个简化的数据框架里;数据集成完成后,触发知识图谱的更新流程,并将这个简化的数据框架加入到音乐知识图谱中;根据音乐知识图谱,通过决策树算法分析音乐制作人或歌词作者关注的旋律或歌词;根据决策树算法预测结果,结合音乐知识图谱生成歌词修改方案,以用于修改旋律或歌词。

主权项:1.基于云算力和大数据技术的知识图谱海量非结构化集成方法,其特征在于,所述方法包括:利用云算力获取音乐平台的非结构化文本,包括评论、歌词,并用朴素贝叶斯算法进行初步分类;筛选出含有歌词或评论的文本,并运用情感分析模块进行情感打分;在云服务器对获取到的数据进行识别,筛选出与情感相关的歌词或音乐元素;形成情感标签-元素对,并将相似或相关的标签进行合并和统一,以降低知识图谱的复杂度;使用数据集成引擎将统一后的标签-元素对整合到一个简化的数据框架里;数据集成完成后,触发知识图谱的更新流程,并将这个简化的数据框架加入到音乐知识图谱中;实时检测机制同步更新数据集成框架中新加入的元素或标签,并在超出预定复杂度时自动触发标签的合并和简化;根据音乐知识图谱,通过决策树算法分析音乐制作人或歌词作者关注的旋律或歌词;根据决策树算法预测结果,结合音乐知识图谱生成歌词修改方案,以用于修改旋律或歌词;其中,所述在云服务器对获取到的数据进行识别,筛选出与情感相关的歌词或音乐元素,包括:通过音乐平台获取一个包含歌曲信息、歌词和情感标签的数据集,其中,所述数据集包括的每个数据点包括歌曲的标题、专辑、艺术家,同时对于歌词,标注出表达的情感标签;通过Python中的NLTK库,构建一个情感词库,这个库包括情感词汇以及表达情感的相关词汇;对歌词和音乐元素文本进行清洗、分词和去除停用词、词干提取和词性标注,具体包括,遍历歌词和音乐元素文本中的每个单词或短语,并在情感词库中查找匹配项;选择一部分数据集,并为每个歌词或音乐元素分配情感标签,然后使用带有情感标签的数据来训练一个支持向量机模型,在训练过程中,将预处理后的文本转换为特征向量,并将这些特征向量和相应的情感标签输入到支持向量机模型中进行训练;将预处理后的文本转换为特征向量,然后将这些特征向量和相应的情感标签输入到支持向量机模型中进行预测,根据支持向量机模型的输出,判断文本是否与某个情感相关;根据支持向量机模型的预测结果,筛选出与某种情感相关的歌词或音乐元素;所述形成情感标签-元素对,并将相似或相关的标签进行合并和统一,包括:获取音乐平台上的歌曲评论,或是使用社交平台获取用户对歌曲的评价,并在音乐数据集中获取歌曲元素信息,其中,所述歌曲元素信息至少包括节奏、音调;使用Spacy来提取歌曲评论中的情感词汇,并使用情感词典将情感词汇与情感标签进行匹配;同时对歌曲元素进行特征提取,包括提取音调、节奏特征,与情感标签进行匹配;使用余弦相似度计算情感标签的相似度,将相似度高于预设相似度的情感标签进行合并和统一,并对元素进行分类和归一化处理;将匹配和归一化后的情感标签与元素进行组合,构建情感标签与元素对,将每个情感标签与对应的元素组成一个数据行,并存储在表格或数据集中;所述数据集成完成后,触发知识图谱的更新流程,并将这个简化的数据框架加入到音乐知识图谱中,包括:获取当前的音乐知识图谱结构,确定新数据的添加方式和对应关系;从简化的数据框架中提取必要的音乐信息作为新实体或属性的值;使用Neo4j编辑已有的音乐知识图谱,添加新的音乐实体和与之相关的实体关联关系;验证和校对新添加的实体和关系,确认其准确性和完整性后,进行保存和更新;还包括:通过循环神经网络模型进行实体识别和消歧,确定不同数据框架中的音乐实体是否指代同一实体,获取准确的实体信息;通过图神经网络建立关系模型,从数据框架中抽取音乐实体之间的关系,得到准确的实体关联信息;所述通过循环神经网络模型进行实体识别和消歧,确定不同数据框架中的音乐实体是否指代同一实体,获取准确的实体信息,具体包括:确定需要识别和消歧的实体类型,包括音乐实体中的艺术家、歌曲,确定需要处理的数据框架和数据源;使用已有的音乐数据库、网络爬取的音乐相关文章、评论,获取包含样本实体和对应上下文的数据集作为训练数据,确保训练数据的多样性和代表性;在训练数据中标注实体和上下文,为每个实体分配唯一的标识符;使用实体识别构建实体识别和消歧模型,训练一个循环神经网络模型,识别输入文本中出现的音乐实体,包括艺术家、歌曲名称,输出不同数据框架中的音乐实体是否指代同一实体;使用训练数据对实体识别和消歧模型进行训练,并根据校验数据的效果进行模型调优;使用交叉验证提高模型的准确性和鲁棒性;将训练好的实体识别和消歧模型部署到生产环境中,通过API或其他方式进行模型调用;将待消歧的实体输入模型,获取实体的唯一标识符,获取准确的实体信息;定期监控实体识别和消歧模型的性能并持续进行维护和改进,获取用户反馈和标注,用于迭代模型训练和优化;所述通过图神经网络建立关系模型,从数据框架中抽取音乐实体之间的关系,得到准确的实体关联信息,具体包括:从各种数据源,包括音乐数据库、音乐平台、音乐评论获取音乐数据包括歌曲、艺术家、专辑实体以及它们之间的关系;对数据进行清洗和预处理,包括去除噪声、标准化数据;使用TF-IDF对歌曲和艺术家的描述进行特征提取,包括风格、流派、情绪,使用音乐指纹,根据音乐本身的音频特性提取特征;根据收集到的数据和提取的特征,选择图神经网络模型来处理音乐实体之间的关系,将音乐实体歌曲、艺术家视为图中的节点,音乐实体之间的关系视为图中的边,训练图神经网络模型来学习节点和边之间的交互;将新的音乐实体和关系输入图神经网络模型,得到音乐实体之间的关联信息,将一首新的歌曲和其艺术家输入模型,图神经网络模型输出音乐实体之间的关联度;使用交叉验证评估模型的准确性和鲁棒性,并根据评估结果对模型进行调整和优化;所述根据决策树算法预测结果,结合音乐知识图谱生成歌词修改方案,以用于修改旋律或歌词,包括:获取决策树模型预测的音乐制作人或歌词作者的关注点,其中,所述关注点为旋律或歌词;根据关注点,结合音乐知识图谱中的相关信息,分析需要进行的修改或改进,若决策树预测结果为音乐制作人或歌词作者关注旋律,则根据音乐知识图谱查找与该音乐类型或风格相关的理论或技巧,并获取音乐制作人或歌词作者的音乐库中使用的乐器和音效,以及音乐制作人或歌词作者过去合作的艺术家和音乐风格,对于旋律修改,包括调整音符的选择、改变旋律的结构、增强节奏感,对于歌词修改,包括增加情感表达、改善词汇选择或优化描述技巧;将歌词修改方案发送相关的音乐制作人或歌词作者;获取音乐制作人或歌词作者的反馈,根据实践和反馈结果,进行再次分析和调整,若需要进一步的修改和改进,则继续优化歌词修改方案。

全文数据:

权利要求:

百度查询: 联通沃音乐文化有限公司 基于云算力和大数据技术的知识图谱海量非结构化集成方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。