买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】基于词嵌入的个性化音乐推荐方法_陕西师范大学_202010219678.4 

申请/专利权人:陕西师范大学

申请日:2020-03-25

公开(公告)日:2020-07-17

公开(公告)号:CN111428076A

主分类号:G06F16/635(20190101)

分类号:G06F16/635(20190101);G06F16/65(20190101);G06F16/68(20190101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101)

优先权:

专利状态码:失效-发明专利申请公布后的视为撤回

法律状态:2023.05.16#发明专利申请公布后的视为撤回;2020.08.11#实质审查的生效;2020.07.17#公开

摘要:一种基于词嵌入的个性化音乐推荐方法,由构建音乐会话记录、音乐会话记录预处理、构建音乐词向量提取模型、训练音乐词向量提取模型、音乐推荐五个步骤组成。本发明结合推荐技术和自然语言处理技术,通过用户行为数据学习会话记录中音乐的词向量表示。学习到的词向量不仅能够反映音乐之间的内在关联,还可作为其他模型的输入数据。本发明聚焦于用户的短期动态音乐偏好预测,与现有的方法相比,具有运算复杂度低、预测准确率高、泛化能力强等优点,可用于下一首曲目预测推荐。

主权项:1.一种基于词嵌入的个性化音乐推荐方法,其特征在于由下述步骤组成:1构建音乐会话记录设定用户集合U为:U={u1,u2,…,un}其中,ui表示用户集合U中的任意一个用户,ui∈U;设定音乐集合M为:M={m1,m2,…,mn}其中,mi表示音乐集合M中的任意一首音乐,mi∈M;设定用户u的历史音乐收听序列Hu为: 其中,表示用户u的历史收听序列Hu中的任意一首歌曲,对于每个用户u,其历史音乐收听序列Hu中的每一首音乐都带有一个相应的时间戳;将每个用户u的历史音乐收听序列Hu中的音乐按照时间戳之间的相近程度组成音乐会话记录;设定用户u的音乐会话记录为: 其中,表示用户u的第k个音乐会话记录中ti时刻收听的音乐,用户u的每个音乐会话记录中的第一首音乐的时间戳与最后一首音乐的时间戳之间的时间间隔在30分钟之内;用户u的音乐会话记录的集合Su为: 其中,表示用户u的第i个会话记录,i和n为有限的正整数,2音乐会话记录预处理1将音乐会话记录中连续重复的音乐视作一首音乐;2剔除音乐数量小于5首的音乐会话记录;3剔除音乐数量大于40首的音乐会话记录;4对于音乐数量处在20到40之间的音乐会话记录,以音乐会话记录中的第20首音乐为分割点,将原音乐会话记录分割成两个不同的音乐会话记录,从第1首到第20首为一个音乐会话记录,从第21首到最后一首为另一个音乐会话记录;3构建音乐词向量提取模型1确定会话记录的中心词和上下文词设定任意用户u收听历史记录中单个音乐会话记录S为:S={m1,m2,…,mn}其中,mi为单个音乐会话记录S中的每一首音乐,即为中心词,mi∈S;使用大小为w滑动窗口捕获mi的上下文歌曲集合Ci:Ci={mi-w,…,mi-1,mi+1,…,mi+w}其中,mi为上下文歌曲集合Ci中的音乐,即为上下文词;2初始化中心词和上下文词向量采用独热编码的方法在CBOW神经网络的映射层处对中心词和上下文词进行编码。用户历史收听序列中的歌曲总数量为N,每首音乐与0到N-1之间的连续整数索引一一对应,对于某个具体的音乐,构建一个长度为N的向量,将该音乐索引对应的状态位设置成1,其余状态位设置为0,每个上下文词对应的独热编码向量记为Xi;3获取上下文词和向量初始化CBOW神经网络的映射层与CBOW神经网络的第一个隐藏层之间的权重矩阵wN×D,wN×D是一个N行D列的矩阵,D为音乐词向量的特征维度,根据需求自行设定。将所有上下文词的独热编码向量Xi送至CBOW神经网络的第一个隐藏层,上下文词和向量h1×D由下式得到: 其中,w为滑动窗口的大小,CBOW神经网络的映射层与CBOW神经网络的第一个隐藏层之间为权重矩阵wN×D,Xi为每个上下文词对应的独热编码向量,Xi∈Ci;4获得预测的中心词音乐初始化CBOW神经网络的第一个隐藏层与CBOW神经网络的第二个隐藏层之间的权重矩阵w′N×D,w′N×D是一个N行D列的矩阵,按下式得到输出向量y1×N:y1×N=h1×D×w′N×DT其中,CBOW神经网络的第一个隐藏层与CBOW神经网络的第二个隐藏层之间权重矩阵w′N×D,h1×D为上下文词的和向量;在CBOW神经网络的输出层处采用Softmax函数对输出向量y1×N进行归一化处理,得到一个N维的概率值Softmaxy1×N: 其中,yi为输出向量y1×N每一维度的取值,Softmaxy1×N是一个经由Softmax函数进行归一化处理获得N维的概率值,每一维都代表一首预测音乐,概率最大的那一行为预测出的中心词音乐;5获得音乐会话记录中每首歌曲的音乐词向量一对训练样本由下式确定:mi,Ci对音乐会话记录中的每一对训练样本mi,Ci,重复上述步骤直至会话记录末端,即反复凭借上下文词Ci来预测中心词mi,CBOW神经网络最终训练得到的权重矩阵wN×D中的所有行向量,即为音乐会话记录中每首歌曲的音乐词向量;4训练音乐词向量提取模型采用负采样优化方法训练构建的音乐词向量提取模型的步骤如下:1构建正样本训练样本mi,Ci构成一个正样本,即当给定上下文词Ci,训练样本中的另一个词为中心词mi时,则标记为正样本;2构建负样本引入negm个与中心词mi不同的噪声词mk,k为1,2,…,neg,则mk,Ci构成了negm个负样本,即当给定上下文词,训练样本中的另一个词为噪声词mk时,标记为负样本,噪声词mk服从概率分布Pm:mk~Pm,表示根据分布Pm来采样中心词mi的负样本mk,词频越高被选中的概率越大,分布Pm的计算公式如下: 其中,Counterm表示音乐m在音乐集合M中出现的频次;3负采样优化采用Softmax函数处理CBOW神经网络的输出向量y1×N的过程中,以negm个负样本和一个正样本进行反向传播参数迭代;5音乐推荐以CBOW神经网络训练得到的所有音乐词向量的均值表示用户向量,衡量用户向量与音乐集合中的每一首歌曲的音乐词向量之间余弦相似度,寻找10个与用户向量最为接近的音乐词向量,这10个音乐词向量所对应的音乐便构成一个推荐列表。判断用户下一首真实收听的音乐是否在此列表中,如果真实收听的音乐处在推荐列表命中,表明推荐结果对用户有效。

全文数据:

权利要求:

百度查询: 陕西师范大学 基于词嵌入的个性化音乐推荐方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。