买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种文本推荐方法、系统、存储介质和设备_济南大学_202111016193.6 

申请/专利权人:济南大学

申请日:2021-08-31

公开(公告)日:2024-04-23

公开(公告)号:CN113688229B

主分类号:G06F16/335

分类号:G06F16/335;G06F16/35;G06F16/9535;G06F16/958

优先权:

专利状态码:有效-授权

法律状态:2024.04.23#授权;2021.12.10#实质审查的生效;2021.11.23#公开

摘要:本发明属于文本推荐领域,提供了一种文本推荐方法、系统、存储介质和设备。其中,该方法包括获取待推荐文本的关键词;基于所述待推荐文本与已知属性文本的关键词,聚类所有待推荐文本;根据所有待推荐文本的关键词与已知文本属性的关键词之间的距离,依次推荐文本;其中,在聚类所有候选文本的过程中,考虑所有待推荐文本与已知属性文本的关键词之间的亲和度信息,将得到的亲和度与属性的权重相结合来构造基于维度亲和度的属性权重套索正则项,同时利用最大熵正则化,以实现属性权重的优化分布。

主权项:1.一种文本推荐方法,其特征在于,包括:获取待推荐文本的关键词;基于所述待推荐文本与已知属性文本的关键词,聚类所有待推荐文本;根据所有待推荐文本的关键词与已知文本属性的关键词之间的距离,依次推荐文本;所述方法还包括:a读入需要进行聚类的文本信息,该文本信息一共包含个文本,该文本又分为个不同内容的文本,每一个文本中的关键词的个数为;b初始化特征亲和度矩阵S,即求解所有样本的关键词之间的特征亲和度矩阵;c采用栅格化初始参数的方法,设置目标函数中的模糊因子、熵项参数和正则项参数,设置优化算法的步长;d初始化迭代计数器,将其设置为0,设置最大迭代次数为100,设置迭代收敛阈值为,初始化个聚类中心;e将迭代计数器加1,即;f利用隶属度的迭代公式计算第个文本属于第个类中心文本的隶属度,即得到文本的隶属度矩阵;g利用类中心文本的迭代公式更新第个类的类中心文本,即得到新的类中心文本C;h利用类中心文本的权重的迭代公式更新第个类中心文本中第个关键词的权重,即得到新的关于类中心文本权重矩阵;i利用辅助变量的迭代公式更新辅助变量;j利用对偶变量的迭代公式更新对偶变量;k计算第次迭代所得到的目标函数的值;l判断迭代循环是否终止,比较第次的目标函数的值与第次的目标函数的值之间的差,如果满足或者,则终止迭代循环,输出聚类结果,如果不满足,则重复执行步骤e到步骤l,一直到满足迭代循环终止条件;其中,在聚类所有候选文本的过程中,考虑所有待推荐文本与已知属性文本的关键词之间的亲和度信息,将得到的亲和度与属性的权重相结合来构造基于维度亲和度的属性权重套索正则项,同时利用最大熵正则化,以实现属性权重的优化分布;所述亲和度信息采用非线性核函数来挖掘;其中,表示第个关键词,表示第个关键词,表示求解两个关键词相似度的一个核函数的参数;其中目标函数的计算公式为: 其中,unk为隶属度;表示第个数据样本的第个特征的值;表示第个聚类中心的第个特征的值;表示第个聚类中心的第个特征的属性权重的值;N表示数据样本个数;K表示聚类中心个数;M表示特征个数;为模糊因子;表示熵项参数;表示正则项参数;为第个聚类中心的第个特征所对应的辅助变量中的第j个元素;qkjm为第个聚类中心的第j个特征所对应的辅助变量中的第个元素;为亲和度矩阵中第m行第j列的元素。

全文数据:

权利要求:

百度查询: 济南大学 一种文本推荐方法、系统、存储介质和设备

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。