买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于用户偏好自动生成主题评价摘要的方法_信阳师范学院_202010022473.7 

申请/专利权人:信阳师范学院

申请日:2020-01-09

公开(公告)日:2024-03-22

公开(公告)号:CN111259136B

主分类号:G06F16/34

分类号:G06F16/34;G06F16/35;G06F16/335;G06F16/9535

优先权:

专利状态码:有效-授权

法律状态:2024.03.22#授权;2020.07.03#实质审查的生效;2020.06.09#公开

摘要:本发明公开一种基于用户偏好自动生成主题评价摘要的方法,通过采集顾客以往的评价信息,对顾客提供所感兴趣领域的评价样本文档进行分析,利用样本文档中词对的共现关系所隐含的语义联系,通过计算词对共现率建立共现词对的特征数据库;并利用该特征数据库,通过对目标文本进行特征词链的聚类和相似度的计算,提供顾客感兴趣的查询式自动摘要。该方法应用并不限于餐饮评价领域,也可用于网上购物消费、旅游等其他活动的推荐和公共及专业领域的信息检索。

主权项:1.一种基于用户偏好自动生成主题评价摘要的方法,其特征在于:包括如下步骤:步骤101,采集用户以往基于特定场景在网上发表的评价文本作为样本文档;步骤102,对样本文档进行预处理;步骤103,从预处理后的样本文档中计算词对共现率;步骤104,将所述词对共现率存入特征数据库;步骤105,当缺少用户以往的评价文本时,或用户有其他偏好需求时,由用户手工输入多个特征关键词,将关键词作为两两关联的共现词对,存入特征数据库;步骤106,采集符合用户挑选范围内上述特定场景内所对应的其他用户的评价文本,分别汇总生成目标文档;步骤107,对所述目标文档进行预处理;步骤108,提取所述目标文档的特征词集,从所述特征数据库中查找所述特征词集中各词汇的距离,生成特征词链;所述从所述特征数据库中查找所述特征词集中各词汇的距离,生成特征词链,包括:对于待生成摘要的目标文档d,从所述特征数据库和目标文档d中查找所述特征词集中各词汇的距离,生成特征词链,具体为:特征数据库中存储的是特征词集V={v1,v2,…,vm}和共现词对集E={evi,vj},E中任意共现词对evi,vj均为WordCo-occurrence结构,包含两个词汇的编号、共现率以及共现次数;目标文档d中包含特征词集W={w1,w2,…,wn};对于W中的任意词对wi,wj,若wi∈V、wj∈V,且该词对包含在E中即有ewi,wj,则这两词汇的关联度lij为ewi,wj中的对应共现率;若wi或wj不包含在V中或者该词对不包含在E中,两词汇的关联度为:lij=Pdwi,wj;如此,生成目标文档d的特征词集W中所有词对的关联度集合L={l11,l12,…,l1n,l21,…l2n,…,ln-1n};根据词对之间关联程度,通过聚类方法,构建多个特征词链,从而显现出目标文档d的多个相关主题;根据聚类时产生特征词链的顺序,将各个特征词链汇总形成特征词链集合C;步骤109,从所述目标文档中划分出单句;步骤110,计算所述目标文档中各单句所含特征词与所述特征词链的相似度,根据单句和各特征词链的相似度关系,依次选取各特征词链相似度最高的单句生成摘要。

全文数据:

权利要求:

百度查询: 信阳师范学院 一种基于用户偏好自动生成主题评价摘要的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。