买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种对网页信息展示位置进行排序的方法_浙江大学_201710090028.2 

申请/专利权人:浙江大学

申请日:2017-02-20

公开(公告)日:2020-07-14

公开(公告)号:CN106919669B

主分类号:G06F16/954(20190101)

分类号:G06F16/954(20190101);G06F16/958(20190101)

优先权:

专利状态码:有效-授权

法律状态:2020.07.14#授权;2017.07.28#实质审查的生效;2017.07.04#公开

摘要:一种对网页信息展示位置进行排序的方法,属于互联网技术领域。该方法利用监控程序收集一定时间段、同一网页内不同展示位置的用户点击量数据,对收集的历史点击量进行数据净化,通过时间序列计算历史点击量期望值,根据期望值来估计展示位置的当前价值,再按照当前估计价值从高到低对网站不同的展示位置进行排序。利用本发明可以实现网页布局的优化设计;实现信息展示位置本身价值和排列顺序的合理匹配;提高网站资源利用效率和平台效用。

主权项:1.一种对网页信息展示位置进行排序的方法,其特征在于利用监控程序收集一定时间段、同一网页内不同展示位置的用户点击量数据,对收集的历史点击量进行数据净化,通过时间序列计算历史点击量期望值,根据期望值来估计展示位置的当前价值,再按照当前估计价值从高到低对网站不同的展示位置进行排序;具体包括以下步骤:1)数据获取:利用监控程序,监控各个展示位置的用户点击轨迹,收集和统计特定时间段、同一网页内各展示位置每天的用户点击量数据;2)对原始数据进行清洗,得到“干净数据”;3)计算在该时间段内各个展示位置点击量的期望值;4)以点击量的期望值来估计展位当前价值,并对展示位置从高到低进行排序;5)滚动排序,即在下一个排序周期,收集相同时间间隔的数据,重复1)到4)的步骤,实现周期性动态排序;所述的步骤2)中对原始数据进行清洗包括如下步骤:1)数据分析,做出数据分布散点图;2)定义清洗规则,包括缺失数据处理规则和噪声数据处理规则;3)执行清洗过程;4)干净数据回流;所述的步骤3)中计算在该时间段内各个展示位置点击量的期望值具体为:以下三种方法得到期望值的组合,其中,且:方法一,算术移动平均:,At,i表示在距离当前时间节点第t天,即时间距离t,其中1≤t≤n,i展示位的日点击量;F0,i(1)表示当前时间i展示位的日点击量估计值,0表示当前时间;n表示特定时间段的时长,用天数表示;方法二,加权移动平均模型:,Ct表示距离当前时间节点第t天的点击量的权重;At,i表示At,i表示在距离当前时间节点第t天,i展示位的日点击量;F0,i(2)表示当前时间i展示位的日点击量估计值;方法三,移动加权-指数平滑模型:基于移动加权平均计算的结果,结合指数平滑方法,计算公式为,表示滑动系数,且0≤≤1,表示在1≤t≤n时间段内,i展示位所有日点击量的期望值,采用方法二的计算公式;F1,i(3)表示距离当前时间前一天的平滑模型计算结果,初始值设置为距离当前时间前一天的实际点击量A1,i。

全文数据:一种对网页信息展示位置进行排序的方法技术领域[0001]本发明属于互联网技术领域,具体涉及一种对网页信息展示位置进行排序的方法。背景技术[0002]随着电子商务的迅猛发展,网页信息浏览量迎来了爆发式增长,伴随而来的是网站信息展示资源竞争的白热化。网站页面是互联网信息展示的载体,由于展示信息量比较大,需要对不同的信息来源进行排序,由此而形成网页设计中的展示位置模块。[0003]网页通常由不同的展示位置组成,不同的信息匹配相应的展示位置。目前展示位置的先后顺序通常是采用按照惯例从左到右、从上到下依次排序的方法,比如第一行左边第一位优先级最高,序号为1,第二位其次,序号为2,第三位序号为3,第二行第一位序号为4···。然而,这种排序方式不是基于展示位置实际价值,而是习惯使然。[0004]现有的相关研究是根据眼球轨迹实验得到的热点图确定用户在网页内浏览的注意力分布,这种结果可以用于评估不同展示位置的价值,然而在现实中无法做到实时、大量统计,而且注意力分布与展示位置的分布不一定可以高度匹配,不具备实际操作性。[0005]综上所述,目前对网站展示位置本身的排序方法上存在需求,提供一种可测量的、与展示位置实际价值匹配的排序方法具有非常重要的实践意义和商业价值。发明内容[0006]针对现有技术存在的问题,本发明的目的在于提供一种对网页信息展示位置进行排序方法,解决现有展示位置实际价值与排序之间的“扭曲性匹配”问题,能够实现展示资源合理化利用。[0007]所述的一种对网页信息展示位置进行排序的方法,其特征在于利用监控程序收集一定时间段、同一网页内不同展示位置的用户点击量数据,对收集的历史点击量进行数据净化,通过时间序列计算历史点击量期望值,根据期望值来估计展示位置的当前价值,再按照当前估计价值从高到低对网站不同的展示位置进行排序。[0008]所述的一种对网页信息展示位置进行排序的方法,其特征在于具体包括以下步骤:1数据获取:利用监控程序,监控各个展示位置的用户点击轨迹,收集和统计特定时间段、同一网页内各展示位置每天的用户点击量数据;2对原始数据进行清洗,得到“干净数据”;3计算在该时间段内各个展示位置点击量的期望值;4以点击量的期望值来估计展位当前价值,并对展示位置从高到低进行排序;5滚动排序,即在下一个排序周期,收集相同时间间隔的数据,重复1到4的步骤,实现周期性动态排序。[0009]所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤1中特定时间段包括:5年到1个月区间内的任意时长,以天数为单位。[0010]所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤2中对原始数据进行清洗包括如下步骤:1数据分析,做出数据分布散点图;2定义清洗规则,包括缺失数据处理规则和噪声数据处理规则;3执行清洗过程;4干净数据回流。[0011]所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤3中计算在该时间段内各个展示位置点击量的期望值具体为:以下三种方法得到期望值的组合,其中,且方法一,算术移动平均:,At,,表示在距离当前时间节点第t天,即时间距离t,其中Kt彡η,i展示位的日点击量;Fo,i⑴表示当前时间i展示位的日点击量估计值,〇表示当前时间;η表示特定时间段的时长,用天数表示;方法二,加权移动平均模型:,Ct表示距离当前时间节点第t天的点击量的权重;At,i表示At,i表示在距离当前时间节点第t天,i展示位的日点击量;Fq,i2表示当前时间i展示位的日点击量估计值;方法三,移动加权-指数平滑模型:基于移动加权平均计算的结果,结合指数平滑方法,计算公式为::4表示滑动系数,且〇^^1表示在距离当前时间节点第t天,即时间距离t,其中Kt彡η,i展示位的日点击量;Fo,i⑴表示当前时间i展示位的日点击量估计值,〇表示当前时间;η表示特定时间段的时长,用天数表示;方法二,加权移动平均模型:,Ct表示距离当前时间节点第t天的点击量的权重;At,i表示At,i表示在距离当前时间节点第t天,i展示位的日点击量;F〇,i2表示当前时间i展示位的日点击量估计值;其中加权移动平均模型中权重Ct随距离当前时间由远到近逐渐增加,越靠近当前时间,权重越大;对同一个t,不同展位的权重Ct是相同的,权重计算公式:方法三,移动加权-指数平滑模型:基于移动加权平均计算的结果,结合指数平滑方法,计算公式为,3表示滑动系数,且〇^^展位5展位2展位6展位7展位4展位3展位8,如表4所示。得到展位价值排序以后,与展示的信息形成匹配,即排序1的展位匹配排名得分第一的信息,排序2的展位匹配排名得分第二的信息…,见附图7。[0030]表4'滚动排序周期设置为7天,S卩每隔7天重新进行_一次排序运算,得到新的展位价值排序。_[0031]需要说明的是,上述对实施例的详细说明仅仅为了理解本发明,对本领域技术人员而言,可以根据上述说明加以改进或变换。只要是达到此目的的所有改进和变换都应属于本发明所附权利要求的保护范围。

权利要求:1.一种对网页信息展示位置进行排序的方法,其特征在于利用监控程序收集一定时间段、同一网页内不同展示位置的用户点击量数据,对收集的历史点击量进行数据净化,通过时间序列计算历史点击量期望值,根据期望值来估计展示位置的当前价值,再按照当前估计价值从高到低对网站不同的展示位置进行排序。2.如权利要求1所述的一种对网页信息展示位置进行排序的方法,其特征在于具体包括以下步骤:1数据获取:利用监控程序,监控各个展示位置的用户点击轨迹,收集和统计特定时间段、同一网页内各展示位置每天的用户点击量数据;2对原始数据进行清洗,得到“干净数据”;3计算在该时间段内各个展示位置点击量的期望值;4以点击量的期望值来估计展位当前价值,并对展示位置从高到低进行排序;5滚动排序,即在下一个排序周期,收集相同时间间隔的数据,重复1到4的步骤,实现周期性动态排序。3.如权利要求2所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤1中特定时间段包括:5年到1个月区间内的任意时长,以天数为单位。4.如权利要求2所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤2中对原始数据进行清洗包括如下步骤:1数据分析,做出数据分布散点图;2定义清洗规则,包括缺失数据处理规则和噪声数据处理规则;3执行清洗过程;4干净数据回流。5.如权利要求2所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤3中计算在该时间段内各个展示位置点击量的期望值具体为:以下三种方法得到期望值的组合,其中,且:課:〒::I:方法一,算术移动平均:,Αμ表示在距离当前时间节点第t天,即时间距离t,其中KtSn,i展示位的日点击量;F〇,i1表示当前时间i展示位的日点击量估计值,〇表示当前时间;η表示特定时间段的时长,用天数表示;方法二,加权移动平均模型,Ct表示距离当前时间节点第t天的点击量的权重;At,i表示At,i表示在距离当前时间节点第t天,i展示位的日点击量;Fq,i2表示当前时间i展示位的日点击量估计值;方法三,移动加权-指数平滑模型:基于移动加权平均计算的结果,结合指数平滑方法,计算公式为1表示滑动系数,且〇§1,表示在Sn时间段内,i展示位所有日点击量的期望值,采用方法二的计算公式;F1,X3表示距离当前时间前一天的平滑模型计算结果,初始值设置为距离当前时间前一天的实际点击量^,μ6.如权利要求2所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤4中排序按照展示位置价值由高到低,即不同展示位置点击量期望值由高到低排序。7.如权利要求2所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的步骤5中所述的排序周期是从1天到3个月时间内的任意时长。8.如权利要求4所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的缺失数据处理规则采用缺失位置相邻两个数据进行求和平均的方法得到数值,四舍五入求整后填补进入缺失位置。9.如权利要求4所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的噪声数据处理规则采用异频分箱删除方法:把经过补缺处理的数据由小到大排序,分为3个箱子,第1个箱子占数据量的2.5%,第2个箱子占数据量的95%,第3个箱子占数据量的2.5%;删除第1个箱子和第3个箱子的数据,得到第2个箱子里面的数据,即干净数据,如果2.5%的数据量小于1,则第1和3个箱子里面分别放入最小的和最大的点击量数据。10.如权利要求4所述的一种对网页信息展示位置进行排序的方法,其特征在于所述的加权移动平均模型中权重Ct随距离当前时间由远到近逐渐增加,越靠近当前时间,权重越大;对同一个t,不同展位的权重Ct是相同的,权重计算公式:

百度查询: 浙江大学 一种对网页信息展示位置进行排序的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。