【发明授权】奖惩机制演化博弈模型构建方法、系统及应用_西安电子科技大学_202110105123.1

导航：龙图腾网> 最新专利技术> 奖惩机制演化博弈模型构建方法、系统及应用_西安电子科技大学_202110105123.1

申请/专利权人：西安电子科技大学

申请日：2021-01-26

公开（公告）日：2023-12-01

公开（公告）号：CN112801299B

主分类号：G06N20/00

分类号：G06N20/00;G06Q50/00

优先权：

专利状态码：有效-授权

法律状态：2023.12.01#授权;2021.06.01#实质审查的生效;2021.05.14#公开

摘要：本发明属于网络信息数据处理技术领域，公开了一种奖惩机制演化博弈模型构建方法、系统及应用，采用外部事件信息流入机制和基于态度行为的奖惩机制；在计算中心个体的自身所拥有信息量能否促使中心个体选择合作时所使用的公式符合随着信息量的增加，合作概率增加同时合作概率增加速率减缓的一般意义，且利用对数函数特性保证模型不会出现随着大量信息渗入社会群体直接快速全合作；利用声望值作为奖惩机制量化标准，在有数理推导的依托下分析社交网络稳定性条件并运用至仿真。本发明对社交网络稳定状态的条件做了探究同时在外界信息流入和对博弈个体的奖励惩罚机制上做了改进。

主权项：1.一种奖惩机制演化博弈模型构建方法，其特征在于，所述奖惩机制演化博弈模型构建方法采用外部事件信息流入机制和基于态度行为的奖惩机制；该模型个体自身声望值的大小即衡量用户间行为态度博弈的收益大小的依据；而用户所拥有的信息量大小和其态度行为策略会直接影响该个体的自身声望值，其自身声望值的变动和与邻居声望值的大小的对比又会反过来影响该个体与其他个体链接权重的变化和适应度的变动；在计算中心个体的自身所拥有信息量能否促使中心个体选择合作符合随着信息量的增加，合作概率增加同时合作概率增加速率减缓的一般意义，且利用对数函数特性保证模型不会出现随着大量信息渗入社会群体直接快速全合作；利用声望值直接作为奖惩机制量化标准，在有数理推导的依托下分析社交网络稳定性条件并运用至仿真；所述奖惩机制演化博弈模型构建方法包括以下步骤：第一步，建立的规则网格网络，进行多轮次的循环演化博弈；第二步，记录每个个体的行为和态度，对网络中的中心个体的行为选择根据个体邻居态度和自身态度进行适应性调整；第三步，根据邻居态度对受压力个体行为进行更新；根据中心个体自身态度对知行不合一个体进一步做个体态度策略更新；第四步，构建基于态度行为的奖惩机制模型收益矩阵；所述奖惩机制演化博弈模型构建方法建立一个大小为L*L的规则网格网络，L根据需模仿的网络规模设定为100、200或400，网络中每一个网格代表一个社交网络中的用户个体；每一个个体都被赋予其特有的属性值，包括1初始行为s，初始行为包括合作和背叛；2初始声望值R；3初始信息量I；4初始链接权重w及其上下限[w-e,w+e]；5链接权重变化值u；设定博弈收益矩阵M、其主要取决于所采用的博弈模型，采用囚徒困境PDG时，收益矩阵为：根据个体的初始行为和博弈收益矩阵计算每一个个体的初始博弈收益；所述奖惩机制演化博弈模型构建方法进行多轮次的循环演化博弈过程包括：每一轮次演化过程中，随机选取网格中的某一个位置处的节点用户作为中心个体，根据其所处网格位置的不同计算中心个体与其邻居个体的平均声望值并进行对比进行链接权重更新：1若中心个体的声望值大于所有邻居个体的平均声望值，且链接权重小于等于链接权重的阈值上界减链接权重增益值，则增加自身链接权重；2若中心个体的声望值小于所有邻居个体的平均声望值，且链接权重大于等于链接权重的阈值下界加链接权重增益值，则减小自身连接权重；3否则链接权重不变；每一轮次演化过程中，比较中心个体与其邻居个体的信息量，进行中心个体所拥有信息量的更新：1若某一中心个体邻居信息量大，则挑选出信息量最大的邻居个体，中心个体将其信息量复制并作为自身信息量；2若中心个体的信息量不小于所有其邻居个体的信息量，则中心个体自身信息量不变；记录每一轮次演化结束时网络中拥有最高声望值的个体作为意见领袖，记录其在网格中的位置、该轮次结束时的声望值和所意见领袖拥有的信息量；在每一轮次的演化博弈过程中，对意见领袖进行声望值和信息量的更新：1若意见领袖选择合作，则在固定的时间间隔后向意见领袖进行外部事件信息流入的操作，并将意见领袖的声望值奖励较大增幅以稳固地位；具体信息流入操作为直接增加信息量，演化博弈整个过程的信息量的总增幅不变，每轮的增量与所设定的外部信息流入速率有关；2若意见领袖未合作，则不进行信息量和声望值的变化；每一轮次演化过程中，中心个体根据自身已更新的所拥有信息量计算出自身选择合作行为的概率并进行判断，若中心个体的自身所拥有信息量没有促使中心个体选择合作，则通过个体和群体态度因素对个体进行分析，采取奖惩机制分析其是否有合作倾向和进行合作的机会；所述奖惩机制演化博弈模型构建方法记录每个个体的行为和态度，对网络中的中心个体的行为选择根据个体邻居态度和自身态度进行适应性调整；假设社会群体以合作行为为主，根据邻居态度对受压力个体行为进行更新：1若个体态度上采取合作策略且行为上采取背叛策略，则根据其邻居个体中观点合作数量占比来判断是否更改中心个体行为；2对于采取其他行为和态度策略的个体，视为所受邻居态度影响较小，知行不合一压力较小；根据中心个体自身态度对知行不合一个体进一步做个体态度策略更新：1若中心个体行为和态度策略不一致，则根据其邻居个体中合作态度数量占比来判断是否更改中心个体态度；2符合知行合一个体不受自我压力；每一轮次中心个体根据自身态度或群体态度判断采取背叛行为策略时，中心个体需考虑一次适应度的影响；构建基于态度行为的奖惩机制模型收益矩阵，依照稳定状态门限对中心个体的声望值进行奖励或惩罚：1若个体在态度和行为上统一策略，则进行知行合一奖励，其中选择全合作，完全符合社会群体主流倾向，对其进行较大奖励Δ1；全背叛不符合社会群体倾向，但促进了网络稳定，进行较小奖励Δ32若个体在态度或行为有趋向合作的潜在倾向，则对其进行适量奖励Δ2；3若个体在行为策略上选择背叛策略，则对其进行惩罚c；所述外部事件信息流入机制考虑网络中个体的自主性和博弈个体的有限理性：所述奖惩机制演化博弈模型构建方法基于态度行为的奖惩机制下的策略收益矩阵为：通过计算中心个体选择不同行为策略的期望和行为策略平均期望，得出中心个体选择合作行为策略的复制动态方程：并对其求偏导得出：当Δ2-Δ3＜0且p＜p0时，fqp,q1＜0，故q1＝0为稳定平衡状态，即中心个体会选择在行为上背叛策略；当Δ2-Δ3＜0且p＞p0时，fqp,q2＜0，故q2＝1为稳定平衡状态，中心个体会选择在行为上合作的策略；当Δ2-Δ3＞0时，而1-p＞0，所以满足fqp,q2＜0，q2＝1为稳定平衡状态，中心个体也会在行为上选择合作策略，得出社交网络的平衡稳定状态要求，确定仿真时各参数的关系，其中p、q分别为中心个体在态度和行为策略上选择合作的人数频率。

全文数据：

权利要求：

百度查询：西安电子科技大学奖惩机制演化博弈模型构建方法、系统及应用

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：无机人造石脱模剂及其制备方法和无机人造石的制备方法_深圳市润丰新材料科技有限公司_202410151462.7

下一篇：重组人白介素2（I）的应用_山东泉港药业有限公司_202410417266.X

相关技术

无机人造石脱模剂及其制备方法和无机人造石的制备方法_深圳市润丰新材料科技有限公司_202410151462.7

重组人白介素2（I）的应用_山东泉港药业有限公司_202410417266.X

一体集成微同轴气密封装结构及其制造方法_中国电子科技集团公司第十三研究所_202410148673.5

一种智能监控法兰及其监控系统_芜湖中集瑞江汽车有限公司_202410324184.0

一种中心静脉压手动测量装置_中山大学肿瘤防治中心(中山大学附属肿瘤医院、中山大学肿瘤研究所)_202410152192.1

基于扩散模型的双阶段无人机遥感图像识别方法_中国人民解放军国防科技大学_202410331538.4

一种助力外骨骼辅助运动装置_中国人民解放军总医院第四医学中心_202311762144.6

一种异性粘结磁粉制备用原料筛选设备_天长市中德电子有限公司_202410411084.1

一种探测烟雾粒度及浓度的方法_烟台创为新能源科技股份有限公司_202410159903.8

一种用于降解餐厨垃圾的诱变菌株的复配及其应用_北京林业大学_202410173755.5

一种靶向性介孔聚多巴胺纳米颗粒及其制备方法和应用_中国药科大学_202410163612.6

一种脑膜炎球菌发酵培养基及其制备方法和应用_成大生物(本溪)有限公司_202410343870.2

模型相关技术

模型渲染方法、装置、设备_北京完美赤金科技有限公司_202010888002.4

基于元模型的数据模型版本管理方法、装置、设备及介质_中国工商银行股份有限公司_202410200029.8

基于黑箱模型与灰箱模型切换的冷却塔运行控制方法_博锐尚格科技股份有限公司_202111647709.7

基于条件扩散模型的细胞荧光图像生成方法、模型及应用_南方医科大学_202410129759.3

机器学习模型运用管理系统以及机器学习模型运用管理方法_川崎重工业株式会社_202080017363.X

去反光模型的训练方法、去反光模型和去反光方法_荣耀终端有限公司_202311752567.X

验证设计版图检测模型功能的方法、验证模型及测试系统_深圳晶源信息技术有限公司_202311550268.8

图像检测方法、模型及装置_联想(北京)有限公司_202410140089.5

通过物理接触细化虚拟网格模型_微软技术许可有限责任公司_201980048643.4

模型防窃取方法、装置及介质_浙江中烟工业有限责任公司_202410164111.X

博弈相关技术

面向博弈对抗任务的多行为树决策方案聚合方法和装置_中国人民解放军军事科学院国防科技创新研究院_202410142819.5

基于先验策略引导下的深度强化学习快速搜索博弈方法及系统_东南大学_202410046727.7

基于区块链与博弈模型的电力交易方法、装置及设备_国网重庆市电力公司电力科学研究院_202410197752.5

一种无人艇集群安全编队博弈控制方法和控制器_大连海事大学_202410168254.8

一种基于主从博弈的虚拟电厂调控方法、存储介质和装置_东南大学_202110996170.X

面向博弈对抗方案评估的参数变量可控式样本生成方法_中国人民解放军军事科学院国防科技创新研究院_202410110473.0

基于多目标跟踪的分布式雷达联盟博弈功率分配方法_南京航空航天大学_202410318118.2

一种面向空中博弈对抗的策略自适应切换方法_中国电子科技集团公司第五十二研究所_202410144270.3

一种无信号右转交叉口人车博弈的行人行为预测方法_重庆理工大学_202410150777.X

一种基于大语言模型的多具身智能体协同博弈决策方法_西安交通大学_202410144687.X

构建相关技术

优化的MULTABODY构建体、组合物和方法_儿童医院_202280051709.7

构建个体迁居轨迹的方法、设备和介质_广州市城市规划勘测设计研究院有限公司_202410169497.3

工况构建方法、装置、设备及存储介质_东风柳州汽车有限公司_202311565409.3

列车门系统模型的构建方法、装置及终端_中车唐山机车车辆有限公司_202410012545.8

一种机械构建自动切割装置_天津市行尘路宇科技有限公司_202322779996.8

一种构建医学指令数据集的方法_云南联合视觉科技有限公司_202410200638.3

重组乳酸乳球菌、制剂、构建方法及其应用_广州医科大学附属第一医院(广州呼吸中心)_202311696135.1

一种基于数据孪生的场景构建方法_云南云金地科技有限公司_202410266011.8

烟碱含量高光谱监测模型构建方法及应用_云南省烟草农业科学研究院_202410163332.5

6D数据集构建方法及装置_睿尔曼智能科技(北京)有限公司_202410130756.1

龙图腾网&IPTOP

【发明授权】奖惩机制演化博弈模型构建方法、系统及应用_西安电子科技大学_202110105123.1

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务