【发明授权】适用于多种棋类的落子策略和局面评估方法_复旦大学_201910929174.9

导航：龙图腾网> 最新专利技术> 适用于多种棋类的落子策略和局面评估方法_复旦大学_201910929174.9

申请/专利权人：复旦大学

申请日：2019-09-28

公开（公告）日：2023-05-02

公开（公告）号：CN110717591B

主分类号：G06N3/092

分类号：G06N3/092;G06N3/0464;G06N3/047;G06N3/048;A63F3/02

优先权：

专利状态码：有效-授权

法律状态：2023.05.02#授权;2020.02.21#实质审查的生效;2020.01.21#公开

摘要：本发明属于计算机博弈技术领域，具体为适用于多种棋类的落子策略和局面评估方法。本发明方法包括：通过神经网络预测落子概率和落子估值；使用MCTS算法和UpdateBoardValue算法产生训练数据；通过强化学习方法迭代训练神经网络；最终使用MCTS算法输出落子策略和局面估值。本发明提供了一种对人类友好的、无需知道先手方优势值、适用于多种棋类（如围棋、黑白棋、国际象棋、象棋、国际跳棋）的局面评估函数和落子策略函数。

主权项：1.适用于多种棋类的落子策略和局面评估方法，其特征在于，具体步骤如下：1利用残差神经网络、像素级分割方法，实现局面评估函数和落子策略函数；2利用MCTS算法、EarlyStop算法、UpdateBoardValue算法，产生训练数据；3重复步骤1和步骤2，进行迭代训练，得到神经网络；4利用步骤3训练的神经网络和MCTS算法，产生最终的局面评估函数和落子策略函数；其中：步骤1实现的局面评估函数和落子策略函数，具体过程如下：11输入8步历史局面，每个局面包含CK个通道，组成输入块；12输入块依次经过残差塔、批量归一化、ReLU激活函数处理；其中残差塔包含K个残差块，每个残差块具有C个通道；13对落子型棋类和移动型棋类采用不同的结构，输出落子策略函数；14使用像素级分割方法，对步骤12的输出依次进行通道数为CK的1x1卷积、通道Softmax，得到局面评估函数；步骤2中所述产生训练数据，具体过程如下：21使用搜索次数为S1的MCTS算法产生每步的落子概率和局面评估函数；依照概率选择下一步，进行落子；22不断重复步骤21，直至终局；同时使用EarlyStop算法，若连续2步的检测到评估值稳定或连续4步检测到某一方优势过大，则提前终止对局；23对产生的长度为T的落子概率和局面评估函数，使用UpdateBoardValue算法合成训练数据；步骤3中所述进行迭代训练，具体过程如下：31将步骤2产生的训练数据插入对局数为R的经验池，若经验池中的对局数大于R，则淘汰最旧的数据；32自对弈G局后，从经验池中随机选择数据，使用选择的数据训练神经网络；33使用训练后的神经网络参数替换MCTS所使用的神经网络；34重复上述步骤，进行迭代训练；步骤4中所述产生最终的局面评估函数和落子策略函数，具体过程如下：41使用步骤3产生的神经网络，每步使用MCTS算法进行次数为S2的搜索；42搜索之后，选择搜索树根节点的局面估值作为最终的局面评估函数，选择搜索次数最多的子节点进行落子。

全文数据：

权利要求：

百度查询：复旦大学适用于多种棋类的落子策略和局面评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种TFT-LCD高阻镀膜工艺气体装置_蚌埠高华电子股份有限公司_202111639860.6

下一篇：一种烟酰胺烘干机_山东昆达生物科技有限公司_202322779029.1

相关技术

一种TFT-LCD高阻镀膜工艺气体装置_蚌埠高华电子股份有限公司_202111639860.6

一种烟酰胺烘干机_山东昆达生物科技有限公司_202322779029.1

一种拆卸式智慧路灯_宁夏利恒达新能源科技有限公司_202322786595.5

一种广告投放优化方法、装置、电子设备及存储介质_浙江大学_202111106131.4

一种燃气轮机压气机可转导叶转动机构_中国船舶重工集团公司第七0三研究所_202111518204.0

应力传感装置和应力测试系统_北京石墨烯技术研究院有限公司_202210198971.6

变桨装置、变桨系统及变桨方法_北京金风科创风电设备有限公司_201811637657.3

检测呈现媒体的媒体装置的设备、方法、存储介质_尼尔森(美国)有限公司_202210040868.9

一种用于薄膜加工的往复压膜传送机构_浙江耀阳新材料科技有限公司_201811368378.1

一种抗震支架抗震装置_浙江衡力机电设备有限公司_202322785551.0

薄膜晶体管及使用该薄膜晶体管的显示面板_乐金显示有限公司_201911274167.6

R－T－B系永久磁铁_TDK株式会社_202011387605.2

相关技术

相关技术

相关技术

龙图腾网&IPTOP

【发明授权】适用于多种棋类的落子策略和局面评估方法_复旦大学_201910929174.9

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务