
事实上,在DeepNash攻克Stratego前,就有报道称AI能够玩“强权外交”这款类似的经典桌游。这是一款具有外交深度的游戏,玩家间存在合作与竞争关系,必要时须通过谈判结交盟友。 “近年来,AI掌握本质不同的游戏的速度相当惊人。”美国密歇根大学计算机科学家MichaelWellman表示,Stratego和“强权外交”这两款游戏大不相同,但它们都极具挑战性,与此前AI已经掌握的游戏也截然不同。 Stratego是一款需在信息缺失情况下进行战略思考的棋盘游戏,类似于中国的军棋。它要比此前AI掌握的国际象棋、围棋或扑克复杂得多。 在游戏中,双方各有40枚棋子,且彼此看不到棋子的真实“身份”。双方轮流移动棋子,来消灭对手的棋子,最终夺得对方军旗或消灭所有能动的棋子的一方获胜。因此,玩家需要进行战略部署、收集信息,并与对方博弈。 一局Stratego游戏中会有10535种可能的布局。相比之下,围棋的布局有10360种可能。此外,在Stratego中,AI需要推理对手超过1066种部署策略,这使德州扑克中初始的106种可能情况相形见绌。 “Stratego中可能出现的结果数量之多及其复杂性,意味着在信息完全的游戏中表现出色的算法,甚至在扑克游戏中表现良好的算法,在这款游戏中都不起作用。”DeepMind研究员JulienPerolat说。 所以Perolat和同事开发了DeepNash,该命名致敬了提出纳什均衡的美国数学家约翰·纳什。 纳什均衡是博弈论中一种解的概念,指满足以下条件的策略组合:任何一位玩家在此策略组合下单方面改变自己的策略(其他玩家策略不变),都不会提高自身的收益。 DeepNash将强化学习算法与深度神经网络相结合,以找到纳什均衡。强化学习包括为游戏的每个状态找到最佳策略。为了学习最佳策略,DeepNash已经与自己进行了55亿次博弈。 今年4月,DeepNash在网络游戏平台Gravon上与人类Stratego玩家进行了两周的比赛。在50场比赛后,DeepNash目前在所有GravonStratego玩家中排名第三。 “我们的研究表明,像Stratego这样复杂的涉及不完善信息的游戏,不需要通过搜索技术来解决。”团队成员、DeepMind研究员KarlTuyls表示,“这是AI迈出的一大步。” 而曾于2019年报告了玩扑克的AI——Pluribus的metaAI研究员NoamBrown团队,则将目光投向了一个不同的挑战:建立一个可以玩“强权外交”的AI。 “强权外交”是一个最多可由7位玩家参与的游戏,每位玩家代表第一次世界大战前欧洲的主要力量,游戏目标是通过移动部队控制供应中心。重要的是,该游戏需要玩家间进行私人交流和合作,而不是像围棋或Stratego那样进行双人博弈。 “当进行超过两人的零和博弈时,纳什均衡思想对游戏就不再有用了。”Brown说,他们成功训练出了AI——Cicero。在11月22日发表于《科学》的论文中,该团队报告称,在40场游戏中,“Cicero的平均得分是人类玩家的两倍多,在玩过一场以上游戏的参与者中排名前10%”。 Brown认为,可以与人类互动并解释次优甚至非理性人类行为的游戏AI,可以为其在现实世界的应用铺平道路。(徐锐)

铁锚
大桥
金桥
京雷
天泰
博威合金BOWAY
马扎克Mazak
威尔泰克
迈格泰克
斯巴特
MAOSHENG贸盛
Miller米勒
新世纪焊接
西安恒立
上海特焊
新天激光
海目星激光
迅镭激光
粤铭YUEMING
镭鸣Leiming
领创激光
天琪激光
亚威Yawei
邦德激光bodor
扬力YANGLI
宏山激光
楚天激光
百超迪能NED
金运激光
LVD
Tanaka田中
BLM
易特流etal
百盛激光
Messer梅塞尔
PrimaPower普玛宝
松下 旗下LAPRISS机器人激光焊接系统
KUKA 库卡摩多机器人流水线作业
大焊 焊机匠心品质 精工之作 行家之选
川崎工业焊接机器人 焊接管架
全自动焊接流水线
上海通用电气 全焊机系列展示
创力 CANLEE光纤激光切割机
直销河北辉腾ZHB-01焊接变位机批发优惠
氩弧焊焊接机器人 小型全自动工业焊接机器人 直销
全自动卧式焊机不锈钢环缝自动焊机氩弧焊自动焊机焊接机
江苏天岳010.20.2224 码垛机器人 焊接机器人 回转支承 现货供应
易燃液体防火防爆柜厂家| 酒精储存安全注意事项 上海晋名
洛阳 ABB 进口弧焊机器人报价 厂家直销 工业机器人 焊接机器人
杰伟浩**出售转让出售10吨滚轮架一套,20吨滚轮架一套30吨滚轮架两套打包价格便宜东营提货
【环尔】电焊机ZX7-250A220/380V 电焊机价格 电焊机厂家 河北电焊机厂家 直流电焊机







