编译 | 网易智能 

参与 | 小小


【网易智能讯 1月25日消息】谷歌旗下DeepMind开发的人工智能AIphaStar在《星际争霸2》(Starcraft II)中击败了两位人类职业玩家,这是AI领域的新里程碑。在YouTube和Twitch上播放的比赛中,AI玩家在连续10局中反复击败人类。而在最后的对决中,职业选手格里戈尔兹·“曼娜”·科明兹(Grzegorz “MaNa” Komincz)为人类赢得了唯一的胜利。

 

01

相比人类玩家,AI的优劣势很明显

 

与兄弟AI AIphago登顶的围棋所不同的是,《星际争霸2》是不完美信息系统,有着阻碍信息顺利获取的战争迷雾,除此之外,操作的单位数量和频率较大,且存在多线作战,需要同时兼顾后方经营,和前方多线战事。显然,在多线决策方面AI的优势要比线性思维的人类要大得多。


Atari、围棋和星际争霸2的比较

 

DeepMind的研究联席负责人戴维·西尔弗(David Silver)在赛后表示:“AI的历史被打上了许多极为重要的、标杆性胜利的印记。尽管还有很多工作要做,但我希望未来的人们在回顾(今天)时,认为这是AI系统向前迈进了一步的象征。”

 

在视频游戏里击败人类玩家似乎是AI开发过程中的一个小插曲,但这也是一个重大的研究挑战。《星际争霸2》这样的游戏比围棋之类棋盘游戏更难玩。在视频游戏中,AI无法通过观察每个棋子的移动来计算下一步棋,它们必须实时做出反应。


去年12月份的比赛截图显示,AlphaStar与人类玩家TLO的对决

 

这些因素似乎对DeepMind被称为AlphaStar的AI系统并未构成多大障碍。首先,它打败了人类职业玩家达里奥·温什(Dario Wunsch,即TLO),而后将目标对准MaNa。这些比赛最初是于去年12月份在DeepMind的伦敦总部举行的,但该公司今天播放了AlphaStar与MaNa的最后一场比赛,这是人类玩家唯一获胜的比赛。

 

《星际争霸》的职业评论员形容AlphaStar的表现是“非凡的”、“超人的”。在《星际争霸2》中,玩家在建立基地、训练军队和入侵敌人领土之前,会从相同地图的不同侧面展开行动。AlphaStar尤其擅长所谓的“微操”,即在战场上快速、果断地控制单个或少量部队的能力。

 

尽管人类玩家有时能够训练出更强大的作战单位,但AlphaZero还是能够在近距离内战胜他们。在一场游戏中,AlphaStar用名为Stalker的快速移动单位骚扰MaNa。评论员凯文·范德库伊(Kevin van der Kooi)将其描述为“非凡的单位控制能力,很不常见”。MaNa在赛后表示:“如果我和任何人类比赛,他们都不会将Stalker运用得如此出神入化。”

 

这与我们在其他高级游戏AI中看到的行为相呼应。当OpenAI去年在《Dota 2》中与人类职业选手对决时,它们最后以失败告终。但专家们指出,这些AI是以一种“模糊而精确”的方式进行着游戏。对此,我们无需感到奇怪,快速做出没有任何错误的决定是机器的天赋异能。

 

专家们已经开始仔细分析这些比赛,并就AlphaStar是否拥有任何不公平的优势展开辩论。这些AI在某些方面依然显得笨拙,例如,AlphaStar的每分钟点击依然比人类低。但与人类玩家不同的是,它每次都能够查看整个地图,而不是手动导航。

 

DeepMind的研究人员表示,这并没有为AlphaStar提供真正的优势,因为它在任何时间只关注地图的某个特定部分。但是,正如比赛所显示的那样,这并没有阻止AlphaStar同时熟练地控制三个不同区域的单位。评论员们表示,这对人类来说是不可能的。值得注意的是,当MaNa在直播比赛中击败AlphaStar时,AI使用的是受限的摄像头视角。

 

AlphaStar的另一个潜在痛点是,人类玩家确实是职业玩家,但却不是世界冠军的标准。TLO还必须扮演《星际争霸2》中他不熟悉的三个种族之一。


AlphaStar处理过程的图形展示,该系统从上到下能看到整个地图,并预测哪些行为将帮助获得胜利


02

AI的重大进步?

 

撇开这些不谈,专家们称这场比赛是AI向前迈出的重要一步。长期参与《星际争霸》AI场景的AI研究人员戴夫·丘吉尔(Dave Churchill)表示:“我认为AI取得了重大成就,至少比我在AI研究人员中听到的最乐观猜测提前了一年。”然而,邱吉尔补充说,由于DeepMind尚未发布任何关于这项工作的研究论文,因此很难说它是否显示出任何技术上的飞跃。他指出:“我还没有读过这篇博客文章,也没有接触过相关的论文或技术细节。”

 

佐治亚理工学院AI副教授马克·里德尔(Mark Riedl)表示,他对结果并不那么吃惊,AI获得胜利只是“时间问题”。里德尔补充说,他不认为这些比赛表明《星际争霸2》已经被AI彻底掌控。他表示:“在上一场直播比赛中,限制AlphaStar的某些能力确实消除了它的许多人为优势。但我们看到的更大的问题是,当人们可以把AI推出舒适区时,它就会崩溃。”

 

丹麦哥本哈根信息技术大学的塞巴斯蒂安·里斯(Sebastian Risi)表示:“这看起来是向前迈出的一大步。我们不知道这其间有多少创新,但培训AI的方式似乎是关键。”里斯的同事尼尔斯·贾斯特森(Niels Justesen)说:“我没想到会发生这样的事情,尤其是因为之前的端到端学习《星际争霸》的尝试远远没有达到人类的水平。”


03

残酷的强化学习AI竞技场

 

最终,这类工作的最终目标不是利用AI在视频游戏中击败人类,而是改进AI的训练方法,尤其是为了创建能够在《星际争霸》等复杂虚拟环境中运行的系统。

 

为了训练AlphaStar, DeepMind的研究人员使用了被称为强化学习的方法。AI智能体基本上是通过反复尝试才能达到某些目标,比如赢球或者仅仅是生存下去。它们首先通过模仿人类玩家来学习,然后在类似竞技比赛中相互对决。最弱的AI会存活下来,最弱的则被淘汰。DeepMind估计,其每个AlphaStar智能体都以这种方式积累了大约200年的游戏时间,游戏速度也在加快。

 

DeepMind很清楚自己开展这项工作的目标。AlphaStar项目联合负责人奥里尔·维尼亚斯(Oriol Vinyals)说:“首先,也是最重要的,DeepMind的任务是建立通用AI,它可以执行人类所能完成的任何心理任务。要实现这个目标,最重要的就是对我们的AI智能体在各种任务中的表现进行基准测试。”

 

科技媒体Engadget评论道,谷歌旗下的AI子公司DeepMind已经转向电脑游戏,其AI系统始终在进行微调,以适应《星际争霸2》。今天的《星际争霸2》比赛,是AlphaStar与职业玩家的第一次正面交锋。在两场五局的系列比赛中,AlphaStar战胜了职业选手TLO和MaNa,赢得了10场胜利。而在连续十次失利后,人类玩家终于赢得了最后一场比赛。


04

DeepMind的野心

 

虽然游戏并不能很好地展示这项技术,但它虽说描绘了DeepMind在理解人类行为方面取得的长足进步。最终,这项技术可以被用于许多其他领域,如理论物理学,甚至医学。纽约大学的朱利安·加里乌斯(Julian lius)表示:“我认为《星际争霸》就像是在经营一家公司,尤其是后勤部门。关键是要规划研发,在正确的时间把产品送到正确的地方,避免瓶颈。”

 

AlphaStar也可以帮助专业人士改善他们的策略。马耳他大学的Georgios Yannakakis称:“如果AI能够找到最优的游戏方式,那将是非常令人兴奋的。这毕竟是人们构建AI的原因之一。目前来说,很多人都不想在任何游戏中遇到DeepMind的AI对手,更不用说像《星际争霸2》中与其进行激烈对决了。



往期推荐

实践者颜水成:在学术界「恋爱」 在工业界「结婚」

▲点击图片观看

谁在AI看面相小程序付了款,赶紧看看吧!

▲点击图片观看

独家 | Roadstar.ai内讧背后 是佟显乔的CEO保卫战

▲点击图片观看

- 加入社群吧 -

网易智能AI社群(AI芯片、医疗AI、金融AI、电商AI、自动驾驶、教育AI、AIoT、机器人等12个社群)火热招募中,对AI感兴趣的小伙伴,添加智能菌微信 kaiwu_club,说明身份即可加入。


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • [微笑]配色方面,配合自然環境,包括苔蘚綠、臭氧藍、小麥色、淺灰色等,喜歡的朋友不妨到專門店試試~[挤眼]傳送門>>华富里水上火车泰国铁路局联手华富
  • 下面逐条分析: 解:此造婚姻不顺 取年上官星为用神,官代表丈夫旺而逢生,丈夫有能力,工作好,有些桃花,长相好,风流倜傥,唯美中不足,被辛金所合,辛金是日主的
  • 我好累 每天吃着无味的菜 在这边也没有在家好 没有空调 还不能吹风扇 天气也特别 睡的床也特别硬 一晚都醒好几遍 一夜不能翻身睡 腰酸脖子疼的 时不时
  • 一个人的工作,事业就像十年佛法,十年修炼,十年禅座,心志的提升,又一次感受到了自己的环境装不满自己的心志。这是我看了2012年《万箭穿心》后,影片最先给我的感
  • 可是你拉著我一起做過夢,那些夢是現實期望,你要用現實的長頸鹿來補償欠缺的面對。小ai也许不喜欢这样的游戏,他总在自己的想象和二手经验里小心翼翼地活,貌似严格恪守
  • 从端午节到现在我基本没过过舒坦日子 每天都感觉人格外疲惫 今天又起晚了 七点的时候我还在桌子上磨蹭 我爸起了在厨房里给我妈做早饭 然后他掂着锅铲在家里到处晃 晃
  • 应该能一眼看出来#仅此一次的爱情##丹,唯一的爱##金明洙[超话]##申惠善[超话]##韩剧OST分享[超话]##网易云电台[超话]#作为一个看了6年韩剧的人我
  • 此次比赛包括来自邯郸及邢台四家医院的6位肺癌领域中青年医师,附属医院肿瘤一科吕林林医师凭借精彩的学术分享、娴熟的演讲技巧、稳定的演讲台风,充分展现了青年医师扎实
  • 预计日内恒指将延续震荡下行走势,关注支撑28200、28000,上方阻力28500附近。【恒指】周一恒指早盘开盘急速下行,跌幅超过400点,随后保持低位震荡​走
  • 他力和自己结合在一起,这个究竟了义我们在下卷再讲,一般来说,我信佛法僧这是住世的三宝,信自己的佛法僧才是理体究竟的。其实正像末法是对著众生的机感而分的差别,你有
  • #胡春杨[超话]#20190727 In ChengDuFM·手幅应援 『最靓的仔不需要文案 所以没有文案』手幅『没有文案』×52小圆镜『可爱』×52领取条件;
  • 更容易就需要知道这个账号背后的消费者更偏向于哪种喜好等等,同时也意味着真正标签时代的到来,不能给我们带来盈利的流量都是垃圾流量。答案:当然不是,目前整个淘系最大
  • 慢慢的,甚至就连身边最亲近的人,也会理所应当地认为:她不要紧的、她没关系的、她可以懂的、她能理解的、她会原谅的......伤害一个懂事的女人,成本太低。连孤儿、
  • 其纤维比较长,吃时口感脆嫩,很易吸味道,所以一般以凉拌为常见。素拌或者和鸡丝、肉丝同拌,风味极佳。
  • 【小经分享】电影《何以为家》 ​《何以为家》是由黎巴嫩、法国、美国制作的剧情片,由黎巴嫩导演娜丁·拉巴基执导,赞恩·阿尔·拉菲亚、约丹诺斯·希费罗联合主演。该
  • 「分享 . 时尚观」穿搭风格并不是说你喜欢什么样就适合什么样,客观来说,最适合你的风格,一定是你的脸蛋和身材(80%)决定的,另外20%会被你的性格影响。但是你
  • 我举一个最简单的例子,比如你拍摄时的重点是一个杯子,可是你觉得放杯子的桌子也很好看,椅子也很漂亮,后面的沙发,包括墙上的画都很美,于是你将所有内容都拍摄了进去,
  • 真的好开心好开心可以遇见你们啊 是葵葵让我们相遇了 我们素未谋面就可以把对方当做很亲近的人,姐妹真的是一个很神奇的东西啊 我们分享想买的小裙子,分享美甲,分
  • 作为一个普通人,做到无我很难,但我觉得至少得承认它是高尚的,甚至是最好的。最萌身高差真的是挺萌的,我其实对身高也没有太大的要求,都可以。
  • 对于很多来访者来说,他们认为心理咨询就是医生帮助自己拿出解决问题的主意,要求尽快得到处理问题的良方良策,但大多数的问题又都是些社会心理问题,而每一个问题又有千差