2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
UPPING ANTE計(jì)算機(jī)首次在多人撲克中擊敗了精英人類專業(yè)人士。
人工智能已經(jīng)超過掌握撲克的最后一個(gè)重要里程碑:六人無限制德州撲克。
像撲克這樣的游戲,隱藏的牌和虛張聲勢的玩家,對(duì)人工智能的挑戰(zhàn)要大于每個(gè)玩家都可以看到整個(gè)棋盤的游戲。在過去幾年中,計(jì)算機(jī)已成為日益復(fù)雜的一對(duì)一撲克形式,但多人游戲?qū)⑦@種復(fù)雜性提升到了一個(gè)新的水平(SN Online:5/13/15)。
研究人員在7月11日的“科學(xué)”雜志網(wǎng)絡(luò)版上報(bào)告說,現(xiàn)在,被稱為Pluribus的卡片鯊魚已經(jīng)在六人德州撲克中擊敗了十幾名精英專業(yè)人士??梢岳眠@些不穩(wěn)定的信息對(duì)幾個(gè)對(duì)手進(jìn)行策劃的算法可以成為精明的商業(yè)談判者,政治戰(zhàn)略家或網(wǎng)絡(luò)安全監(jiān)管機(jī)構(gòu)。
Pluribus通過對(duì)抗自己的副本來磨練其最初的策略,從頭開始逐步學(xué)習(xí)哪些行動(dòng)有助于贏得。然后,人工智能使用這種直覺來確定何時(shí)保持以及何時(shí)在每手牌的第一輪下注期間對(duì)五個(gè)人類玩家進(jìn)行折疊。
在隨后的下注輪次中,Pluribus通過想象游戲如果采取不同的行動(dòng)將如何發(fā)揮作用來微調(diào)其戰(zhàn)略。與為雙人撲克訓(xùn)練的人工智能不同,Pluribus沒有一直推測到游戲結(jié)束 - 在處理這么多玩家時(shí)需要進(jìn)行太多的計(jì)算(SN:4/1/17,第12頁) 。相反,人工智能想象了未來的幾個(gè)步驟,并根據(jù)那些假設(shè)的未來以及玩家可以采用的不同策略決定做什么。
在德州撲克的10,000手牌中,Pluribus與來自13名專業(yè)人士的五名參賽者進(jìn)行了比賽,他們都贏得了超過100萬美元的撲克玩家。每100手牌,Pluribus平均從其人類競爭者手中收入約480美元。
“這大致是精英人類專業(yè)人士渴望擊敗弱勢玩家的數(shù)量,”暗示Pluribus是一個(gè)比人類對(duì)手更精明的玩家,紐約市Facebook AI Research的諾姆布朗說。布朗與匹茲堡卡內(nèi)基梅隆大學(xué)的托馬斯·桑德霍爾姆一起創(chuàng)建了Pluribus。
現(xiàn)在人工智能已經(jīng)撲克,算法可以測試他們?cè)诰哂懈鼜?fù)雜的隱藏信息的游戲中的戰(zhàn)略推理,布拉格捷克技術(shù)大學(xué)的計(jì)算機(jī)科學(xué)家ViliamLisý說,他沒有參與這項(xiàng)工作。Lisja說,在像Kriegspiel這樣的游戲中,玩家無法看到對(duì)方的棋子 - 未知數(shù)可能會(huì)比靠近對(duì)手胸部的幾張牌變得復(fù)雜得多。
像“星際爭霸”這樣的視頻游戲,允許更多類型的動(dòng)作和免費(fèi)玩家進(jìn)行嚴(yán)格的回合制游戲,也可以作為人工智能聰明的新測試(SN:5/11/19,第34頁)。
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。