2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。
谷歌(google)旗下的DeepMind發(fā)表了一篇新論文,概述了團(tuán)隊(duì)如何利用創(chuàng)造了AlphaGo的機(jī)器學(xué)習(xí)系統(tǒng),建立了一個(gè)處理國(guó)際象棋和圍棋的新系統(tǒng),并在每一場(chǎng)比賽中擊敗頂級(jí)程序。這個(gè)名為AlphaZero的程序也擊敗了它的前身AlphaGo Zero。
對(duì)于DeepMind來(lái)說(shuō),這是一個(gè)合乎邏輯的下一步行動(dòng)。國(guó)際象棋和圍棋(起源于的一種類(lèi)似于國(guó)際象棋的棋盤(pán)游戲)都是電腦程序的游戲,已經(jīng)打敗了人類(lèi)頂級(jí)棋手。AlphaZero擊敗了斯托克菲什和埃爾莫,前者在國(guó)際象棋中處于領(lǐng)先地位,后者是與shogi對(duì)弈的最佳程序。
這個(gè)程序被訓(xùn)練成只玩它自己,通過(guò)一個(gè)被稱(chēng)為強(qiáng)化學(xué)習(xí)的過(guò)程,除了關(guān)于每個(gè)游戲規(guī)則的某些關(guān)鍵信息外,沒(méi)有任何預(yù)先知識(shí),比如每個(gè)棋子如何移動(dòng)。AlphaGo(包括AlphaGo Zero,它依賴(lài)于自我游戲強(qiáng)化學(xué)習(xí)來(lái)進(jìn)行訓(xùn)練)是專(zhuān)門(mén)為圍棋開(kāi)發(fā)的,而AlphaZero的設(shè)計(jì)則要靈活得多。
這種通用架構(gòu)可以為開(kāi)發(fā)未來(lái)的AI系統(tǒng)提供藍(lán)圖,既可以用來(lái)玩游戲,也可以用來(lái)解決其他有明確規(guī)則和目標(biāo)的問(wèn)題,比如設(shè)計(jì)藥物。
DeepMind訓(xùn)練了三個(gè)AlphaZero的獨(dú)立實(shí)例,分別用于圍棋、圍棋和國(guó)際象棋。國(guó)際象棋系統(tǒng)對(duì)自己下了4400萬(wàn)盤(pán),而shogi系統(tǒng)下了2400萬(wàn)盤(pán),圍棋系統(tǒng)下了2100萬(wàn)盤(pán)。
AlphaZero的統(tǒng)治地位并不確定。圍棋和DeepMind選擇的另外兩款游戲之間有一些關(guān)鍵的區(qū)別。國(guó)際象棋和shogi都對(duì)不同棋子的移動(dòng)方式有限制,而且棋盤(pán)也不像圍棋那樣是獨(dú)立旋轉(zhuǎn)的。更重要的是,在shogi中捕獲的棋子可以被對(duì)手放置在棋盤(pán)上。
嘉興學(xué)院有幾個(gè)校區(qū)(關(guān)于嘉興學(xué)院有幾個(gè)校區(qū)的簡(jiǎn)介)
京華春夢(mèng)電視劇(關(guān)于京華春夢(mèng)電視劇的簡(jiǎn)介)
2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082 備案號(hào):閩ICP備19027007號(hào)-6
本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。