Facebook首次開源超級圍棋AI,復(fù)現(xiàn)AI高手AlphaZero
最近,F(xiàn)acebook的人工智能研究所(以下簡稱FAIR)宣布,他們開源了自研的圍棋AI訓(xùn)練模型和代碼。這意味著,你可以隨時隨地和Facebook的人工智能下圍棋了,而且此圍棋AI程序重現(xiàn)的是名噪一時的AI高手AlphaZero。
去年5月,F(xiàn)AIR發(fā)布了ELF Open GO,ELF OpenGo是FAIR依照DeepMind在《自然》上發(fā)表的和AlphaGo Zero以及AlphaZero相關(guān)的論文,做出的開源計(jì)算機(jī)圍棋程序,也就是說,ELF OpenGo不使用人類棋譜與累積的圍棋知識,僅使用單一類神經(jīng)網(wǎng)絡(luò)從自我對弈中學(xué)習(xí)。
該圍棋AI之前在和韓國棋院的專業(yè)圍棋選手對弈中,都取得不錯的成績。據(jù)悉,OpenGo 的最新版本使用2000塊GPU訓(xùn)練了15天后,在一塊GPU的情況下與4個排名前30的職業(yè)選手進(jìn)行比賽時,取得了20:0全勝的戰(zhàn)績,可謂是戰(zhàn)無不勝。
在這次開源的論文中,F(xiàn)AIR研究人員全面披露了ELF OpenGo的訓(xùn)練過程,包括取得的是三個突破。
一是為ELF OpenGo訓(xùn)練了一個超人類棋藝的模型,他們在2000個GPU上運(yùn)行類AlphaZero的訓(xùn)練軟件9天后,有20個模塊的模型超越了人類水平。
二是提供了模型在訓(xùn)練過程中的行為分析,包括和其他模型的對比、學(xué)習(xí)速度、學(xué)習(xí)難度等等。
三是通過實(shí)施ablation實(shí)驗(yàn),以研究AlphaZero風(fēng)格算法的性質(zhì),他們發(fā)現(xiàn)對于最終模型而言,對局中加倍rollout水平大約提升200 ELO,AI的發(fā)揮會受到模型容量的限制。
最后,此次論文的主要作者為田淵棟,他一直負(fù)責(zé)Facebook的圍棋AI相關(guān)研究,在此前的一篇知乎文章中,他提到:DeepMind不開源也不透露細(xì)節(jié),文章里面一些地方也沒有寫得很清楚。沒有第一手經(jīng)驗(yàn)總不是很踏實(shí)。所以本著研究目的,我們需要復(fù)現(xiàn)一下,先有復(fù)現(xiàn),才有創(chuàng)新,這個是做研究的習(xí)慣。而且如果我們?nèi)タ?ELF OpenGo 的代碼,會發(fā)現(xiàn)其完全適用于其它方向的工作。而圍棋對我們來說,只是一個把算法和平臺做好的手段。在這一點(diǎn)上,花點(diǎn)時間把圍棋做好是值得的。
最后,關(guān)于ELF OpenGo最新訓(xùn)練模型的具體數(shù)據(jù)可以閱讀原文獲取論文鏈接了解。

發(fā)表評論
最新活動更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會
-
12月18日立即報(bào)名>> 【線下會議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會
推薦專題
- 1 先進(jìn)算力新選擇 | 2025華為算力場景發(fā)布會暨北京xPN伙伴大會成功舉辦
- 2 人形機(jī)器人,正狂奔在批量交付的曠野
- 3 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 4 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 5 AI版“四萬億刺激”計(jì)劃來了
- 6 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長曲線
- 7 2025年8月人工智能投融資觀察
- 8 9 Manus跑路,大廠掉線,只能靠DeepSeek了
- 10 a16z最新AI百強(qiáng)榜:硅谷頂級VC帶你讀懂全球生成式AI賽道最新趨勢