鐵流:AlphaGo是怎樣模擬人類“思考攪拌機推薦”的
1月28日消息,谷歌的人工智能系統AlphaGo以5比0擊敗瞭職自動填充機業棋手樊麾引發瞭圍棋圈和人工智能圈的震蕩。這是在1997年IBM的國際象棋程序“深藍”戰勝瞭國際象棋冠軍卡斯帕羅夫後,人工智能在圍棋領域第一次在未讓子的情況下擊敗職業選手。那麼AlphaGo的棋力究竟幾何,到底是怎樣模擬人類“思考”的呢?
AlphaGo棋力如何
在圍棋人工智能程序方面,除瞭開源程序Pachi和Fuego,還有日本的Zen、韓國的DolBaram和法國的CrazyStone。按照以往的戰績來看,AlphaGo和CrazyStone、Zen的戰績為495戰,494勝,而且在讓四子的情況下(讓對方先下四個子),與CrazyStone、Zen的勝利為77%和86%。雖然還沒有AlphaGo與韓國DolBaram交手的具體戰績,但這並不妨礙AlphaGo成為現階段頂尖水平圍棋人工智能程序。
職業棋手的段位是根據比賽成績來確定的——根據勝、負、和的成績計算積分,按照積分高低將棋手分為初段—九段,而且段位會根據棋手在一定時間內的比賽成績而上升或下降。根據2014年12月31日公佈的中國圍棋職業棋手等級分排名,在讓4子和5子的情況下戰勝DolBaram的中國棋手連笑(七段)排名為第12位,而作為棋壇宿將的李世石(九段)的棋力則更勝一籌。
被AlphaGo擊敗的中國職業二段棋手樊麾,在棋力上與即將和AlphaGo交手的李世石,以及戰勝DolBaram的連笑有著非常大的差距,但畢竟具備職業棋手的基本素質和水平。就現今的戰績來看,AlphaGo基本具備不低於職業初段棋手的棋力。
如果AlphaGo的棋力與韓國DolBaram的水平相當,或僅僅是略優於DolBaram,那顯然是無法戰勝李世石的。若是AlphaGo具備能在讓6子的情況下戰勝DolBaram的棋力,那麼和李世石的比賽就有可能存在一定懸念瞭。筆者在此鬥膽做一個推測,即便在和樊麾對決後的5個月後(和樊麾對決在2015年10月),AlphaGo的棋力又有所增長,但技術的進步有一個過程,就如國際象棋程序在80年代末就有戰勝國際象棋大師的戰績,但真正打敗卡斯帕羅夫要到1997年。也許在將來AlphaGo能與李世石一較高下,但就現階段而言,AlphaGo戰勝李世石的可能性並不高。
就現階段而言,AlphaGo戰勝李世石的可能性並不高。
職業選手如何評價AlphaGo
為瞭更直觀地說明AlphaGo的棋力,筆者將職業棋手看完對局後的評價列舉如下,感謝知乎網友@專吃劉小羊 的匯總整理。
時越九段(世界冠軍,中國棋院等級分第二位):
說實話,我昨天看到這個消息的時候是不信的,雖然我現在還是不能理解電腦是怎麼去學習的,但是事實擺在眼前,這5盤棋電腦下的讓我驚嘆,我認為水平已經邁入瞭職業的門檻。雖然和頂尖棋手還差的很遠,但按照這個進步速度,3月份的對局,我想李世石也不會贏的太輕松。
樊麾二段(法國國傢隊總教練,AlphaGo的對手):
第一盤輸瞭之後,我這個心態就發生瞭很大變化,因為第一盤畢竟覺得可能比較輕松,然後發現他的官子、各方面的掌控能力很強之後,我第二盤就有點(心態)失衡。第二盤打瞭一個大勺之後,整個進程就不對瞭。圍棋畢竟不能用單純的技術來說,一是一、二是二、三是三,因為畢竟有發揮的問題。不過我確實下的也不是很好,當然瞭,下的時候心態也是一個最主要的原因。不管怎麼樣,AlphaGo的棋力確實已經很強瞭。這幾盤棋呢,可以說我自己發揮不佳,但不能說不是我的真實水平,下得不好。主要是在某些方面覺得被他徹底克制住瞭,尤其心理負擔很重,總感覺下到最後一讀秒就會打勺子,這就導致我的棋下的很急。
柯潔九段(世界冠軍,中國棋院等級分第一位,當前的世界第一人):
果殼網:假如是不知情地去看AlphaGo和樊麾的這五盤棋,你會猜到AlphaGo不是人類嗎?
柯潔:完全看不出來。這五盤棋我也仔細地看瞭一眼,但我沒看名字,不知道誰執黑誰執白,完全看不出誰是AI。感覺就像是一個真正的人類下的棋一樣。該棄的地方也會棄,該退出的地方也會退出,非常均衡的一個棋風,真是看不出來出自程序之手。因為之前的ZEN那樣的程序,經常會莫名其妙的抽風,突然跑到一個無關緊要的地方下棋。它這個不會。它知道哪個地方重要,會在重要的地方下棋,不會突然短路。這一點是非常厲害的。
果殼網:就電腦的表現來看,你對它佈局、中盤、官子三個階段的評價,分別是什麼水平?
柯潔:按照我的評價,它的水平大概就是沖職業段之前的水平,雖然職業還到不瞭,但是無限接近於職業瞭。關於這幾個階段,我的感覺是都差不多,非常均衡,也看不出哪個地方是機器,這個很恐怖(笑)。當然這隻是看瞭五盤棋,也看不出它的短板來,可能是因為對手發揮得太糟糕瞭(笑),我也看不出來具體的哪裡好哪裡不好。
羋昱廷九段(世界冠軍,中國棋院等級分第四位):
問:今早的大新聞是谷歌圍棋AlphaGo5比0贏瞭樊麾二段,是否已看過棋譜?
羋昱廷:知道後感覺很刺激,看棋譜覺得實力相當於沖段少年。
李喆七段(全國冠軍):
Google的圍棋AI已經具有職業水準,從棋譜初步判斷是頂尖棋手讓先-讓先倒貼目的水平,離戰勝人類還有一小段距離。但這是三個月前的棋譜……以Google機器學習堆數據的速速,今年三月對決李世石相當值得期待。
劉星七段(全國冠軍):
第一是棋形很正,第二是失誤相當的少。如果把它看作一名業餘頂尖的棋手,做到這兩點,就已經具備瞭相當的實力。(趙守洵:星爺還沒有把它看作職業高手) (劉星:這個很難說)
AlphaGo獲冷凍食品機械勝的秘訣何在
在國際象棋上,因為王、後、車、相、馬、兵的重要性不一樣,程序員可以對不同的子設定不同的分值,比如王10分,後8分……讓計算機以判定分值的高低來指導計算機計算和落子。但圍棋的棋子沒有大小之分,使得計算機很難做出取舍,隻能以窮舉法的方式進行計算。而圍棋的另一個特點是非常復雜——下棋時可能會遭遇3^361種變化,在過去計算機性能相對有限的情況下,又沒有一個良好的算法進行輔助,使用窮舉法計算自然導致人工智能雖然在國際象棋上戰勝瞭卡斯帕羅夫,但在圍棋領域一直處於業餘棋手的棋力水平。
計算機眼中的國際象棋落子思路
計算機眼中的圍棋落子思路
AlphaGo戰勝樊麾的秘訣在於神經網絡系統、蒙特卡洛算法和深度學習。
AUGI SPORTS|重機車靴|重機車靴推薦|重機專用車靴|重機防摔鞋|重機防摔鞋推薦|重機防摔鞋
AUGI SPORTS|augisports|racing boots|urban boots|motorcycle boots
留言列表