? ? ?谷歌圍棋人工智能AlphaGo今天與韓國(guó)棋手李世石的人機(jī)圍棋大戰(zhàn)塵埃落定,AlphaGo拿下最后一場(chǎng),將總比分定格在4:1。雙方聯(lián)手為世人貢獻(xiàn)了五場(chǎng)精彩絕倫的圍棋比賽,比賽結(jié)束了,而相關(guān)的話題討論才剛剛進(jìn)入高潮。
關(guān)注
其實(shí)人們最關(guān)注的話題集中在以AlphaGo代表的人工智能是否會(huì)取代人類上,AlphaGo之父、DeepMind聯(lián)合創(chuàng)始人德米斯·哈薩比斯表示,圍棋是一種"完全信息博弈",比賽雙方所有信息都呈現(xiàn)在棋盤(pán)上。而例如撲克和電腦游戲等由多人參與的對(duì)戰(zhàn)游戲是"不完全信息博弈",計(jì)算機(jī)無(wú)法獲知所有信息,目前這些領(lǐng)域?qū)θ斯ぶ悄軄?lái)說(shuō)還存在困難。另外,對(duì)DeepMind來(lái)說(shuō),他們研發(fā)AlphaGo的最終目標(biāo)指向?yàn)橹悄苁謾C(jī)助手、醫(yī)療健康和機(jī)器人,只是目前先在圍棋領(lǐng)域測(cè)試系統(tǒng),達(dá)到檢測(cè)其學(xué)習(xí)能力算法的目的。所以大可不必過(guò)于驚慌,將此番圍棋較量上升至保衛(wèi)"人類智慧最后一塊高地"的地步。
哈薩比斯稱,人工智能的下一步目標(biāo)是讓計(jì)算機(jī)自己學(xué)棋。也就是說(shuō),下個(gè)版本的AlphaGo將從零開(kāi)始,不接受人類的灌輸?shù)奶囟ㄖR(shí),做到真正的自主學(xué)習(xí)。
回顧:
人機(jī)大戰(zhàn)首局:李世石中盤(pán)認(rèn)輸
北京時(shí)間3月9日,李世石執(zhí)黑先行,為打亂電腦布局采用新走法,AlphaGo應(yīng)對(duì)不佳,出現(xiàn)失誤。在中盤(pán)階段的勝負(fù)關(guān)鍵時(shí)期,AlphaGo下法變得強(qiáng)硬,雙方展開(kāi)接觸戰(zhàn)。李世石圍住一塊大空,在大局上搶得先機(jī)。隨后李世石卻放出了非常業(yè)余的手法,瞬間使微弱的優(yōu)勢(shì)化為烏有,進(jìn)入官子,AlphaGo根本不犯一點(diǎn)錯(cuò)誤,著著精準(zhǔn),李世石算清后投子認(rèn)輸。
人機(jī)大戰(zhàn)次局:李世石完敗
北京時(shí)間3月10日,?AlphaGo執(zhí)黑先行,李世石轉(zhuǎn)變行棋風(fēng)格,開(kāi)局下得非常穩(wěn)健。AlphaGo也下出了不少新手,這讓李世石應(yīng)對(duì)得非常謹(jǐn)慎,黑37和41兩步尖沖令人匪夷所思,尤其是第41手,致目數(shù)大虧。中盤(pán)階段,本來(lái)形勢(shì)占優(yōu)的李世石行棋過(guò)緩,右上角的一步二路打拔被視作敗手,AlphaGo的優(yōu)勢(shì)逐漸清晰起來(lái)。在形勢(shì)陷入被動(dòng)的情況下,李世石下出一手扳的好棋,但幾次轉(zhuǎn)換后,黑棋還是牢牢守住了領(lǐng)先的局面,而且棋形很厚。李世石無(wú)力改變,AlphaGo執(zhí)黑獲勝且優(yōu)勢(shì)明顯,總比分2-0領(lǐng)先。
人機(jī)大戰(zhàn)第三局:李世石破釜沉舟未果
北京時(shí)間3月12日,李世石執(zhí)黑先行,布局階段,李世石左下掛角后走高中國(guó)流。行不到二十手,李世石局面就落入下風(fēng)。隨后,雙方在左上角展開(kāi)戰(zhàn)斗,AlphaGo對(duì)全局的把握一如既往地強(qiáng)大。李世石不但自己的模樣被對(duì)手輕松打入,AlphaGo還借助戰(zhàn)斗在下邊圍起一大塊空,局面看上去還不如前兩盤(pán)好看。隨后的比賽,雖然李世石仍然極力抵抗,并且祭出劫爭(zhēng)的手段,但是電腦精確應(yīng)對(duì),讓他無(wú)功而返,只有投子認(rèn)負(fù)。
人機(jī)大戰(zhàn)第四局:李世石祭出"神之一手"獲首勝
北京時(shí)間3月13日,李世石祭出白78"挖"妙手,?AlphaGo被李世石的"神之一手"下得陷入混亂,走出了黑93一步常理上的廢棋,導(dǎo)致棋盤(pán)右側(cè)一大片黑子"全死"。?此后,"阿爾法圍棋"判斷局面對(duì)自己不利,每步耗時(shí)明顯增長(zhǎng),更首次被李世石拖入讀秒。最終,李世石冷靜收官鎖定勝局。
人機(jī)大戰(zhàn)第五局:李世石執(zhí)黑280手認(rèn)負(fù)
在上局比賽扳回一城后,李世石向AlphaGo團(tuán)隊(duì)提出要在末戰(zhàn)中執(zhí)黑,因?yàn)樗X(jué)得AlphaGo執(zhí)黑時(shí)發(fā)揮并不完美,戰(zhàn)勝執(zhí)白的AlphaGo才更有意義。執(zhí)黑的李世石選擇了穩(wěn)健的錯(cuò)小目、無(wú)憂角開(kāi)局,AlphaGo則以二連星應(yīng)對(duì)。李世石和79和81手連出緩手,被視為敗招。AlphaGo82靠也并非好的應(yīng)手,一波錯(cuò)進(jìn)錯(cuò)出后,黑棋在87和89手再出緩手,致使白棋左上角的圍剿更加有力,黑棋形勢(shì)瞬間坍塌。此后,占據(jù)優(yōu)勢(shì)的AlphaGo展現(xiàn)了它強(qiáng)大的中后盤(pán)計(jì)算能力,鮮有失誤,落子效率極高。不過(guò)李世石也并未放棄,連續(xù)走出強(qiáng)硬應(yīng)手,可惜棋盤(pán)下得越來(lái)越小,難再覓逆轉(zhuǎn)機(jī)會(huì)。第280手,李世石投子認(rèn)負(fù)。
AlphaGo原理
在人機(jī)大戰(zhàn)開(kāi)始前,職業(yè)棋手們幾乎一邊倒地傾向于李世石。就連這個(gè)性格執(zhí)拗、棋風(fēng)兇悍的韓國(guó)人也認(rèn)為5比0不成問(wèn)題,只是在開(kāi)賽前了解到AlphaGo自我學(xué)習(xí)的原理后,才略有擔(dān)心。其實(shí)在科技界人士看來(lái),代表人工智能頂尖水準(zhǔn)的AlphaGo勝出同樣是大概率的事情。
傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)建成一棵搜索樹(shù)?,但這種方法對(duì)圍棋并不適用。AlphaGo則是將高級(jí)搜索樹(shù)與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起,這些神經(jīng)網(wǎng)絡(luò)通過(guò)12個(gè)處理層傳遞對(duì)棋盤(pán)的描述,處理層則包含數(shù)百萬(wàn)個(gè)類似于神經(jīng)的連接點(diǎn)。
其中一個(gè)神經(jīng)網(wǎng)絡(luò)"決策網(wǎng)絡(luò)"(policy?network)負(fù)責(zé)選擇下一步走法,另一個(gè)神經(jīng)網(wǎng)絡(luò)"值網(wǎng)絡(luò)"("value?network)則預(yù)測(cè)比賽勝利方。谷歌方面用人類圍棋高手的三千萬(wàn)步圍棋走法訓(xùn)練神經(jīng)網(wǎng)絡(luò),與此同時(shí),AlphaGo也自行研究新戰(zhàn)略,在它的神經(jīng)網(wǎng)絡(luò)之間運(yùn)行了數(shù)千局圍棋,利用反復(fù)試驗(yàn)調(diào)整連接點(diǎn),這個(gè)流程也稱為鞏固學(xué)習(xí)(reinforcement?learning)。通過(guò)廣泛使用Google云平臺(tái),完成了大量研究工作。
AlphaGo在與人的對(duì)弈中用了"兩個(gè)大腦"來(lái)解決問(wèn)題:"決策網(wǎng)絡(luò)"和"值網(wǎng)絡(luò)"。通俗來(lái)說(shuō)就是,一個(gè)大腦用來(lái)決策當(dāng)前應(yīng)該如何落子,另一個(gè)大腦來(lái)預(yù)測(cè)比賽最終的勝利方。
值得一提的是,李世石也是第一次與機(jī)器對(duì)戰(zhàn),所以他無(wú)法像和人類對(duì)戰(zhàn)那樣,先研究對(duì)方的棋譜和下棋風(fēng)格。李世石所能做的就是和自己對(duì)弈。AlphaGo也是通過(guò)這種方式鍛煉自己,真正做到了"人工智能"。
聲音:
"這是我的失敗,'阿爾法圍棋'很強(qiáng)大。但這不代表了人類棋手的失敗,更不代表圍棋的失敗。"–李世石九段
"棋道一百,我只知七。"–日本棋圣藤澤秀行九段
"AlphaGo就像是好萊塢影片《侏羅紀(jì)世界》里,人類暗中研究培育的那頭變異暴龍。"–上海知名圍棋教練夏勝浩
"職業(yè)棋手已經(jīng)接受競(jìng)技角度上,AI超越人類的現(xiàn)實(shí)。但從思維方式上,AlphaGo會(huì)對(duì)棋手有更多幫助,局部方面的對(duì)抗,大局觀的把控。"–上海棋院副院長(zhǎng)劉世振
"人機(jī)大戰(zhàn)的勝利者依舊是人類,人類制造了AlphaGo,這次比賽預(yù)估也將讓歐美的圍棋普及度增加5倍。"–韓國(guó)棋院院長(zhǎng)洪錫炫
"世界上真正的挑戰(zhàn)不是'人類對(duì)機(jī)器',而是人類利用機(jī)器與那些全球性難題之間的對(duì)決。'阿爾法圍棋'對(duì)人工智能的發(fā)展和人類的發(fā)展都是積極的一步,今后它的水平還可能應(yīng)用到醫(yī)療等其他領(lǐng)域,更好地造福人類。"–谷歌CEO桑達(dá)-皮查
“這絕不是圍棋的終點(diǎn),而是一個(gè)新的起點(diǎn)!我們正處在最好的時(shí)代,一個(gè)激動(dòng)人心的科技發(fā)展的時(shí)代。人工智能、機(jī)器人、深度學(xué)習(xí)、VR虛擬現(xiàn)實(shí)這些將代表未來(lái)科技發(fā)展方向的事物我們都還在探索,云和數(shù)據(jù)現(xiàn)在正在主攻VR虛擬現(xiàn)實(shí)領(lǐng)域?!薄坪蛿?shù)據(jù)CEO郭凱
?
網(wǎng)友吐槽:
看了前三局本來(lái)想給孩子報(bào)個(gè)圍棋班呢,第四局看完,得,還是給送到云和學(xué)院學(xué)編程吧!–云和小編阿凡
我估摸著把李世石拆了,會(huì)發(fā)現(xiàn)有個(gè)阿爾法狗beta版本趴在里面–云和數(shù)據(jù)某程序員一
李世石連輸5局氣急敗壞地砸開(kāi)電腦,發(fā)現(xiàn)柯潔趴在機(jī)箱里–云和數(shù)據(jù)某程序員二
啊~啊~啊~九段,你比八段多一段;啊~啊~啊~九段,你比十段少一段;終于有一天,阿法狗來(lái)挑戰(zhàn),連輸三盤(pán)怎么辦,只好拔插線板~要是再輸怎么辦,要么麻將來(lái)兩盤(pán)~–麻將哥哥
我腳得,大殺器是這樣的:下著下著,李世石從棋盤(pán)上拿起一粒棋子,"啪"的一聲拍在棋盤(pán)另一個(gè)位置,大喊一聲"將軍"?,然后,阿法狗就當(dāng)機(jī)了…–象棋弟弟
我去都3.15了啊,阿爾法狗的產(chǎn)品質(zhì)量問(wèn)題有沒(méi)有人能關(guān)注下?–打假達(dá)人
"我叫李世石,我是一名來(lái)自韓國(guó)的棋手,今天早上出門前我在網(wǎng)上各大投注點(diǎn)用盡家財(cái)下了巨額賭注買我自己輸,我想,這就是人類比人工智能強(qiáng)的地方。"–某直播員
Copyright ? 2013-2021 河南云和數(shù)據(jù)信息技術(shù)有限公司 豫ICP備14003305號(hào) ISP經(jīng)營(yíng)許可證:豫B-20160281