加入星計(jì)劃,您可以享受以下權(quán)益:

  • 創(chuàng)作內(nèi)容快速變現(xiàn)
  • 行業(yè)影響力擴(kuò)散
  • 作品版權(quán)保護(hù)
  • 300W+ 專業(yè)用戶
  • 1.5W+ 優(yōu)質(zhì)創(chuàng)作者
  • 5000+ 長期合作伙伴
立即加入
  • 正文
  • 相關(guān)推薦
  • 電子產(chǎn)業(yè)圖譜
申請入駐 產(chǎn)業(yè)圖譜

冷門 or 實(shí)力,AlphaGo憑什么能贏李世石?

2016/03/10
2
閱讀需 20 分鐘
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

?

昨日,科技圈最大的熱點(diǎn)莫過于世界圍棋冠軍李世石輸?shù)袅伺c谷歌人工智能系統(tǒng) AlphaGo 大戰(zhàn)當(dāng)中的第一場。

其實(shí)賽前,李開復(fù)等多數(shù)科技大佬都紛紛預(yù)測李世石會擊敗 AlphaGo,李世石本人也是信心滿滿,表示后者只是三段棋手的水平,贏下比賽并不難。圈內(nèi)一番熱議之后,支持率幾乎一邊倒,僅有少數(shù)人認(rèn)為機(jī)器會擊敗人類。

李世石與 AlphaGo 首場比賽現(xiàn)場

然而,第一場比賽還是“爆了個大冷門”。在這場歷時三個半小時的對陣當(dāng)中,李世石在開局占優(yōu)的大好局勢下連續(xù)失誤,最終惜敗 AlphaGo,著實(shí)讓人大跌眼鏡 ...

不過,我們先別糾結(jié)李世石輸?shù)暨@場人機(jī)圍棋世紀(jì)大戰(zhàn)有多遺憾,換個角度看,這樣的結(jié)局實(shí)際上是科技界的一次勝利,人類在人工智能的研究上已經(jīng)到上升到了一個新的 level。

我們來看看擊敗世界冠軍的 AlphaGo 到底強(qiáng)在哪里?

AlphaGo 的前世今生

AlphaGo 是由谷歌旗下 DeepMind 公司研發(fā)的圍棋程序,最初并不為人熟知。

到 2015 年 10 月以 5:0 完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾,AlphaGo 完成了史無前例的一次勝利,成為第一個擊敗圍棋專業(yè)選手的機(jī)器人,AlphaGo 瞬間名聲大噪。

除此之外,研究人員還測試了 AlphaGo 與其他圍棋人工智能機(jī)器人之間的戰(zhàn)績,令人瞠目結(jié)舌的是,AlphaGo 在 495 局中僅輸了一場,勝率高達(dá) 99.8%,說它為圍棋界的常勝將軍也不為過。

AlphaGo 的殺手锏——深度學(xué)習(xí)

AlphaGo 如此驚艷的表現(xiàn)不禁讓人想起 IBM 研制的超級計(jì)算機(jī)——深藍(lán)(Deep Blue),深藍(lán)曾在 1997 年也曾代表機(jī)器贏下了與人類之間的競賽。

20 年后的今天,計(jì)算機(jī)的 CPU 以及 GPU 性能遠(yuǎn)遠(yuǎn)超過了彼時的水平,可以說 AlphaGo 與深藍(lán)相比絕對是有過之而無不及。有數(shù)據(jù)顯示,深藍(lán)的計(jì)算能力是 11.38 GFLOPS,而 AlphaGo 的計(jì)算能力是它的 2.5 萬倍,二者差了 N 個 level。

不過,AlphaGo 最大的特點(diǎn)還不是計(jì)算能力的跨越,最讓人膽顫的恐怕還是其融入的深度學(xué)習(xí)能力。

“深度學(xué)習(xí)”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。一層神經(jīng)網(wǎng)絡(luò)會把大量矩陣數(shù)字作為輸入,通過非線性激活方法取權(quán)重,再產(chǎn)生另一個數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機(jī)理一樣,通過合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識別物體標(biāo)注圖片一樣。(來源于百度

深度學(xué)習(xí)并非只用于協(xié)議上的機(jī)器人,這一概念適用于所有人工智能應(yīng)用,例如,人臉識別、語音識別無人駕駛都可通過深度學(xué)習(xí)來實(shí)現(xiàn),說其為一項(xiàng)高大上的技術(shù)應(yīng)該沒人反對吧。

AlphaGo 的深度學(xué)習(xí)功能由兩種深度神經(jīng)網(wǎng)絡(luò)完成:一個是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)”,它的任務(wù)是觀察棋盤布局企圖找到最佳的下一步,通俗點(diǎn)講就是“落子選擇器”;另一個大腦是“價值網(wǎng)絡(luò)(Value Network)”,它的作用在于通過整體局面判斷來輔助落子選擇器。即一邊推算一邊判斷局面,不猜測下一步,只是預(yù)測每一個棋手贏棋的可能。這兩個神經(jīng)網(wǎng)絡(luò)相輔相成,缺一不可。

?


因?yàn)橛羞@兩張超強(qiáng)的神經(jīng)網(wǎng)絡(luò)大腦,AlphaGo 的思路和人類幾乎是一致的,具體如下:

1. 基于深度模仿“腦” 來預(yù)測未來的下一步走法,直到 L 步。

2. 結(jié)合兩種方式來對未來到 L 的走勢進(jìn)行評估,就是通過上述兩個神經(jīng)網(wǎng)絡(luò)來完成的。

3. 評估完,將評估結(jié)果作為當(dāng)前棋局下的下一步走法的估值。即給一開始給出的下一步走法根據(jù)未來的走向進(jìn)行評估。

4. 結(jié)合下一步走法的估值和深度模仿腦進(jìn)行再一次的模擬,如果出現(xiàn)同樣的走法,則對走法的估值取平均。

5. 循環(huán) N 次上述步驟之后,選擇最多的走法作為下一步。

業(yè)界認(rèn)為,圍棋盤面的局部處理上是 AlphaGo 的強(qiáng)項(xiàng),同為專業(yè)九段棋手的古力也自嘆不如。如此看來,面對這樣的對手,李世石今天似乎輸?shù)貌⒉浑y看。

計(jì)算機(jī)已經(jīng)超越人腦了嗎?

隨著人工智能的快速發(fā)展,以至于各種人工智能威脅論逐步被放大,這多少會讓人們產(chǎn)生恐慌。但是,就目前我們此刻還無法預(yù)測人工智能今后會發(fā)展到什么樣的地步,至少現(xiàn)它還沒有強(qiáng)大到威脅人類生命。

其實(shí)去年就有研究指出,即使是現(xiàn)如今最先進(jìn)的超級計(jì)算機(jī),其強(qiáng)大的程度也僅僅是人類大腦的三十分之一。當(dāng)時,來自加利福尼亞大學(xué)伯克利分校 Katja Grace 博士和她的研究團(tuán)隊(duì)用 IBM 紅杉超級計(jì)算機(jī)和人腦作為對比,他們通過測試前者的持續(xù)運(yùn)算以及峰值運(yùn)算速度,最終得出的結(jié)論就是人腦比計(jì)算機(jī)要快 30 倍。

中科院院士段樹民認(rèn)為,李世石輸給 AlphaGo 還不能說明人腦已經(jīng)被計(jì)算機(jī)超越了。他還指出,在純計(jì)算問題上,計(jì)算機(jī)要強(qiáng)于人腦,但如果是比較復(fù)雜的功能,比如圖像認(rèn)知、情感、意識和綜合判斷,人腦是有絕對優(yōu)勢的。

最后還是啰嗦一句,李世石和 AlphaGo,不論誰贏都是人類的勝利!

相關(guān)推薦

電子產(chǎn)業(yè)圖譜