AlphaGo挑戰(zhàn)柯潔前 這8件事幫你重新認(rèn)識(shí)它的主人
點(diǎn)擊:825
A+ A-
所屬頻道:新聞中心
今日,兩次出手都讓吃瓜群眾大驚失色的“AlphaGo”又要?dú)⒒貋?lái)了,這次對(duì)戰(zhàn)的對(duì)手將是中國(guó)棋手柯潔,其意義對(duì)中國(guó)觀眾來(lái)說(shuō)當(dāng)然非同小可。加之醞釀已久的“終極決戰(zhàn)”和高達(dá)150萬(wàn)美金的史上最高圍棋賽獎(jiǎng)金,這場(chǎng)“捍衛(wèi)人類(lèi)尊嚴(yán)”的大賽必定萬(wàn)眾矚目。
但相比于棋盤(pán)內(nèi)的勝敗,我們卻更希望在這時(shí)候聊一下AlphaGo的創(chuàng)造者,著名人工智能企業(yè)DeepMind。
對(duì)于大部分人來(lái)說(shuō),常識(shí)中AlphaGo是由谷歌制造。但事實(shí)上,DeepMind雖然在14年就被谷歌收購(gòu)。但總部和項(xiàng)目始終繼續(xù)保留在倫敦,人員也對(duì)外保持著高度的神秘性。另一方面,即使對(duì)DeepMind有了解的人,也更多的是知道它的創(chuàng)始人戴密斯·哈薩比斯(Demis Hassabis)是一位少年天才,4歲下國(guó)際象棋16歲進(jìn)入劍橋等等。但DeepMind作為一家創(chuàng)業(yè)企業(yè)的規(guī)劃、產(chǎn)品序列和目標(biāo)實(shí)施情況,好像總是隱藏在一些面紗之后。
從目前消息來(lái)看,谷歌AI與DeepMind依舊保持著高度的相互獨(dú)立屬性。雖然有戰(zhàn)略和技術(shù)上的結(jié)合,但谷歌AI的重點(diǎn)推進(jìn)工程列表中可說(shuō)是完全不見(jiàn)DeepMind的蹤影。
而AlphaGo作為DeepMind的核心創(chuàng)造物之一,絕不僅是為了挑戰(zhàn)人類(lèi)圍棋界而生。作為核心領(lǐng)域技術(shù)的關(guān)鍵載體,承接著整個(gè)公司戰(zhàn)略的上下銜接。
因此,通過(guò)DeepMind做了什么,來(lái)重新認(rèn)識(shí)一下這家被谷歌大腦專(zhuān)家稱(chēng)為“AI實(shí)力世界第一”的公司,可以幫助我們更好的理解AlphaGo及其背后的更大野心。
我們通過(guò)8件DeepMind所做的關(guān)鍵動(dòng)作來(lái)梳理這家公司的實(shí)力與目標(biāo),希望在棋盤(pán)的決勝以外,提供給你一點(diǎn)新的思考。
一、一鳴驚人的游戲系統(tǒng)
DeepMind的創(chuàng)始人是棋類(lèi)和電子游戲高手,而這家公司邁出的第一步就與游戲有關(guān)。
2013年,當(dāng)時(shí)名不見(jiàn)經(jīng)傳的在DeepMind發(fā)表了一篇論文,內(nèi)容是他們自己開(kāi)發(fā)的AI游戲系統(tǒng)。論文中描述的計(jì)算網(wǎng)絡(luò)并不是為了游戲而服務(wù),反而是讓一個(gè)AI系統(tǒng)自己去玩游戲。
神奇的是,DeepMind的游戲系統(tǒng)可以在完全沒(méi)有接觸的前提下,通過(guò)對(duì)游戲的自我學(xué)習(xí),自動(dòng)的玩一系列初級(jí)電視游戲。
這個(gè)系統(tǒng)可以通過(guò)屏幕上面的圖像和游戲中的分?jǐn)?shù)是否上升下降,從而做出選擇性的動(dòng)作。
雖然這個(gè)行為對(duì)人來(lái)來(lái)說(shuō)難度不大,但對(duì)于機(jī)器學(xué)習(xí)來(lái)說(shuō)卻意義驚人。因?yàn)樗婕凹茉O(shè)任務(wù)、建立人工精神網(wǎng)絡(luò)、建立深度學(xué)習(xí)模型和完善學(xué)習(xí)過(guò)程幾個(gè)關(guān)鍵部分,并且需要大量的圖形處理單來(lái)輔助。
這款“玩兒出來(lái)”的AI程序,最終幫助DeepMind登上了《自然》。隨后開(kāi)始受到各大互聯(lián)網(wǎng)巨頭的關(guān)注,并成功在一系列拉鋸戰(zhàn)后,被谷歌以據(jù)說(shuō)高達(dá)6億美金的代價(jià)收購(gòu)。更可怕的是,這還被稱(chēng)為谷歌有史以來(lái)最成功的收購(gòu)案。
從初出茅廬的這件作品,可以看出DeepMind的幾個(gè)特點(diǎn)。首先是擅長(zhǎng)多種復(fù)雜技術(shù)的集成,其次對(duì)于AI應(yīng)用有遠(yuǎn)超于業(yè)界水準(zhǔn)的解決能力。而其喜歡游戲、熱愛(ài)人機(jī)對(duì)決的基因特質(zhì),也在一開(kāi)始就暴露無(wú)遺。
二、給AI上3D游戲課:開(kāi)源DeepMind Lab
2016年底,DeepMind將其核心深度學(xué)習(xí)平臺(tái)之一“DeepMind Lab”進(jìn)行開(kāi)源,供研究人員和開(kāi)發(fā)者使用。
區(qū)別于以往的深度學(xué)習(xí)開(kāi)源平臺(tái),DeepMind Lab的特殊之處在于,它其實(shí)是一套專(zhuān)門(mén)給AI玩的3D游戲。
就像人類(lèi)玩的第一人稱(chēng)射擊游戲一樣,這套開(kāi)源程序可以設(shè)計(jì)多重復(fù)雜的環(huán)境架構(gòu),專(zhuān)門(mén)用來(lái)訓(xùn)練人工智能和機(jī)器學(xué)習(xí)系統(tǒng)。用于訓(xùn)練人工智能在大型環(huán)境、部分可視環(huán)境,以及視覺(jué)多樣化條件下學(xué)會(huì)執(zhí)行復(fù)雜任務(wù)。
DeepMind Lab據(jù)說(shuō)是在《雷神之錘3》的基礎(chǔ)上演變而來(lái)的,有比較強(qiáng)的延展性和適用性??梢宰屵m用人員自行設(shè)計(jì)關(guān)卡和環(huán)境效果,來(lái)針對(duì)性訓(xùn)練出AI不同的判別與處理機(jī)制。
相比于針對(duì)數(shù)據(jù)樣本的機(jī)器學(xué)習(xí)系統(tǒng),DeepMind開(kāi)源的體系可以專(zhuān)注于AI在實(shí)際環(huán)境中進(jìn)行視覺(jué)+感知的交互。這對(duì)于AI行業(yè)來(lái)說(shuō)可謂是打開(kāi)了巨大的腦洞,尤其對(duì)于無(wú)人駕駛、AR、地圖導(dǎo)航、機(jī)器人記憶等領(lǐng)域的研究與創(chuàng)業(yè)者來(lái)說(shuō),可謂是福音。
從這套靈感依舊來(lái)源于游戲的系統(tǒng)中,不難看出DeepMind一個(gè)特點(diǎn)是非常重視AI與人類(lèi)高度貼合的研究。目標(biāo)指向把人類(lèi)的感知與精神思維方式移植到機(jī)器當(dāng)中去,而且他們還鼓勵(lì)其他人一同在這個(gè)方向嘗試。
三、人腦模式與經(jīng)典計(jì)算機(jī)合體:可微分神經(jīng)計(jì)算機(jī)
另一個(gè)值得關(guān)注的動(dòng)作,是2016年底DeepMind公布了他們打造的一臺(tái)“可微分神經(jīng)計(jì)算機(jī)”(DNC)。
DNC的特點(diǎn),是結(jié)合了精神網(wǎng)絡(luò)的運(yùn)作原理和經(jīng)典計(jì)算機(jī)的運(yùn)算能力和外部?jī)?chǔ)存能力。簡(jiǎn)單來(lái)說(shuō),其解決方案就是將神經(jīng)計(jì)算機(jī)的本體:以人類(lèi)大腦為生物網(wǎng)絡(luò)藍(lán)本設(shè)置的精神網(wǎng)絡(luò),與可讀寫(xiě)的外部存儲(chǔ)器相分離,架設(shè)雙層的處理與運(yùn)算結(jié)構(gòu)。
這樣打造的運(yùn)算系統(tǒng),核心特征是解決了神經(jīng)網(wǎng)絡(luò)實(shí)際運(yùn)作當(dāng)中的機(jī)器記憶問(wèn)題。做出了一臺(tái)又能像人類(lèi)一樣想,又能像計(jì)算機(jī)一樣高速運(yùn)算、記憶數(shù)據(jù)的機(jī)器。在發(fā)布的論文中,這臺(tái)計(jì)算機(jī)可以規(guī)劃相距甚遠(yuǎn)的地鐵站間的最佳路線,弄清楚復(fù)雜的親戚關(guān)系——尤其這些都是在沒(méi)有先驗(yàn)數(shù)據(jù)的前提下。
整合多元能力,對(duì)算法進(jìn)行創(chuàng)意性的解放,在這臺(tái)計(jì)算機(jī)當(dāng)中展現(xiàn)的淋漓盡致。雖然原理聽(tīng)起來(lái)蠻簡(jiǎn)單,但實(shí)際運(yùn)用到的解決方案卻非常復(fù)雜,設(shè)計(jì)多個(gè)領(lǐng)域的協(xié)同。
四、開(kāi)發(fā)用于《星際爭(zhēng)霸2》的人工智能訓(xùn)練環(huán)境
2016年的暴雪嘉年華上,DeepMind宣布將于暴雪合作,打造一個(gè)專(zhuān)門(mén)玩《星際爭(zhēng)霸2》的AI系統(tǒng)。這臺(tái)系統(tǒng)會(huì)像人類(lèi)一樣去思考和決策,并希望復(fù)制AlphaGo的奇跡,最終打敗所有人類(lèi)高手。
這里不禁要懷疑,這家公司到底是有多愛(ài)玩游戲。
但事實(shí)卻是如此,《星際爭(zhēng)霸2》這種完全動(dòng)態(tài)的游戲環(huán)境當(dāng)中,人類(lèi)選手對(duì)大勢(shì)、時(shí)機(jī)、環(huán)境的處置始終都是高于電腦系統(tǒng)的。
圍棋的問(wèn)題是運(yùn)算量巨大,而這類(lèi)策略游戲的問(wèn)題是變化性太強(qiáng),都是人工智能面對(duì)的核心問(wèn)題。
顯然通過(guò)挑戰(zhàn)人類(lèi)擅長(zhǎng)領(lǐng)域來(lái)做PR、講故事、推產(chǎn)品,是DeepMind的拿手好戲。
五、最精準(zhǔn)的語(yǔ)音生成系統(tǒng)WaveNet
在玩游戲之余,DeepMind也做點(diǎn)大家都在做的“正經(jīng)事”。
比如近兩年,DeepMind先后公布了其在圖像生成和語(yǔ)音生成領(lǐng)域的成果。比如16年公布的語(yǔ)音生成系統(tǒng)WaveNet,號(hào)稱(chēng)將計(jì)算機(jī)輸出音頻與人類(lèi)自然語(yǔ)音差距縮小了50%。至少根據(jù)親身嘗試者的說(shuō)法,這一系統(tǒng)比谷歌和蘋(píng)果的語(yǔ)音生成系統(tǒng)都聽(tīng)起來(lái)自然流暢許多。
(波形原理合成聲音的WaveNet)
WaveNet的優(yōu)勢(shì),是通過(guò)原始的波形合成了近似真人的語(yǔ)音,而不是將語(yǔ)音樣本進(jìn)行逐字逐句的拼接。
這讓未來(lái)機(jī)器的聲音可能更加接近人來(lái),想想也是細(xì)思恐極的一件事。
六、醫(yī)療應(yīng)用計(jì)劃DeepMind Health
以上說(shuō)的,基本都是DeepMind在研發(fā)端的動(dòng)向,核心載體是算法架構(gòu)和論文。而在產(chǎn)品應(yīng)用端,DeepMind也有一些動(dòng)作,比如其推出的DeepMind Health就指向智能醫(yī)療系統(tǒng),根據(jù)與英國(guó)全國(guó)醫(yī)療系合作獲取的數(shù)據(jù),來(lái)打造基于人工智能進(jìn)行診療幫助和癥狀判斷幫助的系統(tǒng)。比如說(shuō)DeepMind打造的智能診療系統(tǒng)可以通過(guò)學(xué)習(xí)上百萬(wàn)份眼部監(jiān)測(cè)資料,據(jù)此建立模型來(lái)識(shí)別早期征兆及早發(fā)現(xiàn)眼病。此外,DeepMind還架設(shè)了一些移動(dòng)應(yīng)用類(lèi)的非人工智能產(chǎn)品。
不過(guò),與英國(guó)醫(yī)療系統(tǒng)的合作也帶來(lái)很大麻煩,DeepMind在缺少監(jiān)督的境況下獲得了全英病人數(shù)據(jù),讓媒體發(fā)出了不小的驚恐和反對(duì)聲音。
七、幫谷歌省電
去年夏天,很少真正嘗試應(yīng)用領(lǐng)域的DeepMind在東家谷歌的大本營(yíng)小試牛刀了一把
利用深度學(xué)習(xí)算法,DeepMind把谷歌數(shù)據(jù)中心的冷卻系統(tǒng)用電給節(jié)約了40%。冷卻系統(tǒng)是維持?jǐn)?shù)據(jù)中心服務(wù)器運(yùn)行的重要系統(tǒng),但因?yàn)樵O(shè)備眾多、需求量極高,其中大量的能源其實(shí)是被浪費(fèi)掉了。
DeepMind運(yùn)用AI系統(tǒng),優(yōu)化了整個(gè)冷卻系統(tǒng)的用電效率,據(jù)說(shuō)一次性幫助谷歌節(jié)省了上億美金的開(kāi)銷(xiāo)。而外界更加關(guān)注的,是這類(lèi)技術(shù)可以被用于多種大規(guī)模工業(yè)系統(tǒng)上,谷歌從自家大樓做案例,顯然也是要為未來(lái)的大規(guī)模發(fā)展做廣告。
八、全面進(jìn)駐谷歌TensorFlow
最后,不得不說(shuō)的一件事,是DeepMind雖然在產(chǎn)品和研究上保持了高度的獨(dú)立性,但還是在2015年將研究全面進(jìn)駐到了谷歌的TensorFlow開(kāi)源架構(gòu)當(dāng)中。并且官方高度肯定了TensorFlow的高度適用性、延展度和操作體驗(yàn)。2016年,DeepMind 還開(kāi)發(fā)了一個(gè)能在TensorFlow 上快速創(chuàng)建神經(jīng)網(wǎng)絡(luò)模塊的高級(jí)框架Sonnet,并且對(duì)其進(jìn)行了開(kāi)源處理。
由此可見(jiàn),對(duì)于谷歌AI體系的核心業(yè)務(wù)和生態(tài)基礎(chǔ),DeepMind還是支持的。并且愿意在這個(gè)領(lǐng)域幫助谷歌完善生態(tài)。
其實(shí)谷歌本體所需要的,也是DeepMind作為一個(gè)精英企業(yè)在生態(tài)核心上提供更多支持——面向大眾賺錢(qián)的事可以谷歌做,但華山論劍的時(shí)候DeepMind還是出馬一下的好。
總結(jié)
通過(guò)總結(jié)DeepMind在研究方向、應(yīng)用化和與谷歌關(guān)系的幾個(gè)案例。我們不難發(fā)現(xiàn)DeepMind的幾個(gè)特點(diǎn),或許我們可以為它做個(gè)簡(jiǎn)單清晰的畫(huà)像:
在技術(shù)探索方面,DeepMind更多指向以高度模擬人腦的方式,在核心領(lǐng)域超過(guò)人類(lèi)已有水平的AI系統(tǒng)。無(wú)論是圍棋、游戲,還是環(huán)境判斷、圖像與音頻生成,都指向這個(gè)巨大的野心。
而在技術(shù)優(yōu)勢(shì)上,DeepMind一方面得力與強(qiáng)大的多領(lǐng)域人員儲(chǔ)備,讓它擁有了橫跨多學(xué)科打造算法與產(chǎn)品的優(yōu)勢(shì)。另外一方面,DeepMind的技術(shù)優(yōu)勢(shì)在于高度應(yīng)用化水準(zhǔn)跨越上。雖然他發(fā)布的東西不多,但沒(méi)有一次讓我們看到很初級(jí)、很簡(jiǎn)單的應(yīng)用模型。
在產(chǎn)品的商用價(jià)值上,DeepMind或許會(huì)主攻醫(yī)療健康和垂直領(lǐng)域的機(jī)器學(xué)習(xí)應(yīng)用上,這個(gè)從他們2016年的動(dòng)向中已現(xiàn)端倪。
綜合來(lái)看,這家公司是半學(xué)術(shù)化半商業(yè)化的創(chuàng)業(yè)團(tuán)隊(duì),技術(shù)實(shí)力極高,卻也不太急于賺錢(qián)——有谷歌做后臺(tái),他們還忙著玩游戲呢。
當(dāng)然,這家公司最強(qiáng)的可能還是人工智能的品牌PR上,這不,他又來(lái)用圍棋PR人類(lèi)了。
(審核編輯: 林靜)
分享