谷歌DeepMind發(fā)布最新研究:人類認(rèn)知心理學(xué)開(kāi)啟人工智能的“黑盒子”
點(diǎn)擊:1621
A+ A-
所屬頻道:新聞中心
深度神經(jīng)網(wǎng)絡(luò)已經(jīng)掌握了解決各種問(wèn)題的方法——從識(shí)別、推理圖像中的物體,到成為“圍棋上帝”。隨著這些任務(wù)變得越來(lái)越復(fù)雜,神經(jīng)網(wǎng)絡(luò)摸索出來(lái)的解決方法也變得越來(lái)越繁瑣。
因?yàn)檫@個(gè)系統(tǒng)太復(fù)雜了,即使是設(shè)計(jì)該系統(tǒng)的工程師可能也無(wú)法分析出它發(fā)出某一指令的原因。當(dāng)然,你也不能強(qiáng)求這個(gè)神經(jīng)網(wǎng)絡(luò)能夠給出它下達(dá)每一個(gè)指令的原因:目前為止還沒(méi)有一套能夠讓 AI 自己解釋自己行為的系統(tǒng)。
實(shí)際上,這就是人工智能領(lǐng)域著名的“黑盒子”問(wèn)題,隨著神經(jīng)網(wǎng)絡(luò)在現(xiàn)實(shí)世界中的應(yīng)用越來(lái)越廣泛,對(duì)這一問(wèn)題的研究也開(kāi)始變得無(wú)比重要。對(duì)此,《麻省理工科技評(píng)論》曾以“人工智能核心地帶的黑暗秘密”為題刊發(fā)專題文章,來(lái)深入探討神經(jīng)網(wǎng)絡(luò)的不可解釋性問(wèn)題。
圖丨《麻省理工科技評(píng)論》關(guān)于人工智能的“黑盒子”問(wèn)題的封面文章
作為人工智能研究領(lǐng)域的先鋒,DeepMind對(duì)“黑盒子”問(wèn)題也在持續(xù)關(guān)注——目前,該團(tuán)隊(duì)正著手開(kāi)發(fā)更多的工具,用于解釋人工智能系統(tǒng)。6 月 26 日,在最新發(fā)布的一篇論文中,DeepMind提出了一種基于認(rèn)知心理學(xué)來(lái)研究深度神經(jīng)網(wǎng)絡(luò)的新方法。
那么,什么是認(rèn)知心理學(xué)?一般而言,該學(xué)科通過(guò)評(píng)估行為來(lái)推測(cè)認(rèn)知機(jī)制,并涵蓋了大量與認(rèn)知機(jī)制相關(guān)的細(xì)節(jié),同時(shí)還設(shè)計(jì)了很多實(shí)驗(yàn)來(lái)證明這些機(jī)制。隨著神經(jīng)網(wǎng)絡(luò)在解決某些具體問(wèn)題上的能力已經(jīng)達(dá)到或超越人類水平,認(rèn)知心理學(xué)的研究方法將與人工智能的黑盒子問(wèn)題愈發(fā)相關(guān)。
為了證明這一點(diǎn),DeepMind設(shè)計(jì)了一個(gè)實(shí)驗(yàn)來(lái)解釋人類認(rèn)知,從而幫助人類進(jìn)一步了解深度神經(jīng)網(wǎng)絡(luò)是如何解決圖像分類問(wèn)題。
實(shí)驗(yàn)結(jié)果顯示,認(rèn)知心理學(xué)家觀察到的人類行為,在深度網(wǎng)絡(luò)中也有類似的體現(xiàn)。總體上說(shuō),實(shí)驗(yàn)的成功也證明,認(rèn)知心理學(xué)完全可以用來(lái)幫助人們更好地理解深度學(xué)習(xí)系統(tǒng)。
在 DeepMind 的案例研究中,甚至考慮到了孩子們是如何辨識(shí)物體的,這是認(rèn)知心理學(xué)的一大研究領(lǐng)域。
通常而言,孩子們從單個(gè)例子中猜測(cè)詞語(yǔ)意思的能力,被稱為“單次語(yǔ)義學(xué)習(xí)”(one-shot word learning)——這種認(rèn)知能力看起來(lái)非常自然,會(huì)讓人們覺(jué)得,這一過(guò)程其實(shí)沒(méi)什么太復(fù)雜的機(jī)制。
然而,美國(guó)著名哲學(xué)家威拉德·奧曼·奎因多年前設(shè)計(jì)的一個(gè)經(jīng)典思想實(shí)驗(yàn),卻向人們展示了這一過(guò)程到底有多復(fù)雜:
一個(gè)語(yǔ)言學(xué)家要去一個(gè)地方,但那里的語(yǔ)言和這個(gè)語(yǔ)言學(xué)家所使用的完全不一樣。于是,這位語(yǔ)言學(xué)家想找一位當(dāng)?shù)厝藖?lái)學(xué)習(xí)一些本地語(yǔ)言中的詞匯。這時(shí),正巧有一只兔子從他們身邊跑過(guò),當(dāng)?shù)厝嗣摽诙觥癵avagai”,于是語(yǔ)言學(xué)家就開(kāi)始推測(cè)這個(gè)詞的意思。
圖丨“gavagai”到底指的是什么?
當(dāng)然,這個(gè)詞可能表示很多意思,可以是“兔子”、“白色的東西”,甚至指兔子身上的某一部位。
那么,面對(duì)這么多的可能性,人類如何去選擇哪個(gè)正確的意思?
時(shí)至今日,我們?cè)谑褂蒙疃壬窠?jīng)網(wǎng)絡(luò)進(jìn)行單次語(yǔ)義學(xué)習(xí)時(shí)也會(huì)遇到了同樣的問(wèn)題,而 DeepMind 團(tuán)隊(duì)所開(kāi)發(fā)的名為“匹配網(wǎng)絡(luò)”(Matching Network)的新型神經(jīng)網(wǎng)絡(luò)模型或許可以解決這些問(wèn)題。
實(shí)際上,匹配網(wǎng)絡(luò)憑借著在關(guān)注度和記憶方面的進(jìn)步,完全可以做到僅憑一個(gè)案例就對(duì)ImageNet圖像識(shí)別數(shù)據(jù)庫(kù)中的海量數(shù)據(jù)進(jìn)行分類篩選,而且表現(xiàn)絕對(duì)是無(wú)可爭(zhēng)辯的。
圖丨“匹配網(wǎng)絡(luò)”的結(jié)構(gòu)
為了闡明這一點(diǎn),研究團(tuán)隊(duì)參照了認(rèn)知心理學(xué)家的研究結(jié)果——他們發(fā)現(xiàn),孩子們往往是通過(guò)歸納出偏好來(lái)消除許多錯(cuò)誤推論,從而得出正確推論。這些典型的偏好包括:
整體偏好(whole object bias):孩子們會(huì)更傾向于認(rèn)為一個(gè)詞指代的是整個(gè)物體,而不是它的組成部分(兔子未被關(guān)注的部分);
類別偏好(taxonomic bias):將一類物體歸于類別中的某一種物體(所有動(dòng)物都可能被當(dāng)做“兔子”);
形狀偏好(shape bias):孩子們往往會(huì)根據(jù)事物的形狀,而不是顏色或條紋來(lái)描述一個(gè)物體。(所有白色的東西都可能被歸類為“兔子”)。
在上面三種偏好中,DeepMind的研究團(tuán)隊(duì)選擇了“形狀偏好”作為檢測(cè)神經(jīng)網(wǎng)絡(luò)的切入點(diǎn),這是因?yàn)椤靶螤钇谩痹谌祟惼醚芯恐姓紦?jù)了很大的比重。
圖丨從左至右:原物體、形狀匹配物體、顏色匹配物體
更為關(guān)鍵的是,在接下來(lái)的試驗(yàn)中,DeepMind 研究團(tuán)隊(duì)向深度神經(jīng)網(wǎng)絡(luò)展示三個(gè)物體的圖像——原物體、形狀匹配物體(形狀相似但顏色不同的參照物體)以及顏色匹配物體(顏色相似但形狀不同的參照物體)。同時(shí),研究團(tuán)隊(duì)記錄了原物體和形狀匹配物體被歸為一類的次數(shù),以及原物體和顏色匹配物體被歸到一類的次數(shù)。
在對(duì)上述歸類次數(shù)進(jìn)行比對(duì)后,研究人員發(fā)現(xiàn),正如人類一樣,該網(wǎng)絡(luò)對(duì)形狀的感知有著超過(guò)對(duì)顏色和材質(zhì)的偏好——也就是說(shuō),神經(jīng)網(wǎng)絡(luò)也有著“形狀偏好”。
圖 | DeepMind在匹配網(wǎng)絡(luò)中進(jìn)行的認(rèn)知心理學(xué)實(shí)驗(yàn)。A為形狀匹配物體,B為顏色匹配物體。由于匹配網(wǎng)絡(luò)對(duì)形狀的偏好,會(huì)傾向于將原物體于A相匹配。
然而,除了觀察到深度網(wǎng)絡(luò)的形狀偏好外,還有一些值得注意的結(jié)果:
首先,形狀偏好在對(duì)網(wǎng)絡(luò)訓(xùn)練的早期就開(kāi)始出現(xiàn)。這很容易令人聯(lián)想到了人類思維方式對(duì)于形狀的偏好。心理學(xué)家表示,兒童所展示的形狀偏好比青少年要少,而成年人的形狀偏好最為明顯;
其次,取決于不同的組合和訓(xùn)練模式,深度網(wǎng)絡(luò)對(duì)形狀偏好的程度也不一樣。所以當(dāng)研究團(tuán)隊(duì)對(duì)深度學(xué)習(xí)系統(tǒng)進(jìn)行測(cè)試時(shí),必須使用大量的訓(xùn)練模型來(lái)得到可靠的結(jié)果,就像心理學(xué)家對(duì)不同對(duì)象的測(cè)試一樣;
最后,即使形狀偏好程度不同,每個(gè)網(wǎng)絡(luò)在同種單次語(yǔ)義學(xué)習(xí)測(cè)試上的表現(xiàn)是一樣的。這說(shuō)明不同的網(wǎng)絡(luò)可以針對(duì)同一個(gè)復(fù)雜問(wèn)題找到同樣有效的解決辦法。
總之,DeepMind團(tuán)隊(duì)認(rèn)為,此次實(shí)驗(yàn)的重大成功就在于證明了認(rèn)知心理學(xué)在解釋和推測(cè)神經(jīng)網(wǎng)絡(luò)行為方面的潛力。而由于人類在認(rèn)知心理學(xué)研究領(lǐng)域具備豐富的知識(shí)儲(chǔ)備,這將為解決人工智能“黑盒子”問(wèn)題提供全新的思路,讓人類更深刻的理解深度神經(jīng)網(wǎng)絡(luò)的行為。
(審核編輯: 林靜)
分享