中國日報網(wǎng)3月10日電(涂恬)9日揭幕的全球頂級“人機大戰(zhàn)”中,由谷歌DeepMind團隊研發(fā)的人工智能程序AlphaGo首場戰(zhàn)勝世界圍棋名將李世石,“一戰(zhàn)成名”。幾乎是在一夜之間,人工智能、AlphaGo還有DeepMind就立刻“刷爆”了許多人的朋友圈。
當(dāng)不少人還在就人工智能的開發(fā)與人類尊嚴(yán)的存續(xù)爭辯個不停的時候,DeepMind已經(jīng)野心勃勃地宣布,要“破解智能,用它來讓世界變得更好”。如此種種不禁喚起了我們的好奇,想要對敢喊出這種口號的家伙們來做一番“刨根問底”。那么,匯集了AlphaGo背后“最強大腦”的谷歌DeepMind究竟是一個什么樣的存在?
打開DeepMind的官網(wǎng),“破解智能,用它來讓世界變得更好”的口號赫然映入眼簾。官網(wǎng)介紹稱,DeepMind是由哈薩比斯(Demis Hassabis)、雷格(Shane Legg)與蘇萊曼(Mustafa Suleyman)三人于2010年在倫敦創(chuàng)立的。
三人頂級“夢之隊”組建“最強大腦”
搜索一下資料我們可以發(fā)現(xiàn),在這三人中,哈薩比斯是英國著名人工智能研究者,同時也是神經(jīng)系統(tǒng)科學(xué)家、電腦游戲設(shè)計師與世界級的游戲選手,從小就有“神童”稱號。雷格專注于機器學(xué)習(xí)領(lǐng)域,擁有人工智能領(lǐng)域的博士學(xué)位。蘇萊曼則是一名英國企業(yè)家,除了幫助創(chuàng)立DeepMind,他還參與創(chuàng)立了一家專門研究社會問題、提供“沖突解決方案”的公司。
DeepMind不為人知的輝煌業(yè)績
2014年,DeepMind正式被谷歌納入麾下,這也是谷歌截至目前在歐洲地區(qū)的最大收購案。據(jù)傳,在谷歌之前,包括特斯拉創(chuàng)始人馬斯克、Facebook創(chuàng)始人扎克伯格在內(nèi)的許多硅谷大佬們也都曾向DeepMind拋出過橄欖枝。可以說,雖然成立不到6年,但這家公司卻似乎沒有經(jīng)歷多少創(chuàng)業(yè)企業(yè)的艱辛,而是很早就飛上了枝頭,成為了各類大牌科技企業(yè)、風(fēng)險投資機構(gòu)眼中的“香餑餑”。
那么,拋開一些科技企業(yè)拿人工智能炒作的嫌疑不提,DeepMind在成立的六年里又主要干過些什么? 為什么他們會具備受硅谷大佬青睞的潛質(zhì)呢?
潛質(zhì)之一,或許是這個團隊對人工神經(jīng)網(wǎng)絡(luò)的研究。據(jù)媒體報道,早在2013年,DeepMind就創(chuàng)造出了可以模仿人類思維、學(xué)習(xí)如何玩電子游戲的人工神經(jīng)網(wǎng)絡(luò)。當(dāng)年,DeepMind還獲得了劍橋大學(xué)計算機實驗室的“年度公司”獎項,名聲大震。
DeepMind在人工智能、深度學(xué)習(xí)領(lǐng)域的研發(fā)實力還可以從成立以來發(fā)表的各類學(xué)術(shù)論文中一窺。近六年來,該公司不斷在包括Neuron(號稱神經(jīng)科學(xué)界的“頂級期刊”)、Nature(全球最權(quán)威學(xué)術(shù)期刊之一)等雜志發(fā)表研究成果。尤其是在2014年被谷歌收購后,發(fā)表的尖端研究成果數(shù)量更是與日俱增。
最后一個,當(dāng)然也是最給DeepMind“長臉”的就是AlphaGo。資料顯示,AlphaGo和過去挑戰(zhàn)人類的機器們最大的區(qū)別在于,它是一款具備“深度學(xué)習(xí)”功能的機器人,也就是說他不是為了下棋而設(shè)計的,是來“學(xué)習(xí)”下棋的,無時無刻不在模仿人類的思維進行學(xué)習(xí)。
那么AlphaGo究竟是怎么思考的?
AlphaGo的兩個“大腦”
資料顯示,AlphaGo下圍棋的原理和人類有相似之處,一是判斷局部,二是把握全局。
DeepMind此前在Nature雜志發(fā)表的一篇論文中,也曾有過細(xì)節(jié)方面的介紹。簡而言之就是,AlphaGo總體上由兩個不同功能的“大腦”網(wǎng)絡(luò)組成:策略網(wǎng)絡(luò)(Policy network)和價值網(wǎng)絡(luò)(Value network)。
對弈中,AlphaGo的兩個“大腦”協(xié)同工作。策略網(wǎng)絡(luò)負(fù)責(zé)在當(dāng)前局面下判斷“最好的”下一步,可以理解為落子選擇器;價值網(wǎng)絡(luò)負(fù)責(zé)評估整體盤面的優(yōu)劣,淘汰掉不值得深入計算的走法,協(xié)助前者提高運算效率,可以理解為棋局評估器。然后,兩個“大腦”取各自選擇的平均值,做出最終的決定。
AlphaGo不斷升極的“腦力”也可以用它的戰(zhàn)績來證明。2015年,它就曾以5:0的絕對勝利打敗過歐洲圍棋冠軍樊麾,讓DeepMind由此有了向李世石“叫陣”的基礎(chǔ)。據(jù)稱,2015年那次也是人工智能程序首次在不讓子的情況下戰(zhàn)勝人類圍棋選手。這一戰(zhàn)績,加上9日首場比賽就戰(zhàn)勝了李世石,DeepMind對AlphaGo的信心或許還真不是空穴來風(fēng)。
那么,在發(fā)明了迄今為止“史上最強機器人圍棋選手”、名利雙收后,DeepMind還打算干些什么?據(jù)透露,目前DeepMind正在與英國NHS(國家醫(yī)療服務(wù)體系)進行合作,并已經(jīng)成立了“DeepMind健康”項目,并希望通過技術(shù)手段,幫助有意向參與的醫(yī)護人員提高服務(wù)質(zhì)量?;蛟S在圍棋選手后,DeepMind的下一個創(chuàng)造就是“機器人醫(yī)生”。
(編輯:田阿萌)