遊戲男孩開啟人工智慧新紀元

今天要聊的故事，是一個遊戲男孩，如何開啟人工智慧的新紀元？

玩遊戲就是浪費大腦？

這個男孩的名字叫做戴密斯·哈薩比斯（Demis Hassabis）。在他年少的時候，哈薩比斯就是國際象棋上非常具有天賦的孩子。在他11歲時，就在國際象棋比賽上，擁有了世界級的排名。但是之後他放棄了在國際象棋領域的發展，他認為玩國際象棋的人，都是非常聰明的人，但是單純的玩遊戲就是浪費大腦，他要用他的大腦去做一些更有意義的事情。

在他16歲那年，他向劍橋大學申請成為一名計算機科學專業的學生，劍橋大學破格錄取了他，但由於同齡的人還在唸高中，學校要求他晚一年入學。就在這一年裡，哈薩比斯參加了美國遊戲雜誌Amiga Power舉行的遊戲設計大賽，並獲得了二等獎，也因此得到了遊戲開發公司的邀請。

那個說“玩遊戲浪費大腦”的男孩，在遊戲公司開發了一款叫“主題公園”的新遊戲，玩家可以在這款遊戲裡創造和經營自己的主題公園，這款遊戲獲得了巨大的成功，哈薩比斯也賺到了自己人生中的第一桶金。

“深藍”（Deep Blue）擊敗了頂尖的國際象棋手，不代表計算機可以挑戰圍棋

在1997年，計算機“深藍”（Deep Blue）擊敗了頂尖的國際象棋手，這在計算機界引起了巨大的反響。在劍橋大學唸書的哈薩比斯也和教授們討論計算機這一成就。教授們雖然認可了“深藍”（Deep Blue）的成績，但是他們認為計算機可以打敗國際象棋，卻不能打敗圍棋。

圍棋起源於中國，相傳是帝堯所作，隋唐時期傳入了日本，後來輾轉流傳到世界各國，成為一種國際遊戲。兩名遊戲者，分別用一種顏色的棋子，進行交替落子，在19根線條組成的361個交叉點上，圍棋可能演變的走法大約有300位數字。圍棋的規則非常簡單，只有黑白雙子交替落子，搶奪地盤的遊戲，但與國際象棋相比，圍棋更具難度。

國際象棋的行棋步驟，是一種可控有序的方式逐漸構成分支，最終形成一種包含各種可能性的樹狀結構，計算機和人類都可以依據邏輯規則，逐級分析不同分支之間的關係。

相比之下，圍棋棋手是透過觀察棋子的佈局來判斷局勢的。人是一種視覺的動物，人類的大腦可以敏銳的捕捉視覺影象所形成的結構和模式。擁有300位數字的圍棋佈局走法中，對計算機強大的計算能力是一種挑戰。更何況圍棋的走法是一種極具創造性和直覺性的抽象視覺遊戲，所以計算機可以打敗國際象棋，但是圍棋才是計算機的天花板。

遊戲男孩的鬥志

少年國際象棋比賽的經歷讓哈薩比斯擁有了不服輸的鬥志，教授們越說計算機下不好圍棋，他越要挑戰這個不可能完成的任務。經過了一番思考和研究，哈薩比斯認為與其編寫一個會下圍棋的程式，不如直接編寫一個通用性的

“元程式”

，讓計算機自己學習如何在圍棋比賽中獲得勝利。這個程式的重點在於“元程式”要實現具有模式學習的能力，隨著經歷的棋局越多，可以在下棋的過程中總結經驗教訓，

在不斷地自我學習和改進中擁有創造力

，獲得遊戲的勝利。這個程式好比一個新生的嬰兒，要透過不斷學習和挑戰，才能學會如何解決問題。

哈薩比斯打算研究**人類的大腦是如何學習解決問題的**，為此他還攻讀了神經科學博士學位，並與神經學家謝恩·萊格（Shame Legg）、自己的發小三人創辦了公司DeepMind。這個公司要研究的專案就是“用人工智慧來玩圍棋遊戲”。

人類的大腦是如何解決問題的？創造力是如何產生的？這些問題一直困擾著科學家們。有些人認為，創意是日積月累的效果，一切創意都是一種混搭；也有人認為，創意來自於靈感，這是人類的一種直覺；更有一些人認為，創意是天才的事情，而天才往往是神秘的、孤獨的、被神化的。一直以來神經科學、腦科學、認知科學家們，一直想透過解開人類大腦的秘密來揭開創造力的秘密。但是人的大腦，複雜的就如同一個黑匣子，我們知道輸入，看得見輸出，卻無法探究黑匣子是如何運作的。

我們人類的知識，是對事物所展現的外部規律進行歸納和總結，從而形成了某種理論、定理或公式。人類的進步，得益於人類這種總結模式的抽象化思維。

在編寫計算機演算法的邏輯中，從外部觀察行為，模擬內部結構，是一種自上而下的研究。而新的計算機演算法編寫邏輯，是猜測它的內部結構，從外部進行輸入輸出來驗證這種行為，這是一種自下而上的研究。我們無須知道黑匣子是如何運算的，但是我們可以透過不斷最佳化輸出結果，來得到我們想要的程式。

我們無法得知黑匣子裡具體是如何運算的，但是我們可以透過不斷最佳化輸出的部分來最佳化演算法程式，進而計算機演算法的程式，AlphaGo就是這樣一個自下而上的編寫邏輯。在程式的最開始AlphaGo像一個嬰兒一樣輸入目前存在的所有圍棋對弈的資料。在這樣龐大的資料庫中，建立一個機率的概念，在特定的棋盤位置，演算法可以分析出，每一步落子隊獲勝的影響機率。人類的經驗幫助AlphaGo的圍棋對弈讀過“基礎學習階段”。

但這些遠遠不夠，AlphaGo要經歷第二個階段，被稱為“強化學習階段”。強化學習是在經驗學習中逐漸開發改進演算法的效能，對每一個輸出的結果進行判斷，並及時調整演算法公式，避免再次出錯，在錯誤中不斷最佳化的一種方法。

哈薩比斯將機器學習比喻成攀登高山，如果你攀登上A峰的山頂，四周都是迷霧，你往哪個方向走都是下坡路。當迷霧被風吹散，你才能發現A峰的不遠處還有更高的B峰。要想攀登上更高的B峰，你必須先下山，從山底重新爬起，才能到達B峰。這就是數學家提出的“區域性極大值”困境。人類的傳統經驗，已經形成了某種思維定勢，這種思維定勢幫助我們到達A峰，但是，只有打破原有思維的束縛，從一條我們不熟悉的路從新開始，才能到達更高的山峰。AlphaGo沒有情感，他們並不害怕失敗，不介意重新開始。他們在“強化學習階段”一次次自我更新，自我挑戰。

人機大戰：機器有創造力嗎？

2016年3月，萬人矚目的人機大戰拉開了帷幕，9段高手李世石將代表圍棋的最高棋技挑戰AlphaGo。在比賽開始之前，李世石認為自己可以輕鬆戰勝這個機器棋手，但是當真正的比賽開始，輕視對手的李世石和AlphaGo對弈中逐漸失去優勢，他忍不住看了一眼對手，但是無法獲得任何微表情的細節來幫助他分析對手。反之，AlphaGo把數以百萬計的棋局資料，透過神經網路進行深度學習並加以改進，並時刻調整對戰最佳的對弈策略。當下到第186手時，李世石棄子認輸了，AlphaGo在五番棋首局獲得了勝利。

第二局開始，李世石不再輕視對手，在第36手時外出放鬆。就在他離開座位的時候，AlphaGo的37手，將棋子落在了距離棋盤邊緣5步的位置，這一手讓所有人震驚，李世石得到訊息也快速返回棋局，這步棋不符合人類的思維邏輯。

按照人類以往的下棋套路，在初始階段，會選擇最外側的4條線上落子。在第三條線上落子，可以有效的形成區域控制，在第4條線上落子，可以幫助棋手在後期擴張自己的勢力範圍，所以棋手一般只會選擇第3條線和第4條線上落子，這樣被認為是一種很明智的攻守兼備的策略。但是在第5條線上落子，容易給對方可乘之機。

很多評論者在看到第37手後，都在懷疑是不是AlphaGo的失誤，這會為李世石帶來機會。但是在接下來的應戰中，李世石還是輸掉了比賽。事實證明第37手不僅不是失誤，還是一個精妙的佈局。

“這步棋真是神來之筆，精彩絕倫。”

“第37手不是人類的經驗，這是機器的創造力。”

在接下來的第三局裡，李世石使用了非常強硬的策略，但是AlphaGo始終以微弱的優勢控制著局面，評論員稱AlphaGo展示的是怠惰走法策略。在真人的對弈中，這種做法是非常冒犯的，但是計算機並沒有這種情感，他只想要最後的結果，他只想要贏，而且並不在乎贏多少，最後AlphaGo以3：0勝利了。

在這種五番棋賽的對弈中，三局勝利就代表著AlphaGo已經贏得了比賽。但是deepmind團隊卻高興不起來，這場人機之戰中，他們已經分不清自己是站在機器這一邊，還是人類那一邊，這讓他們困惑，他們對李世石的遭遇感同身受。即使是早知結果的我，在影片播放到這裡的時候，也有一種深深的悲傷感。

人機大戰：人類的反擊

也許因為連輸了三局，整場比賽勝負已定，在第4局的時候，李世石卸下了思想的包袱，開始放手一搏。

在第4局中，AlphaGo依舊佔據著領先的優勢，當下到第78手的時候，李世石思考了半小時，在AlphaGo的兩個黑子之間下了一子，這一子出乎意料，也讓AlphaGo措手不及，接連下了幾個莫名其妙的子應對。評論家認為，李世石的第78手讓人意外，但AlphaGo之後的表現，沒有透過圖靈測試，任何一個具有戰略眼光的棋手，都不會做出接下來的決策。

當棋局下到第180手的時候，AlphaGo棄子認輸，人類贏得了一場寶貴的勝利。

李世石在事後的採訪中表示，在第78手的時候，他認為只有那個位置可以落子。這是人類的一種直覺，人類獨有的創造力。評論家將第2局，AlphaGo的第37手稱之為“神來之筆”，體現了機器也具有創造性，那麼第4局，李世石的第78手就是“上帝之手”，打破了傳統棋局的套路，為整場比賽帶來了深遠影響，這是真正的人類創造力的表現。

當李世石剛走進新聞釋出會，現場就爆發出雷鳴般的掌聲。這場勝利讓所有人激動，讓人們看到了人類戰勝機器的可能，在人類連敗三局的低落中點燃了一場希望之火。

哈薩比斯在事後的新聞釋出會上解釋AlphaGo與人類對弈的歷史經驗，讓他沒有預料到李世石的第78手。這種下法在以往的對弈經驗中，只有萬分之一勝利的可能，所以他的機率分析就不自覺的優先考慮了其他應對辦法。這是機器的缺憾。

在第4局的勝利之後，人們希望最後一句，李世石依據可以戰勝AlphaGo。但是，顯然AlphaGo在他的錯誤中，學習到了新的東西。第5局變得異常艱難，歷經5個小時，終於在第281手的時候，李世石認輸。至此，這場“人機大戰”以4：1的結果畫上了句號。

很多人在賽後發表評論：“這將是人工智慧重要的轉折點”。AlphaGo不僅僅在下圍棋，哈薩比斯也不只是在玩遊戲，機器的學習和適應能力，將會是人類關注的全新課題。

哈薩比斯在首局勝利之後，曾發表推特說：“AlphaGo贏了，我們成功把它降落在月球表面”。是的，這場勝利是AlphaGo的一小步，也是人工智慧的一大步。

從AlphaGo到AlphaZero

在比賽之後，哈薩比斯的團隊又研發出AlphaGo的升級版AlphaZero。AlphaGo的資料基礎來源於人類的對弈經驗，AlphaZero則完全摒棄了人類曾經的知識，從0（Zero）開始訓練，他不再學習人類曾經的走法、策略，而是完全依靠自我對弈來迅速提升棋藝，打破人類在圍棋認知上的侷限和思維定勢。這種新的演算法呈現出強大的能力，AlphaZero僅僅透過三天的自我訓練。就在和AlphaGo（贏下李世石的那一版）對弈時，取得了100：0的壓倒性戰績。在這三天中，AlphaZero不眠不休的自我對弈達到了490萬盤。這個數字，人類需要花費3000年才能實現。

在那場人機大戰之後，哈薩比斯團隊宣佈退出了圍棋競技領域，那個遊戲少年還記得自己曾經的理想，“聰明的大腦，應該去做一些更有意義的事情”。他的團隊DeepMind把目光投向了醫療保健、能源效率、語音識別等其他領域。AlphaZero自學成才的能力，不僅僅適用於圍棋領域，還可以應用在其他現實問題上。

哈薩比斯從人類的智力問題中獲得靈感，讓機器透過自我學習獲得了“新的智慧”，。打贏了最考驗人類智力的遊戲，然後用這個“新的智慧”去解決其他領域的問題。

【DeepMind官網】

DeepMind 的官網上寫著DeepMind Technologies 的目標是結合“機器學習和系統神經科學的最佳技術來構建強大的通用學習演算法”。

AlphaFold ：破解了蛋白質摺疊的密碼

在中學的生物裡，就學習過蛋白質，它為我們的生命提供能量。進入到我們身體的微觀世界中，把每一個蛋白質比做一個小機器，我們身體裡的每一個細胞中，都有數億臺這種小機器在勤勤懇懇的工作。為我們的血液提供氧氣，給我們的肌肉提供力量，所有的生物都離不開蛋白質。

一直以來科學家都渴望破解蛋白質的密碼，也就是蛋白質的摺疊結構。每個蛋白質都是由20種氨基酸組成的，多種氨基酸之間相互作用，就形成獨特的蛋白質摺疊。只有破解了蛋白質摺疊的密碼，才能知曉蛋白質的作用，以此來對抗病毒，治療疾病，甚至延長壽命。

科學家已知的蛋白質結構，超過了2億種，這種數字還在逐漸增加。1969年，塞勒斯 · 萊文塔爾（Cyrus Levinthal）指出，用暴力計算法列舉一個典型蛋白質的所有可能構型所需的時間比已知宇宙的年齡還要長，他估計一個典型蛋白質有10 ^ 300種可能構型。這種無窮的計算是人力不可為的，卻是計算機的強項。

為了鼓勵大家破解蛋白質的摺疊密碼，1994年，John Moult 教授和 Krzysztof Fidelis 教授創立了 CASP （Critical Assessment of Structure Prediction），以促進研究並建立蛋白質結構預測的最新水平。CASP被稱之為蛋白質的奧林匹克競賽。

【自由建模類別中蛋白質靶標的兩個示例，AlphaFold 根據實驗結果預測高度準確的結構】

2016 年，DeepMind 將其人工智慧轉向了蛋白質摺疊，這是科學中最棘手的問題之一。2018 年 12 月，DeepMind 的 AlphaFold透過成功預測 43 種蛋白質中的 25 種最準確的結構，贏得了第 13 次蛋白質結構預測技術關鍵評估（CASP）。哈薩比斯對《衛報》說：“這是一個燈塔專案，我們在人力和資源方面對一個基本的、非常重要的、現實世界的科學問題進行了第一次重大投資。”

【主要神經網路模型架構概述。該模型對進化相關的蛋白質序列以及氨基酸殘基對進行操作，在兩種表示之間迭代傳遞資訊以生成結構】

2020 年，在第 14 屆 CASP 中，AlphaFold 的預測達到了與實驗室技術相當的準確度分數。科學評審小組之一安德烈·克里什塔福維奇博士將這一成就描述為“真正了不起”，並表示預測蛋白質如何摺疊的問題已“基本解決”。

AlphaFold 是我們迄今為止最重要的進步之一，但與所有科學研究一樣，仍有許多問題需要回答。並非我們預測的每個結構都是完美的。還有很多東西需要學習，包括多種蛋白質如何形成複合物，它們如何與DNA、RNA或小分子相互作用，以及我們如何確定所有氨基酸側鏈的精確位置。在與他人合作的過程中，還有很多關於如何最好地利用這些科學發現來開發新藥、管理環境的方法等方面的知識。

對於我們所有致力於科學計算和機器學習方法的人來說，像 AlphaFold 這樣的系統展示了人工智慧作為輔助基礎發現工具的驚人潛力。就像 50 年前安芬森提出了當時科學無法觸及的挑戰一樣，我們宇宙的許多方面仍然未知。今天宣佈的進展讓我們更加相信人工智慧將成為人類擴充套件科學知識前沿最有用的工具之一，我們期待未來多年的辛勤工作和發現！

圖片來自DeepMind

機器成為了人的延伸，遊戲男孩的故事還在繼續......

遊戲男孩開啟人工智慧新紀元

猜你喜歡

推薦文章