選單

第三次人工智慧浪潮來襲,認知AI興起

自1956年AI的概念首次被提出,至今已有60多年的發展史。如今,隨著相關理論和技術的不斷革新,AI在資料、算力和演算法“三要素”的支撐下越來越多地走進我們的日常生活。

但是,這一系列驚喜的背後,卻是大多數AI在語言理解、視覺場景理解、決策分析等方面的舉步維艱:這些技術依然主要集中在感知層面,即用AI模擬人類的聽覺、視覺等感知能力,卻無法解決推理、規劃、聯想、創作等複雜的認知智慧化任務。

當前的AI缺少資訊進入“大腦”後的加工、理解和思考等,做的只是相對簡單的比對和識別,僅僅停留在“感知”階段,而非“認知”,以感知智慧技術為主的AI還與人類智慧相差甚遠。

究其原因在於,AI正面臨著制約其向前發展的瓶頸問題:大規模常識知識庫與基於認知的邏輯推理。而基於知識圖譜、認知推理、邏輯表達的認知圖譜,則被越來越多的國內外學者和產業領袖認為是“目前可以突破這一技術瓶頸的可行解決方案之一”。

近日,英特爾實驗室副總裁、被評為AI領域50位全球思想領袖和影響者之一的Gadi Singer 發表了一篇題為The Rise of Cognitive AI的文章,探討了人工智慧的第三次浪潮:認知人工智慧的興起。在不改變原文大意的情況下,學術頭條對文章進行了精心的編譯,內容如下:

深度學習(DL)正取得巨大的進步,並在我們生活的各個方面革新整個行業,包括醫療保健、零售、製造業、自動駕駛汽車、安全和防詐騙以及資料分析。但是,為了構建人工智慧(AI)的未來,推動新一代技術進一步發展,我們要對其設定一組目標和期望——到2025年,人工智慧將會發生質的飛躍,機器也將明顯變得更加智慧。

目前,基於深度學習演算法的很多應用都解決了相關的感知任務,如物件識別、自然語言處理(NLP)、翻譯以及其他涉及資料廣泛關聯處理的任務(比如推薦系統)。深度學習系統依靠微分程式設計和複雜的基於資料的相關性做出了出色的成果,並有望在未來幾年內推動整個行業的轉型。但與此同時,我們必須克服深度學習本身固有的限制,以進一步幫助機器學習或者更廣泛地說是人工智慧實現其潛力。要實現非增量創新,需要在以下三個方面共同努力:

✮實質性地提高模型效率;

✮大大增強模型的穩健性、可擴充套件性和可伸縮性;

✮全面提高機器的認知能力。

第三次人工智慧浪潮來襲,認知AI興起

基於深度學習的語言模型中引數數量呈指數級增長(來源:microsoft)

雖然剪枝、稀疏性、壓縮、蒸餾和圖神經網路(GNN)等技術可以提高模型效率,但最終也同時產生了增量改進。在不影響結果的前提下,將模型大小降低幾個數量級,可能需要對捕獲和表示資訊本身的方法以及深度學習模型中的學習能力方面進行更根本的改變。此外,持續性進步也需要更具計算效率的深度學習方法或者轉向其他機器學習方法。現在,一類具有前景的人工智慧系統正透過在輔助資訊庫中進行檢索來代替大量事實和資料的嵌入,從而迅速受到人們的青睞。

與此同時,統計機器學習方法基於這樣的假設——訓練樣本的分佈代表了推理過程中必須處理的內容,在現實生活的使用中存在重大缺陷。尤其在遇到訓練資料集取樣稀疏,甚至缺乏樣本的情況時,深度學習模型就會受到挑戰。

除此之外,遷移學習和小樣本/零樣本推理方面取得的結果也不盡人意。模型的低效擴充套件性使得人工智慧無法擴充套件到資料集和資料科學家缺乏的許多領域。此外,深度學習還非常容易受到資料變化的影響,從而產生低信度分類,但這一問題可以透過提高模型的穩健性和可擴充套件性得到解決。

最後,在大多數情況下,神經網路無法正確提供認知,推理和可解釋性。深度學習缺乏認知機制,無法進行抽象、上下文語境、因果關係、可解釋性和可理解性的推理。

第三次人工智慧浪潮來襲,認知AI興起

下一階段:認知人工智慧

人工智慧有望達到人類理解水平。依靠Daniel Kahneman在《快思慢想》一書中定義的正規化,Yoshua Bengio將當代深度學習的功能等同於他所描述的“系統1”的特點——直覺的、快速的、無意識的、習慣性並完全處於自主控制狀態。與此相反,他指出,人工智慧系統的下一個挑戰在於實現“系統2”的功能——緩慢的、有邏輯的、有序列的、有意識和演算法化,例如實現計劃和推理所需的功能。

Francois Chollet以類似的方式在廣泛概括的基礎上描述了人工智慧發展中的新興階段(“Flexible AI”),它能夠適應廣泛領域內的未知事件。這兩個特徵都與DARPA(美國國防部高階研究計劃局)的“人工智慧的第三次浪潮”的內容一致,其特徵是語境順應(contextual adaptation)、抽象、推理和可解釋性。實現這些功能的一種可能途徑是將深度學習與符號推理和深度知識結合起來。下面,我將使用術語“認知人工智慧”(Cognitive AI)來指代人工智慧的這一新階段。

儘管我們無望實現開放式通用人工智慧(AGI),但具有較高認知能力的人工智慧也能在技術和商業領域中發揮更大的作用。一旦人工智慧可以在不可預測的環境中做出可靠的決策,它最終將獲得更高的自主權,並在機器人技術、自動運輸以及物流、工業和金融體系的控制點等領域中發揮重要作用。

第三次人工智慧浪潮來襲,認知AI興起

結構化知識在認知人工智慧中的作用

在人工智慧領域,有些人認為可以透過進一步發展深度學習來實現更高級別的機器智慧,而另一些人則認為這需要合併其他基本機制。對此,我贊同後者的觀點,原因如下:

深度學習掌握了從嵌入空間中的多維結構的輸入到預測輸出的基於統計的對映。這讓它在區分寬資料和淺資料(例如,影象中的單詞或畫素/體元序列)方面表現出色。此外,深度學習在索引資源(如維基百科)和從語料庫中最匹配的地方檢索答案方面同樣有效——正如在NaturalQA或EffiicentQA 等基準測試中所表現的那樣。根據Bengio的定義,系統1的任務依賴於訓練期間建立的統計對映功能。而深度學習可以為完成這些任務提供幫助。

相比之下,結構化、顯性和可理解的知識可以為實現更高階機器智慧或系統2的功能提供途徑。一種基本的知識構建就是能夠捕獲有關元素和概念的宣告性知識並編碼抽象概念(例如,類之間的分層屬性遺傳)。例如,有關鳥類的知識,加上有關雀形目鳥類的資訊,再加上有關麻雀的詳細資訊,即使沒有特別的說明,也能提供大量有關慄麻雀的隱含資訊。除此之外,其他知識構建還包括因果模型和預測模型。

這樣的構建依賴於顯性的概念和定義明確的關係,而不是潛在空間中的嵌入式機器,並且因此所得模型將具有更廣泛的解釋和預測潛力,遠遠超過了統計對映的功能。

人類大腦有“想象”、模擬和評估潛在未來事件的能力,這些能力是經驗或觀察都無法企及的。同時,這些功能為人類智慧提供了進化優勢。在不受明確規則限制的環境中,對未來可能發生事件進行心理模擬是基於世界動力的基本模型,這在計劃和解決問題方面具有很大的適應性價值。

過程建模機制基於隱式的數學、物理或心理原理,而不是從輸入到輸出的可觀察的統計相關性,這對於實現更高的認知能力至關重要。例如,物理模型可以捕獲滑水現象,並對各種條件下汽車的運動進行簡單預測。這樣的過程模型可以與基於深度學習的方法結合使用以擴充套件當前人工智慧的功能。

知識庫可以捕獲(或隱式)常識性假設和底層邏輯,這些假設和邏輯並不總是公開地呈現在深度學習系統的訓練資料中。這表明,對世界及其動力的理解有助於解決更高階機器智慧的任務。最後,合理的結構化知識可以在上下文語境和聚合內容方面消歧(將“俱樂部”的屬性分為棒球類,武器類,紙牌類或聚會場所)。

第三次人工智慧浪潮來襲,認知AI興起

認知人工智慧與知識時代

在未來的幾年中,隨著淺層對映功能變得更加豐富,計算處理變得更加經濟和快捷,基於深度學習的系統1有望取得重大進展。認知人工智慧也將帶來更多更高階的功能。

總而言之,我相信,到2025年,將出現一批新的認知人工智慧,它們不僅具有更強的解釋力,而且比當前基於深度學習的系統更接近人類的自主推理水平。

我們已經在英特爾實驗室建立了認知計算研究部門,來推動英特爾在機器智慧和認知交叉點上的創新,並不斷提高新興認知人工智慧的能力。我們努力將深度學習的最新成果與知識構建和神經符號人工智慧的整合結合起來,來構建能在複雜情景中做出明智決策的自主學習人工智慧。

深度學習使人工智慧系統在識別、感知、翻譯和推薦系統任務方面成果卓越。下一波機器學習和人工智慧技術的興起,將創造出一種擁有更強理解力和認知力的新型人工智慧,從而為我們的生活帶來更大便利。