選單

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

什麼是機器學習,什麼是人工智慧,什麼是深度學習,這些名詞概念我們一直有聽說,但是也很容易混淆。

1

人工智慧

人工智慧技術希望使用計算機來構造複雜的、擁有與人類智慧同樣本質特性的機器,這些能夠代替人工工作的機器,演算法等等統一稱之為人工智慧,人工智慧是一個很大的範疇,隨著計算機技術的不斷髮展,人工智慧的研究領域也在不斷擴大,下圖展示了人工智慧研究的各個分支,包括專家系統、機器學習、進化計算、模糊邏輯、計算機視覺、自然語言處理、推薦系統等。

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

人工智慧

機器學習:一種實現人工智慧的方法

機器學習最基本的做法,是使用演算法來解析資料、從中學習,然後對真實世界中的事件做出決策和預測。與傳統的為解決特定任務、硬編碼的軟體程式不同,機器學習是用大量的資料來“訓練”,透過各種演算法從資料中學習如何完成任務。

2

深度學習,一種實現機器學習的神經網路方法

一個例子在計算機視覺領域中,若識別一隻熊貓,機器學習的方法是告訴機器熊貓的各種特徵,比如鼻子,眼睛,嘴巴,毛髮等等特徵,讓機器認識到擁有這些特徵的便是一隻熊貓

然而深度學習的方法是給機器一張圖片,讓機器自己去提取特徵,進而預測出是否是熊貓,若預測失敗,神經網路透過前向傳遞,告訴神經網路哪裡出現了錯誤,重新進行識別,直到識別正確為止,最著名的便是這幾年大火的CNN卷積神經網路, 包括計算機識別,自然語言處理,專家系統,推薦系統等等,都或多或少利用了CNN卷積神經網路的知識

總結下圖,便很好的解釋了三者之間的關係,隨著計算機演算法的不斷改進,深度學習越來越受到人工智慧領域的讚賞。

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

AI 的核心目標是提供一組演算法和技術,可用於解決人類憑直覺就能自動執行,但對計算機而言非常具有挑戰性的問題。這類人工智慧問題的一個很好的例子是解釋和理解影象的內容——這項任務是人類可以毫不費力地完成的任務,但事實證明,機器很難完成。

人工神經網路 (ANN) 是一類機器學習演算法,它從資料中學習並專注於模型識別,其靈感來自大腦的結構和功能。深度學習是人工智慧的一個子集,我們重點學習深度學習。

3

神經網路和深度學習的簡明歷史

“深度學習”自 1940 年代以來就已經存在,並經歷了各種名稱更改,包括控制論、連線主義和最熟悉的人工神經網路(ANN)。雖然受到人類大腦及其神經元如何相互作用的啟發,但人工神經網路並不意味著是大腦的現實模型。相反,它們是一種靈感,使我們能夠在一個非常基本的大腦模型與我們如何透過人工神經網路模仿其中一些行為之間進行比較。

第一個神經網路模型來自McCulloch 和 Pitts 於 1943 年。這個網路是一個二元分類器,能夠根據一些輸入識別兩個不同的類別。問題是用於確定給定輸入的類標籤的權重需要由人工手動調整——如果需要人工干預,這種型別的模型顯然不能很好地擴充套件。

然後,在1950年代,Rosenblatt(1958 年,1962 年)釋出了開創性的感知器演算法——該模型可以自動學習對輸入進行分類所需的權重(無需人工干預)。感知器架構的一個例子可以在下圖 中看到。事實上,這種自動訓練過程構成了隨機梯度下降 (SGD) 的基礎,如今它仍然用於訓練非常深的神經網路。

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

感知器演算法

一個簡單的感知器網路架構示例,它接受多個輸入、計算加權和並應用階躍函式來獲得最終預測。

在此期間,基於感知器的技術在神經網路社群風靡一時。然而,Minsky 和 Papert於1969 年發表的一篇論文有效地使神經網路研究停滯了近十年。他們的工作表明,具有線性啟用函式(無論深度如何)的感知器只是一個線性分類器,無法解決非線性問題。非線性問題的典型示例是下圖 中的 XOR 資料集。嘗試一條直線來將藍色星星與紅色圓圈分開是不可能的。

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

XOR  資料集

此外,作者認為我們沒有構建大型深度神經網路所需的計算資源,僅這一篇論文就幾乎扼殺了神經網路研究。

幸運的是,反向傳播演算法被Werbos、Rumelhart 和LeCun等人提出。能夠使神經網路從可能已經過早死亡的情況中復甦。他們在反向傳播演算法方面的研究使多層前饋神經網路得以訓練。

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

反向傳播演算法

一個多層前饋網路架構,具有一個輸入層(3 個節點)、兩個隱藏層(第一層有 2 個節點,第二層有 3 個節點)和一個輸出層(2 個節點)。

結合非線性啟用函式,研究人員現在可以學習非線性函式並解決 XOR 問題,為神經網路的全新研究領域開啟大門。進一步的研究表明,神經網路是通用逼近器,能夠逼近任何連續函式(但不保證網路是否能夠真正學習表示函式所需的引數)。

反向傳播演算法是現代神經網路的基石,使我們能夠有效地訓練神經網路並“教”它們從錯誤中學習。

也許將深度學習應用於特徵學習的典型例子是應用於手寫字元識別的卷積神經網路(LeCun),它透過在每個影象的頂部依次堆疊層來自動從影象中學習區分模式(稱為“過濾器”)。網路較低層的過濾器表示邊和角,而較高層的層使用邊和角來學習更多用於區分影象類別的抽象概念。

LeCun在貝爾實驗室工作期間開發了一套能夠識別手寫數字的系統,並把它命名為LeNet。或許你沒聽過LeNet,但是當年美國大多數銀行就是用它來識別支票上面的手寫數字的。能夠達到這種商用的地步,它的準確性可想而知。那麼LeNet究竟是什麼呢?LeNet是一種典型的用來識別手寫數字的卷積神經網路。自動識別銀行支票,這是卷積神經網路第一次應用於解決實際問題。最著名的MNIST資料集便是此神經網路訓練的資料集

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

MNIST

神經網路發展到這裡,便成功了打開了深度學習的大門,隨著近幾年的大力發展,不同的計算機演算法,特別是CNN卷積神經網路的不斷髮展,慢慢壯大了深度學習的發展

4

深度學習的主要幾個方向

計算機視覺是深度學習的第一個應用到商業用途的深度學習應用,說得白一點,計算機視覺便是使用神經網路模仿人眼看的功能,包括人臉識別與人臉檢測以及相關人臉方面的應用。

計算機視覺的另外一個應用,目標檢測與目標追蹤,當我們看美國大片時,透過攝像頭進行目標的識別檢測,並實時進行追蹤,雖然科幻大片的場景設計的比較科幻,但是目標追蹤技術也逐漸成熟。

計算機視覺的其他應用,包括手機行業比較熱門的AI成像技術,AR,VR虛擬現實技術,人體姿態檢測,人手檢測,影視技術處理等等

隨著計算機視覺技術的不斷髮展,其計算機視覺不僅僅是告訴計算機如何看的技術,更多的是改善看的技術

5

深度學習的其他方向,自然語言處理

自然語言處理( Natural Language Processing, NLP)是計算機科學領域與人工智慧領域中的一個重要方向。它研究能實現人與計算機之間用自然語言進行有效通訊的各種理論和方法。自然語言處理是一門融語言學、計算機科學、數學於一體的科學。因此,這一領域的研究將涉及自然語言,即人們日常使用的語言,所以它與語言學的研究有著密切的聯絡,但又有重要的區別。說的白一點,自然語言處理便是告訴機器如何聽說的技術,包含手機行業的智慧語音助手,智慧音箱,智慧家居等等

6

深度學習的其他方向,推薦系統

推薦系統我們在生活中都有接觸到,特別是我們在使用頭條,抖音,購物平臺等產品時,我們點讚的影片,看過的文章,購買記錄等等,都成為了推薦系統學習的資料,進而給我們推薦更多符合我們預期的影片文章等等

什麼是機器學習、人工智慧、深度學習,三者之間的關係?

推薦系統

當然深度學習還有很多應用,我們後期會慢慢分享其中深度學習的具體例子與深度學習中的不同概念。