選單

圖靈測試:人工智慧行業的“天花板”?

在這個充斥著人工智慧、大資料技術的時代,我們每個人似乎都沒有秘密可言。

也許你隨口說一句“我想吃日式料理”,接著各種APP就會帶著日式料理資訊對你進行輪番轟炸。

人工智慧、大資料讓這個世界更瞭解你,同時也讓你無處遁形。

在大環境下,越來越多的人開始關注人工智慧,他們愈發想知道什麼才是智慧,怎樣定義智慧。

而說起這個話題那便繞不開一個人——艾倫·麥席森·圖靈,他被稱為人工智慧之父。

圖靈測試:人工智慧行業的“天花板”?

在1950 年,他發明了一個迄今為止仍被稱為人工智慧終極測試的思想實驗——模仿遊戲,也就是廣為人知的“圖靈測試”。

“圖靈測試”的目的是用來測試機器是否具備人類智慧,檢測所謂人工智慧的智慧化程度,它是否可以達到人類水平。

圖靈測試是測試人在與被測試者(一個人和一臺機器)隔開的情況下向被測試者隨意提問。

問過問題後,如果被測試者超過30%的答覆不能使測試人確認出哪個是人、哪個是機器的回答,那麼這臺機器就通過了測試,並被認為具有人類智慧。

圖靈測試:人工智慧行業的“天花板”?

測試採用的是問答形式,讓測試人依據回答來進行判定,這種評判方法非常的直觀。

如果在測試中,對話是這樣的:

測試者:你會唱歌嗎?

被測試者:是的。

測試者:你會唱歌嗎?

被測試者:是的。

測試者:再問一遍你會唱歌嗎?

被測試者:是的。

這個時候,你基本可以判斷這是一臺機器,但現實往往並非如此,當對話變成了這樣:

測試者:你瞭解莎士比亞麼?

被測試者:一點點。

測試者:那聊聊唄。

被測試者:莎士比亞是英國最傑出的戲劇家,代表作有《奧賽羅》、《哈姆雷特》、《李爾王》和《麥克白》……

圖靈測試:人工智慧行業的“天花板”?

根據回答你可能會覺得對方是機器,人類不可能記得這麼清楚,可實際上對方是一名學藝術史的學生。

也就是說,在測試中往往會遇到預想不到的結果,同時,每個人對智慧的概念有著不一樣的標準,測試卻是由人主觀評定,而非客觀的“量化評定”。

這意味著可能在這一批的測試人中絕大多數認為他是人類,換了另一批測試者後結果卻截然相反。

在今天,仍然有一部分人將圖靈測試看作人工智慧行業的“天花板”,覺得透過圖靈測試的機器才是真正的人工智慧。

但圖靈測試有很大的弊端,因為有時候機器是需要透過欺騙或假裝無知來透過測試的。

舉一個例子,如果機器要想透過圖靈測試,就必須在回答 “你知道5824892478乘以65475217是多少嗎?” 這種問題時,加入停頓語氣。

即便機器因強大的計算能力早就知道了答案,但為了模仿人類,它必須停頓陷入思索,但顯然在應用中這不是對它技能的最大化利用。

從本質上來看圖靈測試是想讓機器在最大程度上模仿人類,而非讓機器變得更智慧。

另外,圖靈測試也僅限於文字交流,它幾乎全盤否定了人工智慧快速計算和資訊查詢的功能,而這些正是人工智慧最有實際意義的部分。

如今的 AI除了在對話方面,更多是需要在聽、看和感受等方面都需要升級最佳化,去滿足一些更實用的日常需求。

比如智慧家居,無人駕駛汽車等,是需要將人從繁瑣複雜的工作中解放出來,而不僅僅是痴迷於使人工智慧與人類更難以區分開來。

圖靈測試:人工智慧行業的“天花板”?

當人工智慧深度滲透到生活中的方方面面,我們更期待的是他可以高效率大批次的完成日常任務,聽懂我們的指令,幫助我們解決問題。

當我對它下達“開臥室的燈”這種指令的時候,我們希望它用行動來表明它的智慧,而非與我們完成一段“對口相聲”。

那麼,圖靈測試是真的必須要退出歷史舞臺嗎?

其實也不應該對他的影響全盤否定。實際上,圖靈測試只是人工智慧的一個充分條件,它本身並沒有試圖定義人工智慧的範疇。

一個好的人工智慧可以透過圖靈測試,但並不表示圖靈測試是人工智慧的全部。

隨著技術的不斷髮展,真正的人工智慧應該是能為人類承擔更多繁重、複雜、危險工作任務的人工智慧。