圖靈測試：人工智慧行業的“天花板”？

在這個充斥著人工智慧、大資料技術的時代，我們每個人似乎都沒有秘密可言。

也許你隨口說一句“我想吃日式料理”，接著各種APP就會帶著日式料理資訊對你進行輪番轟炸。

人工智慧、大資料讓這個世界更瞭解你，同時也讓你無處遁形。

在大環境下，越來越多的人開始關注人工智慧，他們愈發想知道什麼才是智慧，怎樣定義智慧。

而說起這個話題那便繞不開一個人——艾倫·麥席森·圖靈，他被稱為人工智慧之父。

在1950 年，他發明了一個迄今為止仍被稱為人工智慧終極測試的思想實驗——模仿遊戲，也就是廣為人知的“圖靈測試”。

“圖靈測試”的目的是用來測試機器是否具備人類智慧，檢測所謂人工智慧的智慧化程度，它是否可以達到人類水平。

圖靈測試是測試人在與被測試者（一個人和一臺機器）隔開的情況下向被測試者隨意提問。

問過問題後，如果被測試者超過30%的答覆不能使測試人確認出哪個是人、哪個是機器的回答，那麼這臺機器就通過了測試，並被認為具有人類智慧。

測試採用的是問答形式，讓測試人依據回答來進行判定，這種評判方法非常的直觀。

如果在測試中，對話是這樣的：

測試者：你會唱歌嗎？

被測試者：是的。

測試者：你會唱歌嗎？

被測試者：是的。

測試者：再問一遍你會唱歌嗎？

被測試者：是的。

這個時候，你基本可以判斷這是一臺機器，但現實往往並非如此，當對話變成了這樣：

測試者：你瞭解莎士比亞麼？

被測試者：一點點。

測試者：那聊聊唄。

被測試者：莎士比亞是英國最傑出的戲劇家，代表作有《奧賽羅》、《哈姆雷特》、《李爾王》和《麥克白》……

根據回答你可能會覺得對方是機器，人類不可能記得這麼清楚，可實際上對方是一名學藝術史的學生。

也就是說，在測試中往往會遇到預想不到的結果，同時，每個人對智慧的概念有著不一樣的標準，測試卻是由人主觀評定，而非客觀的“量化評定”。

這意味著可能在這一批的測試人中絕大多數認為他是人類，換了另一批測試者後結果卻截然相反。

在今天，仍然有一部分人將圖靈測試看作人工智慧行業的“天花板”，覺得透過圖靈測試的機器才是真正的人工智慧。

但圖靈測試有很大的弊端，因為有時候機器是需要透過欺騙或假裝無知來透過測試的。

舉一個例子，如果機器要想透過圖靈測試，就必須在回答 “你知道5824892478乘以65475217是多少嗎？” 這種問題時，加入停頓語氣。

即便機器因強大的計算能力早就知道了答案，但為了模仿人類，它必須停頓陷入思索，但顯然在應用中這不是對它技能的最大化利用。

從本質上來看圖靈測試是想讓機器在最大程度上模仿人類，而非讓機器變得更智慧。

另外，圖靈測試也僅限於文字交流，它幾乎全盤否定了人工智慧快速計算和資訊查詢的功能，而這些正是人工智慧最有實際意義的部分。

如今的 AI除了在對話方面，更多是需要在聽、看和感受等方面都需要升級最佳化，去滿足一些更實用的日常需求。

比如智慧家居，無人駕駛汽車等，是需要將人從繁瑣複雜的工作中解放出來，而不僅僅是痴迷於使人工智慧與人類更難以區分開來。

當人工智慧深度滲透到生活中的方方面面，我們更期待的是他可以高效率大批次的完成日常任務，聽懂我們的指令，幫助我們解決問題。

當我對它下達“開臥室的燈”這種指令的時候，我們希望它用行動來表明它的智慧，而非與我們完成一段“對口相聲”。

那麼，圖靈測試是真的必須要退出歷史舞臺嗎？

其實也不應該對他的影響全盤否定。實際上，圖靈測試只是人工智慧的一個充分條件，它本身並沒有試圖定義人工智慧的範疇。

一個好的人工智慧可以透過圖靈測試，但並不表示圖靈測試是人工智慧的全部。

隨著技術的不斷髮展，真正的人工智慧應該是能為人類承擔更多繁重、複雜、危險工作任務的人工智慧。

猜你喜歡