選單

2020年AI發展盤點 - 那些我們新的收穫和感悟

a16z 成立於初代 iPhone 釋出的兩年後,在移動網際網路的浪潮中,這家風險投資機構憑藉著 Instagram、Twitter 和 Skype 等成功投資案例迅速躋身矽谷最成功 VC 之列。近幾年來 a16z 戰績顯赫,助推多家獨角獸成功上市,而且這些獨角獸公司多為在大眾視野內知名度頗高的網際網路企業,僅已經或計劃在今年上市的就包括 Airbnb、Lyft、Pinterest、Slack 等。

回顧2020年和2021年,a16z公司總結了AI的最新故事,也包括一些實踐中的突破

建立AI業務

就像資料庫在1980年代成為軟體的核心部分一樣,我們進入了“ AI/ML內嵌”軟體的新時代。那麼,當內部包含AI/ML時,業務模型將是什麼樣子,經濟原理(以及我們衡量現有軟體業務的方式)是否適用?

2020年AI發展盤點 - 那些我們新的收穫和感悟

AI的新業務(以及與傳統軟體的區別)

主要內容

:人工智慧代表了一種全新的業務,其利潤率可能低於傳統軟體業務。更不用說邊緣案例的長尾問題,這使得擴充套件這些業務具有挑戰性。使用AI/ML構建軟體的企業有著光明的前景,但成功的開始在於瞭解構建AI業務與傳統軟體有何不同(並相應地管理對其他軟體的期望)。

關鍵問題

:基於資料模型的AI業務與基於程式碼的軟體在本質上有所不同嗎?還是隨著市場的成熟以及GTM手冊和工具的發展,人工智慧業務會變得像軟體業務嗎?

馴服長尾問題:人工智慧經濟學歷險記

2020年AI發展盤點 - 那些我們新的收穫和感悟

主要內容

:人工智慧業務中邊緣案例的長尾問題與解決問題的複雜性以及解決該問題所需的工作量直接相關。但是,有一些方法可以將長尾問題視為一階問題。在“人工智慧的新業務”的後續活動中,我們採訪了數十個領先的AI/ML團隊,以總結來之不易的行業機密,因為它們“馴服了AI的長尾”。這些建議包括:a。選擇合適的問題進行研究,b。縮小和最佳化全域性長尾,c。解決區域性長尾的新興技術。

關鍵問題

:解決長尾問題的經濟性與雲計算成本直接相關,但是雲成本曲線如何變化?這對我們如何應對人工智慧業務中長期存在的情況意味著什麼?

遏制複雜性:AI / ML的未來

主要內容

:AI模型和資料是流動和複雜的-更像是形而上學,而不是典型的資料管理或工程學。Anaconda聯合創始人兼執行長Peter Wang認為:“There is no such thing as ‘data’, there’s just frozen models,”。a16z的合夥人馬丁·卡薩多(Martin Casado)觀察到,也許那些具有物理學背景的人可以更好地領會在自然世界中極其艱難的挑戰,由此或許可能獲得更多。但這不僅僅是哲學上的辯論!

關鍵問題:康韋定律如何適用於資料組織?現在,價值在軟體價值鏈中什麼位置?

長尾問題與自治市場

主要內容

:人工智慧業務存在“長尾問題”,因為它們可以模擬現實世界的複雜性。而且神經網路的本質使問題變得更加複雜,神經網路可以在一定範圍內做出準確的預測,但是同時會在範圍之外表現非常糟糕。構建AI系統成為協調大規模和廣泛的資料收集工作以對邊緣案例進行建模的問題。當前,資料收集的方法已經集中,自上而下並且由技術巨頭所主導……如果資料自下而上的收集會怎麼樣呢?

關鍵問題

:如果加密技術為分散式資料收集提供了機會,那麼這將如何給AI初創企業帶來優勢呢?

適用於AI / ML的工具

隨著AI / ML內置於更多軟體中,資料對於我們的軟體功能而言與程式碼同等重要。AI/ML工具現如今已經被大量的預裝在軟體當中。這些工具如何組合在一起,以及它們如何發展?

運營ML / AI的新興藍圖

主要內容

:由於在生產中可靠執行AI / ML的工具的數量爆炸式增長,高階資料科學已為更多”玩家“所用。例如,Uber乘車定價時。越來越多的開源庫和方法論也使相應的工具包更加成熟,並降低了准入門檻。

關鍵問題

:基於傳統技術的現有使用者將如何適應這種巨大的變化?

2020年AI發展盤點 - 那些我們新的收穫和感悟

資料體系結構的演變和重大資料討論

2020年AI發展盤點 - 那些我們新的收穫和感悟

主要內容

:僅僅資料並沒有價值,它需要一套工具和系統來收集,處理,儲存和分析。傳統上說,資料工具是在兩個獨立但並行的生態系統中構建的—資料湖來處理AI/ML,而資料倉庫為分析和BI提供了基礎。但是,資料湖和資料倉庫的技術能力正在融合,從而為資料基礎架構啟用了新的設計模式(例如,資料倉庫),其中單個集中儲存點可以處理傳統的分析工作負載和操作ML / AI。

關鍵問題

:執行AI / ML和分析的單獨工具(和團隊)是否正在朝著融合的方向發展?

新聞中的AI

極限能力的GPT-3

2020年AI發展盤點 - 那些我們新的收穫和感悟

發生了什麼

:今年在一篇論文中宣佈了

GPT-3

,這是一種經過預先訓練的機器學習模型,該模型經過最佳化以執行各種自然語言處理任務。7月,OpenAI(GPT-3背後的研發公司)釋出了對其API的有限的私有訪問權,其中包括GPT-3以及其他模型背後的一些技術成就。不久之後,出現了許多大型語言模型可能實現的示例和演示。9月,OpenAI將GPT-3技術許可給了Microsoft。

為何重要

:GPT-3允許使用它的人去減少部分進行資料處理和建立AI業務的部分(經濟成本。這使得自然語言處理(NLP)成為AI研發最有前途的領域之一。A16z的運營合作伙伴Frank Chen認為,NLP遵循的是一種過時的計算機科學方法:基礎的資料/演算法模型突破帶來了創新,但是這些突破需要幾年的時間才能傳播到各地。

關鍵問題

:GPT-3對初創企業,老牌企業以及“AI即服務”的未來有何影響?

規範人工智慧

2020年AI發展盤點 - 那些我們新的收穫和感悟

發生了什麼

:白宮管理和預算辦公室(OMB)和科學技術政策辦公室(OSTP)釋出了一項備忘錄草案,其中包含10條關於“人工智慧應用程式的管理”的原則。

重要性

:美國是人工智慧領域的領導者,但其他國家(尤其是中國)也在大力投資人工智慧。

關鍵問題

:人工智慧是新的創新太空競賽嗎,“規範”人工智慧到底意味著什麼?有多少的必要?

Nvidia + Arm合併

2020年AI發展盤點 - 那些我們新的收穫和感悟

發生了什麼

:英偉達宣佈有意收購Arm。Nvidia生產GPU;Arm憑藉針對低能耗和低成本進行了最佳化的架構,在數十億個裝置中製造了晶片系統。

重要性

:這代表了過去十年計算領域的三大技術趨勢的頂點:雲原生,移動優先和機器學習(cloud native, mobile first, and machine learning)。

關鍵問題

:如果價值一直在不斷上升,並且硬體,軟體,韌體,應用程式等之間的劃分在很長一段時間內都不穩定,那麼誰在主導這個遊戲?

聚焦:生物中的AI

對於生物技術中一些最重要的開放問題,人工智慧有廣闊的應用前景。例如,更好,更復雜的模型可以將不同的資料集結合在一起,以改善藥物發現和臨床試驗。新的機器學習技術有潛力改善我們的預測,建模和模擬,從細胞的工作方式到全球性大流行將如何發展;AI / ML甚至可以最終幫助我們繪製神經圖譜並逆向工程神經複雜性,以更好地瞭解阿爾茨海默氏病等疾病。那麼,今年的重大研究突破是什麼及其對生物和醫療保健的影響?

解決醫療保健中的Baumol成本病

鮑莫爾成本病(Baumol‘s cost disease)是美國經濟學家威廉·鮑莫爾所提出的一種現象,主要在說明一種部門的生產力相對落後於另一種部門的理由。他建立兩部門宏觀經濟增長模型,其中一個部門是進步部門,另外一個部門是停滯部門。進步部門的生產率相對快速增長將導致停滯部門出現相對成本的不斷上升。他認為很多服務部門都具有這一特徵,相對於製造業,服務業勞動生產率更難以提高,因而,隨著製造業的生產率改進,服務業在整個經濟中的比重反而上升。

2020年AI發展盤點 - 那些我們新的收穫和感悟

主要內容

:鮑莫爾的成本病可以解釋為什麼依靠專門勞動力的服務(例如醫療保健和教育)變得更昂貴,而襪子和電子產品等商品卻變得更便宜。而且與其他領域不同的是,軟體已經滲透到透過將服務轉變為商品來降低成本的領域,在醫療保健領域,這樣做的速度很慢。

關鍵問題

:人工智慧能否最終帶來巨大的成本節省,並讓人類工作人員專注於更高階的醫療服務?

AlphaFold!蛋白質摺疊

發生了什麼

:本月,Google DeepMind的AlphaFold系統在每兩年一次的挑戰中勝過了20個國家/地區的100個團隊,僅憑氨基酸序列就可以預測蛋白質的3-D結構。

2020年AI發展盤點 - 那些我們新的收穫和感悟

重要性

:蛋白質決定了所有生物併為所有生物提供動力,但是蛋白質可能存在的結構種類是一個天文數字,這使得其成為生物學的重大挑戰之一。AlphaFold其準確度可與實驗室實驗相媲美(甚至更快)。

關鍵問題

:這是否是生物界AI的高光時刻呢?實際上,AlphaFold是否會像GPT-3或TensorFlow?這對未來的藥物發現和其他應用意味著什麼?

使用ML尋找新抗生素

發生的事情

:訓練了一個深層神經網路來預測抗生素,並且在查看了十億種化合物後,發現了在已知抗生素中具有獨特結構的抗生素。

2020年AI發展盤點 - 那些我們新的收穫和感悟

為何重要

:這項研究表明,透過掃描大量潛在的候選物,然後將最有希望的樣本由科學家進行人工驗證,人工智慧可以真正有效地用於鉛化合物的鑑定。透過降低發現成本,它為初創企業和學術實驗室提供了一個更加經濟的方法。

關鍵問題

:在藥物發現和開發的其他地方,是否有可能將深度學習神經網路與人類專家驗證進行組合呢?

2021

to be continued。。。