選單

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

視覺進擊工業,從象牙塔到生產線的他們。

「原來計算機視覺也還沒有內捲到無可救藥的地步。藉助計算機圖形學與其他學科知識,計算機視覺的發展也有望取得進一步突破,更上一層樓。」

事實上,除了研究成果的創新,計算機視覺的商業落地也一直是產學研三界的熱門話題。長久以來,人們也一直對計算機視覺存在或多或少的誤解,其中一個最常見的問號是:除了人臉識別,這項技術還有什麼用?

在決策智慧的話術逐漸佔領傳播的高地後,感知智慧的聲音開始減弱。與此同時,隨著「AI寒冬」的輿論對深度學習的批判,基於神經網路的視覺研究在商業前景上也跟著被「唱衰」,一度成為槍口的正中點。

不過,決定創業的賈佳亞並不太在意這一點。2019年年底,從騰訊離職的他,在香港科技園創立思謀科技,宣佈進場,沒多久就完成了IDG資本領投的數千萬美元融資。今年6月,思謀科技又獲得2億美元的B輪融資,人員規模也在一年內從最初的個位數擴充套件到超過600人。

計算機視覺領域頂尖專家、IEEE Fellow、香港中文大學終身教授等頭銜,無疑為之加持,但無論是賈佳亞本人,亦或外界,都認為思謀能在AI落地的急流中「站穩腳跟」,除了深厚的技術積累,也離不開正確的賽道:工業製造。

沈小勇是最早跟隨賈佳亞創業的學生之一。他對AI科技評論表示:「我認為思謀科技不是一家AI公司,而是一家『工業製造+AI』的公司」。換言之,思謀科技的模式不是「AI+」,而是「X+AI」,其中的「X」,就是行業。

比如,他們發現,在他們與國際頭部光學廠商合作的鏡片隱形二維碼識別專案中,最大的「助攻技能」竟然不是超強的演算法,而是光學系統的設計。這個在計算機視覺領域有多年積累的創業團隊,也不得不面臨的「心理落差」是:要取得客戶的信任,除了演算法能力,還要打好行業根基。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

1

入場

公元二零二零年十二月,廣州黃埔區北邊知識城內的一家廠房內,經過一番激烈的比拼、與數位頂尖同行切磋較量後,思謀科技戰略客戶經理劉浩然走出思緒紛飛的房間,心滿意足地吸了一口南方的冷空氣。

在這場方案的提交之戰中,他所代表的思謀科技PK掉了其他同臺競爭的廠商,取得這家有著超過175 年曆史的全球頂尖光學廠商(以下暫且起代號為「Z」)的信任,拿到了思謀創業一年後在精密光學領域的第一份合同。

這也意味著,在接下來的4-5個月內,思謀科技要研發出光學領域第一臺由人工智慧初創企業開發的鏡片隱形二維碼識別裝置。

在此之前,思謀多是將計算機視覺用於3C消費電子產品的零部件瑕疵檢測。但對於一個從創業之初就渴望成為「中國IBM」的團隊來說,思謀還想挑戰更高難度的落地。所以,能夠拿下這家500強巨頭的訂單,對思謀來說,確有幾分里程碑式的意義。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

劉浩然不惜口舌之戰拿下的光學專案,是思謀科技毅然入場「工業製造」的一個縮影。

思謀科技的創始人賈佳亞是計算機視覺領域的知名學者,谷歌學術被引數超過36000次,曾培養出多位人工智慧領域新秀,包括商湯科技的聯合創始人兼CEO徐立。在進入工業界之前,他所創立的視覺實驗室便已在影象濾波、影象稀疏處理、多頻段影象訊號的融合以及增強和逆向視覺問題解法等方面有了深厚的技術積累。

因其在計算機影象去模糊技術方向做出的貢獻,他在2018年當選了IEEE Fellow。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

在創立思謀科技前,賈佳亞的第一段工業界之旅是在騰訊優圖實驗室(X-Lab)。

2017年5月加入騰訊時,賈佳亞帶了兩位想跟自己到外面「闖一闖」的學生,沈小勇就是其中之一。那時,沈小勇剛畢業沒多久,對研究落地也很感興趣,於是就跟著導師加入了X-Lab擔任研發負責人,並迅速成長為當時騰訊最年輕的T4科學家之一。後來,2019年,賈佳亞決定離開騰訊、創立思謀,沒多久,沈小勇也跟著離開,成為了思謀科技的聯合創始人兼CEO。

據沈小勇介紹,他們在騰訊時就已經有過將計算機視覺在工業生產上落地的探索:TCL旗下液晶面板生產子公司華星光電的面板缺陷檢測。

華星光電的液晶面板生產涉及上百道工序,生產過程中可能出現的面板缺陷種類多達120種,賈佳亞帶領團隊設計出人工智慧質檢裝置搭載在生產產線上,可以在5秒內識別出面板缺陷,產線所需的質檢人員只需原先的50%。

正是有感於計算機視覺在工業生產最佳化上的神奇作用,賈佳亞在啟動思謀科技時,就確定了接下來的賽道:工業製造。

從18世紀60年代開始,工業革命對人類歷史的程序產生了重要影響。如許多前沿學者一樣,賈佳亞也相信,人類歷史的當下正處於「工業4。0」時代:

「工業1。0」是機械製造,即透過引入機械裝置實現工廠機械化的製造時代。上世紀40年代進入「工業2。0」,電氣與自動化時代開創了產品批次生產的高效模式。70年代開始並持續至今的資訊化則是「工業3。0」,透過數字化的技術將資訊儲存起來,方便工廠的決策者管理。而如今的「工業4。0」時代,是智慧製造時代,對生產力提出了更高的要求,背後的動力極有可能是如今蓬勃發展的人工智慧技術。

前三次工業革命,中國都沒趕上。18世紀,中國處於閉關鎖國的封建時期;上世紀 40年代,中國處於動盪之中;70年代,中國則剛剛起步發展。

因此,對當下的中國來說,國泰民安,人才培養增多,資源豐富,抓住「工業4.0」的智慧製造時代機遇至關重要。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

智慧製造的核心在於「智慧」:智慧並不是簡單的自動化,而是讓製造擁有「大腦」和讓大腦決策的各種「神經系統」。

沈小勇介紹,本質上,計算機視覺要解決的是「看得清」與「看得懂」的問題,也就是看完後還要進行分析,對應人的眼睛與大腦。只有擁有敏銳的「眼睛」與聰明的「大腦」,才能最大化發揮自動化「手臂」的作用,而AI正是讓製造擁有會思考的機器裝置的核心所在。

思謀的創始團隊相信,新一代AI將貫穿於設計、生產、管理、服務等生產活動的全鏈條,使製造具備自感知、自學習、自決策、自執行、自適應等功能的新型生產方式。在2015年提出的「中國製造2025」計劃中,工業計算機視覺應用佔了重要位置。

從人臉識別到工業智造,計算機視覺的落地目前已跨越了半導體、汽車、航空、新能源、精度光學等行業,如鏡片分揀、軸承檢測、特種條碼設計與識別、偏光彎膜、模具檢測、AVI檢測等。以晶片檢測為例,基於深度學習的計算機視覺演算法就有可以完成億級晶體結構的全自動聚類分析:檢出率超過99。99%、單流程處理效率提高96%、AI自動化全檢處理效率提升90%。

傳統制造業在國家經濟中的佔比,就是智慧製造未來的市場容量。據國家統計局資料顯示,2019年、2020年,中國工業增加值的規模均超過了31萬億。工業領域1-2%的效率提升就意味著數千億級的經濟增值。

在此背景下,自然不止思謀科技這一家AI出身的團隊盯上「工業製造」與「數字轉型」的賽道。

但在瞭解計算機視覺賦能工業製造的雄心前,我們無法逃避面對的一個事實是:

無論是「工業」,亦或「工廠」,都是一個極其龐大的存在。這也意味著,計算機視覺演算法只是繁雜工藝中的一環,

要嵌入完整的生產線上,必然會遇到與其他環節合作的挑戰、甚至與工業本身的相互磨合。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

2

樂起

仔細說來,這並不是一個多麼跌宕起伏的故事。

簡單來說,在與Z的合作中,思謀科技要做的事情,就是設計一臺能夠智慧定位識別及讀取不同度數的鏡片上的隱形二維碼裝置(Enigma Reading Machine),安裝在Z的產線上,方便Z在生產的全過程中把控鏡片的質量,實現防偽功能。

我們可以將這個二維碼理解為「普通」的二維碼,只不過它由0。125毫米點陣組成,載體是一個個曲面鏡片毛胚(我們日常戴的近視眼鏡鏡片原材料),並且是「隱形」的。

這個裝置的工作步驟也很簡單,只有兩步:一,對整個鏡片進行完整拍攝;二,在1-2秒內成功讀取鏡片上的隱形二維碼,並自動將資料上傳到Z的內部質檢系統中。

但、就是這麼看似簡單的兩個步驟,卻難倒了這家頭部光學廠商的幾乎所有供應商。在Z丟擲這個問題時,也曾有許多工業視覺或AI整體解決方案的公司嘗試迎接挑戰,但都以失敗告終。

識別鏡片中隱形二維碼的難度極高,難點主要體現在三個方面:

(一)

只有從特定的角度往鏡片上打光,隱形二維碼才有可能顯現。

而為什麼只是「有可能」呢?因為Z使用了先進的鍍膜工藝對鏡片表面做了高透設計,即使從完全相同的角度打光,隱形二維碼的讀取也可能失敗。換言之,讀位元速率的穩定性極低。

(二)

鏡片的度數、厚度與品類(如近視眼鏡與墨鏡)不一,造成光線的反射率也不一樣,因此隱形二維碼的嵌入方式與位置也會有所差異。

(三)

鏡片的材質是透明玻璃,會反光。

即使是沒有任何折射角度的無度數鏡片,機器也不一定能在透明的介質上自動識別到隱形二維碼。更嚴峻的現實是,鏡片分為凹透鏡與凸透鏡,度數不一,光線折射的角度也不一。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

思謀科技的解決方案架構師周工介紹,識別隱形二維碼的技術難度絕對處於金字塔的頂尖級別:

「就打光來說,它就已經完全顛覆了傳統的視覺打光方式。傳統的打光方式是被測物體與打光鏡頭基本成一個相對位置,比如被測物垂直於光源,直接受光。而在隱形二維碼的識別技術中,被測物的點陣二維碼的呈現是透過思謀自研光源發出光束穿過鏡片直接照射到膜材、然後反射回直徑小於0。125毫米的一群小光束的原理。」

借用賈佳亞對半導體產品缺陷檢測難度的表述,要在曲面型別多樣的玻璃鏡片上準確識別直徑只有0。125毫米的隱形二維碼,難度絕對比「在整個廣東省內,一秒鐘內定位出一個有輕微故障的紅綠燈」還要高!

這不僅要求研發團隊具備演算法能力,他們還要精通光學原理與膜材設計。

換作普通的光學廠商,一遇到這麼棘手的問題,可能早就擺手不幹、尋找其他價效比更快的替代方案了。但Z這樣歷史悠久、實力雄厚的企業不同,他們作為標杆,凡事追求「最好」,畢竟具備足夠的技術創新條件。而不斷追求技術實力甩對手幾條街的理念,也正是他們能夠佇立國際市場多年而不倒的根源所在。

所以,即使難度重重,Z也不惜克服萬難,尋找可以定位並識別隱形二維碼這一「小滑頭」的方法。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

此前,Z識別隱形二維碼的方法主要有兩種:

第一種是「源頭管控」,開模時就預先在模具上刻出隱形二維碼,在鏡片成型時將二維碼一同印在鏡片上,然後透過模具的編號進行鏡片追溯。這種方法的短板是隻能在源頭管控。

隱形二維碼就相當於一個鏡片的「身份證」,每完成一道生產工序就要進行一次識別,以證明該二維碼「順利」地走完了所有工序。因此,如果只是在源頭管控,就相當於只監測到了最開始的開模工序,無法透過在全產線中追蹤該二維碼、以把控每一個生產環節的質量。

第二種方法是高價購入一臺德國隱形碼識別裝置。但很遺憾,這是一臺單體裝置,只能人工手動檢測,識別的速度慢,價格也十分高昂。此外,由於裝置從德國進口,受智慧財產權的保護,Z只能購買標準的模組,無法整合其他裝置,也就是無法配合他們的產線進行定製化設計。

3

副歌

當時,作為一家剛成立不到一年的「小廠」,思謀科技選擇挑戰Z的這個專案,更多是想要抓住一個重要的「成長機會」。

他們的目標陣地是工業產品的外觀檢測,如果能成功突破鏡片隱形二維碼識別的技術,那麼對他們進軍精密光學領域自然大有幫助。

所以,在剛接到任務時,他們也是心情澎湃,擼起袖子就準備大幹一場。

但理想很豐滿,現實很骨感。很快他們就發現:事情沒有那麼簡單。

雖是「識別」,但他們要攻克的技術卻不只是機器的「眼睛」,還有目標識別物背後的光學原理。而且,後者才是他們要面對的「大boss」。

所幸,思謀有先見之明,在剛成立時就為進軍工業賽道籌備了兩大團隊。

在工業產品缺陷檢測中,核心技術有兩個:一是視覺演算法,二是光學成像。

所以,除了賈佳亞、沈小勇帶領的CV能人,思謀在一開始就成立了一個光學實驗室,並招募了一批經驗老道的光學系統研發人才。

機器要識別的隱形二維碼大小為2mm*2mm,其中,每一個小方塊(即「點陣」)的直徑則是0。125mm。

從光學的原理來看,在打光時,鏡片的膜材料必須將光源分解為一束束直徑比125μm還小的光束,隱形二維碼才能顯現出來。

這是因為光束透過微小間隙後的傳播不一定是線性的,如果同時透過兩個小孔,就會產生衍射條紋。而衍射條紋並不是固定的,就會導致檢測失敗。

此外,鏡片是一種三層結構,即「空氣-膜-玻璃」。光的入射角、膜的厚度與折射率等等都會影響光的傳播,某些角度下甚至可能在膜裡產生全反射,導致隱形的二維碼無法被檢測。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

也就是說,思謀要用計算機視覺演算法成功識別鏡片上的隱形二維碼,最大的難題其實是找到一種高透光度、高光潔度、耐高溫、滿足高精度陶瓷刀具加工強度的特殊膜材料,並且能夠相容不同曲率、不同折射率的鏡片,使光束能從不同的方向平行射出。

在4個月的專案期裡,除了開發演算法與製造裝置,他們花費了超過一半的時間與精力在尋找適合「機器識別」的膜材料上。

為了弄明白如何使隱形二維碼的成像更清晰,他們推理膜材料的加工原理,買來了各種原材料進行驗證。周工對AI科技評論回憶:

「我們做了不下100次的實驗!單單光學原理驗證,就花了3個月。」

功夫不負有心人。最終,他們選擇了多面體微鑽石結構的光源反射膜,但所需的膜材料十分特殊,市場上沒有,所以他們需要自己研發設計。

「這一環消耗的時間最多,因為加工的膜材料要求奈米級的精度,刀具要從日本定製。」

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

在這個過程中,他們頻繁地與國內外的光學廠商、高校研究團隊交流,「最常交流的是原材料廠商,因為他們會知道膜材在什麼溫度下的加工效果最好,透射率與折射率如何達標等等。」周工談道。

經過100多次的膜材開發與反光測試,就像在上課鈴響的1秒鐘衝入教室一樣,今年4月,他們終於在約定交付日期的前兩天解決了膜材料問題,並完成生產加工。交付時,Z所提供的44片100-700度的鏡片樣品全部掃碼成功,令Z的代表十分驚喜。

最後,思謀科技自研的膜材料可以做到:

無論鏡片是凹是凸、度數多少,機器都可以將鏡片上的隱形二維碼完整識別出來。

度數越低,識別的速度越快,500度以下的鏡片甚至可以在50毫秒內識別出來。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

縱觀計算機視覺在工業上的落地,他們的此次探索對於透明介質產品的缺陷檢測具有劃時代的意義。除了玻璃鏡片,他們的方案也可以拓展至面板類產品的裂痕檢測與缺陷檢測中,比如車燈透鏡與手機攝像頭的瑕疵檢測。

但很顯然,從上述的故事中,我們看到的似乎更多是沉悶的、陌生的光學難題,而不是AI的「大力出奇跡」。

一位精密光學領域的行家告訴AI科技評論,在工業生產中,材料、方法與環境往往佔主導位置,基於神經網路的視覺演算法只是眾多方法中的一個組成部分,甚至在大多數情況下,「不一定需要多複雜的演算法,而是更多地受到其他現實因素的影響。」

因此,AI在工業上的落地,更偏向於高速視覺識別或精密視覺識別的範疇。計算機視覺團隊要想取得突破,難點也自然更多地落在了「成像」與「控制」,而不完全是「演算法」。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

4

尾聲

一個有趣的視角可能是:在AI、甚至任何一項技術的落地中,任何強大的科學家都

不再是「科學家」,而是「技術供應商」

。最終,決定科學家創立的公司是否能在市場競爭中存活的,也許不是學術積累的深度,而是技術落地的實力。

計算機視覺在精密製造中的落地,是一個科學/工程探索過程,不僅需要先進的深度學習演算法,還要深諳光學原理與材料工藝,掌握多學科、懂機理、能實現的技術。

沈小勇談道:「別人問我科學家創業的問題與挑戰時,我回答比較多的是,最難的是

在將商業價值最大化的情況下形成技術到產品、再到市場的閉環

。」

此外,技術的落地,也許無法避免採取

「以點帶面」

的策略。對於大多數工業製造廠商來說,他們對AI技術並不精通,在傳播深度學習視覺演算法的優勢時,往往要先透過一個專案合作來呈現、滲透,然後再去展示人工智慧在工業製造與數字轉型上的力量。

想征服精密工業製造的AI團隊,差點被一個隱形二維碼攔住

這個專案完成後,他們繼續與Z開展了其他合作,讓計算機視覺與其他機器學習方法在精密光學領域有了更多的應用。除了鏡片隱形二維碼的識別,Z又向思謀提出了更多生產線上的需求,包括難度極高的AR鍍膜工藝大資料分析。

而與Z的合作,也讓思謀有一個深刻的體會:「只有創新,才可以創造價值。」

對於一個精通深度學習的視覺演算法團隊來說,所謂的「創新」,大約就是不斷挑戰演算法與行業結合的技術邊界,掌握更多演算法以外的工業製造知識,從而實現「X+AI」的藍圖。

而這,也是AI落地的時代所趨。

版權申明:凡本公眾號內容註明【原創】的,內容版權歸本作者所有,未標註【原創】的圖片與文字內容均轉載自網路,版權歸原創者所有,圖片和文字如有侵權煩請告知我們,我們會立即刪除。謝謝!