選單

計算機怎樣看“世界”?最常見的五種影象標註工具

計算機怎樣看“世界”?最常見的五種影象標註工具

在人工智慧和機器學習領域,資料為王,沒有資料就不可能有資料科學。對於AI開發人員和研究人員來說,要實現專案的宏偉目標,他們需要訪問海量高質量資料。

作為機器學習的一個主要領域——影象資料需要在計算機視覺中獲取大量已經標註的影象。想知道有關不同影象標註型別的資訊嗎?繼續看下去吧!

什麼是計算機視覺?

計算機視覺是機器學習和人工智慧開發的重要領域之一。簡單來說,計算機視覺旨在使計算機“看到”並以視覺的方式解釋所處世界。從自動駕駛汽車和無人機到醫療診斷技術和麵部識別軟體,計算機視覺的應用相當廣泛,而且發揮著變革性作用。

由於計算機視覺是為了開發機器模仿或超越人類視覺的功能,訓練這樣的模型需要大量標註影象。

計算機怎樣看“世界”?最常見的五種影象標註工具

什麼是影象標註?

影象標註是一個給影象新增標籤的過程。它可以為整個影象新增一個標籤,也可以分別為影象內每組畫素新增多個標籤。一個簡單例子是向人工標註器提供動物影象,讓其用正確的動物名稱標記每個影象。

當然,標記的方法依賴於專案所使用的影象標註型別。這些帶標註的影象有時被稱為地面實況資料,之後將饋入計算機視覺演算法中。透過訓練,模型可以對已標註的動物影象與未經標註的影象進行區分。

這個例子很簡單,當進一步細化到更復雜的計算機視覺領域,比如無人駕駛汽車,我們就需要更復雜的影象標註。

計算機怎樣看“世界”?最常見的五種影象標註工具

計算機怎樣看“世界”?最常見的五種影象標註工具

最常見的影象標註型別有哪些?

想知道哪類影象標註最適合你的專案?下面是五種常見的影象標註型別以及它們的相關應用。

1。 邊界框

邊界框標註,是指給人工標註器提供一幅影象,讓其在影象內特定物件周圍繪製一個框。該方框應儘可能靠近特定物件的每個邊緣。這項工作通常是在不同公司的自定義平臺上完成。如果你的專案有特殊需求,一些公司可以調整其現有的平臺來滿足此種需求。

邊界框的一個具體應用是針對無人駕駛汽車的研發。標註器需要在交通影象中識別車輛、行人和騎車者這類實體,並在其周圍繪製邊界框。

開發人員透過向機器學習模型提供帶有邊界框標註的影象,幫助無人駕駛車輛實時區分這些實體並避免與它們接觸。

2。3D長方體

與邊界框類似,3D長方體標註是在圖中物件周圍用標註器繪製一個框。與只描繪長和寬的2D邊界框不同,3D長方體標註了物件的長、寬和近似深度。

使用3D長方體標註,人工標註器會繪製一個框把感興趣的物件封起來,並將錨點放置在物件的每個邊緣。如果物件的一個邊緣不在檢視中或被影象中的另一個物件擋住,那麼標註器就會根據物件的大小和高度以及影象的角度來估算其邊緣所在的位置。

3。 多邊形

計算機怎樣看“世界”?最常見的五種影象標註工具

有時影象中的物件不能很好地匹配上邊界框或3D長方體,有時開發人員希望對影象中的物件進行更精確的標註,例如交通影象中的汽車或航拍影象中的地標和建築物。在這些情況下,開發人員可能會選擇多邊形標註。

使用多邊形進行標註時,標註器會透過在需要標註的物件的外邊緣放置多個點來繪製成線,這個過程就像是一個連點成線的練習。然後,使用一組預定的類別,即汽車、腳踏車、卡車,來標註由點所包圍的區域內的空間。當分配多個類進行標註時,稱其為多類標註。

4。 線和樣條線

雖然線和樣條線適用於多種用途,但它們主要用於訓練機器識別車道和邊界。顧名思義,標註器將簡單地沿著你需要機器學習的邊界畫線。

線和樣條線標註可以用來訓練倉庫機器人準確地將箱子排成一排,或將物品放在傳送帶上。該標註最常見的應用是在無人駕駛汽車領域,透過標註車行道和人行道,可以訓練自動駕駛車輛理解邊界,並保持在一條車道上而不轉向。

5。 語義分割

計算機怎樣看“世界”?最常見的五種影象標註工具

上述示例著眼於繪製物件外部邊緣或邊界輪廓,而語義分割更為精確、具體。語義分割是用一個標籤將整個影象中的每個畫素關聯起來的過程。對於需要進行語義分割的專案,通常會為人工標註器提供一個預設標籤列表,讓其從中選擇,標註器必須用這些標籤標記頁面中的所有內容。

語義分割使用的是和多邊形註釋類似的平臺,讓標註器在需要標記的一組畫素周圍繪製線條。這也可以透過AI輔助平臺來完成,例如,可粗略估計汽車邊界的程式,但程式可能會出錯,在分割中包含了汽車下方的陰影。

在此情況下,人工標註器將使用一個單獨的工具來剔除不屬於分割中的畫素。例如,利用自動駕駛車輛的訓練資料,標註器可能會得到類似“請按道路、建築物、騎腳踏車的人、行人、障礙物、樹木、人行道和車輛對影象中的一切東西進行分割”的指令。

語義分割的另一個常見應用是醫學成像裝置。針對提供過來的患者照片,標註器將從解剖學角度對不同的身體部位標記。語義分割還可以用於一些難度較大的特別任務,如在CT掃描影象中標記腦部病變。

這就是機器學習和AI開發中最常用的五種影象標註型別,你可以根據具體的專案需要選擇不同的方法。

瓜分6666元現金紅包!領取8%+理財券,每日限額3000份!