圖像分割這個基本的問題都有哪些演算法?
圖像分割,顧名思義就是將圖像劃分成若干個具有獨特性質的區域。比如醫學圖像處理中,將病變的部位與其他部位相分割開來。圖像分割是由圖像處理到圖像分析的關鍵步驟,能夠幫助我們進一步的理解圖像。
目前,隨著深度學習的發展,圖像分割就被劃分成傳統方法和深度學習方法。
傳統的圖像分割方法主要是提取圖像的局部或底層特徵如紋理、顏色、直方圖的分布等等,進行圖像的劃分。這些方法有:閾值分割、區域生長法、聚類、分水嶺等等。這些方法本質上都屬於無監督的方法,演算法本身並了解每個區域所代表的含義。此外往往只能進行二類物體分割,如將目標物體和背景分割開來。
而基於深度卷積神經網路的語義分割(semantic segmentation),現如今大放異彩。語義分割就是基於一個語義單元,例如將人、車、樹等目標從圖像中分割出來。藉助於深度神經網路的強大的擬合能力,直接輸入待分割圖片到神經網路中,得到的分割結果同已經標記好的分割圖進行比較,再不斷更新網路的參數,最終收斂到同目標分割相一致。2015年提出的FCN方法是語義分割的開山之作,將圖像級別的語義分類擴展到像素級別的分類。
此外如今還發展出了實例分割(instance segmentation),就是在語義分割的基礎上進行更加細粒度的分割。可以對同一類中的不同物體進行劃分,還可以清楚的指導分割出來的左邊和右邊的兩個人是不是同一個人。(下圖展示了圖像分類、目標檢測、語義分割、實例分割之間的區別)
圖像語義分割的應用十分廣泛,可以作為實現圖像語義理解的預處理步驟,比如看圖說話等等。此外在自動駕駛領域,通過攝像頭拍攝的實時圖像來探測周邊的有哪些物體。
推薦閱讀:
※【動態】重磅來襲!WinSafe新版官網正式上線
※WebNutrients的 NooStax NZT-48 有效果嗎?副作用又有哪些?
※極鏈科技Video++將亮相2018世界人工智慧大會
※linux sudo 與 /etc/sudoer的配置