參加 CVPR 2018 機器學習圖像壓縮挑戰賽

圖像壓縮對數字攝影至關重要,如果沒有壓縮技術,一個 1200 萬像素的圖像將佔用 36 MB 的存儲空間,這會讓大多數的網頁內容變得非常大。儘管現階段的信號處理社區已通過更先進的圖像編解碼器(例如 BPG 和 WebP)大大改進了圖像壓縮,使之不再局限於 JPEG(20 世紀 80 年代引入),但這些現代編解碼器中利用的許多技術,仍是在通過與 JPEG 中相同的像素來進行變換。近期的多個 Google 項目利用依託機器學習的端到端技術、超解析度壓縮和創建感知改進 JPEG 圖像等方式改進了圖像壓縮領域,而我們相信,通過推出這項研究挑戰賽,來吸引更廣大機器學習社區的關注,可以讓圖像壓縮技術得到更大幅度的提升。

為了促進圖像壓縮領域的進步,Google 將聯合 ETH 和 Twitter,在即將舉行的 2018 計算機視覺與模式識別大會 (CVPR 2018) 上贊助研討會和機器學習圖像壓縮挑戰賽 (CLIC)。在研討會上,傳統圖像壓縮領域的知名貢獻者和基於機器學習的新興圖像壓縮系統領域的早期貢獻者將匯聚一堂。受邀演講嘉賓包括圖像與視頻壓縮專家 Jim Bankoski (Google) 和 Jens Ohm(亞琛工業大學),以及具有視頻與圖像壓縮經驗的計算機視覺與機器學習專家 Oren Rippel (WaveOne) 和 Ramin Zabih(Google,正在康奈爾大學休學術假)。

來自移動和專業數據集的 1,633 個未壓縮圖像的訓練集,可以在 compression.cc 上找到

我們將為此次挑戰賽提供無版許可權制的高質量圖像數據集 P(「專業」)和數據集 M(「移動」),這可以為加快這一領域的研究速度清除一些阻礙。採集的數據集包含成千上萬個圖像,包含了各個行業常用的圖像。挑戰賽允許參與者利用任意的數據集或者其它的模型來訓練神經網路(我們希望參與者可以採用更多的訓練數據,例如 ImageNet 和 Open Images Dataset),當然也可以在我們直接提供的數據集上訓練。


使用神經網路的首批大圖像壓縮系統於 2016 年發布 [Toderici2016、Ballé2016],不過只能達到與 JPEG 相當的性能。更新的系統取得了快速發展,它們可以達到或超過現代行業標準圖像壓縮的性能 [Ballé2017、Theis2017、Agustsson2017、Santurkar2017和 Rippel2017]。然而,基於神經網路的壓縮圖像技術的快速發展僅僅出自與寥寥數個的研究實驗室的工作成果,如果更廣大的機器學習社區能積极參与進來,相信在未來我們可以看到更加強力的壓縮壓縮技術。

我們希望各位能參與推動這個重要應用領域的發展,並鼓勵各位參加今年的 CVPR。詳情請訪問 compression.cc,可以詳細了解新數據集和重要的專題講座時間。訓練數據已經在這個網站上發布。測試集將於 2 月 15 日發布,提交壓縮版測試集的截止日期為 2 月 22 日。


▏ 文章作者:Google Research 研究員 Michele Covell

▏ 原文發布時間:2018 年 1 月 21 日

▏ 原始鏈接:A Summary of the First Conference on Robot Learning

▏ 中文博客鏈接:推出 CVPR 2018 學習圖像壓縮挑戰賽


推薦閱讀:

看到了CVPR 2018 accepted paper list,大家有什麼想說的?
多風格生成網路——實時風格轉換
首發——Large Margin Object Tracking with Circulant Feature Maps
從CVPR2017 看多樣目標檢測

TAG:CVPR | 機器學習 | 圖片壓縮 |