深度報告 | AI 新職位 「人工智慧訓練師」

深度報告 | AI 新職位 「人工智慧訓練師」

5 人贊了文章

前言:本文作者 @朱明德 正在轉型 AI 產品經理,是我們 「AI 產品經理大本營」 的成員;本文指導顧問黃釗 hanniman 圖靈機器人 - 人才戰略官,前騰訊產品經理。

研究背景

有人說,「人工智慧訓練師」 是 AI 給人類帶來的第一個非技術類 「新職位」,這也許能讓大家對 AI 多一些客觀認知、甚至是好感;不過這個新職位,AI 領域從業者的認知度還不高——

AI 公司為什麼要設立這樣一個職位

職責邊界是什麼

什麼樣的人適合

職位發展前景如何

等等問題,都還是業內空白,為此我將在正文中為大家一一揭曉。

核心結論

1、人工智慧訓練師的定義:通過分析產品需求和相關數據,完成數據標註規則的制定,最終實現 「提高數據標註工作的質量和效率」 以及 「積累細分領域通用數據」 的價值。

2、人工智慧訓練師的行業認知度:開始得到杭州、北京等城市 2 年以上 AI 公司的重視,考慮到人工智慧訓練師的人才缺口 5 年後將增長 20 倍以上,該職位將會愈加受到各家 AI 公司的重視

3、人工智慧訓練師的職業規劃1~3 歲互聯網產品經理最有可能成為人工智慧訓練師的主要來源職位;而 AI 產品經理將成為最合適的上升職位

目錄

一、人工智慧訓練師的產生背景

二、人工智慧訓練師是什麼

三、人工智慧訓練師的人才缺口

四、人工智慧訓練師的職業規劃

五、結語

1

人工智慧訓練師的產生背景

一般而言,AI 公司從客戶(用戶)那裡獲取到的原始數據無法直接用於模型訓練,在 「人工智慧訓練師」 出現以前,是由 AI 產品經理先用相關工具簡單處理,再交給數據標註人員進行標註加工,但因為標註人員對數據的理解和標註質量差異很大,導致整體標註工作的效率和效果都不夠理想

同時,AI 公司在其細分領域內積累了大量數據,這些數據往往在使用一次後就不再產生更多價值,隨之帶來了第二個問題,數據無法沉澱和復用

基於這兩個問題,「人工智慧訓練師」 應運而生

註:「人工智慧訓練師」 這個職位,據說最早是由 BAT 某部門在 2 年前創造的。

2

人工智慧訓練師是什麼?

1、定義

人工智慧訓練師,是通過分析產品需求相關數據,完成數據標註規則的制定,最終實現 「提高數據標註工作的質量和效率」 以及 「積累細分領域通用數據」 的價值,從工作流和工作難度等角度看,它介於數據標註和 AI 產品經理之間。

2、工作職責

人工智慧訓練師的工作職責,主要有以下三點:

提供數據標註規則:通過演算法聚類、標註分析等方式,從數據中提取行業特徵場景,並結合行業知識,提供表達精準、邏輯清晰的數據標註規則,最終確保數據訓練效果能滿足產品的需求;

數據驗收及管理:參與模型搭建和數據驗收,並負責核心指標和數據的日常跟蹤維護;

積累領域通用數據:根據細分領域的數據應用要求,從已有數據中挑選符合要求的通用數據(適用於同領域內不同客戶 / 用戶),形成數據的沉澱和積累。

註:在不同公司,人工智慧訓練師的職責具有一定差異性,比如有的偏重前期的數據挖掘和模型訓練,有的偏重後期的產品運營和產品體驗。

3、職位辨析(一):人工智慧訓練師和數據標註、AI 產品經理的異同

1)人工智慧訓練師和 AI 產品經理的異同

人工智慧訓練師需要和 AI 產品經理討論需求,進而制定數據標註規則,並提出產品體驗優化建議

2)人工智慧訓練師和數據標註的異同

人工智慧訓練師需要和數據標註人員緊密協作,把控好整個流程的輸入規則輸出結果,最終輸出標註準確的數據(供模型訓練)。

3)人工智慧訓練師的工作流程圖:

下圖,展示了人工智慧訓練師和數據標註、AI 產品經理協作的工作流及其每個節點的交付物。不難發現,人工智慧訓練師在數據標註和 AI 產品經理之間,起到橋樑的作用。

註:人工智慧訓練師的工作交付物 「數據標註規則模板」,可見完整版深度報告(下載方式見文末)。

4、職位辨析(二):人工智慧訓練師和初級互聯網數據產品經理的異同

1)兩者工作職責的主要區別在於 「積累細分領域通用數據」,這項工作將為公司創造新的價值,比如:

大大減少後續標註人員的工作量,提升業務的接入速度和效率

逐步建立細分領域的行業壁壘

總之,由於一般的數據不能全領域通用,所以不同應用場景下,細分領域通用數據少的問題,將成為整個行業的痛點和機會

2)在 AI 工作場合,原本由初級互聯網數據 PM 完成的 「貢獻數據採集標準、打通數據資源、數據應用的推廣」 等工作,並沒有交給人工智慧訓練師,而是由更適合的 AI 產品經理完成,原因在於這部分工作更偏重前端的需求和推廣(AI 產品經理更熟悉和擅長產品體驗及流程)。

5、能力模型

基於人工智慧訓練師的工作職責,需要具備哪些能力呢?通過調研分析,我們總結出了如下的能力模型:

1)數據能力:了解科學的數據獲取方法論,能運用數據處理工具(如 Excel 等),邏輯思維強

2)行業背景:熟悉公司行業領域知識,特別是語言圖像方面數據的特點。

3)分析能力:基於產品的數據需求,及時發現、提煉問題特徵,產出優化方案和建議

4)溝通能力:具備較強與不同崗位同事同頻交流的能力,能通俗易懂的闡釋專業術語信息。

5)AI 技術理解力:能夠釐清基本的 AI 概念,並了解其技術邊界(能做什麼和不能做什麼)。

6)AI 行業理解力:具備 AI 行業知識(如了解行業術語)或相關產品運營經驗,在此基礎上能夠預判行業趨勢、深挖場景痛點、設計 AI 方案。

3

人工智慧訓練師的人才缺口

1、當前人才缺口

暫未形成明顯的人才缺口,因為一方面,大部分公司都是近期才開始設立這個職位,人才需求量不多(不超過三位數);另一方面,目前大多數人才需求,通過公司內部運營人員轉崗外部招聘就能滿足。

1)人工智慧訓練師的職位畫像

工作經驗:大公司的要求明顯高於創業公司,一般在三年以上

工資範圍:主要集中在 8k 以下

2)人工智慧訓練師的公司畫像

發展較為成熟的智能客服類公司,對於人工智慧訓練師的需求量明顯領先於其它行業。

出人意料的,杭州 AI 公司表現出了更高的敏銳度(有 4 家公司,和北京並列第一),背後原因可能是政府的大力推動——根據 2017 年 11 月杭州人社局發布的相關政策,人工智慧訓練師不僅被納入杭州市專項能力考核項目,而且獲得高級專項能力認證的人工智慧訓練師將有機會申請公租房及杭州落戶加分等政策福利。(原文鏈接:《杭州人社局:人工智慧訓練師將有機會享受落戶加分等福利》)

成立 2 年以上的公司(73%)更需要人工智慧訓練師,一般情況早期創業公司側重搭建產品技術框架、驗證解決方案和商業模式,沒過多精力放在 「提升效率」 或 「積累細分領域通用數據」 上,所以 「人工智慧訓練師」 對於需控制團隊規模、降低管理成本和風險的早期創業公司而言,非必需單獨拆分的職位。

已上市和 A 輪的公司,相對而言對人工智慧訓練師的需求量更大。

另外需要說明的是,按道理 CV(計算機視覺)領域也有數據標註工作,但我們搜索了 10 多家(計算機視覺)領域公司的招聘頁面,暫時都沒有發現人工智慧訓練師的需求,這可能是因為相對 「標註語料數據」,「標註圖像數據」 更簡單,主要找外包公司即可完成。

註:以上結論,來自對 15 家公司職位描述信息的分析匯總;具體這 15 家公司的詳細信息,可見完整版深度報告(下載方式見文末)。

2、未來人才缺口

1)未來 5 年人才缺口將增長 20 倍以上

在即將到來的 2018 年,人工智慧訓練師的人才缺口預計將達到近 1000 人;

兩年後的 2020 年,伴隨著 AI 行業的高速成長,人才缺口也將隨之猛增至 2018 年的四倍,達到近 4000 人;

按照這個發展趨勢,到 2022 年人才缺口將突破 2 萬人,相當於職位自然流入人才數量的四倍左右,人才缺口越來越大,需要引起行業的足夠重視

註:以上數據的詳細估算過程,可見完整版深度報告(下載方式見文末)。

2)職位畫像和公司畫像在未來可能發生的變化

CV(計算機視覺)領域公司可能也會逐步建立自己的人工智慧訓練師團隊,因為隨著 CV 領域商業化越來越成熟,各家公司對於數據標註的質量和效率要求會越來越高,甚至數據需求的 CV 領域可能會越來越細分,進而導致外包數據標註公司可能滿足不了。

成立年限小於 2 年的 AI 公司,可能會更加重視招募人工智慧訓練師,因為一方面,這個職位的行業認知度在逐漸提升,另一方面,更重要的是,各家公司會越來越意識到,在業務初期,細分領域的某些數據就能提升用戶價值,並同時建立初步的行業壁壘。

3、結論:未來,各家 AI 公司會愈加重視 「人工智慧訓練師」 這個職位

隨著大部分 AI 創業公司逐漸完成產品驗證,所服務的行業領域越來越多,市場將進入快速增長期,構建數據方面的行業壁壘(積累領域數據、提升數據標註效率等),將逐漸成為一種趨勢,而 「人工智慧訓練師」 正好能滿足這些需求,在未來幾年會得到各家公司更多的重視與關注。

4

人工智慧訓練師的職業規劃

1、人工智慧訓練師的來源職位,主要是 1~3 歲互聯網產品經理

從行業現狀看,無論是外部招聘還是內部轉崗,絕大部分人工智慧訓練師的應聘者都不具備 AI 相關的專業或行業背景,因此在人才選拔時,公司會更看重數據產品相關經驗,人才來源主要有以下三類:

內部轉崗:從客服等和數據有關的運營崗位中平級轉崗;

內部轉崗:從數據標註員中擇優提拔;

外部招聘:從有 1 年以上互聯網產品經驗的產品經理中招聘篩選。

而這 3 個來源之中,目前 1~3 歲互聯網產品經理就有 4~5 萬(並且由於互聯網產品經理已經供大於需,他們正面臨找工作的壓力);另一方面,一般 1 歲以上的互聯網 PM,能力也已經可以勝任人工智慧訓練師了

綜上所述,1~3 歲互聯網產品經理將最有可能成為人工智慧訓練師的主要人才來源

註:1~3 歲互聯網產品經理的數量,由四個基礎數據估算得出(2016 年底互聯網從業者人數、2016 年底互聯網從業者人數同比增長率、產品經理從業者人數佔比、3 年以下工作經驗從業者人數佔比),數據取自拉勾網《2016 年互聯網職場生態白皮書》和經緯 & 獵聘《互聯網人才 360° 印象報告》。

2、人工智慧訓練師的上升職位,主要是 AI 產品經理

職位創造價值更大:AI 產品經理更關注整體的產品體驗和商業價值,對於公司能產出更大的價值。;

職位能力要求更高:在數據分析能力、相關行業經驗基礎上,還需要具備 AI 技術理解力、AI 人機交互設計、AI 行業理解力等更高階的能力素質。

綜合來看,從人工智慧訓練師轉型 AI 產品經理大約需要 6~12 個月的時間,出色的工作表現和抓住時機的決心將在轉型過程中將起到決定性作用。

附:一個真實轉型案例

SY 同學,從數據標註轉型到 AI 產品經理,花費了 6 個月,這應該是最快的速度了,因為她的每一步都是能力剛剛 ready 時,公司就有內部轉崗或借調使用的 headcount 機會。

剛入職,具有超高工作質量與效率,明顯高出其他同期入職同事

1 個月後,指導其他兼職標註人員

3 個月後 ,公司內其他部門有 AI 產品助理空缺,正好內部借調(從產品助理工作開始)

6 個月後,正式轉型 AI 產品經理

5

結語

1、關於我們

1)個人介紹:朱明德,3 年互聯網電商 PM 經驗,正轉型 AI 產品經理,主要通過學習飯糰 「AI 產品經理大本營」 的 AI 相關內容,加速成長。

2)飯糰 「AI 產品經理大本營」 (可點擊 fantuan.guokr.net/group(二維碼自動識別)進入):由黃釗 hanniman 建立的行業內第一個 「AI 產品經理的成長交流社區」,通過 「乾貨分享 + 職位內推」 的基礎服務,以及 「社群討論 + 線下交流 + 寫作指導」 的隱藏服務(需要用心爭取),幫助大家完成 「AI 產品經理成長的實操路徑」。

3)指導顧問:黃釗 hanniman,圖靈機器人 - 人才戰略官,前騰訊產品經理,5 年 AI 實戰經驗,8 年互聯網背景,微信公眾號 / 知乎 / 在行 ID「hanniman」,飯糰 「AI 產品經理大本營」,分享人工智慧相關原創乾貨

本報告得到諸多同行大力支持。

特別感謝指導顧問 圖靈機器人 @黃釗老師在寫作和調研過程中提供的幫助和建議(前後30 多天時間裡,針對 10 多個修改版本的文章框架和排版細節,總計提了 300+ 個建議;並且幫助邀請了不少其他 AI 公司的調研對象)。

感謝四位大力配合的調研對象:圖靈機器人 @鄭殊予、追一科技 @劉傑以及另 2 位不便署名的同行;

還要感謝 @Shertin 對報告提出的修改意見。

由於成文時間倉促,報告中難免有疏漏之處,歡迎您提出問題、評論和建議。

2、核心結論

1)人工智慧訓練師的定義:通過分析產品需求和相關數據,完成數據標註規則的制定,最終實現 「提高數據標註工作的質量和效率」 以及 「積累細分領域通用數據」 的價值。

2)人工智慧訓練師的行業認知度:開始得到杭州、北京等城市 2 年以上 AI 公司的重視,考慮到人工智慧訓練師的人才缺口 5 年後將增長 20 倍以上,該職位將會愈加受到各家 AI 公司的重視

3)人工智慧訓練師的職業規劃1~3 歲互聯網產品經理最有可能成為人工智慧訓練師的主要來源職位;而 AI 產品經理將成為最合適的上升職位


推薦閱讀:

人工智慧產品經理系列(九)通向AI產品成功的必要條件
第一次購買使用電話機器人需要注意什麼?【服務篇】
打破異地集成項目交付難的枷鎖,大魚U服解決集成商難題
神了!人工智慧學會了繪畫上色!
紅海殺手——249元翻譯機的逆襲

TAG:產品經理 | 人工智慧產品 | AI技術 |