抖音和它背後的黑科技
在剛剛過去的 2017 年裡,如果要盤點整個互聯網行業最引人矚目的產品,抖音無論如何都會榜上有名。
從 3 月爆發起,抖音全年保持了令人震驚的增長態勢,以至於此前所有關於他將會曇花一現的預言統統落空。就在 12 月的月末,抖音更是實現了一波強勁地增長,順利登頂中國 App store 的免費榜。
事實上,早在 9 月,抖音就已經進入了位居 App Store 攝影與錄像分榜第一,並進入總榜前十。而登頂之後,也並未迅速跌落,即使到了今天,抖音在 App Store 上仍僅次於支付寶和微信,位列第三。
(抖音 3 月以來的百度指數)
那麼,抖音是如何能在 2017 年一路勢如破竹,甚至在年末戰勝微信、支付寶這樣巨頭登頂 App Store 的呢?
和外界大多數所分析推演的不同,來自抖音內部的結論是,新技術新功能的不斷開發迭代是產品能夠持續走高的重中之重。
以歲末的這次登頂為例,抖音內部歸功於產品新推出的功能玩法。12 月 21 日,抖音的新版本上線了名為」尬舞機」的功能,上線的第二天,抖音就成功登頂。
是什麼讓抖音在 2017 年實現了現象級的表現?如同尬舞機這樣為抖音帶來質的變化的功能又有哪些?其中如尬舞機這樣的技術功能又貢獻幾何?這些功能又有什麼特殊之處?
帶著這些問題,我們採訪了抖音產品負責人王曉蔚,以下是採訪內容實錄:
Q:抖音年末的這波爆發真的是因為新功能「尬舞機」嗎?它是如何做到的,從產品表現來看怎麼樣?能詳細介紹一下這個功能嗎?
抖音:其實在封閉開發的時候我們就有這樣的期待(登頂),畢竟從 9 月開始抖音就穩定在 App Store 前十。所以開發的時候項目組的同學都憋著一口氣,想要把這個功能做爆炸,最後也確實實現了。
尬舞機研發上的技術支持來自今日頭條人工智慧實驗室(簡稱 AI lab)。它其實是人體關鍵點檢測技術的應用。依靠這項技術,我們能夠檢測到圖像中所包含人體的各個關鍵點的位置,從而實現從用戶姿態到目標姿態的準確匹配。簡單來說是把就把跳舞機、kinect 這樣的體感遊戲搬到了手機上。體感類遊戲之前受技術條件的限制,大家只能藉助特定硬體設備才能玩。尬舞機的出現標誌著,憑藉先進的深度學習技術的支持,我們已經能夠讓我們的手機實時,精準地「讀懂」人體的姿態和動作,讓普通用戶隨時隨地能夠體驗這種遊戲形式。
上午新版本放出以後,就有很多用戶參與進來了。因為尬舞機玩起來沒什麼門檻,效果又很「尬」,玩的好的會很酷,玩的不好也會顯得蠢萌蠢萌的,用戶把視頻分享到 social 渠道不會有什麼負擔。事後來看尬舞機視頻的站外分享量都非常高。其實到了當天半夜,我們就已經 App Store 登頂了,也就不到 20 個小時吧,那個時候我們原定的推廣活動都還沒開始。
Q:我們看到近期一些其他產品也推出了類似的功能,從結果上來看,都沒有尬舞機對抖音的貢獻那麼直接明顯,這是否說明產品的增長其實不完全是新功能的作用?
抖音:很多看上去相似的功能,因為工程能力的不同,在實現效果上會有很大差異。以尬舞機為例,動作識別準確率高,用戶才能玩起來,否則只會讓人反感。
而要想做好這個功能,需要解決兩個難題。第一,人體的形變範圍比較大,受衣服變化、物體遮擋等影響嚴重,在日常場景下準確地檢測人體關鍵點一直是計算機視覺領域中的一個熱點問題。第二個難點是,要實現精準檢測,需要耗費高昂的計算資源,無法在手機端實現日常場景應用。
由於這兩個難點的存在,市面上很多產品的類似功能只能實現半身檢測,甚至人臉檢測。這樣功能的實現效果上會大打折扣,玩法上也會有很多限制。
對此,頭條 AI lab 的同事創新了技術方案。相比於業界流行的自頂向下(Top-Down)的方案,我們採用的是自底向上(Bottom-Up)的方案。核心是我們針對移動端設備自研的網路結構,極大地減少計算量,同時讓準確率大幅提升,實現了在移動端的實時無損運行。
我們的人體關鍵點模型是業界領先的水平。從實現效果來看,我們在國內首次把檢測範圍擴大到了全身。而對於更簡單,也更廣泛實用化的人臉關鍵點檢測技術,可以對視頻進行實時檢測。也積累了很大的人臉庫,可以很準確的識別人臉。
Q:所以尬舞機是抖音的「大招」嗎?最開始立項要做的原因是什麼?
抖音:整個功能前後封閉開發了一個多月,內部確實對尬舞機的效果是有期待的。但不是以憋大招的心態去做的,像尬舞機這樣玩起來更簡單,效果更酷炫的功能這一年來抖音一直在做。包括背景分割、音樂濾鏡、AR 貼紙等等,都是基於我們的 AI 技術開發的特效功能。只不過這次登頂了所以大家都關注到了。
之所以做這些還是跟我們的初心有關,當初我們做抖音的時候就覺得應該有一個適合中國年輕人的音樂短視頻社區產品。這個產品要年輕人喜歡玩,能輕鬆自在表達自己,展現自我,要有意思。所有的功能設置都是圍繞這個目標展開的,中國年輕人的歌舞基礎很弱,想要更多的人能夠參與表達,就要在產品層面做更好的引導,降低他們表達的門檻,讓他們更容易變酷。
這也是為什麼抖音的濾鏡和特效會受到追捧,因為我們確實在這方面投入了很多心血去做好它。說一個挺有意思的事,最近「國民閨女」關曉彤也開始玩抖音了。看上去她玩的還是挺開心的,最近我們發現她把個性簽名改成了「這裡的濾鏡和美顏讓我無法自拔」,這也算是對我們的特效功能的一種認可吧。
Q:所以抖音的濾鏡和特效的不同之處是什麼呢?
抖音:還是我們的技術。背後的很多「黑科技」讓我們的特效不僅僅停留於其他平台的賣萌貼紙。
舉個例子,抖音有一個「實時染髮」的特效,即能在手機上實時改變頭髮顏色,模擬現實生活中的染髮效果。這個功能是站內最受歡迎的特效之一,別的平台還沒有辦法實現。
(實時染髮特效)
其中的難點是頭髮的分割。因為頭髮非常細,邊緣部分的識別和分割非常難。我們專門針對頭髮做了識別優化。基於自研的網路,我們的頭髮分割能達到髮絲級的精度。我們通過頭髮追蹤技術和自研著色技術,估計頭髮的反射率,能夠在不同的原始發色和光照條件下渲染大多數顏色。
Q:這些「黑科技」對於抖音這一年的增長到底起了哪些作用?
抖音:這麼講吧,基本上每次有新玩法新功能出現,都能在數據上獲得直觀的體現。不僅是尬舞機,「單身狗」、「大臉怪」、「憨厚」等,我們這些在社交網路受到廣泛喜愛的特效,都為我們吸引來了很多新用戶,並形成了很好的品牌效應。
Q:對於這些新功能新玩法,抖音內部有一套運作機制來持續地開發嗎?
抖音:談不上什麼固定的機制,其實冒出來的想法遠多於最終能夠落地實現的。這些想法一方面來自我們自己產品運營同學的腦洞,另一方面,我們也會從用戶那裡汲取靈感,有些想法是用戶直接反饋給我們,有些則是我們從用戶的視頻里發現,通過技術手段來實現。
前不久,今日頭條與北京大學共同完成的「互聯網信息摘要與機器寫稿關鍵技術及應用」項目獲得了吳文俊人工智慧技術發明獎。吳文俊獎被外界譽為「中國智能科學科技最高獎」。
背後有頭條 AI lab 的支持,也是抖音比較幸運的地方,這讓我們的很多想法有機會落地。這可能也是我們相對於其他同類產品的優勢。反過來包括抖音在內頭條的眾多產品業務線,為 lab 前沿的 AI 技術研究提供了應用的場景。
【享你mall】
- END -
*圖文源於網路,如有侵權請聯繫刪除推薦閱讀:
※【推薦】兩款桌面圖標整理利器,從此告別桌面凌亂
※【推薦】點陣圖JPG轉CAD矢量化軟體R2V
※做自媒體必懂的幾款工具,讓你的視頻更高大上!
※cURL命令行工具的使用
※推薦一些Windows上的效率工具與實用軟體