每秒千萬級實時數據傳輸,同時理解視頻和用戶,快手在AI領域發力

每秒千萬級實時數據傳輸,同時理解視頻和用戶,快手在AI領域發力

來自專欄 DeepTech深科技

「對於記錄來講,每一份記錄都有兩類人:一個是記錄的產生者、記錄者,另一個是記錄的觀察者。」

記錄者是生產視頻的人。快手 CEO 宿華認為,每一個人都有著相同的渴望,那就是希望自己的狀態、自己的情感、自己的靈感能夠被更多的人看見,並且被更多的人理解。而觀察者則是看視頻的人,他們可以通過視頻軟體看到更廣泛的世界,比如在城市的人能夠看到農村,而農村的人可以看到世界。

正是這兩種人的交織與互動,促使視頻在產生以及分享過程中為他們自己帶來滿足感。但隨之而來的便是挑戰——視頻公司若想要捕獲這些情感,就必須越過天文數字級別的坎

然而快手的日活超過了 1 億,每天產生的視頻數量超過一千萬,不用想也知道,光靠人工的力量是不可能實現的。於是快手給出了這樣一個時髦的答案,那就是 AI。

快手平台負責人韋彬表示,快手的 AI 在應對海量數據處理的背後,依靠的是快手強大的系統平台工程團隊。

首先,支撐海量社區交互的分散式在線服務需要處理每秒千萬級的實時數據的傳輸和計算,同時還需要做到高可用、解決社區服務特有的熱點問題;其次是支撐巨量數據的存儲服務,則需要支撐每日 P 級的數據增長,同時提供高性能高可靠的查詢能力,為此來自AI研發團隊做了很多深度優化。

同時,為了加快 AI 研究,快手自主搭建了基於 GPU 集群的 AI 引擎,可以快速調研,測試和發布先進的AI演算法和模型。

快手一直非常重視 AI 團隊的建設,快手 AI 研發團隊多來自斯坦福、卡內基梅隆等高校,以及 Google、微軟等知名科技企業,同時也在積極招攬人才。他們相信 AI 研發團隊實力會始終保持在業內領先的位置。

快手 AI 技術副總裁鄭文曾經舉過這樣一個例子:快手會通過深度學習演算法來檢測用戶拍攝的場景類別,並據此選擇最適合的濾鏡效果來提升視頻的質量。通過人體關鍵點識別技術,快手能夠為用戶的肢體加上特效,比如讓虛擬的火球跟隨人手的位置進行運動,此外還有很多人臉裝飾貼紙、AR 模型等基於 AI 技術的特效,讓每個用戶的記錄形式更加豐富多彩。

演算法與幸福感之間的聯繫

正如宿華所說,幸福感的提升實際上是來自兩類人。對於觀察者來說,內容分發的質量高低,才是決定他們獲得幸福感的關鍵。事實上,AI 推薦演算法從很久以前就被捲入了一個輿論漩渦之中。這是指人們的信息領域會習慣性地被自己的興趣所引導,從而將自己的生活桎梏於像蠶繭一般的「繭房」中的現象。

由於信息技術提供了更自我的思想空間和任何領域的巨量知識,一些人還可能進一步逃避社會中的種種矛盾,成為與世隔絕的孤立者。在社群內的交流更加高效的同時,社群之間的溝通並不見得一定會比信息匱乏的時代來得順暢和有效。

鄭文對 DT 君表示,快手的 AI 一定程度上已經做到了避免信息繭房。他表示,AI 主要進行了海量的視頻理解和海量的用戶理解,然後把內容和用戶進行精準匹配。這個匹配的機理不僅僅是只根據單個用戶的喜好需求和內容來進行連接,還會基於某一個內容點來研究大量的用戶具有哪些共性,找出這種共性,再來用它拓展單個用戶的興趣邊界。簡單來說,就是 AI 讓成千上萬的用戶和你一起來探索。這種方式自然能有效防止信息繭房,還能加強人與人之間的聯繫。

鄭文還舉出了這樣一個例子,「某一位用戶對足球感興趣,那麼後台 AI 系統除了給他推送足球和其他球類甚至其他類別體育運動相關內容,還會對同樣喜歡足球的群體進行分析,找到他們除了足球以外還有哪些興趣點,從而把這些興趣點相關內容也推送給這位用戶,幫助用戶不斷拓展興趣邊界,打破信息繭房,也與其他人建立更強更深入的連接。」

換句話說,快手的 AI 其實是發力在產生者以及觀察者兩端的。鄭文對 DT 君說:「之所以講快手幫助用戶提升幸福感,是基於記錄和連接。因為千千萬萬的記錄和分享,所以用戶得以看見彼此發布的內容,看見記錄這些內容背後的彼此,用戶用這種方式和這個世界發生連接。這種有效的連接,一定程度上可以幫助用戶消解孤獨,讓用戶自身的視野、審美、學習的慾望、知識結構、對世界的了解、乃至把握外部機會的可能,都會發生一些積極的有利的改變,這種改變是會提升每個人獨特的幸福感的。要實現這種海量的連接,那麼就一定需要技術來提供對視頻的理解,對用戶的理解。」

Y-Lab 浮出水面

鄭文還向 DT 君介紹了快手 Y-Lab。這其實是一個成立於 2016 年 9 月的實驗室,致力於通過最前沿的科技帶給用戶新奇的記錄體驗,研究領域涉及人工智慧、機器學習、計算機視覺和計算機圖形學等。

其較為知名的成果是通過快手的視頻拍攝功能,讓用戶的臉以猩猩臉的樣子展現在屏幕上。據說這樣做是為了配合電影《猩球崛起 3》的宣發。

「Y-Lab 對於未來的技術發展有自己的判斷,並且已經做出了一些布局。」鄭文告訴 DT 君,「其中,我們非常希望能夠為人類在人工智慧領域的整體發展貢獻出自己的力量。為此,我們在人工智慧相關的一些基礎方向上都有一定的投入。」

鄭文還介紹了幾個 Y-Lab 正在研發的「黑科技」:比如目前流行的深度學習方法需要大量的數據標註,耗時長代價大。但其實人類並不需要大量的標註來進行學習,而是先從對世界的觀察中自主學習到一個基本模型,再在這個基礎上通過少量標註,舉一反三的學習。這正是目前 Y-Lab 的研究目標之一。

鄭文進一步指出,目前的人工智慧也無法像人類一樣具備常識,所有的任務都必須從最原始的數據開始進行訓練。解決這些基礎性的問題,將可以把人工智慧向更接近人類智能的水平提高一大步,不僅僅對於快手有很重要的意義,對於全人類來說也是激動人心的進步。

如此看來,快手對於 Y-Lab 的重視程度很有可能和谷歌對待 DeepMind 是一樣的。鄭文表示快手是一家科技驅動的公司,人工智慧技術是快手技術的核心,也是公司發展最重視的方向。

用科技的力量帶來獨特的幸福感

無論是宿華或者是鄭文,他們都是資深的計算機研究者。「幸福感」這個飽含感性色彩的詞對於理工男來說,或許比開發、寫代碼更難理解。然而快手的確做到了,用戶與視頻的高速增長就是最好的證據。

宿華曾經表達了他這樣一個願望,「也許有一天我們做的人工智慧系統,能夠像我一樣,像人類一樣去理解生活中的片斷,能夠更好的理解人類的情緒、情感,甚至是靈感。我很期待那一天的到來。」

他說這是在看一個包含人類複雜情緒的視頻時所感悟到的,「一對男女擁抱之後,發出帶有悲傷情緒的聲音,但分開的時候又很決絕。」

或許有一天機器真的能理解人類,這也是為什麼快手著手於研究多模態信息融合的視頻理解。鄭文表示,這項技術將使機器更好地理解視頻中圖像、文字、語音、音樂等多重維度的信息,實現機器對視頻更高層級的理解,在內容推薦、分發上有更清晰的參考依據。

這些技術的研發,均為服務快手的本質——社區。宿華以自己為例展示社區對興趣拓展的重要性,「一方面是隨機的,比如為什麼我會做人工智慧,因為某天碰到了一個在做機器學習應用的團隊,我跟他們聊了以後很感興趣,從此走上了這個路,這是一個非常隨機的狀態。還有一個做法是問朋友,比如有人在你的朋友圈裡面,或者你的室友、你的同學,分享他昨天打了棒球,很好玩,問你要不要一起來玩一下,或者剛學了一個 C++ 語言不錯,要不要一起來學,從而幫助你擴展你的興趣偏好。」

在一個大的社區裡面,總有興趣相似卻不同的一群人。在嘗試幫助用戶擴展興趣的時候,去理解一個用戶群偏好的時候,快手會把這個邏輯應用其中,「你不是一個人在探索,社區裡面有成千上萬的人跟你相似又不同的人在一同探索,同時,你也在幫助其他跟你相似而不同的人去探索。」宿華說到。

同時,宿華也揭示了快手的願景:構建一整套的以 AI 技術為核心的基礎設施,用科技的力量提升每一個人獨特的幸福感,讓每一個人更多更好的感受這個世界,也能夠更好的被這個世界所感受到。


推薦閱讀:

這些錄音技巧,在拍攝視頻時你都注意了嗎?
針對此次快手整改後作出的後續發展判斷
帝聯觀察:一篇文章簡析短視頻和在線直播行業格局!(上)
愛情為什麼要儀式感?火遍短視頻的情侶告訴你答案。
如何在抖音上火起來:抖音上那些不露痕迹的「炒作」

TAG:快手 | 短視頻 | 視頻 |