我把蒼井空的照片放進人工智慧算了算
來自專欄淺黑科技65 人贊了文章
文 | 史中@淺黑科技
我的一位盆友,在一家著名的新聞網站負責法務。
最近他這個法務比 CEO 還忙,因為網站每天都被人告。
原因很簡單:新聞里用的圖片侵權了。尤其是多年以前的舊新聞成了「重災區」,那時候編輯的版權意識還不強,使用了很多某圖庫的插圖。於是,這位法務重拳出擊迎戰版權方!
。。。
。。。
。。。
然後他敗了,公司已經陸續賠出去好幾百萬。
「這種鐵證如山的侵權官司如果能逆轉,簡直是對共和國法律的踐踏嘛!」受盡老闆折磨的他怒吼。
不過,作為技術流的中哥,我卻沒和他在一個頻道,當即問了他兩個問題:
1、侵權的都是四五年前的舊網頁,現在都幾乎沒人看了,那對方是怎麼找到這些圖片的呢?
2、為什麼這麼多年都是風平浪靜,單單今年你們的侵權行為被暴風驟雨般訴訟呢?
看著他迷茫的小眼神,我甩給他一個最近剛剛看到的網頁:
你看,現在反盜版的鬥士已經鳥槍換炮,靠人工智慧自動尋找侵權圖片了。它的效率可不是人能比的,有詩讚曰:
從來不吃飯,
只需幾度電。
價格很低廉,
還不知疲倦。
有人工智慧幫忙,找盜版圖片肯定小菜一碟,難怪千年墳圖都能給你挖出來。
送走這位糾結的朋友,我卻陷入思考。
過去說到 AI,大家都覺得這是科學家的事情。
但是現在,一家圖片社都可以嫻熟地駕馭 AI。
「AI 反盜版」這個案例背後,可能藏著一個技術大腦洞。
一、「掃碼借智商」
我注意到一個細節:
在「反盜版」這件事情里,圖片社使用的人工智慧,不是他們自己開發的,而是使用了華為雲的「深度學習服務平台」訓練出來的。
之前我對阿里雲、騰訊雲和百度雲比較熟悉,唯獨對華為雲有些陌生。於是我千方百計找到華為雲一位神秘的老司機(這位技術大牛很低調,所以要隱去姓名),跟他請教了一下這「深度學習平台」背後的腦洞。
先來科普一下,深度學習是目前人工智慧的一個重要分支技術,它的原理不難解釋:
讓機器「看」大量的數據,它就會自動學會一種技能。
你日常體驗到的人臉識別、語音識別,大多是深度學習的產物。
「深度學習服務平台」,簡單來說就是人工智慧界的「共享單車」。哪家公司自己的「智商」不夠用,需要讓人工智慧幫忙完成任務,就可以從平台「掃碼借智商」。
共享單車用起來很簡單,嘀一下刷開就可以騎,咔一下關鎖就可以走。老司機告訴我,華為這個「深度學習平台」也很簡單:哪怕你是個不懂代碼的小白,也可以通過輸入一些樣本,拉拽一些參數,瞬間定製出一個「大腦」。
依靠這樣的共享平台,有人玩出了不少「騷操作」:
1)布料達人
在紹興的柯橋,有一票服裝行業的工廠,它們是中國服裝業的半壁江山。很多大商人每天的工作,就是從千萬種布料裡面選出自己想要的那種,然後採購回去做成服裝。
然而,雖然這些服裝商都是身經百戰,但面對千萬種花紋、顏色、走線極其類似的布料,也像看到王珞丹和白百何一樣,兩眼發藍懵的一比。
但時間可不等人,在服裝行業,有時候流行趨勢是變化得很快的,這個布料你幾分鐘之內不拿,可能就被別人搶走了。所以這些老闆們迫切需要一種人工智慧技術,只需要它做一件事:認識布料。
果然,他們就把市場上成千上萬的布料照片,一股腦輸入深度學習平台,很快就訓練出一個能認識各種布料的「人工智慧專家」。後來業務員只需要給布料拍張照片,就能自動比對,告訴你這是不是你要的那一款。這種騷操作,省下了大量人工走訪判斷的時間,下訂單特別快,他好我也好。據說現在各個服裝廠都在用。
2)臉盲福音
深圳是個比腳大的城市,2100萬人,只有2萬個警察叔叔。
1996平方公里的轄區,警察叔叔靠雙腿可溜達不過來。大多數情況,他們都會通過監控探頭來發現違法的壞人。而讓他們吐槽無力的是,很多攝像頭的清晰度都不高。
經常發生這種情況:攝像頭拍到了一個嫌疑人,一群警察叔叔圍在屏幕前犯了臉盲症,很難把這個人和公安資料庫里的人臉對應上。
所以,警察叔叔就用深度學習平台,搞出了一套「模糊圖像匹配系統」。這樣,即使視頻里的人像模糊到懷疑人生,人工智慧還是能告訴你,Ta 和資料庫里的誰最匹配。
果然,這個系統效果炸裂。
就在2018年春節的時候,深圳龍崗區有一個3歲的孩子被人販子拐走了。警察叔叔接到報案,馬上在監控里找到一個片段:一個中年婦女把孩子領走了。但是這個婦女的臉非常模糊。於是警察叔叔馬上想到了自己的「臉盲福音系統」。一下子就把她和身份證庫裡面的人對應上,拿到了嫌疑人的高清無碼大圖。從孩子失蹤,到警察叔叔狂奔到武漢救回孩子,全程只有不到15個小時。
3)勤奮的書記員
另外,還有很多企業的銷售部門,需要把手動填寫的單據轉化成 Word 歸檔,或者對身份證、名片上的名字和數字進行識別。這些枯燥的轉錄任務,原來是由人來做的,最近都換成人工智慧來完成了。
此外還有挺多,篇幅有限就不列舉了。
有句話叫「簡單就是力量」。
最近抖音這麼火,主要原因就是它的操作夠簡單,卻能賦予每個人無限的創造力。同理,人工智慧平台的操作夠簡單,各家公司也能在上面創造出五花八門的應用。
這個趨勢就是——「AI 平民化」。
二、「H」的另類人工智慧史
說了這麼多,你可能有一個和我相同問題:提到雲計算,我們聽說更多的是阿里雲、騰訊雲,為什麼最近華為雲會出現在我們的視野?
應該這樣說,「對外提供 AI 服務的能力」並不是你想有,想有就能有。至少要具備兩方面的條件:
1、強大的 AI 技術——AI 技術能力來自於大量的數據和應用場景鍛煉,所以這個公司必須是大公司;
2、強大的硬體基礎——AI 服務需要的硬體基礎,來自於雲計算。所以這個公司需要有雲計算業務。
符合這兩個條件的選手只有BATJH(百度阿里騰訊京東華為)這類大公司,華為當然也在其中。只不過很多人在日常的新聞里對互聯網巨頭比較了解,卻很少有機會了解華為的過往。
說到這,中哥得先轉述一下華為的「人工智慧簡史」。
1)「世界末日」的決定
2012年(也就是世界末日那一年),華為突然成立了一個神秘的實驗室——2012實驗室。沒錯,這個實驗室的重要任務之一就是用各種姿勢研究人工智慧。在那個時候,人工智慧還不被大眾了解,甚至被妖魔化。然而,當時任正非的態度很明確:「我也擔心人工智慧對人的價值觀產生破壞。但是我們擋不住人類社會前進的步伐。」
「2012實驗室」下屬的前沿人工智慧實驗室名字就叫「諾亞方舟」,更昭示了一種「救生艇」的意味。
2)直接「干實事」
那時候,華為的人工智慧,主要用於解決自身的實際問題。當時華為業務大面積拓展,人手突然不夠用。特別是技術流的「老濕傅」不夠用了。於是,AI 「臨危受命」,被用來解決火燒眉毛的問題。
我給你舉幾個例子:
- 環境健康安全:華為的很多業務都需要進工地施工。在施工之前,要有專人檢測工人「反光背心身上穿,安全帽兒帶規範」。這種本來靠人的檢查後來被人工智慧給替代掉了。攝像頭自動分析你的裝束,合格就放行,不合格絕不通融。
- 供應物流:華為的日常業務,需要運輸很多設備到海外。這時候,就有一個世紀難題:集裝箱怎麼裝才能塞進最多的貨物?這就像小時候,你從盒子里拿出積木的時候,他們排列整齊,當你放回去的時候,卻總是多出來幾塊,蓋不上蓋子。在集裝箱里,華為就用人工智慧排兵布陣,幾秒鐘就制定貨物擺放的最佳方案。
- 基站規劃:華為的王牌業務,是建設通信基站。每個區域的基站建設,都需要一個高級工程師對線路的走位、基站的位置進行科學規劃。這是非常考驗經驗的,一個一年經驗的工程師,設計出來的效果可能比五年經驗的工程師差很多。眼看老濕傅不夠用了,華為就把他們的經驗值傳給 AI,然後讓 AI 輔助年輕的工程師做規劃。
2012年,距離後來 AI 圍棋大師「阿法狗」出山還有四年時間,華為就已經開始用人工智慧低調地解決業務難題了。從時間上看,他們算得上是人工智慧界的「老炮兒」了。
3)幫其他小朋友「補課」
小時候,老師都會安排班上學習好的同學幫助別人補習功課。華為比小朋友更自覺,既然自己的人工智慧已經相對成熟了,那下一步就是幫助其他企業一起進步了。
你可能了解,華為的行事方式就是:不看準不出手,一旦出手就不鬆手。2017年,華為終於覺得時機成熟了,於是整合成立雲事業部。他們雪藏多年的人工智慧技術「存貨」通過華為企業智能 EI(Enterprise Intelligence)開始對外服務,
這才有了開頭「圖片社怒懟盜圖君」之類的故事。
三、「吃素」的華為雲 & AI 平民化的漫漫長路
隨著研究的深入,我越來越想弄明白:華為在「AI 平民化」的過程中,到底想承擔什麼角色呢?
幾大巨頭裡,華為雲應該是最晚對外開放雲計算和人工智慧的公司(2017年成立「雲事業部」)。
,但有兩點讓它不能被忽視:
1、華為的體量巨大:它的營收等於 BAT 三家的總和;
2、華為的基因特別:同樣做雲計算和人工智慧,但 BAT 是從互聯網切入,而華為是從硬體和實體經濟切入。在「AI 平民化」的浪潮里,AI 被更多地用於實體經濟,所以實際上是 BAT 正在強行併入 H 的優勢賽道。
競爭對手的評價,可能最說明問題。前兩天我和國內公有雲 No.1 的阿里的同學吃飯,私下提到騰訊雲,他們談笑風生;但是提到華為雲,他們全都豎起拇指:「華為雲是值得尊敬的對手」。
很多人說華為有「狼性」文化。但在我心裡,華為其實是「吃素」的。
首先,華為不上市,不覬覦資本加持,更專註於民族技術本身。
其次,華為有著名的三不:不做應用,不碰隱私,不投股權。把自己的邊界劃得非常明晰。
當你說的「No」越多,你的「Yes」就越有重量。華為用近乎嚴苛的自我限制,使得各行各業天然相信它能提供穩定高效的產業工具。(這也是過去華為成功的經驗之一。)
讀懂這些,你就能感覺到:華為想為「AI 平民化」提供一個「穩定、高效、人人都能學會」的工具。
那位華為大牛告訴我,為了讓這個「深度學習平台」穩定、高效和易學,技術團隊做了很多技術努力:
首先,是軟硬體結合的部分(智商)
每個人都會思考,但人和人的智商可是不一樣的。
同樣,每個人工智慧都可以運作,但它們的「智商」也是不同的。
從腦科學來看,人類智商和每個人大腦神經元聯動過程的強弱快慢有很大關係。對應到人工智慧上,硬體之間的網路通信速率,網路帶寬,都是影響它「智商」的重要因素。而「網路通信」這些底層硬體的優化,是華為在運營商時代就開始積累的傳統強項。
在底層的硬體空間里,華為爭取把技術做得更前衛,這也是他們最能和阿里雲騰訊雲拉開差異的地方。
(注意,我把這種優化定義為「軟硬體結合部分」的優化。這種優化並不涉及「腦細胞」——也就是 GPU 本身——的優化。在計算晶元層面,華為和其他人工智慧服務平台並沒有區別。)
其次,是純軟體部分(學習技巧)
智商高的人並不一定成為人生贏家。如果把一個聰明的孩子放到山區的學校,一定不如他在北京四中接受頂級系統化教育學得好。這就是學習技巧的作用。
對應到人工智慧平台上,同樣有很多「技巧」。比如華為雲開發了一個叫做「Moxing」的平台(這個平台有兩個中文名字:模型、魔性),就添加了很多「特色服務」:
1)把深度學習的模型做成了不同的「套餐」,無論需要什麼類型的圖像識和語音識別,都可以像在麥當勞買套餐一樣,直接拿來就吃。另外還有類似番茄醬、冰水這樣的「輔助開發工具」提供,盡量提高人工智慧訓練的效率。
2)深度學習分為單機模式和分散式模式,以往如果想從單機模式切換到分散式模式,是需要重寫代碼的。而這對於很多企業來說非常不方便,Moxing 平台為這個事情也專門作了優化,一套代碼既能跑單機,也可以跑分散式。這同樣可以提升人工智慧訓練的效率。
類似這樣的細節還有挺多,它們都可以提升使用者的感受。不過在我看來,想要真正實現「AI 平民化」這個宏偉的目標,還需要更勁爆的東西。
之前也說到,人工智慧平台,從某個角度來說就是「共享經濟」。共享經濟能夠發展的動力之一,就是不斷把成本攤低。
而攤低成本有兩條路:
1、吸引越來越多的人加入這個共享社群;
2、利用資金和技術進步直接把成本降低。
這兩條路徑,是雞生蛋和蛋生雞的關係。而作為技術流的廠商華為,顯然會在第二條路上走得更遠。
舉個例子:
在大規模深度學習計算的時候,會需要非常多的 GPU 同時工作。而依靠現有的調度能力,在超過10枚GPU同時工作的時候,性能會出現很大程度的損耗(劣化)。簡單來說就是,即使1000顆 GPU 同時工作,效果也和10顆 GPU 差不多。
華為雲在做的,就是對軟體進行改進。讓他們引以為傲的一個數據是:在1000個 GPU 同時工作時,性能可以達到它們單獨工作時的80%。這個數據,在人工智慧界工業界應該算第一梯隊。而減少損耗提高效能,就是標準的成本節省。以至於這位華為的大牛羞澀地說:我們的優勢是「性價比」。。。
而能效提高,從另一個方面看就是時間的節省:
使用深度學習平台的用戶,目的往往是在平台上試驗出一套最好用的模型演算法。而這些演算法往往不是一次就能成功。就像「苦吟派」詩人那樣,吟安一個字,捻斷數根須。需要反覆調整參數進行試驗,才能讓識別率到達最優值。
在這個場景里,時間成本非常重要。你想,如果一個企業開發一個識圖模型就需要一個月的時間,就差不多等於你掃碼共享單車之後,十分鐘鎖才打開。。。所以,華為雲的深度學習平台,拚命做了優化,實現了讓一個模型在一天之內或者幾個小時之內搞定。
(想要體驗網址的私信我)
從業界來看,雲計算廠商都在把「人工智慧平台」作為下一個重點的業務。
就在前幾天,AWS 上海站技術峰會就透露了亞馬遜在人工智慧平台上的野心。這家全球頂級的雲計算廠商會通過AI平台提供圖像、語音、自然語言理解這三種能力,這和我們的民族雲計算廠商不謀而合。可見 AI 平民化,並不是我們一個國家的特例,而是一個世界潮流。
任何一種改變世界的技術,都不是上帝揮手拋到人間的。
我們今天能方便地用到電能,不僅要感謝法拉第發現了電磁感應,更要感謝愛迪生和西屋公司用商業的力量把它的成本降低到人人都能負擔得起。
人工智慧同樣如此。從圖像識別到機器翻譯,從「AI 反盜版」到「AI 找孩子」,普通人已經慢慢被各種 AI 技術包圍。
在它背後,是華為雲和無數人工智慧平台為了降低 AI 的成本做出的不懈努力。
再自我介紹一下吧。我叫史中,是一個傾心故事的科技記者。我的日常是和各路大神聊天。如果想和我做朋友,可以關注微博:@史中方槍槍,或者搜索微信:shizhongst。
不想走丟的話,你也可以關注我的公眾號「淺黑科技」。
推薦閱讀: