觸摸現實:顛覆手機的下一個十年
來自專欄 科技雜談
文/王胖子
【1】
自上個世紀以來,包括手機在內,整個信息通信業的科技創新,都一直以十年左右的周期,重複著自己的顛覆節奏。
1987年11月18日,中國第一個模擬蜂窩行動電話系統在廣東省建成並投入商用,俗稱大哥大的摩托羅拉手機第一次正式進入中國大陸市場。
1997年,中國電信的GSM用戶突破1000萬大關——是的,這時它和中國移動還沒有拆分。這一年,摩托羅拉發布了歷史上第一款摺疊手機,菲利普·卡恩(Philippe Kahn)也發明了全球第一部拍照手機,而諾基亞取代摩托羅拉,成為了全球最大的手機生產商。
2007年,TD-SCDMA開始在中國十個城市大規模建網。這一年,喬布斯在Macworld大會宣布,"蘋果將重新發明手機",而當時全球手機老大諾基亞,對其不屑一顧。
從沒有手機,到模擬手機,到功能手機,再到智能手機,每一次都是徹底的顛覆。
而每一次顛覆的背後,都是人類在無線通信、材料工程、集成電路、應用軟體、互聯網路等科技領域的科技演進的"量變到質變"。
【2】
然而,從2007年iPhone將我們帶入智能手機時代,一直到現在,我們仍未看到手機有新的顛覆式創新出現。
事實上,在這11年里,從基礎科學到應用科學,從通信到網路,從雲到大數據,從人工智慧到虛擬現實,全世界的科技創新積累已經天翻地覆,但為何時至今日,它們仍未能彙集出手機的新一輪顛覆變革趨勢?
或者說,如果這個顛覆即將出現,那麼,它將出現在何處,又將如何定義手機行業的下一個十年?
關於這個問題,已經有很多的猜測。
有人認為,顛覆的引爆點將會來自石墨烯,這種超級材料帶來的各種性能飛躍,將為手機的創新,製造廣闊的空間。
也有人認為,顛覆會來自柔性材料,它可以讓手機打破形體的束縛,以更具想像力的可能性,來重新定義手機,甚至以其他的終端形式取代手機。
還有人認為,顛覆會來自於人工智慧,它將在各個垂直領域不斷突破,乃至以更人性化的"器靈"方式,重塑手機給我們的功能和體驗。
【3】
但在我看來,以上判斷可能都不準確。
無論石墨烯還是柔性材料,它們雖然已經有很多激動人心的數據與案例,但要真正走出實驗室,並實現大規模的產業化和商業化,還需要一個不短的時間過程。
而人工智慧並不是一個獨立的進程,在人類發明真正通用的超級智能之前,它更現實的情況,是以春風化雨的方式,融入到各個垂直領域,實現能力的提升。但它本身卻還難以為我們創造一個獨立的、爆髮式的顛覆體驗。
我認為最重要的,是交互方式。
最早,模擬手機只能用於打電話,與人沒有交互。
功能機時代,通過鍵盤的交互,手機可以用來發簡訊、上網,以及最原始的其他應用。
在智能機時代,觸摸取代了實體鍵盤,讓手機真正變成了我們大腦和手的延伸。
如果沒有這種觸及到交互層面的深刻變革,那麼,其他的創新再多,也做不到真正開啟下一個時代。
所以,也有很多人,把語音交互,尤其是近幾年來,在深度學習人工智慧驅動下的語音交互,作為下一次顛覆的希望。
但問題在於,且不論目前還未能徹底攻克的語音識別率問題,僅僅是語音交互方式的效率、外界干擾影響和私密性,就限制了它的應用場景,使它難以以一個完整的獨立體系來實現顛覆。
【4】
真正的變革,更可能來自另一個方向:虛擬與現實的融合。
注意,我這裡說的是方向,而不是技術,因為它會是包括了3D結構光、虛擬現實技術、5G、人工智慧、大數據等多個領域的技術在內,最終在這個大的方向上,匯聚成為手機功能與體驗突破的合力。
如果說,在智能手機時代,手機取代電腦,成為我們在虛擬世界的信息中樞;那麼,在下一個十年,手機將有望消弭虛擬與現實的邊界,幫助我們用現實塑造虛擬,以虛擬觸摸現實。
在這方面,有太多的想像空間。我可以簡單列幾個:
(1)手機可以精確地識別人臉、表情、手勢等指令,它與我們的交互可以突破屏幕限制,更方便、更多元,而且可以適用於更多更複雜的環境。
(2)手機應用可以實時獲取現實世界的信息,並將其實時投射到虛擬世界中,從而為創造更豐富的應用場景。
比如未來的遊戲,我們可以使用與自己相同體型、身材甚至面貌的角色,甚至代入我們身邊的場景;
未來的購物,可以實時測量我們身體、房間等各種需求數據,獲得量身定製的個性化商品,而且可以先在線上"試穿"、"試擺放",滿意了再確認購買;
未來的工匠,可以對著一片空氣,就用手捏出滿意的作品模型,然後通過3D列印完成;
未來的電話,我們不再是語音或視頻,而是像科幻電影里一樣的三維投影,彼此清楚看到對方的動作和表情;
未來的安全識別,不再需要驗證密碼,因為人的面部特徵遠比指紋更加複雜,三維的人臉識別也將能做到比指紋識別更準確、更安全、更方便。
……
這些,都能讓我們獲得完全不同的,顛覆式的手機體驗。
【5】
我認為虛擬與現實的融合能成為下一個顛覆的另一個重要原因,是它的技術積累已經比較充分,而且已經走到臨界點。
(1)現實數據的採集:
這方面,最重要的就是要讓手機對現實世界的位置數據採集,從二維變成三維,才能真正在虛擬中還原現實世界。
(2)數據的傳輸:
空間數據從二維變成三維,意味著數據量的指數級增長,而且要實現虛擬與現實的真正融合,對於數據的傳輸與處理時間也有更高的要求。
這意味著,我們需要帶寬更高、時延更低的數據傳輸系統——這也是相對4G網路來說,5G實現的最大性能提升之一。
(3)數據實時的智能化的處理:
這方面,需要人工智慧、AR/VR/MR、大數據等相關領域的提升,比如更高效的人工智慧演算法、更適合人工智慧運算的AI晶元、面向虛擬現實的各種應用,以及相對應的數據處理系統等等。
我們看到,以上各個領域,都在最近幾年有長足的進展。
比如,按照預期,包括中國在內的很多國家,都將在未來1年內啟動5G商用。
【6】
整個技術鏈條中,最核心也最重要的,是三維數據的採集環節。
在這方面,科技巨頭們很早就已經在做準備。
比如英特爾此前推出的RealSense解決方案,就通過多組攝像頭捕捉2D圖像,經過計算變成實時的3D圖形,從而試圖將一切"看到"的視覺數字化。
而高通的和Spectra 模塊項目,則通過前置的iris 生物識別模塊和視覺攝像頭模塊,讓手機具備3D結構光(SLiM)的識別和處理能力。
當然,高通與英特爾都還處在行業的最上游,它們的技術從提出到真正成熟,再應用於終端產品,也還需要產品。
所以,另一個事實更具有標誌性意義。
2018年5月10日,OPPO成功實現全球首個採用3D結構光技術的5G視頻通話演示。
這意味著,我前面提到的,無論是三維信息的採集、傳輸還是實時處理,它已經實現了真實的應用。
【7】
我們來看一下,OPPO批露的一些細節和數據:
傳統的RGB攝像頭通過采象的元件把環境光、自然光、太陽光呈現出來的光線效果採集起來,形成圖像。
3D結構光則是通過固定的發光源發射光線,投射到物體表面,再通過採集設備收集物體表面反射呈現出來的反射映象,並通過採集設備上的演算法,分析出來這個景物在3D環境中呈現的反射效果,分析它的景深信息,進行3D結構構造。
它與過去的單攝像頭或雙攝像頭的區別是:
單攝像頭無法確認深度信息和形狀信息,雙攝可以通過演算法實現厘米級別的深度信息檢測,3D結構光則可以實現毫米級別的景深信息檢測。
OPPO表示,3D結構光可以達到百萬分之一級別的識別精度,遠超指紋識別的五萬分之一。可以通過演算法,精確地錄入用戶的面部信息和比對信息,從而帶來更安全的支付環境。
而在女性用戶最關心的美顏功能上,3D結構光也可以帶來巨大的提升。
過去,在面部特徵的精度上,2D美顏的精度無法做到完美,所以美顏度越強,美顏效果越讓人感覺不真實。
但有3D結構光技術後,可以對人面部的輪廓實現幾千點甚至上萬點的特徵點提取,把立體信息全部提取出來,這樣無論面部磨皮、美白、大眼還是瘦臉,都能做到更精細、真實的美顏。
以OPPO的結構光為例,它可以生成一張精度達到0.6毫米的3D人臉模型,精確區分眼睛、嘴唇、鼻子等器官,並根據這些信息進行高精度磨皮、美白、瘦臉,甚至是模擬影棚燈光效果的3D補光渲染,或是進行精確的AR貼紙與調整人物表情。
【8】
OPPO是安卓手機陣營中,首個實現3D結構光技術的廠商。
據透露,OPPO 3D人臉識別已經具備量產條件,預計在未來6個月內推出商用終端。
在此之前,全球實現3D結構光技術應用的手機,只有2017年11月上市的iPhone X一款手機。而直到現在,iPhone X也還未實現基於3D結構光技術的5G視頻通話。
值得注意的是,過去中國手機企業的技術創新和產品迭代,大都依賴於供應鏈的革新。但現在,OPPO的3D結構光卻是其自身主導完成。
據了解,OPPO於2017年底成立自己技術團隊,藉助自身技術積累,瞄準結構光技術進行攻關。按照OPPO的計劃,要在最多6個月內全部完成包括結構光發射端,接收端和結構光解碼晶元在內的,整個硬體方案的選型,硬體預研,試產和驗證工作。
彼時,OPPO這一計劃一度被其他廠商視為"不可能完成的任務"。但最終,OPPO在半年時間裡實現了4輪硬體方案迭代,一舉完成了年底訂立的目標。
而且,相比蘋果需要3萬結構光紅外線點才能生成2048維的人臉安全特徵碼,OPPO方案只要1.5萬個,識別人臉時間只要0.1秒,且可用於摺疊屏幕之上。
更重要的是,基於5G的3D視頻通話演示,意味著OPPO所實現的,不僅僅是三維信息的採集,而是已經走完了從三維信息採集,到數據傳輸和實時智能處理的整個流程,真正意義上實現了虛擬與現實的融合。
據透露,在OPPO此次完成的演示中,5G下行速度已達到1.4 Gbps,上行速度也達到160Mbps。
這得益於OPPO多年來的技術創新積累。
比如,目前在全球OPPO已擁有超過1000件5G通信標準專利。所以,在5G尚未開始規模商用之前,OPPO已經能實現5G與3D結構光技術的應用融合。
此外,在國內還沒有成熟的3D人臉識別演算法情況下,OPPO的3D人臉識別演算法也是自主研發。
據透露,OPPO的演算法團隊與硬體團隊深度合作,已在全球完成10萬人次的3D人臉數據採集,並搭建了一個500TFlops大型訓練伺服器,整合業界一流供應商,經歷10輪迭代訓練後,最終完成具有自主知識產權、識別精度達到百萬分之一的3D人臉識別演算法。
就目前而言,OPPO領先一步,但可以預期,在它的刺激與帶動下,更多虛擬與現實融合的技術與產品,必然會不斷湧現出來。
或許,顛覆用戶體驗、重新定義行業的新產品,就會在不久誕生。
推薦閱讀:
※深剖:全流程項目管理平台最敏捷如何做到 AI 自動化?
※Confluence 6 站點高級自定義
※索尼在家研發5年又出黑科技 —— TOIO 震撼玩具圈
※「藍色巨人」終於出手,在京發布全新晶元架構!IBM聯手NVIDIA欲對Intel「釜底抽薪」