如何評價微軟高級工程師對FaceID「我不知道蘋果打算如何繞開我這個專利」的發言?

相關答案鏈接:

叛逆者:FaceID技術和微軟使用在Surface上的WindowsHello有什麼區別?


這石頭看樣子是微軟發的,應該是工作期間申請的,屬於微軟的專利。
微軟和蘋果之間應該有IP合約,所以我覺得大概率是:不需要繞過。。。


基於目前的信息,一句話總結:別說怎麼考慮繞過了,該專利對face id的實現基本構不成任何威脅,根本無需考慮。

看到發明人自己的回答了,回想起以前跟很多技術牛人溝通專利方面的基礎知識時的崩潰體驗,感覺有必要更新一下。

首先,已經強調了很多遍,專利的保護範圍是以權利要求書為準!!!!!說明書只是用來解釋,不是用來確權的,不是說你說明書中寫了什麼就是什麼都在你的保護範圍之內了!!!!!
該專利權利要求書寫的很清楚,授權版本的權利要求1引用如下:

1. A method that facilitates constructing a computer-implemented three-dimensional representation of a head of a user, the method comprising:
receiving a plurality of red-green-blue (RGB) frames of the head of the user from a camera, the plurality of RGB frames captured by the camera over a range of time;
receiving a plurality of depth frames from a depth sensor, the depth frames being indicative of distances of respective portions of the head of the user from the depth sensor, the depth frames generated by the depth sensor over the range of time, wherein orientation of the head of the user relative to the camera and the depth sensor changes during the range of time;
identifying a feature of the head of the user in the plurality of RGB frames, the feature being one of a center of an eye of the user, a center of a nose of the user, a first nasal alar of the user, or a second nasal alar of the user;
aligning the plurality of depth frames with one another based upon the feature of the head of the user identified in the plurality of RGB frames;
in response to aligning the plurality of depth frames with one another, computing a three-dimensional point cloud based upon the plurality of depth frames being aligned with one another;
generating a three-dimensional mesh of the head of the user based upon the three-dimensional point cloud; and
texturizing the three-dimensional mesh based upon the plurality of RGB frames.

很清楚,該專利的主題名稱是一種方便構造用戶的頭部的計算機實現的三維表示的方法,也就是用來形成基於rgb圖的用戶頭部的三維模型的方法,其中使用了RGB相機獲得的RGB幀和深度感測器獲得的深度幀,通過特徵提取、對齊等一系列操作,最後基於多個RGB幀來紋理化三維網格。

表現出來是什麼意思呢?

大概就是這樣:

這是從深度信息建模形成的三維模型(圖1,只是示意)

這是在深度信息的基礎上結合了RGB圖像的三維模型(圖2,只是示意)

該專利主要就是從圖1到圖2的過程,所針對的就是要獲得更加準確的基於RGB圖像的三維模型(也就是要優化類似圖2的模型的效果,至於顯示不顯示倒是無所謂),該專利說明書背景技術部分也有清楚的描述。通過RGB幀紋理化圖1的三維網格形成。而具體類似圖1的網格是怎麼形成的,這不是該專利的重點,說明書中只寫了採用現有的技術,「深度感測器106可利用任何合適的技術來生成深度圖像。例如,深度感測器106可利用基於紅外線 的深度感測系統、飛行時間深度感測系統或任何合適的深度感測技術」。

好了,該專利授權權利要求1的保護範圍弄清楚了。判斷face id是否侵權,就看face id的工作過程是否包含了該權利要求1所有內容

現在看face id的工作過程:

首先,驗證的過程是根本不涉及RGB圖的,只需要獲得高精度、高效率的圖1類似的三維模型,和參考模型快速匹配就行了,這個大家都沒有疑義。

那麼關注註冊的過程:Youtube的實際視頻:https://www.youtube.com/watch?v=LVB1-sc0DRs 25秒開始

前置攝像頭工作,顯示的二維圖像

用圓環圈出人臉,依然是二維圖像

轉動,便於獲取各個角度的深度信息,依然是二維圖像。

然後設置結束。

好了,現在已經可以確認,face id的註冊過程中自始至終顯示的都是二維圖像,沒有涉及生成基於RGB圖像的三維模型(至少表現出來的沒有,你要強行說其演算法中偷偷的進行了這個操作,但是沒有顯示,那誰也沒法取證,不過也沒有實際意義不是嗎,沒有必要去做一件根本不需要做的事對吧)

另外,發明人認為:

把RGB攝像頭檔上,如果還能註冊,那就說明蘋果的演算法只要depth sensor,那肯定沒問題。

這也根本是毫無道理的神邏輯。

上面已經分析了,US9552668的RGB攝像頭是用來拍攝RGB幀,最後用來貼圖三維模型的。而face id註冊時雖然用到了前置攝像頭,但是其顯示的是二維圖像,跟US9552668完全不一樣,其可能是用於引導使用者的操作或者用於確認是使用者的臉在合適的位置而不是其他部位對著感測器。

也就是說,face id註冊時,雖然也用到了前置rgb攝像頭,但是其作用跟該專利完全不一樣,當然也不會侵權了。

如果該發明人認為,只要用到了rgb輔助註冊,那就肯定侵權,那隻能說,他把自己的專利想的太值錢了……………或者確實對該專利的價值判斷有誤?

因此,基於目前的情況來看,說face id的工作過程中侵犯了專利US9552668是完全站不住腳的。雖然我本人對Apple很不感冒,而且對於iPhone X的有限創新點與其漲價3000元這種嚴重不匹配的商業行為極其失望,但是一碼歸一碼,技術的歸技術,還是要實事求是的。

說實在的,大家不要把專利想的太神秘,一個領域的專利數量實在太多太多太多了(我天天看到肝疼。。。。。。心塞)。專利US9552668隻是涉及利用RGB幀和深度幀獲得更準確的三維模型而已,該領域也有大量其他的專利,真不是什麼驚天動地的專利,當然,相對於現有技術在某個方面有改進是肯定的,對於工程師的研究工作也是要肯定,但是該專利的地位真沒有大家想的那麼誇張。

—————————————更新線————————————

專利us9552668主要是為了基於rgb圖和深度信息更準確的顯示出虛擬三維模型,所以用到rgb圖像,而face id主要是用來進行識別,不一定需要生成結合rgb圖像的三維模型(目前沒看到,只看到用於結合到卡通表情中),即使需要生成,也不一定採用該專利授權權利要求書中記載的那一種特定的實現方式。face id更主要的是要進行更高精度更快速的進行深度建模,主要改進點應該是針對紅外發射器的投影解析度和紅外感測器,以及相關演算法,跟該專利的的技術改進方向有很大不同。

專利us9552668是利用深度感測器結合rgb圖生成虛擬三維模型,這樣你在屏幕上就能看到很像自己的三維模型,是深度掃描的上層應用,不是針對深度掃描本身的精度和效率進行的。說明書中對於深度感測器也是籠統的說採用常用的方案,例如結構光或者tof等都行,因為這不是本專利的重點。

face id則是需要實現高精度高效率的深度掃描以及快速與參考模型mapping,以確定是否是同一個人,這個過程根本不需要涉及rgb圖,只要紅外點陣發射器和感測器的解析度夠高,匹配演算法夠快就行,這也是為什麼face id可以黑暗中進行的原因,因為rgb攝像頭是不需要工作的。當然,後面可能也會出現利用face id結合rgb攝像頭生成自己實景三維模型的上層應用,但是用不用該專利的具體演算法就不一定了,畢竟這方面的演算法不是只有這一篇專利,其他很多專利也有,實現路徑不一樣。

判斷是否侵權的原則是要全面覆蓋,就是A的技術方案的實現要包含B的所有技術特徵,A才可能構成侵權。舉個例子,B要求保護一套傢具,包含桌子和椅子,桌子和椅子能互相組合達到很牛逼的功能。而A就是一個桌子,這個桌子上有很牛逼的地方,那雖然A裡面也有桌子,顯然也不可能對B構成侵權,只有當A包含B的所有東西的時候才可能侵權。

實際上,B也想只要求保護一個桌子啊,這樣誰都繞不開我(專業點的說法就是保護範圍很大),都侵我的權,豈不是美滋滋?關鍵是,桌子本身早就被別人(現有技術)佔領了,你只保護桌子根本不可能獲得授權啊。


首先,我說的是先建立3D模型,再識別。這是兩步。那個專利是建模的,正好是其中的第一步。所以,那些說「方向不同」的人,都可以散退了。

其次,註冊的時候需要正臉和略微晃頭,設備是RGB+D,輸出是個3D模型。正因為輸入、輸出、操作方式、設備,都一樣,所以我才說我不知道如何繞開。這也可以酸?

再者,有的人說那是depth sensor,不是蘋果的紅外光點。這是現代的白馬非馬論吧。這些人也可以散退了。

當然,進一步驗證也很簡單。把RGB攝像頭擋上,如果還能註冊(注意,是註冊,不是之後的識別),那就說明蘋果的演算法只要depth sensor。那就肯定沒毛病。


在這些問題下面總有一些陰陽怪氣的答案,自己沒什麼水平,看不得別人牛逼。總的來說,向別人學習並不是一件恥辱的事情,別人跟自己學習也不是見不得光的事情。龔大當然有向我傳授很多圖形學的知識,我也不是只從他一個人學習,他也不是什麼都沒有從我這裡得到,這些都沒有什麼丟人的。教別人當然可以自豪,這也是應該的。

而且帶入門這種事情,也是很正常的。一個人在一個領域上總是會遇到很多人比自己厲害,你向他們學習,第一個當然是帶你入門的。這跟後面的無限多個一樣重要。你自己牛逼了,遇到無數個人向你請教,有些人以前沒有碰過,你就帶他入門了。這種事情是經常發生的。

最後,每個人都有自己擅長的東西,小圈子裡都是大家互相傳授知識的,而且往往並不局限於技術上。只是最後有沒有用上是吧,這個得看臉。

P.S.

龔大的圖形學自然是很厲害的。有些時候我遇到了工程上的問題,總的來講這樣的問題比起學術上的問題,更具有不確定性,更加需要收集大量的信息才可以得到答案,但是每次龔大總是可以指出來大概考慮的方向,而且都是有用的。像這樣的人,除了經驗豐富以外,沒有別的解釋了。就算你跟愛因斯坦一樣高智商,但是你做過的項目不多,一樣做不到。


你不明白,龔大不用暗諷,他就是明說覺得這個專利被侵犯了,也沒什麼問題。

反正說歸說,龔大要是樂意去起訴就是了,不起訴的話人家就是顯擺下專利,難道不是很光榮的嗎(逃


「陰陽怪氣」真是個好詞,看一個人不爽但是自己又挑不出問題的時候用它准沒錯。
如何看待?我圖形學技術不如龔大十分之一,不敢看待。
那個專利的事,不就只有「繞開了」、「沒繞開」以及「完全無關」三個答案嗎?你看看那些諷刺的人答的是什麼。
有的人可能在學校里工作中看到牛逼的同學和同事覺得是大神,可是到了網上,只要你不是比爾蓋茨,他們都瞧不起,總能挑出一堆毛病。


被摺疊了,有趣。

那好吧,補點正經的東西。

龔老師他的確有放這種話的資本。雖然稱不上是微軟圖形學第一人(龔大之前在他自己的某個答案中提到過,微軟還有一位他更尊敬的女性圖形工程師),但他的圖形學功力,即使不提他對《光環》的貢獻,僅憑他在實現Fluent Design設計語言中所做的大量工作即可見一斑。

不明白為什麼有些人見到微軟的人或物就要拿出來酸一遍,彷彿一切都是蘋果創造的才是最好的。別忘了,蘋果沒讓每個人都用上圖形界面計算機,微軟才是做到的那一個。所謂吃水不忘挖井人,一些人卻有奶便是娘,實在有趣。

=========以下是原答案=========

勃勃 是你嗎

==================

上電腦看了一眼 不是勃勃 大家散了吧


不懂這方面的技術,但是根據IT課程裡面學到的,一個功能並不只有一種implementation,也許蘋果和微軟互換專利包括了這個技術,也許蘋果自己implement了。所以我覺得這個答主這句話重點也許是「裝個X」(但是人家確實真牛逼有資格說這個話)。如果真的想知道,直接問微軟相關部門就好了,有沒有把專利授權給蘋果。因為據我所知目前蘋果沒有微軟數量這麼多的工程師在知乎跳身份,所以在知乎說這句話明顯不是為了得到答案。


一段時間之後你會發現,很多人都去稱讚 iPhone X 的顯示屏鮮艷生動,然而並沒有人知道這是三星的功勞,甚至很多用 Galaxy 設備的人都沒覺得 Super AMOLED 有多鮮艷。


下面這句話我對好壞不做評論
「在抄襲創意這件事上,我們向來是厚顏無恥的」


我覺得申請一個「立體建模」的專利可以秒殺全球了


不是「他」的專利, 是微軟的專利。微軟和蘋果有IP交叉授權。


當年webOS的卡片式多任務屌不屌?
然後Palm倒台後,水果直接接盤了當年設計這個feature的人…
後來的事情大家都知道了~
記得以前有人討論過如果抄襲得比原創還要好,要如何評價?
我跟你說,搞研發搞產品的那一撥人都是絕頂聰明的人精,你的idea很容易在他那邊變成一個更bigger的idea,以及考慮到法律上的規避~

但到底算不算抄?或者抄了幾成?優化了幾成?
大概只有當事人心裡明白。


他還曾經說過120hz沒意義呢,因為UI渲染沒必要做到120hz,做到60就夠了。他們做過實驗,做到120hz之後耗電但體驗沒增加。

叛逆者:如何評價蘋果 WWDC17上宣布 Apple Pencil 在iPad Pro上延遲僅 20ms?

至於結果,你去問問那些體驗過iPad pro上120hz的人吧。

這次也是啊,站出來說「我們做過了,暗示蘋果是抄襲的」。實際上呢,看那個問題下的高票答案貼的專利細節吧。


專利是否被侵犯大概專業律師比專利技術發明人更有說服力吧?
另外說不定蘋果和微軟有專利互換?


有些人被我乎封了一萬次賬號,還在這裡四處挑釁,可惜撞到了鋼板上。

先說一下我們的微軟高級工程師,從技術層面說,銀河系第一象限實時渲染領域第一人當之無愧吧,知乎的「叛逆者」(龔敏敏)是地球上實時渲染領域最牛的人之一嗎?

他的學生遍布全球,包括浙大教授周昆都是他一把屎一把尿帶大的,然而技術上的卓越並沒有給他優越感,而是一顆平常心,一個與世無爭,低調的心態,比如

他懂得推賢進士,把名譽留給最器重的學生,讓周昆作為他引以為傲的Halo項目(有5個轉基因,哦不,有5個技術哦)負責人,而把自己的名字低調的寫在其他5位徒孫之後,這種精神有幾個senior能做到,這就是微軟的企業文化:隱忍,低調,專註於技術。

這次的蘋果微軟專利之爭,肯定是蘋果大敗,可惜我們的大神不想與庫克鬧得不開心,所以就放棄了訴諸法律的權力,這種精神也是我們應該欽佩的。

最後,祝龔大大每天開開心心,工作順利,祝夜勃早日自殺成功,下個賬號再見。


爭三小。

假如真是 Apple 買專利的話,也不見得非得被這些大神們知道。

但 Apple 沒這個過程、反而繞開專利的話,那也是他們的事情。

你們這樣爭出翔來,能吃嗎?

與其抽時間混這種存在感,還不如做點別的事情享受享受。

# EOF.


龔大的問題是:「我不知道蘋果如何繞開我這個專利」。


既然到現在作為蘋果新產品最大的亮點還沒有惹上麻煩,那足夠說明蘋果已經成功地「繞開」了。

而且,以我一個普通人的腦力,我也能想到,蘋果在做face id之前,windows hello已經存在了很久,那麼,關於「如何繞開」,蘋果鐵定很早就做了工作,也理所當然地有了答案。

所以,「成功繞開」基本上99%是板上釘釘的事情,不然,龔大此刻應該沒有時間在知乎上抱怨,而是已經和律師緊鑼密鼓地工作了。

至於「如何繞開」,看起來龔大還不知道,微軟的法務可能知道(如果繞不開的話),蘋果的法務一定知道,我們這些看客自然是不知道。我個人也是很好奇如何繞開的,持續關注,希望能看到答案。


我很佩服龔大的技術實力,但對他的為人處世態度不太喜歡。
譬如這次,龔神本人裝逼是有點過頭。我喜歡微軟是因為微軟的謙遜過硬的實力。可龔神卻沒有讓我看到謙遜。
還有軟飯們,請不要為這件小事和別人大動干戈,這樣不僅不講道理,還會給我們軟飯和微軟留下一個污點。
最後祝蓋茨老爺子永遠健康!


全線蘋果產品果粉表示,你就用就完了,他有這個專利他是真懂而且真厲害,蘋果也不是都是對的,產品好用沒錯,但是專利戰作為用戶就不用關心了。有啥用啥。而且人家說的沒毛病。


推薦閱讀:

對異性來說,看起來成熟的臉會更有吸引力嗎?這個會有性別差異嗎?
頭部向肩膀左右傾斜 15 度以上就能躲過人臉識別系統是真的嗎?
「臉盲」與「閱讀能力」真的相關嗎?
人臉識別的技術能判斷區分兩個雙胞胎或者長相非常相似的人嗎?
人臉識別技術處理「圖中有幾張臉」之類的圖片會有怎樣的結果?

TAG:微軟(Microsoft) | 蘋果公司 (Apple Inc.) | 人臉識別 | iPhonex | Face ID |