谷歌欲將個人突破性發明申請專利,雙方爭執引發專利與開放大討論

谷歌欲將個人突破性發明申請專利,雙方爭執引發專利與開放大討論

來自專欄 DeepTech深科技

幾年前,波蘭計算機科學家 Jarek Duda 發明了一種叫做不對稱數字系統(ANS)的重要新型壓縮技術。在發明這項技術之初,他就想保證所有人都可以使用,因此他沒有為這項技術申請專利,而是將其公開。自 2014 年以來,Facebook、蘋果和谷歌都基於 Duda 的突破開發了軟體。

圖丨 Jarek Duda

但現在,谷歌卻在申請一項專利,該專利試圖在視頻壓縮時使用 ANS 技術。Duda 對此表示不滿。

谷歌則否認了其試圖為 Duda 的發明申請專利。谷歌的一位發言人說,Duda 提出了一個不能直接獲得專利的理論概念,而谷歌申請的專利,是谷歌工程師經過額外工作,基於該理論的具體化應用。

但 Duda 提交了他在 2014 年與谷歌工程師的交流郵件,他當時的技術就是谷歌現在要申請的技術專利,這一觀點在 2 月很大程度上得到了歐洲專利局初步裁決的支持。

儘管歐洲的訴訟尚未結束,谷歌則依然正在美國申請專利。

從 3 月份開始 Duda 向媒體求助,媒體開始調查這個問題。經過幾周的反覆討論,谷歌終於提供了一份針對這一專利的正式聲明——一份非常乏味的聲明。它聲明,谷歌在其應用中包含了 Duda 先前的工作成果,但「我們依然在等並將尊重美國專利商標局(USPTO)的裁定。」

圖丨 Facebook 基於 ANS 開發了一個壓縮庫

但幾天後,谷歌就以不同的語氣發了後續聲明。

「谷歌承諾,長期且持續開源編解碼器 (如 VP8、VP9 和 AV1),並免版稅。所有這些編解碼器都可免版稅獲得許可,本專利也將如此。」

然而,Duda 不相信他們。「我們可以期待谷歌的善意,然而,這並不能保證什麼。以『免版稅許可條款』獲得許可的專利通常會有問題。」

Duda 希望谷歌承認他是最初的發明者,並在法律上保證所有人都可以使用這項專利。最好,谷歌完全停止申請這項專利。

ANS:更好更快的壓縮技術

計算機使用字元串 1 和 0 表示數據。例如,ASCII 編碼方案使用一個 7 位字元串來表示字母數字字元。

通常,符號會以不同的頻率出現,數據壓縮技術正是利用這個來表示數據。例如,在英文文本中,字母「e」出現的頻率比「z」或「x」要高得多。因此,用 7 位來表示所有字元可能不是高效的方案,而使用 3 或 4 位來表示常見的字母、使用 7 位來表示不常見的字母會更高效。

有一種標準的方法叫做霍夫曼編碼(Huffman coding),當處理概率為 2 的倒數的符號時,這種方法很有效。信息理論認為,最優編碼使每個符號的長度 (以位為單位) 與其概率的負對數成正比。例如,假設你要對符號 A (P=1/2)、B (P=1/4)、C (P=1/8) 和 D (P=1/8) 進行編碼。在這種情況下,最優編碼可能是 A=0, B=10, C=110, D=111。

圖丨霍夫曼樹

這樣編碼是最優的,因為 log2(1/2) = -1,所以 A 應該有 1 位表示,log2(1/4) = -2,所以 B 應該有 2 位表示,log2(1/8)=-3,所以 C 和 D 應該有 3 位表示。

但當符號概率不是 2 的冪的倒數時,霍夫曼編碼就沒有那麼好了。例如,符號 E (P=1/3)、F (P=1/3)、G (P=1/6) 和 H (P=1/6),霍夫曼編碼就不是那麼有效了。資訊理論認為,E 和 F 應該用 1.584 位字元串來表示,而 G 和 H 應該用 2.584 位字元串表示。

使用霍夫曼編碼時,有些符號需要用很多位來表示,而有些符號卻很少。因此,使用霍夫曼編碼技術壓縮數據通常會需要更長的時間。這不可能實現高效編碼。但是,如果放寬每個符號由特定離散位字元串表示的要求,則可以有效地表示非整數位的符號。

例如,一種稱為算術編碼的技術將實數行細分為 0 和 1 之間的數字,每個符號的間隔份額與該符號預計出現在數據中的頻率成正比。編碼首先識別與第一符號對應的區域,然後對剩下的區域進行細分(同樣,每個符號的份額與其頻率成正比),編碼第二符號,以此類推。

當所有的符號都被編碼後,系統就會使用一個長二進位字元串 (比如 0.1010010111010110…) 來表示與編碼字元串對應的數軸上的精確點。這種方法實現了接近理論最大值的壓縮。但是因為它涉及到任意精度分數值的乘法,編碼和解碼步驟在計算上代價很大。

Duda 的突破是開發了一種新的編碼方案,稱為非對稱數字系統 (ANS),它結合了這兩種方法的最佳特性。它可以像算術編碼一樣簡潔地表示一串符號,但編碼和解碼步驟像霍夫曼編碼一樣都很快。

這一技術已經被各大軟體公司迅速掌握。Facebook 基於 Duda 2016 年的工作成果推出了一種新的壓縮演算法,名為 ZStandard。蘋果公司在其 LZFSE 壓縮演算法中同時加入了 ANS。谷歌已經將 ANS 合併到其用於壓縮 3D 點雲的 Draco 庫,以及一種名為 Pik 的新圖像壓縮格式中。

Google 正在對基於 ANS 的視頻壓縮技術申請專利

壓縮圖像和視頻的方式與壓縮文本的方式基本相同。例如,壓縮軟體會查找圖像中比平均出現頻率更高的顏色或形狀的統計模型,然後,用較短字元串表示頻繁出現的模型,實現壓縮圖像。視頻編碼器通常使用數據的數學轉換來識別這一微妙的規律,然後就像處理一串字母數字元號一樣,使用基於 ANS 的演算法對來自視頻的圖像數據進行編碼。

Duda 不僅僅是開發了 ANS,他也是該技術的傳道者。2014 年 1 月,他給許多視頻編解碼器開發人員發了電子郵件,推薦 ANS 演算法,可用於類似 Google VP9 等視頻編碼格式。

參與開發 VP9 的高級技術專家 Paul Wilkins 曾回復說:「這不是現階段可以應用到 VP9 的東西,但未來的編解碼器值得關注這一技術。」

幾年後,谷歌提交了一項名為「混合布爾令牌 ANS 係數編碼」(mixed boolean-token ANS coefficient coding)的專利申請。就像任何專利申請一樣,這個專利申請里塞滿了法律術語。但專利中最重要的部分在法律方面的表述是相當清楚的。這是第一個主張使用熵解碼器狀態機概念的專利,該狀態機包括一個布爾 ANS 解碼器和一個字元 ANS 解碼器(這兩個版本的 ANS 解碼器都是 Duda 發明的),來解碼符號流。視頻被分解為「具有像素塊的視頻幀」,像素塊又由一系列變換係數表示,然後用這些符號來表示像素塊。

Duda 認為,這個「發明」只是將 ANS 應用於傳統的視頻解碼流水線。大多數有效的視頻壓縮方案都是將視頻幀表示為像素塊,並通過數學變換,使用可被高效壓縮的符號來表示那些像素塊。Duda 認為唯一重要的創新是該專利聲稱使用 ANS 來編碼這些符號。

在過去的幾個月里,外界多次要求谷歌聯繫一位技術專家,以準確地解釋谷歌的新專利究竟是什麼,以及它對比 Duda 的發明有哪些優勢。但谷歌一直沒有照辦,所以我們無法解釋谷歌是如何將自己的發明與 Duda 的原創發明區分開來的。這樣看來,似乎 Duda 認為谷歌的專利只適用於傳統視頻解碼器的說法就很說得通了。

事實上,這也是歐洲專利局在初步裁決中得出的結論。歐洲專利局 2 月份的一項裁決稱:「專利聲明 1 的主題事項中不涉及創造性步驟」,Duda 在 2014 年 1 月的郵件中提供的信息「足以使技術人員無需任何技能就能獲得新發明」。

這顯然是不利於谷歌的跡象。但歐洲的專利程序還沒有結束,外界也在等美國專利商標局的裁決。

目前的專利制度不利於發明人公開發明

ANS 被看作是算術編碼方案的快速替代品。這些方案是在 20 世紀 70 年代發明的,但很快就被專利阻礙,限制了其早期的使用。Duda 說,他決定不讓 ANS 發生這種情況。他希望通過公開自己的成果而不申請自己的專利,阻止其他人為這項技術申請專利,讓所有人都可以自由使用它。

圖丨美國專利商標局

專利系統可能最終會滿足 Jarek Duda 的願望:美國和歐洲的專利機構可能會拒絕谷歌的專利申請,讓所有人都可以免費使用 ANS。如果是這樣的話,這要歸功於 Duda 數月來的努力。

從理論上講,公開一項發明而不申請專利,足以使其進入公共領域。在授予專利之前,專利審查員會先搜尋現有技術,而現有技術都可以在出版物中找到。因此,如果一項發明之前已經向公眾公開,審查員應該發現這一披露,並利用它來拒絕專利申請。

問題是審查員不是無所不知的。他們沒有可以搜索所有已經發布的文檔的工具。即使有,他們找到的同一發明的出版物,也可能是用不同語言描述的。

專利審查員的時間也有限。在美國,一個典型的審查員總共應該在審查過程的所有階段花費 19 個小時。要理解一項複雜的技術,然後嘗試搜索每個曾經發布的文檔,查看是否有引用,這樣的時間並不夠。

在實踐中,美國審查人員經常嚴重依賴專利資料庫本身來尋找現有技術。專利資料庫是一種便於專利審查者使用的模式,而且它們已經經過技術類型分組,使得查找相關專利變得容易。因此,如果你申請了專利,專利局可能會阻止其他人提出與你的發明相似的專利申請。但如果你像 Duda 一樣,選擇不為發明申請專利,專利局可能不知道到你曾公開過這項發明,所以他們可能會授予其他人這一專利。

歐洲專利體系在審查過程中為 Duda 這樣的第三方提供了一種信息提交機制。Duda 利用這一機制在去年 10 月提交了一封信,指出他自己之前的工作與谷歌的專利有相似之處。美國專利局最近也推出了類似的機制,但這一機制讓發明者有責任監督專利申請,並反對為自己的工作成果申請專利。

Duda 說:「有很多像我這樣的人都希望自己的專利能被他人無限制地使用。」專利局通常只是檢查專利而不檢查那些文獻。如果某些東西沒有寫在專利里,他們就不太可能找到。

Duda 說:「如果這項專利獲得批准,就很難擺脫它了。他們可以以數百萬美元的價格起訴你,為了擺脫現有的專利,這需要花費數十萬美元。」

谷歌一直提倡開放視頻標準

公平地說,谷歌一直主張保持視頻標準不受專利限制。早在 2011 年,谷歌就表示將不再支持 Chrome 的 H.264 編解碼器,並與 Firefox 的開放標準一致。谷歌推出了自己的 VP8 編解碼器作為一個更開放的選擇。最近,谷歌推出了免版稅的 VP9 編解碼器,並宣布支持免版稅的 AV1 格式。

谷歌認為申請專利沒有改變什麼——它仍然致力於開放視頻格式並免版稅。

那麼,為什麼谷歌還要嘗試為 ANS 基礎的視頻申請專利呢?谷歌拒絕討論這個問題,我們也只能猜測。一個可能的原因是,為了防止其他擁有大量專利組合的公司申請專利。專利的界限從來都不是很清楚,所以即使谷歌試圖完全使用開放的、免版稅的編解碼器,它也要擔心有人會用適用於谷歌自身視頻的技術申請專利。

谷歌公司申請 ANS 專利也可能是一個簡單的官僚疏忽行為。谷歌擁有大量的專利律師,他們的工作就是儘可能多地獲得專利。沉浸在專利文化的熏陶下,他們可能根本沒有想到會有 Duda 這樣的人故意不為發明申請專利,而且可能會阻止谷歌試圖這麼做。

無論如何,Duda 不相信谷歌的意圖。他指出了最近谷歌自動駕駛汽車公司 Waymo 與 Uber 之間的訴訟。該案主要是涉嫌盜竊商業機密,但 Waymo 在訴訟中也包含了一些專利聲明(專利聲明在幾個月後被撤銷)。在 Duda 看來,這表明谷歌只會利用專利來報復起訴谷歌侵犯專利權的其他人。


推薦閱讀:

申請專利的最佳時機
5年1832件行政訴訟判定專利無效
小白撰寫專利

TAG:專利 | 專利申請 | 專利保護 |