小裝置,大未來:量子機器學習1.0時代

小裝置,大未來:量子機器學習1.0時代

來自專欄人工智慧學習筆記7 人贊了文章

編譯:集智翻譯組

文章來源:medium.com

導語

量子機器學習不知不覺已經進入1.0時代了。這個如此讓人興奮的新領域,不僅可以幫助我們更好地進行機器學習,還有助於我們對機器學習進行創新,甚至重新定義我們對於機器學習的思考方式。

量子機器學習是量子計算的新流行語。這個新興領域除其他外,還要求我們了解如何使用量子計算機進行智能數據分析。在Xanadu公司,對於量子機器學習,我們是非常興奮的並且花了很多時間來思考它。下文是具體原因。

首先,重要的事要注意,量子機器學習是非常年輕的,這意味著尚不清楚能從中期望得到何種結果以及商業應用。這在西班牙畢爾巴鄂舉行的量子機器學習會議上的「量子遇見行業」小組中得到了證實。當被問及商業投資量子機器學習的時機是否成熟時,來自IBM,微軟和美國宇航局等單位的專家們對他們給出的回答顯然非常小心。儘管如此,今天幾乎所有涉及量子計算的公司,包括該小組的代表們,都有一個機器學習小組。

對於量子計算機用於機器學習任務的前景,比如說五年之內——如果連「大玩家們」都在努力做出關於這個問題的明確陳述,那麼像Xanadu這樣的量子計算創業公司應該加入進來嗎?我們認為答案是肯定的,並且希望提出三個論點:

  • 早期的量子器件是不斷增長的AI加速器集體的新成員,從而使機器學習成為現實。
  • 量子機器學習能夠導致新模型的發現,從而使機器學習得到創新。
  • 機器學習,尤其是量子機器學習,將越來越多地滲透到量子計算的各個方面,重新定義了我們對量子計算的認知。

讓我們逐一了解這些觀點。

1.助力機器學習

早期的量子器件在它們的編程模型、通用性、其所承諾的量子優勢,以及它們運行的硬體平台等方面各不相同。總體而言,它們與研究人員在20世紀90年代該領域起步時所設想的通用處理器截然不同。對於機器學習,這可能是一個特徵而不是一個缺陷。

1.1 量子器件作為專用AI加速器

一個「量子 ASIC」的例子是一個集成的 nanophotonics 晶元,它實現了一個固定數量模式 (這裡對應於黃色光束) 的玻色子取樣。如果我們增加了模式的數量,玻色子取樣很快就會在經典計算機上變得難以解決。

當前許多量子技術類似於特定用途的硬體,如專用集成電路(ASIC),而不是通用CPU。它們通過硬連線來實現有限的量子演算法。 可以對更先進的量子器件進行編程以運行簡單的量子電路,這使得它們更像現場可編程門陣列(FPGAs),即使用低級硬體專用硬體描述語言編程的集成電路。在這兩種情況下,都需要熟悉硬體設計和限制才能運行有效的演算法。

一個 FPGA (左) 和 IBM 16 量子比特晶元的示意圖(右)。近期量子器件可以與 FPGA進行比較,因為它們還包括具有面向硬體編程語言的本地可編程門。圖源:https://quantumexperience.ng.bluemix.net/qx/devices

ASIC和FPGA在機器學習和人工智慧中得到越來越多的應用,它們的輕量級架構減少了中央處理器的負荷,並自然地適合它們專門從事的任務。如果當前的量子技術類似於這種經典的特殊用途硬體,它們可以在機器學習中找到類似的應用。這甚至沒有通用量子計算和指數量子加速器。

「隨著我們開發了越來越新的技術來推進通用人工智慧,量子技術最終或許能在混合的AI 硬體中佔有一席之地。」

看看最先進的AI 解決方案, 就會發現它們已經使用了混合技術。越來越多的計算工作被放在了邊緣特殊用途設備上完成, 在這些設備上技術與環境存在著相互作用 (如在手機中的指紋解鎖或相機中的笑臉檢測)。在頻譜的另一端,計算工作在GPU 集群上進行 (例如, 通信路由或標記照片)。事實上,現代 GPU 本身已經是一種技術融合了: Nvidia 最新的沃爾特晶元包含的低精度的張量核ASICs 就是專門為加速神經網路的訓練而設計的。Google 遵循了同樣的路徑,設計張量處理單元 (TPUs)來支持 TensorFlow 機器學習框架。簡而言之,AI 已經包含了異質性。量子技術最終可能在AI 硬體的混合中佔有一席之地。如果我們想朝著通用人工智慧的方向發展,這種混合必須儘可能地強烈。

最後, 硬體可以顯著地塑造軟體的發展。從2010年以來,GPU的使用促進了神經網路模型的復興(已經存在數十年, 但基本上因無法訓練而被丟棄)。同樣地,加速發展的量子技術可以為提升特定的機器學習方法在可行的、甚至是尖端的領域做出自己的貢獻。對於那些難以用經典硬體進行訓練並被更方便的競爭者取代的方法,情況尤其如此。

未來的人工智慧和機器學習應用程序將需要多個硬體平台, 其中每個組件負責某些子任務。早期的量子器件可以在 AI 加速器的低通用性 (但高速度) 端找到它們的位置。終有一天,一個糾錯的通用量子處理單元 (QPU) 可以將頻譜向右側進行擴展。

1.2 量子計算機擅長什麼

如果最初幾代量子器件可以被認為是特殊用途的 AI 加速器,那麼量子計算機究竟能為機器學習和 AI 貢獻什麼呢?為什麼我們要使用 「量子ASIC」?讓我們來看看一些激動人心的候選任務, 即優化、線性代數、取樣和內核評估。

優化

與機器學習一樣,優化是量子物理中的一個突出任務。物理學家 (和量子化學家)

通常對在高維能量格局中尋找最低能量點感興趣。這是絕熱量子計算和量子退火的基本範式。毫不奇怪,在機器學習的背景下, 量子計算機的首要任務之一就是優化。D-Wave量子退火是一種能解決所謂二次無約束二元優化問題的特殊用途器件, 它早在2008就被用於求解分類任務。最近,提出了變分電路的混合量子經典技術。其中,用量子器件評估一個難以計算的成本函數,而經典設備則基於此信息執行優化。

線性代數

當談到機器學習的潛在指數量子加速器時,人們通常是指量子計算機在執行線性代數計算時的固有能力。這一說法有許多微妙之處,其在短期內對硬體的展望並不總是明確的。其中一個瓶頸是數據編碼:將量子計算機用作大矩陣乘法和 eigendecompositions (不同於TPU)的一種超快速線性代數啟用碼,我們必須先將大矩陣 "載入"到量子器件上,這是一個高度非平凡的過程。

如果我們把描述量子門的矩陣解釋為神經網路的線性層,我們就可以想像出柵極是如何連接輸入和輸出的(最終是量子態的振幅)。一個量子比特門能以高度對稱的方式變換一個指數大向量。左: 任意單個量子比特門應用到五個量子比特的第三位第三個五量子位元。右: 任意兩個量子比特門應用於五個量子比特的第三和第四位。每種顏色代表不同的「權重」。

然而,將量子計算機理解為快速線性代數處理單元可能會有近期的好處。從數學上講,量子門可以將指數大的(或無限大的)矩陣與同樣大的向量相乘。因此,特定的代價高昂的線性代數計算(即與量子門對應的) 可以在量子計算機上的單個操作中完成。這一觀點在用量子演算法構建機器學習模型時是有利用的,例如可以認為量子門是一個巨大神經網路的 (高度結構化) 線性層。

採樣。所有量子計算機都可以被理解為取樣器,用於準備一個特殊的分布類(量子態) 以及通過測量值從這些分布中取樣。因此,一個非常有希望的途徑是探索如何利用量子器件中的樣本來訓練機器學習模型。對於這一問題,已有工作針對玻爾茲曼機和馬爾可夫邏輯網路進行了研究,其中所謂的吉布斯分布發揮了重要的作用,其受到了物理啟發,因此可以相對容易地用物理系統實現。

每一個量子計算機基本上都是一個取樣器,它從一個簡單的概率分布到所有可能的測量結果, 計算一個更複雜的分布, 並通過測量來取樣結果。因此量子器件是基於抽樣的訓練的有趣協助, 例如玻爾茲曼機。

「我們應該把早期的量子計算機看作是小型的、部分可編程的特殊用途器件, 其可以為機器學習接管耗時的工作, 而這自然很適合它們。」

內核評估。Xanadu的一個最近想法*表明了為何機器學習中有更多具體的任務可以被量子器件處理。如何有更多的具體任務,機器學習, 可以接管的量子器件。核方法使用機器學習模型,其以數據點間被稱為內核的距離度量為基礎。內核方法使用基於數據點之間的距離度量的機器學習模型,稱為內核。量子器件可以用來估計某些內核,包括那些很難以經典方式計算的核。量子計算機給出的估計可以被送入標準內核方法中,如支持向量機。推理和訓練以經典的方式進行,但增加了專用量子器件。

參見:

medium.com/xanaduai/ana

「量子核」的思想是使用量子器件通過估計兩個非常高維量子態的內積來計算數據點的核。內核給出的估計之後可以被輸入到經典機器學習模型中進行訓練和預測。該圖取自這篇論文https://arxiv.org/abs/1803.07128。

總之, 我們應該將早期的量子計算機看作是小的、部分可編程的專用設備,而不是像GPU助力深度學習那樣加速機器學習的特定任務。

2. 創新機器學習

除了助力現有的機器學習技術外,量子機器學習還有潛力提供更多的東西。最近,越來越多的物理學家接受了量子理論和量子計算方法的訓練,開始思考機器學習的問題。讓物理學家們進入機器學習領域已被證明是卓有成效的——回想一下物理學家約翰.霍普菲爾德(John Hopbeld),他把對伊辛模型(Ising model)的深刻認知帶到了機器學習領域, 並創造了Hopfield神經網路*中的聯想記憶。量子計算可以引出全新的機器學習模型。這些新的模型是為量子器件量身定做的, 其可能工作的很好,而同時機器學習界的人們可能根本沒有想過。我們將用量子機器學習中兩個被積極研究的例子進行說明。

參見:en.wikipedia.org/wiki/H

2.1 從量子分布取樣

Amin et al. (2018) *的結果顯示了在訓練期間, 經典玻爾茲曼機 (BM) 和兩個版本的量子玻爾茲曼機 (bQBM 和 QBM) 的目標和模型分布之間的 KL 散度。經過幾次迭代後, 兩個量子模型都表現出了比經典模型更好的結果。[圖已略有調整]

參見:

journals.aps.org/prx/ab

上面已經提到量子器件擅長取樣。例如, 量子退火可以用於從吉布斯分布中近似取樣來訓練玻爾茲曼機。但這並不簡單, 因為量子器件實際上準備了一個量子吉布斯分布。研究人員沒有試圖 "使事物成為經典", 而是研究了如果我們使用自然量子分布的話會發生什麼。事實證明, 在某些情況下, "量子樣本" 對訓練非常有用, 如上圖所示。

「發現新的機器學習模型類似於在一個未知的島嶼上尋找黃金。在量子機器學習方面, 我們在第一個海灘發現了一些非常有希望能找到黃金的跡象, 這就是為什麼我們正在建造更好的探險裝備並準備進一步冒險——我們對可能的發現感到興奮。」

2.2 變分量子電路

作為第二個例子,考慮一個可編程的量子器件,其中 「可編程」是指一些可以調整的設備參數,用以改變其他特殊固定計算的規格。我們將其中的一些參數設置為輸入數據 x ,並將其他參數與可訓練變數θ關聯起來。該設備最終給我們一些輸出 y = f (x, θ) ,其依賴於輸入和變數。這樣的量子器件 (這個描述確實很通用) 實現了一個監督學習模型。這個模型有時被稱為變分分類器,它與變分 (即可訓練) 量子電路的概念有關。以類似的方式,

我們可以建立無監督模型。

可編程量子器件可被解釋為一個計算 y = f (x, θ)的有監督機器學習模型 。可訓練參數θ可以通過經典優化方法來學習。該圖取自這篇論文https://arxiv.org/abs/1804.00633

量子器件計算的函數 f 可以具體地對應於它的硬體體系結構,參數如何輸入計算, 以及如何將變數、輸入和輸出與量子演算法聯繫在一起。之後, 我們得到了完整的 "量子模型"。重要的是, 如果我們不知道如何用經典的計算機模擬量子模型,我們不僅需要一個新的開端來做機器學習,還要有一個只能用量子器件來執行的模型。關於變分電路的新興文獻顯示了如何用經典計算機訓練這種「硬體衍生」模型, 世界各地的團隊目前正忙於研究這種量子模型的威力和極限。

發現新的機器學習模型類似於在一個未知的島嶼上尋找黃金。在量子機器學習方面, 我們在第一個海灘發現了一些非常有希望能找到黃金的跡象, 這就是為什麼我們正在建造更好的探險裝備並準備進一步冒險——我們對可能的發現感到興奮。

3.重新定義我們對量子計算的思考方式

還有第三個更「幕後」的原因說明了為什麼我們認為量子機器學習是必不可少的。量子機器學習及其中心子任務及優化,不僅是量子計算的子領域,更逐漸成為了一種實現量子計算的途徑。因此,其有可能重新定義我們對量子計算的思考方式。這對依賴於量子計算的軟體設計、硬體開發和應用來說都是如此。

量子機器學習不僅是量子計算的潛在應用, 而且是貫穿其所有方面的思維方式。

3.1 量子軟體設計

到目前為止,量子演算法是由那些對相關技巧有深刻了解的人精心組織的。甚至量子計算的「聖經」,尼爾森和艾薩克的教科書*都評論道:「想出好的量子演算法似乎是一個難題」。但是量子演算法也可以學習的。

參見:

en.wikipedia.org/wiki/Q

例如,考慮資源狀態的準備。資源狀態具有廣泛的性質,即在連續變數的應用程序中或通過魔術狀態進行糾錯, 其計算依賴於將準備好的特定狀態作為輸入。通常,準備初始狀態的演算法是未知的。然而, 給定一個具有某種類型的門, 我們可以讓計算機「學習」 一個門序列, 其可在特定硬體上準備所需的狀態。同樣, 整個量子實驗裝置 (即生成高度糾纏的量子系統) 都是由機器學習方法設計的。

3.2 量子硬體開發

使用機器學習對於量子計算中測量數據進行後處理正在變得越來越流行。在未來的某一天,任何量子計算的結果或許都將依賴於機器學習方法。

對機器學習的深刻認識也有助於量子計算機的建造。建造量子計算機將會產生大量有標記和無標記的數據。例如,在讀出設備的最終量子態時,在評估門的性能時或在估計測量結果時都會有數據產生。量子機器學習有一個非常活躍的子領域,其中經典的機器學習被當做一種方法來理解實驗室中的量子實驗產生的數據。機器學習系統將自然成作為量子硬體的一個標準組件。

「某一天,機器學習將成為一個讀取量子設備計算結果的標準技術。」

應用

量子機器學習技術也與多種應用領域密切相關。以量子化學為例,其同樣對最小化高維的、複雜的代價函數感興趣,如為藥物研發或材料科學找到最小能量的分子結構。通過使用如上文提到的可變數子本徵求解*,量子計算機可以解決此類問題。

實例參見arxiv.org/abs/1806.0046,其在極度嘈雜的量子計算機上將此方法應用在了水分子上。

由於機器學習和量子化學均十分依賴優化演算法,那麼它們使用相同的量子演算法也就不足為奇了。可變數子本徵求解本質上與變分分類器是相同的演算法,其作為一種利用量子計算機進行機器學習的創新方法被引入。從機器學習方面獲得的理解將被作為新的領悟並用於化學方面。基於數據和優化,優秀的量子機器學習演算法將將會對其他的量子應用產生直接的影響。

總之,量子機器學習擁有的助力或革新未來人工智慧應用的潛力,以及對量子計算領域自身的發展帶來的貢獻,上述三條理由即解釋了為何當小型量子器件出現時量子機器學習就可能擁有了一個光明的未來。

翻譯:Sylvia

審校:非線性

原文地址:

medium.com/xanaduai/qua

原文題目:Quantum Machine Learning 1.0,A big future for small devices

線上直播預告

2018北京師範大學複雜系統夏令營名師講座

(點擊圖片查看直播詳情)

集智AI學園將對夏令營講座獨家全程直播!

qr23.cn/E6Zeos (二維碼自動識別)

推薦閱讀

對稱性與拓撲序:新型量子計算機的物理基礎

Science:用人工神經網路解決量子多體問題

引力、量子與人工智慧的深度對話 | 尤亦庄

量子計算時代的機器學習

加入集智,一起複雜!集智俱樂部團隊招新啦!

推薦課程

campus.swarma.org/gpac= (二維碼自動識別)


集智QQ群|292641157

商務合作及投稿轉載|swarma@swarma.org

◆ ◆ ◆

搜索公眾號:集智俱樂部

加入「沒有圍牆的研究所」

推薦閱讀:

貽康量子晶元針對穴位改善疾病使用方式
量子霸權是什麼意思?谷歌72比特量子晶元到底意味著什麼

TAG:量子計算 | 量子晶元 | 科技 |