張量分解如何應用於數據挖掘?求詳細說明,最好有例子!?


張量,其實就是所謂的多邊矩陣(向量一個邊的矩陣,矩陣兩個邊的矩陣,如此理解)。
張量來做數據挖掘,首先我理解數據要有能構建為張量的特點,無非是一,數據本身天然就是張量,如RGB圖像天然就是一個三維的張量。樓主查一查可以看到很多相關的張量分解在圖像上的應用。
另外如上面回答提到的文章,「bayesian poisson tensor factorization for inferring multilateral relations from sparse dyadic event counts」,實際是一種多關係圖的數據,「country i took action toward country j at time t」,這一方面,大多數的應用是在社區發現上,通過適當的演算法設計,可以發現哪些國家經常互動,這些在社交網路上的應用很多。
還有就是具有多模態的數據,比如打分推薦系統,電影-用戶-時間構成一個三維的張量,但這樣一個張量往往是很稀疏的,我們怎麼根據用戶有限的打分,「填補」而推薦其沒打過分的電影呢?如果我們假設數據在電影-用戶-時間三個模式都具有很強的相關性,我們就可以利用張量分解設計張量填充演算法,對未打分的數據進行填補,進而給用戶推送電影,2016有本書「Matrix and Tensor Factorization with Recommender System Applications」。另外,最近對於交通數據的丟失和預測也有應用,因為交通數據有多相關性(天,周周期性,空間上的相似性),"A tensor-based method for missing traffic data completion"

張量分解的另一個重要問題,就是分解演算法的設計,目前大多數都是基於CP分解和Tucker分解,但是目前也有很多新的分解方法在冒出來。下面給兩個張量分解的示意圖

CP分解

Tucker分解

對於張量分解,可以理解為矩陣分解向多維的延伸,可以理解為對高維數據的一種低秩逼近或者特徵提取。


張量是多維矩陣,張量TUCKER分解可以分解為核心張量和模式因子矩陣的多模式乘法。張量本質是不變的量,所以基的選取不同,分解後的因子矩陣意義也不同。張量數據挖掘或者特徵提取希望能選取有意義的基,也就是子空間,使得數據在子空間的投影具有某種有意義的解釋。很多矩陣的演算法可以遷移到張量。


最近在研究這個問題,推薦一篇論文,爪機無力就不貼鏈接了,名字叫bayesian poisson tensor factorization for inferring multilateral relations from sparse dyadic event counts


推薦閱讀:

如何優化正交矩陣?
有沒有將深度學習融入機器人領域的嘗試?有哪些難點?
技術上講,王樹森和吳佳俊誰更牛逼?
想去上海交大讀研,計算機視覺與機器視覺怎麼選?
國外比較有名的機器學習、計算機視覺相關論壇有哪些?

TAG:數據挖掘 | 機器學習 | 矩陣運算 | 高等數學大學課程 |