張量分解如何應用於數據挖掘?求詳細說明,最好有例子!?
張量,其實就是所謂的多邊矩陣(向量一個邊的矩陣,矩陣兩個邊的矩陣,如此理解)。
張量來做數據挖掘,首先我理解數據要有能構建為張量的特點,無非是一,數據本身天然就是張量,如RGB圖像天然就是一個三維的張量。樓主查一查可以看到很多相關的張量分解在圖像上的應用。
另外如上面回答提到的文章,「bayesian poisson tensor factorization for inferring multilateral relations from sparse dyadic event counts」,實際是一種多關係圖的數據,「country i took action toward country j at time t」,這一方面,大多數的應用是在社區發現上,通過適當的演算法設計,可以發現哪些國家經常互動,這些在社交網路上的應用很多。
還有就是具有多模態的數據,比如打分推薦系統,電影-用戶-時間構成一個三維的張量,但這樣一個張量往往是很稀疏的,我們怎麼根據用戶有限的打分,「填補」而推薦其沒打過分的電影呢?如果我們假設數據在電影-用戶-時間三個模式都具有很強的相關性,我們就可以利用張量分解設計張量填充演算法,對未打分的數據進行填補,進而給用戶推送電影,2016有本書「Matrix and Tensor Factorization with Recommender System Applications」。另外,最近對於交通數據的丟失和預測也有應用,因為交通數據有多相關性(天,周周期性,空間上的相似性),"A tensor-based method for missing traffic data completion"
CP分解
Tucker分解
對於張量分解,可以理解為矩陣分解向多維的延伸,可以理解為對高維數據的一種低秩逼近或者特徵提取。
張量是多維矩陣,張量TUCKER分解可以分解為核心張量和模式因子矩陣的多模式乘法。張量本質是不變的量,所以基的選取不同,分解後的因子矩陣意義也不同。張量數據挖掘或者特徵提取希望能選取有意義的基,也就是子空間,使得數據在子空間的投影具有某種有意義的解釋。很多矩陣的演算法可以遷移到張量。
最近在研究這個問題,推薦一篇論文,爪機無力就不貼鏈接了,名字叫bayesian poisson tensor factorization for inferring multilateral relations from sparse dyadic event counts
推薦閱讀:
※如何優化正交矩陣?
※有沒有將深度學習融入機器人領域的嘗試?有哪些難點?
※技術上講,王樹森和吳佳俊誰更牛逼?
※想去上海交大讀研,計算機視覺與機器視覺怎麼選?
※國外比較有名的機器學習、計算機視覺相關論壇有哪些?