轉載:用Tensorflow實現Sammon嵌入
02-07
近年來,由於很多人工智慧的問題都涉及大量特徵量造成向量長度過大,各式各樣的降維方法應運而生。這在自然語言處理的問題更明顯的,如果每一個字(漢字或英語單詞)都是一個特徵的話,那向量就太長了,所以才Word2Vec、GloVe、FastText、Wordrank之類的嵌入(embedding)方法。坊間不缺降維的方法,線性的如主成份分析(Principal Component Analysis, PCA),非線性的如自組織映射(self-organizing map, SOM)、自編碼器(autoencoder)、t-SNE(t-distributed stochastic neighbor embedding)等。
這條目要實現的是Sammon嵌入或Sammon映射,是一個比較古老的方法,現在也十分常用。
鏈接:用Tensorflow實現Sammon嵌入
插圖來自Multidimensional Data Visualization Techniques for Financial Performance Data: A Review (PDF Download Available)
推薦閱讀:
※機器學習:彈性伸縮的雲端託管服務
※TensorFlow 101
※tensorflow 為何方聖物??
※TensorFlow官方教程翻譯:導入數據
※學習筆記TF012:卷積網路簡述
TAG:TensorFlow |