標籤:

轉載:用Tensorflow實現Sammon嵌入

近年來,由於很多人工智慧的問題都涉及大量特徵量造成向量長度過大,各式各樣的降維方法應運而生。這在自然語言處理的問題更明顯的,如果每一個字(漢字或英語單詞)都是一個特徵的話,那向量就太長了,所以才Word2Vec、GloVe、FastText、Wordrank之類的嵌入(embedding)方法。坊間不缺降維的方法,線性的如主成份分析(Principal Component Analysis, PCA),非線性的如自組織映射(self-organizing map, SOM)、自編碼器(autoencoder)、t-SNE(t-distributed stochastic neighbor embedding)等。

這條目要實現的是Sammon嵌入或Sammon映射,是一個比較古老的方法,現在也十分常用。

鏈接:用Tensorflow實現Sammon嵌入

插圖來自Multidimensional Data Visualization Techniques for Financial Performance Data: A Review (PDF Download Available)


推薦閱讀:

機器學習:彈性伸縮的雲端託管服務
TensorFlow 101
tensorflow 為何方聖物??
TensorFlow官方教程翻譯:導入數據
學習筆記TF012:卷積網路簡述

TAG:TensorFlow |