支持向量機(SVM)方法在預測方面有什麼優缺點?

我是經管類專業的,對SVM原理大概懂,不過數學不好理解不怎麼深。之前老師讓做投資回報率預測,我用SVM,選擇核函數選擇線性時準確率達到97/99(800多個原始樣本,99個作為測試)。但又據說SVM已經是很久的方法了,這樣做預測沒有帶來什麼優化。想請問向量機預測有什麼優點?如果可以說說它優化方向就更好了,謝謝


首先有個疑問:投資回報率的預測應該是個連續值的預測(SVR),而不是分類問題吧?97/99的成功率指的是什麼?

其次,你的目的是什麼呢,寫文章,大作業還是實際項目?你現在的效果很好,對項目而言那就最好不過了;對寫文章而言,啊哦,好像不太好啊,沒什麼創新;97/99的結果還能怎麼優化啊。作為應用SVM的,我覺得去研究如何優化SVM本身是不現實的,而應該研究的是怎麼把一個問題轉化成適合SVM使用的,而且需要和其他模型不僅比較結果優劣,也要比較模型複雜度,訓練時間等。


如果是線性可分的SVM 已經很好了。如果不是線性可分,你也可以加Kernel ,但是會存在overfitting . 如果你要看效果,建議cross validation 而不是只測試99個。如果你知道class conditional , 可以用基於bayes 的logistic 或 linear/quadratic discriminative analysis .具體要看誰的cross validation 效果好


第一次被邀請,謝邀

優點:
適合小數量樣本數據,可以解決高維問題,理論基礎比較完善,對於學數學的來說它的理論很美。

缺點: 一旦數據量上去了,那麼計算機的內存什麼的資源就支持不了,這時候LR等演算法就比SVM 要好。

對於核函數的運用對SVM來說確實是一個亮點,但是核函數不是SVM專屬的,其他演算法一旦涉及到內積運算,就可以使用核函數。它的優化方向的話就是各種不同的場景了,比如擴展到多分類,類別標籤不平衡等都可以對SVM做些改變來適應場景


在SVM工程應用中,即使是你們項目的應用,可以關注更多的是SVM參數的選擇,調整,包括核函數的選擇,數據的前期處理,如歸一化問題等,這些做好了SVM的性能還是可以的。再有,特徵提取的好的話,對分類器本身的要求就不高了。


『我是經管類專業的,對SVM原理大概懂,不過數學不好理解不怎麼深。』

如果你看過原理,就知道它已經很好了。決定效果的更多是特徵選擇和參數調優。


推薦閱讀:

點擊率模型中遞進特徵適合一起訓練嗎?
深度學習領域有哪些瓶頸?
搞架構和搞演算法,哪個更牛一些?
用「機器學習」做「股票預測」能做到什麼程度?
人工智慧是不是只是一場鬧劇?

TAG:機器學習 | 數據統計 | 財務 | SVM | 預測模型 |