數值,向量,矩陣

數值

生活當中用來描述物體的長短,人體的身高,溫度的高低,空氣污染指數,都可以利用某一種度量方式,用數值來表示,比如10厘米,20攝氏度。一些不那麼顯然的也可以通過定義一些標準,指得其可以用數值進行表示,比如顏色可以通過RGB這種方式,利用3個數字對顏色進行表示,當然還有其它的顏色表示方式。任何可以通過數值對其進行表示的事物,都可以利用機器學習完成某些與之相關的任務。當前機器學習當中涉及的,圖像,視頻,遊戲,人臉等等無一不是可以通過數值對其進行表示的內容。

向量

對於一些任務,比如說房屋價格預測的任務,首先需要對房屋進行描述,比如房子的大小,房子的樓層,房子的經緯度,這裡作為例子,取這3個項目對其進行描述,所取項目的多少是否會影響到房屋價格預測任務的多少是一個有趣的話題,這裡不作展開討論,確定了所要描述的項目,就可以通過一些度量單位下的數值來對其進行表示,比如100平方米,4樓,(北緯30度,東經108度),這多個數字,隱藏度量單位後可以通過一個向量來表示,[100,4,30,108],這是一個1 	imes 4的向量,這個向量也叫作特徵,一個4維特徵。其對應的房屋價格是100萬人民幣,這就是一個完整的數據描述。

矩陣

一個常見的機器學習問題通常會給你一個,比如訓練數據如果有300個,會給你一個300個1	imes 4的向量組成的,300 	imes 4的矩陣,每行表示一個數據,或者一個房屋,另外給你一個300個房屋價格,可以用一個300 	imes 1的矩陣表示。如果測試數據有100個,那麼還會給你一個100 	imes 4的矩陣表示需要你來判斷的房屋價格。

總結

用一些確定的項目對某些事物進行描述,描述的內容通過數值表示之後,可以組成一個向量,多個向量,可以組成一個矩陣,可以用一個矩陣對這一批事物進行表示,另外一個矩陣對這一批事物的預測目標進行表示。

矩陣以及矩陣各個維度的含意,就可以完整地描述一個確定了的機器學習問題。

當然有很多機器學習問題可以是沒有確定的,比如哪些項目對事物進行描述,度量單位是什麼,什麼度量對之後的效果會有什麼樣子的影響,都是可以值得研究的內容。

推薦閱讀:

3.3 易控傾向及其特徵

TAG:機器學習 | 特徵 | 矩陣 |