標籤:

閱讀、電影和音樂的推薦演算法,哪一個更難做?為什麼?

假設獲取的數據都很全面的話,難度從易到難應該是 電影 音樂 書籍


個性化音樂電台&>電影=音樂&>書籍


想做的有突破性,都難啊


推薦演算法基本上兩個大分類:基於內容的推薦演算法,基於用戶行為的推薦演算法。

1.可信息化程度決定了基於內容的推薦演算法的準確度

可信息化程度基本上決定了採用基於內容過濾的演算法的準確度。這一點上書籍完勝,很簡單,書本因為其載體為文本,所以採用一些基於內容的演算法來做推薦會準確很多。相對來說,電影因為其有台詞,劇本,影劇評等周邊數據,其可信息化程度也較高。而音樂就差很多,五線譜?歌詞?曲評?這些和上面書本自身的文字、影劇評相比都太抽象和個性化,很難形成對其風格準確的描述。

2.用戶喜好方差決定了基於用戶行為的推薦演算法的準確度

這裡我定義用戶喜好方差為:用戶對同一種類事物的喜好波動程度。

用戶喜好方差基本上決定了採用CF(協同過濾,典型的基於行為的推薦演算法)來做推薦的有效性,用戶對一類東西的喜好越有群體性特徵,其行為越模式化,CF的效果會越好。

在可信息化程度上:書 &> 電影 &> 音樂,這個應該大家都能達成理解並達成一致的結論。

而對喜好方差方面,我就不做實證只做感性猜測了,有數據的同學可以跑數據看情況。

排除掉只看熱門的小白用戶,和什麼都看的專家用戶,我主觀的認為:

在喜好方差上:音樂 &> 書 &> 電影

--------------------------------------------

當然,題主的問題並不太嚴謹。準確度通常靠人來給出反饋是最直接的,但是人給出的反饋不僅在於準確度。準確度、覆蓋度、新穎度、驚喜度、信任度、透明度這些都對用戶的主觀準確度有感受有影響。


我不是搞技術的,僅僅從這幾類文藝作品的自身特點和用戶需求的角度簡單分析。

電影最難做。

原因有:

1. 電影的信息量最大,藝術形式最複雜。因此延伸出的評價維度、偏好分類,都比書籍和音樂要龐雜。

2. 電影的原始數據最難分析。文字、音頻,都可以有演算法輔助分析歸類,並且一部分技術已經比較成熟。

3. 一個人的閱讀和音樂欣賞興趣和偏好特點比電影穩定多了。電影的私人體驗比較多,每個人覺得好的電影,跟自身的生活經歷有很大關係,藝術鑒賞能力只是一方面。


謝邀!

個人覺得電影更難一點。理由@川葉已經說了; @Filestorm回答的更全面一點,但是現實中,能夠拿到電影的所有相關數據(視頻本身,電影劇本字幕,評論,用戶評分)的很少,例如一下電影的垂直搜索站點,除了電影的基本屬性(標題,主演,導演,年代,類型,簡介..)就沒有其他信息了。


我是真的真的不知道……

但是普通猜測一下,書,電影最好加簡介,雖然簡介裡面講述的內容有可能不能完全表達齣電影的精髓,但是我覺得對簡介先進行搜索比對然後再搞出來個推薦比音樂會簡單些吧?

音樂通過某種技術(我不知道啊囧)也會形成數據吧?比如節奏斷拍或者歌手分類專輯分類之類的……好吧跑題了貌似。

我總覺得把這些想的太複雜了沒必要,也許就是在網上隨便搜索出一些關鍵詞然後拼湊一下就推薦給你了呢,反正都不靠譜……

唔我啥都不懂,請摺疊吧= =


三類應用實現個性化推薦時都可以有多種做法,如基於標籤推薦、協同過濾推薦等等,這裡僅從一個小角度來說說自己的看法:如果閱讀推薦的對象是文本(如果不是漫畫的話……),那麼相較於電影和音樂這些多媒體內容的推薦,設計演算法時還可以更充分利用文本信息,這意味著多了一個基於內容推薦的手段,對推薦對象的刻畫有可能更全面。當然電影和音樂也可以探索基於內容進行推薦,但難度會比文本大。如果閱讀推薦對象是漫畫或圖片內容,那麼上述閱讀推薦的優勢就不存在了。


推薦閱讀:

知乎對用戶有權重判斷嗎?如果有,是以什麼樣的機制來判斷的?
什麼叫基於模型的推薦演算法?
推薦系統如何解決對於使用頻率較低的產品的用戶特徵冷啟動的問題?
怎麼確定LDA的topic個數?
三百萬級用戶數據做基於用戶協同過濾演算法,相似度如何計算?

TAG:推薦演算法 |

分頁阅读: 1 2