專欄文章分類及各類內容簡介

本文主要介紹一下專欄目前打算髮布的文章的三大種類以及每一類下打算寫的內容。當然,目前各類下面的內容只是暫時計劃寫的,實際發布的文章內容可能會出現一些增刪變動。

理論篇

理論篇分類下的文章主要是介紹與專欄主題相關的一些重要的機器學習模型與求解演算法,該類文章由於是介紹純理論的內容,所以在每篇文章的開頭會說明一下所需的數學基礎知識,方便讀者及時查缺補漏以完全看懂文章,同時也會說明文章介紹的內容與文章主題有什麼關係、與其他常見的模型有什麼關係、常見的應用是什麼,使得讀者知道了解該模型會起到什麼用處,避免「盲目學習」的感覺的產生。除了介紹數學原理以及數學公式之外,文章也會附上必要的概率圖模型,進行編程實驗並附上代碼的鏈接地址(Github)以及實驗結果圖,文末會列出比較複雜的數學推導步驟(同時正文相應部分就不再列出,保持文章的簡潔)以及所有參考到的資料(包含論文、書籍、公開講義、教學視頻),尊重相關作者的知識成果。

目前該類下打算介紹的內容有:期望最大化演算法,LDA模型及求解演算法,隱馬爾科夫鏈,變分推理,矩陣分解,非參貝葉斯

技術篇

技術篇分類下的文章直接面向實戰,主要介紹如何利用Python的多個第三方科學計算開源庫來進行一些常見的文本處理,實現一些簡單的推薦演算法等,由於直接面向編程過程,所以文章中會直接列出一些核心代碼以及結果截圖,全部的代碼會附上相應的Github鏈接。

目前該類下打算介紹的內容有:網路爬蟲的簡單介紹及使用方法,幾種分詞、詞頻統計工具的介紹及使用,開源文本處理包gensim的介紹及使用,Python科學計算包numpy、Scipy、Matplotlib的介紹及部分常見用法的介紹。

論文篇

論文篇分類下的文章主要是針對 2009---如今 的某一篇推薦系統領域的論文進行一定程度的講解以及剖析,所選論文中2013年前的主要是介紹一些經典推薦系統模型與文本推薦的論文,2013年後的主要是介紹基於評論挖掘的推薦演算法的論文。文章中會列出論文的基本屬性(包括標題、作者、年份、所屬會議/期刊)以及與其有著密切聯繫的論文(比如most

related work等),並從個人觀點介紹論文的思想、核心內容、主要貢獻等。

目前該類下打算介紹的論文有:Matrix Facorization Techniques for RS(IEEE,2009)、ITLFM(IEEE,2016)、CTR(KDD,2011)、fLDA(WSDM,2010)

結語

以上就是專欄文章分類以及各類內容的介紹了,文章實際發布時的內容可能會有一些增刪上的出入,但是基本上不會變動太大,希望看到專欄文章的小夥伴能夠及時在評論區指出自己不懂或者認為不對的地方或者給予建議或指導,萬分感激~我們會在盡量短的時間內回復各位,互相探討更加有助於對知識的理解哦~


推薦閱讀:

如何用Python做詞雲?
7款免費的詞雲可視化工具,圖表控沒有理由拒絕啊!
文本分析上nltk和snownlp有什麼區別,哪個更適合,有什麼好的學習資源?
輿情監控技術如何應對各類水軍刷屏?
windows下如何查看超大文本文件(5G )

TAG:文本挖掘 | 个性化推荐 |