對於社交網路的數據挖掘應該如何入手,使用哪些演算法?

如何更準確的找出與自己關係最緊密的網友


知乎社交網路分析(下):關注網路


關注這個問題

這個問題涉及到兩個事情

1.如何獲得數據。可以通過新浪的api或者其他圍脖的api來跟蹤獲取。獲取數據的途徑,獲取哪些數據需要找到方法

2.挖掘的目的是?你想知道什麼?從sns數據中一般可以挖掘出:

用戶圍脖使用行為(包括圍脖的使用粘性,圍脖的使用時間和頻次等等)

圍脖上廣告的認知(用戶接受什麼樣的小廣告,接受什麼形式什麼位置神馬產品等等)圍脖產品的改進(設計的改進,功能的改進等)

我不知道太多演算法,這裡就是提個想法


好像現在對於社會網路的挖掘一般都傾向於鏈接挖掘,就是挖掘實體的關係網,還有就的情感分析,事件預測,都挺熱門的


簡單的來說,首先你要有社交關係的數據,能夠體現到你們網站會員與會員關係的數據。之後你就會擁有你們會員的關係網。可以利用各種的中心度去,pagerank。leaderrank之類的演算法尋找你的領袖人物。也可以做劃分社群的分析,運用到的演算法也包括Random walk,spin glass之類的。這樣你網站的社交網路就基本構建了。你可以再結合其他的數據,豐滿你的社交網路圈,例如打上一些便簽之類的。然後針對不同的營銷活動,你可以結合不同的數據去提供社交網路的數據驅動產品。例如:提高品牌形象,用戶口碑,產品理念的宣傳之類的。但是要和你的業務人員溝通的是:社交不是一個賣東西的地方,所做的運營活動一定要是易於傳播,分享的。


這篇文章看有幫助否:

http://www.lovelucy.info/pagerank-sns-model-1.html


我來從數據維度上來回答你的問題,如何採集社交網路數據,以下是摘自我們的公眾號「發源地數據挖掘平台」。

如何採集社交網路數據

2015-12-01 情報君 發源地數據挖掘平台

知道嗎

1 我從騰訊那「偷了」800萬QQ用戶數據,出了份很有趣的獨家報告!

2 雙棍節後,千000萬單身貴族的「真愛畫像」數據刷爆了朋友圈!

3 如何使用數據從Intagram分析時尚品牌在社交媒體的秘訣?

4 數據顯示,每位創業者平均擁有77位高管(職位總監以上)朋友,69位風投(風險投資人)朋友,46位產品(產品經理、設計師)朋友。

數據類型:社交指數/文本/用戶/其他數據

社交指數數據

瀏覽量,關注量,粉絲數,好友數,發布量,評論數,點贊數等;

文本內容數據

熱門話題,活動,新聞動態,博客文檔,分享源文等;

用戶行為數據

用戶訪問,用戶評論,用戶瀏覽,用戶日誌等;

其他數據

關係數據,位置數據,傳播數據,查詢數據,社交徵信數據等;

數據內容:目標網站網頁的所有要素

分類(category:娛樂entertainment;trending熱點;news新聞;events活動;等)

話題(topic)

關鍵詞(keywords)

網址(website)

博客(blog)

活動(events)

自定義(definition)

圖片(photos)

用戶昵稱(nickname)

社交賬號(account info)

用戶評論(user comments)

訪問時間(visit time)

其他(others)

數據採集適用範圍:99%網站都可以被採集

覆蓋社交媒體QQ,微博,微信,博客,論壇,facebook,網易lofter等;以及個人、企業和自媒體類的網站;

數據採集獲取:發源地 - 讓數據更有價值免費使用

數據多功能管理

在線創建數據採集任務,實現數據測試,編輯,複製,預覽和導出;

數據云端存儲

24小時全線存儲你的數據,可隨時獲取;

數據高效輸出

導出格式:Excel格式(包括xls和xlsx),CSV格式,PDF格式,TXT文本格式;

API調用:支持API調用,滿足開發者所需;

免費教你:數據採集演示舉例

回復 "1",閱讀 免費教你 用戶信息採集

回復 "2",閱讀 免費教你 商品信息採集

回復 "3",閱讀 免費教你 分類信息採集

回復 "4",閱讀 免費教你 聯繫信息採集

回復 "5",閱讀 免費教你 網路文摘信息採集

國內首個互聯網數據交易平台


這個專欄可關註:

從好友推薦演算法說起 - Data Science - 知乎專欄


推薦閱讀:

TAG:社交網路 | 演算法 | 數據挖掘 |