對於社交網路的數據挖掘應該如何入手,使用哪些演算法?
如何更準確的找出與自己關係最緊密的網友
知乎社交網路分析(下):關注網路
關注這個問題
這個問題涉及到兩個事情
1.如何獲得數據。可以通過新浪的api或者其他圍脖的api來跟蹤獲取。獲取數據的途徑,獲取哪些數據需要找到方法2.挖掘的目的是?你想知道什麼?從sns數據中一般可以挖掘出:
用戶圍脖使用行為(包括圍脖的使用粘性,圍脖的使用時間和頻次等等)圍脖上廣告的認知(用戶接受什麼樣的小廣告,接受什麼形式什麼位置神馬產品等等)圍脖產品的改進(設計的改進,功能的改進等)我不知道太多演算法,這裡就是提個想法好像現在對於社會網路的挖掘一般都傾向於鏈接挖掘,就是挖掘實體的關係網,還有就的情感分析,事件預測,都挺熱門的
簡單的來說,首先你要有社交關係的數據,能夠體現到你們網站會員與會員關係的數據。之後你就會擁有你們會員的關係網。可以利用各種的中心度去,pagerank。leaderrank之類的演算法尋找你的領袖人物。也可以做劃分社群的分析,運用到的演算法也包括Random walk,spin glass之類的。這樣你網站的社交網路就基本構建了。你可以再結合其他的數據,豐滿你的社交網路圈,例如打上一些便簽之類的。然後針對不同的營銷活動,你可以結合不同的數據去提供社交網路的數據驅動產品。例如:提高品牌形象,用戶口碑,產品理念的宣傳之類的。但是要和你的業務人員溝通的是:社交不是一個賣東西的地方,所做的運營活動一定要是易於傳播,分享的。
這篇文章看有幫助否:http://www.lovelucy.info/pagerank-sns-model-1.html
我來從數據維度上來回答你的問題,如何採集社交網路數據,以下是摘自我們的公眾號「發源地數據挖掘平台」。如何採集社交網路數據
2015-12-01 情報君 發源地數據挖掘平台
知道嗎1 我從騰訊那「偷了」800萬QQ用戶數據,出了份很有趣的獨家報告!
2 雙棍節後,千000萬單身貴族的「真愛畫像」數據刷爆了朋友圈!
3 如何使用數據從Intagram分析時尚品牌在社交媒體的秘訣?
4 數據顯示,每位創業者平均擁有77位高管(職位總監以上)朋友,69位風投(風險投資人)朋友,46位產品(產品經理、設計師)朋友。
數據類型:社交指數/文本/用戶/其他數據
社交指數數據
瀏覽量,關注量,粉絲數,好友數,發布量,評論數,點贊數等;
文本內容數據
熱門話題,活動,新聞動態,博客文檔,分享源文等;
用戶行為數據
用戶訪問,用戶評論,用戶瀏覽,用戶日誌等;
其他數據
關係數據,位置數據,傳播數據,查詢數據,社交徵信數據等;
數據內容:目標網站網頁的所有要素
分類(category:娛樂entertainment;trending熱點;news新聞;events活動;等)
話題(topic)
關鍵詞(keywords)
網址(website)
博客(blog)
活動(events)
自定義(definition)
圖片(photos)
用戶昵稱(nickname)
社交賬號(account info)
用戶評論(user comments)
訪問時間(visit time)
其他(others)
數據採集適用範圍:99%網站都可以被採集
覆蓋社交媒體QQ,微博,微信,博客,論壇,facebook,網易lofter等;以及個人、企業和自媒體類的網站;
數據採集獲取:發源地 - 讓數據更有價值免費使用
數據多功能管理
在線創建數據採集任務,實現數據測試,編輯,複製,預覽和導出;
數據云端存儲
24小時全線存儲你的數據,可隨時獲取;
數據高效輸出
導出格式:Excel格式(包括xls和xlsx),CSV格式,PDF格式,TXT文本格式;
API調用:支持API調用,滿足開發者所需;
免費教你:數據採集演示舉例
回復 "1",閱讀 免費教你 用戶信息採集
回復 "2",閱讀 免費教你 商品信息採集
回復 "3",閱讀 免費教你 分類信息採集
回復 "4",閱讀 免費教你 聯繫信息採集
回復 "5",閱讀 免費教你 網路文摘信息採集
國內首個互聯網數據交易平台
這個專欄可關註:
從好友推薦演算法說起 - Data Science - 知乎專欄
推薦閱讀: