蘑菇街通過怎樣一個機制來識別和過濾托兒、spam 等不可信內容?

來自蘑菇街 CEO 陳琪的微博 http://weibo.com/1661307294/yb62mgIid

要不下次再專門說說這個?有人想聽么? //@專屬社區: 呵呵,如何保證過濾的公正和公平,不要和我說你們通過獨一無二的技術手段,聽真話 //@SharkUI:嗯,其實這是我們的核心能力之一,這個過濾的過程都是系統自動完成的。 //@蘑菇街餅哥哥: 必須要澄清一下,78%的托兒數據是後台的,展現給用戶的信息,這78%肯定被我們幹掉了,@程苓峰 這條微博容易誤導人啊

//@程苓峰:蘑菇街的最新數據:每天160萬用戶,人均50個PV,每天給淘寶帶的交易額400萬。近來每月能有100-200萬的新註冊。每天分享的貨品里有78%是托兒,剩下22%可信,其中只有3%是靠譜的有質量的分享。用戶最喜歡的動作是「喜歡」,每天100多萬次,喜歡是個自利的動作,收藏給自己看;而利他的「分享」很少人做。


我每次說話都秉承一個原則:要麼不說,說就只說乾貨。所以今天在艾瑞的會上,主要講了我這一年對social shopping內在的社會學機制的一點思考。同時曝了曝我們的基本運營數據,主要是方便大家對比我之前說的數據,互相佐證後,能顯得我說的乾貨更干一些^_^

剛剛和知乎的@周源 同學聊的時候,也比較深入地聊到所有UGC產品在運營過程中,必然會受到的巨大挑戰:spam及惡意用戶。而蘑菇街這樣與網上零售如此靠近的UGC產品,當然會更面臨更加嚴峻的挑戰。所以對我們來說,如何識別內容來源的可信度就變得異常的重要。

*註:我們說的不可信來源包括托、廣告、惡意內容(spam)、無效內容等等,總之所有不能幫助其他用戶挑選商品的內容、以及明顯有利益驅動的內容。

蘑菇街識別來源可信度的具體演算法不能與大家分享,這就像Google公開他的搜索排序演算法一樣不可能發生。但是我大概可以說的兩點演算法基礎是:

1. 可疑用戶的行為一定是與普通用戶不一樣的;

2. 長期活躍的用戶,行為模式是趨同的。

對於這個過濾和識別的系統,它本身必須不斷變化(spam的形式變化很快)。我們現在能識別出78%的不可信來源,是這一年來不斷調優這個系統的結果。當然肯定還做不到100%的準確率,但我們會繼續努力逼近這個結果。

其實今天講到最多的是「利已行為的積累有可能得到利他結果」,這一方面表現在我們可以通過對用戶行為的建模匯總,過濾78%不可信來源的內容,也表現在剩餘的22%被群體智慧認可的內容,具有超高的轉化率(每100個送到電商的UV,可以產生近10個訂單)。這是我們引以為豪的成果,也是我們慢慢意識到「利已得利他」的直接原因。

希望蘑菇街這一點經驗對做社區和做導購的同行們有所幫助,我們會持續總結自己的經驗與大家分享。這個市場很大,未來會很豐富。


做了幾年的搜索聯盟,見識了中國偉大的站長的技術作弊能力,我一般只需要掃一眼就大概能了解哪些是作弊的,總結有幾點:

1、作弊的永遠不是一個,一個人經常傾向於分散不同帳號來作弊,但受限於社會資源,這些帳號的IP或聯繫方式或收款帳號經常存在某種關聯。所以看一些異常帳號的共性,很容易能發現誰在作弊;

2、假的永遠真不了,先看看一周的每天它的數據波動是否跟正常的一致,如果一致再看看分時段,如果時段一致,再看看點擊分布,總有破綻。

3、時間會自動揭露他。作弊的帳號總會因為對方的技術bug或伺服器問題導致大的波動,這一天就是它的死期。

至於很多人說的規則庫,這個太普通和技術化了,我就不多說了。


廣告動作與用戶動作可以通過多個維度進行識別,並進行排序。 如:短時間內發單一賣家商品次數等等,還有「喜歡」商品的維度,標籤信息等等


c段用戶的ugc佔比幾何,沒數據 不好說。但是我敢肯定佔大頭的一定是b的內容


好的bi+大量數據的積累,對判斷ugc質量和提高轉化率是非常重要的。

現在都在談社會化電商,其實有多少人理解其核心。大家都認為其核心是社會化,都在拚命加sns元素,其實社會化是手段不是目的。目的是電商(既賺錢),你的推薦精準、你的好友關係符合用戶真實場景、你的流程/ue簡單直接,這些都是手段。


過濾?過濾後的數據?我不信。去淘寶看看,那些賣網路營銷的傢伙是怎麼吹噓的,幫你的產品營銷到蘑菇街,美麗說那個頁面多少多少錢。幫你的產品在蘑菇街、美麗說刷多少個喜歡試多少多少錢。不否認,存在一部分愛分享的用戶,但這個用戶的群體多大?做過網路運營的人會有比較,分析,讓用戶持久的UCG,讓那類用戶UCG,是什麼樣的一個難度,需要什麼樣的引導,都不需要明說。


有時候大家想自清很難,你不想賺錢嗎?你堅持得了理想嗎?看看每天旺旺上發來的刷信譽的多少多少!社會化電商跟他們是一條鏈上的嗎?


我不信會有大量用戶去蘑菇街這類網站貼有淘寶鏈接的圖,也不信蘑菇街的瀏覽推薦機制能勝過淘寶的比價系統,使很多用戶根據蘑菇街的推薦就直接購買商品而不去貨比三家。


據說,蘑菇街和美麗說都是這樣的:用戶發布的內容是默認沉在內容列表最底部的,然後由運營人員手工篩選優秀的往上頂,篩選過程還包括圖片美化、去水印等。


我覺得既然是UGC內容的話,大部分的網民還是希望淘到物美價廉的東西,所以自然會對內容進行自我的篩選,而且現在網購的網民的數量又是很多的

另外,美麗說蘑菇街的運營人員也不是白吃飯的呀


推薦閱讀:

蘑菇街最近開發了一個App叫Top,是不是平台做不下去又要回歸做導購了?
現在做導購類網站還有機會嗎?
堆糖、美麗說、蘑菇街相比較,哪個的用戶體驗更好?

TAG:美麗說 | 信息過濾 | 社會化電子商務 | 蘑菇街 | 互聯網社區運營 |