如何在減少用戶介入的情況下提高信息匹配精準度?

比如知乎通過tag做信息推送,這樣我們就需要在提問的時候添加tag,如何在不添加tag的情況下做好信息推送?


信息組織, 前互聯網時代是通過"有條理樹形組織", 造就了圖書館信息組織方法, 如分類法,敘詞法等, 主要思想還是某個信息內容從屬於一個"文本關鍵詞". 然後區別在於這些從屬如何定義, 這些"文本關鍵詞"之間有何關係.

互聯網時代, 信息量增大,無法通過人工來進行信息組織, 於是在敘詞等方法基礎上, 擴大為任意關鍵詞索引的方式. 信息匹配, 靠關鍵詞的命中程度, 但難點在於提取出準確度高可信賴的信息內容, 這個完全靠機器智能和文本分析是不可能的, 於是有google的pagerank, 有百度的超鏈分析(兩家所謂的專利), 目前都是篩選, 實際上搜索引擎各種方法都會用到.

社會化網路時代, 信息推送可能跟個人興趣有關, 協同過濾或個性化推送, 俗稱"推薦"則是另一種信息關聯和組織方法. 前提是, 需要一些數據標籤或信息屬性, 能知道"個人興趣"是什麼? 才能基於社會化協同, 來將合適信息推送給個人.

tag雖然只是"文本關鍵詞"由用戶UGC貢獻, 但由下往上生長的數據, 就比由上往下定義的詞表要更合適廣泛信息量. 但要做到信息匹配精準, 完全依賴tag關聯也不行, 還需要結合其他手段. Tag是社會化網路時代, 做信息索引和數據定義的手段之一.

如果想做好基於個人的推薦, 如果能知道物品的tag,有效度會大很多. 最合適的辦法是找到適合自己數據特性的方法並結合使用, 不太可能某一種方法就是萬能的. :)


如果你有很牛逼的語義分析、數據挖掘技術,並且有很好的用戶數據積累和匹配演算法,你也可以試試做一個玩聚網或者豆瓣猜,減少用戶的直接介入。


在目前的語義分析水平上,「沒有用戶介入」基本不可能提供多麼精準的信息匹配
所能做的只能是盡量讓用戶感覺不到它在介入
比如百度,你在檢索的時候已經再幫他改善信息匹配,但是你自己沒有這個感覺,你整個的檢索過程是流暢而不被打斷的,這個過程中百度通過監控你的行為也同時積累了優化信息匹配的數據。
而就是論事,比如知乎的tag,只能說知乎可以做得更加隱蔽一些,比如利用自動分詞技術以及相關的語義匹配自動為內容做tag,但是可以相應減少自動tag的權重以免對用戶產生打擾。同時,在沒有用戶主動編輯tag的問題,根據訪問者的回答,訪問者本身的屬性來不斷調整tag的排序或者自動產生新的tag。——不過個人並不覺得讓用戶介入編輯tag會是多麼糟糕的事情,其實還是很多人會以此為樂的。


粗分類或許給用戶在心理上以更大的滿足性。譬如只分男女,每個人都被覆蓋到了。
還有個很笨的方法是這樣的:推送的時候先分男女,男女又各分年齡段,各年齡段又可更加細分,排列組合起來,總會有命中。命中的那些留下來成為忠實用戶。
一個故事,賭徒收到競猜預測的郵件,試用幾次後發現每次都猜對,於是大手筆購買了預測服務。原來,競猜預測只是個包含勝負兩種結果的大撒網,譬如發送了1w個,命中率只有千分之一,可這十個就足夠他們賺一把啦。


以用戶需求為導向的信息匹配,第一前提就是精準捕獲用戶介入行為。只不過,根據用戶對信息匹配需求的主動程度,可以分為主動型和偶然型。其中,主動型是建立在用戶主動對某類信息述求基礎上,如搜索,訂閱等;偶然型是建立在挖掘分析潛藏在用戶某種行為下的可能性需求的基礎上,如網上購物時的衝動行為,商品推薦等。因此,主動型需要用戶主動介入的信息多,而偶然型更偏重行為軌跡的分析和行為發生情景的分析。


通過大量的預料分析,可以分析出中文不同詞語之間的內在語義關係、不同詞語所帶的信息量多少,通過這些信息可以做一定程度的匹配。你的這個問題基本上是一個計算廣告的問題。


不解,用戶不介入怎麼可能提高信息匹配的精準度?服務的基礎是用戶,背離用戶的數據反饋貌似是不對的


想不太出來如何減少信息介入的方法,不過到是可以減少所需要介入的信息量,來做到少tag,精測算
1、可以考慮做因子分析來降低維度,不一定所有標籤都有意義,我覺得可以考慮標籤的線性組合,來作為公共標籤,以達到降維的目的。不過需要計算特徵值的貢獻度,來不停完善。
2、可以做相應分析,由此找到標籤的相關性並以此來減少重複。
說實在的,個人以為沒有必要一定要tag明確化,可以不用tag,直接從用戶的信息上來考慮。就好似每個用戶所對應的信息為(x1,x2,....,xn),不一定要明確每一個x是什麼,只要知道哪些用戶的信息的相關係數最接近1就可以完成推薦.
當然,以上只是學統計時的個人想法,可能在現實中信息過大不適用。


我來說個玄乎點的答案。

通過滑鼠的游標,得知你最近都點擊過哪些標籤。

利用腦電波來獲取你大腦興奮區域,通過長期臨床實驗,可以得知興奮區域對應什麼內容??
利用攝像頭獲取你視線的焦點,根據停留時間以及瞳孔的縮放程度,來判斷??

先想這麼多


信息推送E-mail、BBS、移動終端、微博……首先,就當前互聯網時代而言,在許多社交網站、BBS、社區等添加tag推送信息是比較實用、方便,也是更見成效的方法,已被廣大的用戶群體所接受並且使用;其次,就是抓取關鍵詞,這種用法大多出現在SEO,能夠讓你在海量的信息中迅速找到自己所需要的;最後,你的這個問題太操蛋了,有這些簡單的擺在面前的不用,扯那些還沒搞出形的幹嘛,我也就是個小菜鳥


推薦閱讀:

TAG:信息推送 | 信息質量 | 用戶體驗分析 | 精準推薦 |