篩選資訊這事,我還是更相信人,而不是機器
以前獲得資訊靠聽廣播,後來通過報紙和電視,再後來網路發展,將報紙和電視都搬到網上,實現了電子化,一下子人們方便了。然後就開始了內容爆炸,用戶也開始自己創造內容和傳播資訊了,於是形成了傳統媒體、網路記者、用戶自己聯合創造內容的混雜局面。這一下讓許多資訊門戶和應用十分迷惘,不知道該提供什麼,各自紛紛尋找突破口。
這兩年『圈子』理論很流行,大概是每個人都生活在自己的幾個小圈子中,而自己的這幾個興趣圈不相交,獨立運行。人們的生活就是在不同的圈子之間頻繁切換。聽上去很有道理,也被大多數人聽進去了。QQ群,陌陌群,微信群,還有剛興起的小密圈等都成功應用了圈子理論。
於是我們看到了,在這些成功產品的感召下,這些資訊和門戶各出奇招,產品形態一變再變,雖然折騰的五花八門,但總體方向還是由之前的編輯推薦往興趣推薦上轉變,靠更智能的機器和數據演算法來猜你在哪幾個圈子中,對哪些方面感興趣,從而來做精準推薦。以期望能猜對你的小心思,讓你戀戀不捨,多打開一會,不都說碎片時間是價值不可估量么。
本來這是社交網路發展的一個必然結果,也符合自由主義的訴求特徵——憑什麼我看什麼要由你來決定,我要由我自己決定。但是,很快人們發現,事情貌似不是這樣子的。
猜中了我的興趣,但大量同質化、低質量、謠言化的內容資訊紛紛撲面而來,看來看去都是這些內容,而且還得花大量時間去辨識,造成了看個資訊
都在忙打假舉報的局面。
猜中了我的興趣,我也喜歡看,但儘是搞笑、段子、有趣和獵奇的內容,這些人人愛看,但看完了又覺得浪費時間,常常產生自責的心理,因為心理有部分提升自己的訴求未得到滿足。
猜錯了我的興趣,不是因為我看了篇房產對經濟的影響,就一定對房產感興趣,然後就活該天天看房價要漲,要跌,互相喊的不亦樂乎。完全不感興趣的東西,反覆出現。
當然你可以說這是演算法不完善導致的,很快機器就可以解決,你看的東西越多,越可以猜中你的興趣點,越能準確推薦。這一定程度上可以解決興趣問題,但卻解決不了內容的質量問題,從大姑大姨大媽大舅母轉發的朋友圈謠言可以窺探一二,這些文章要長度有長度,要數據有數據,要論據有論據,要閱讀量、轉發量、點贊數也都不落後,但它們許多就是謠言,就是無用的雞湯。
這些稍有見識的人都能看出來的不靠譜文章,機器在很長一段時間內還無法鑒別,於是打著科技的幌子,這些網站和應用提前把我們的閱讀交給機器,只能讓人們越來越得不到想要的,只能越來越遠離。
基於興趣的圈子推薦還會產生另一個問題,就是讓人只能接觸到自己感興趣的範圍,將視野局限在一定的範圍內,超出這個範圍,即使再是好東西,你也無法接觸到了。認知的外延在一定程度上被鎖死,人將越來越固化,自己用手在周圍壘起一道牆。
人終究還是需要多元化的信息,來認識這個真實的世界。
我想也正是因為如此,『即刻』才會被這麼多人安利吧,因為它的內容一方面是非UGC由人去精挑細選,另一方面不靠推送,而是靠用戶自行訂閱。簡直就是內容資訊應用中的一股清流。這樣最起碼的好處是你看到的內容質量得到了一定的保證,再進階點的好處是準確訂閱到你喜歡的內容,而不會看到完全不喜歡的推送。
題圖:Gerd Altmann
圖片授權基於:CC0協議微信號:如若不信(ruruobuxin)如若不信:
網易做為最早的三大門戶之一,喊著『做有態度的媒體』這個口號,切入到移動互聯網領域,一度大紅大紫,成為裝機必備。然後試圖變革,徹底改為機器推薦,數據一路下滑,是個可深入研究的推薦典型例子。
推薦閱讀:
※三百萬級用戶數據做基於用戶協同過濾演算法,相似度如何計算?
※最近我在完成一個旅遊個性化推薦系統的設計,裡面用到的關聯規則和一些協同過濾演算法,目前是用weka在做測試,有沒有對此比較熟悉的朋友?
※推薦系統中用到的熱傳導演算法和物質擴散是怎麼用的?
※請教推薦演算法中關聯規則的最小支持度和最小置信度如何確認呢?
TAG:推荐算法 |