為什麼用搜索引擎搜過的東西,在上別的網站時會顯示類似的廣告?這是互聯網的陰謀嗎?

我用搜索引擎搜過的東西,上別的網站尤其是小網站,現在連百度貼吧都會發現廣告。


你指的是向用戶提供個性化的服務,這在web應用中叫做會話跟蹤技術。

常用的會話跟蹤技術有CookieSession。簡單地說,Cookie通過在客戶端記錄信息確定用戶身份,Session通過在伺服器端記錄信息確定用戶身份。

Cookie是當你瀏覽某網站時,網站存儲在你電腦上的一個小文本文件,它記錄了你的用戶ID,密碼、瀏覽過的網頁、停留的時間等信息,當你再次來到該網站時,網站通過讀取Cookie,得知你的相關信息,就可以做出相應的動作,如在頁面顯示歡迎你的標語,或者讓你不用輸入ID、密碼就直接登錄等。

我們瀏覽網頁使用的是HTTP(HyperText Transfer Protocol)超文本傳輸協議,HTTP協議是無狀態的,就是指你看的網站的伺服器不知道你上次點了啥、看了啥、做了啥。那這樣就嚴重影響web應用的交互、用戶體驗。所以Cookie就是用來避開HTTP的無狀態性的辦法之一。伺服器可以設置或讀取Cookies中包含信息,藉此維護用戶跟伺服器會話中的狀態。

Cookie總是保存在客戶端中,按在客戶端中的存儲位置,可分為內存Cookie和硬碟Cookie。

內存Cookie由瀏覽器維護,保存在內存中,瀏覽器關閉後就消失了,其存在時間是短暫的。硬碟Cookie保存在硬碟里,有一個過期時間,除非用戶手工清理或到了過期時間,硬碟Cookie不會被刪除,其存在時間是長期的,存儲在硬碟上的Cookie可以在不同的瀏覽器進程間共享。

———————————————————————————————————————————

恩,是的,廣告商可以通過分析Cookie,為你推薦相關的廣告!

通過上面的講述,不難看出,使用Cookie,網站可以很方便的識別和跟蹤用戶,進而基於這個獨立的用戶,提供更為優質的服務。網站還可以基於Cookie和獨立用戶標識統計自己每天每月的獨立用戶數(在Cookie中寫入一個GUID(Globally Unique Identifier),Server端通過識別計算GUID的個數,便可進行UV的統計,就是整個廣告活動投放期間看過廣告的人數),基於用戶的行為進行個性化廣告推薦。

以某次廣告投放演算法為例,簡單說明一下怎樣由預先標註的關鍵詞標籤,一步步建立完整的受眾行為分析模型,挖掘出具有相似行為特徵的人群,提煉人群的屬性特徵,最終進行最合適的廣告投放的:

第一步,建立關鍵詞標籤:

關鍵詞標籤從何而來? 從網頁中來。一個Cookie會被貼上什麼樣的標籤,是由這個Cookie瀏覽過的網頁等歷史行為所決定的。這個預處理過程,大致可分為以下三步:

(1) 記錄受眾的歷史行為,包括產生瀏覽、點擊、搜索、註冊、購買等行為的網頁地址(URL),積累原始數據;

(2) 以商品內容和新聞內容為導向,建立關鍵詞標籤庫,作為受眾行為分析的基礎元數據;

(3) 針對所有受眾相關的URL,通過網路爬蟲程序和語義分析(分類和關鍵詞提取),生成每個cookie的初始標籤集合。

第二步,建立受眾對象模型:

關鍵詞標籤模型記錄了最原始關鍵詞信息,將爬蟲所得的非結構化文本抽象成為結構化的標籤信息。接下來對標籤的五個行為計數器進行加權歸一化處理,遍歷受眾的全部關鍵詞標籤,量化每個關鍵詞標籤對於受眾的重要程度,就形成了受眾對象模型。

第三步,使用聚類模型和演算法:

將數據集劃分為若干類。聚類的宗旨和評判標準是使得同類對象相似度儘可能大,而各個類之間的相似度儘可能小。

第四步,人群定向投放!


我發現了摧毀他們陰謀的方法,很簡單,只需:打開瀏覽器的工具選項把安全級別調整為最高或者禁止cookie...


朋友,你的洞察力相當敏銳,就跟我一樣。

我也發現要是在原版Android系統上隨時搭著梯子,手機每天都會問我是不是想去經常光顧的那家按摩店,還自動把地圖給顯示出來。

簡直是喪心病狂。


鄙視你們,一大堆人嘲諷一個外行,你們覺得很光榮?有優越感啊?

我覺得要只有嘲諷的三觀不正,人品惡劣的奇葩問題,問這問題的人明顯是真不知道。


留坑

原則:

首先,是你許可了(多數情況下是默許)你使用的瀏覽器在瀏覽的同時獲取了用於追蹤你的瀏覽記錄的可執行代碼(通常是javascript)

其次,服務提供方通過各種cookie(最原始的cookie,Flash LSPs,Local Storage)標註你的瀏覽器的唯一識別標記,由此識別出你就是之前來訪過的那個你。

對此說不的辦法:

初級

uBlock/Adblock Plus,訂閱Chinalist+EasyList+EasyPrivacy

高級

uBlock使用高級用戶模式

使用進級的uMatrix/NoScript,以及別的Cookie/Javascript許可擴展程序

再高級一些的

手機端需要使用別的方法來減少非必要信息的暴露


題主表現不算糟糕,我見過有業內的碼農一直以為互聯網公司的收入來自電信每個月收的寬頻費呢。


哇,這是陽謀


不,這是互聯網的餅乾


這個提問者明顯地是在誠懇的提問,不會答的人就不要嘲諷題主,就是看不慣你們這樣欺負人的,知乎的網友現在怎麼都這樣了?


騷年,我推薦你個插件叫廣告終結者,然後再把百度的cookies關掉。不要把這個秘密說出去不然會被百度追殺的。我看在你我有緣的份上才說的。


現在是大數據時代啊題主。

唉,題主,其實現在這個領域研究的最前沿… 比你現在碰到的厲害多了…我不敢說,怕嚇著你。(*?-?*)

你知道為了提高給用戶推送的準確度(當然搞這個研究肯定不是為了給你推送廣告…),我們要爬多少數據設計多少演算法編多少代碼做多少實驗嗎…

對,我馬上要念的Ph.D就是搞這個的…

不說了,擦擦眼淚繼續寫代碼。


我在很長時間裡覺得:卧槽!這也太巧了吧!


這不是陰謀。。。。。。 這個和大數據有關


怒答一題 手機碼字

這個問題我曾經也想過,以至於當我看視頻的時候兩邊都是飛機杯讓我刷淘寶刷過去了之後我意識到了問題的嚴重性。(不能讓朋友再玩我的電腦了)

畢竟我一農民最後還是沒能弄懂這個問題,當我參與了考研記得歷年真題中有一年有篇閱讀中說到美國就有雷同的現象,於是出現了無痕模式的瀏覽器,廣告人這個時候站出來說不行,即使是這樣用戶也不會少受到廣告而是不定向的廣告,意味著你會受到很多沒用的廣告!況且無痕模式也阻止不了他們,只要他們想不管你用任何方式都可以查到你的記錄!

回答的有點偏題,對這個問題理解不夠透徹,就是剛考完研想起這個!謝謝!


一大堆人在說cookie,其實跟cookie無關,cookie是禁止跨網站訪問的!

真正的原因是:你用任何一個終端(手機,電腦,平板)使用過大型網站(百度,淘寶,京東等大型企業,小型企業不大可能投入巨大的成本做這個).這些網站會記下你的終端的信息(CPU,網卡MAC地址...)和賬戶信息,以及你的搜索記錄,然後配合他們做的系統,能精準地向你發送你"在意"的東西.典型的大數據應用.現在淘寶做到了:只要你在淘寶上搜過相關東西,馬雲就能知道你有沒有車,是不是買了新房待裝修,你是不是喜歡運動......所以在互聯網裡,每個人都是裸體的,你的任何信息都有人替你保存著...


如果你用的是百度搜索,那麼如果你到了一個投放了百度聯盟廣告的網站,百度廣告代碼就會根據你的用戶信息和搜索偏好來推送相應的廣告;同樣,在淘寶上搜索寶貝,到了使用阿里媽媽的廣告的廣告位時也會推送淘寶相關的廣告。

這不是陰謀,而是廣告的精準化投放的結果,也是互聯網廣告行業的大趨勢!

比如你搜索了「上海到北京的機票」,那麼還會給你推送衣服的廣告嗎?肯定不會了,而是推送與機票相關的廣告。然後你到了北京也不會再繼續推送機票團購的廣告了,而是推送酒店打折或者旅遊門票的廣告。

這樣的精準分析用戶行為的投放才能做到利益最大化。


看了很多大神的回答,我來弱弱的說幾句!

首頁你在百度瀏覽搜索的時候,瀏覽器會產生緩存數據,就叫它cookie吧,然後當你訪問一些其他站點的時候,這些站為了盈利,引入了百度廣告聯盟的js,然後js會讀取你cookie內的信息,基於一系列複雜的運算,基於各種高大上的大數據技術,會給你推薦類似的東西!淘寶的同理!


挺傻逼的,老子都買完了,他們才貼廣告,一點意義都沒有。而且還特反感。


大數據典型應用,基於搜集用戶習慣數據後的針對性推送。


哎,我也剛發現不久。以前看到我們出版社的書去哪個網站都能看見,還以為單位市場部的人投了那麼多錢做廣告呢,想想圖書利潤這麼低還有錢投那麼多廣告,百思不得其解,後來終於明白了,sigh。

剛被糾正拼錯了單詞,不想活了。。


推薦閱讀:

華為EchoLife HG8120C接無線路由器 如何破解?
如何看待Impact Team於8月21日凌晨公布了從某婚外情網站竊取的數據?
非程序員有哪些電腦技能讓程序員感到神奇?
電腦小軟體相關網站?
網吧電腦只有顯示屏,那麼遊戲是在哪裡運行的呢?

TAG:互聯網 | 計算機網路 | 計算機科學 |