3分鐘,從奧巴馬競選中輕鬆讀懂大數據
陳 根
最近,身邊一群對新科技充滿好奇,卻又風趣地自諷為「偽科迷」的朋友向我吐槽:已經嗅到科技平民化時代的氣味了。大家都在說道著物聯網、AI、虛擬現實、大數據……頓時,感覺自己連「偽」都稱不上了,甚至開始有點LOW了。
其實,未來科技並沒有那麼神奇玄乎。今天,根哥就先來給大家科普點大數據。作為未來科技發展的趨勢方向,大數據已然成為當下風靡的流行。通過下面的介紹,希望能讓大家走出大數據的晦澀印象,更能在以後的談笑中胸有成竹。
大數據源於大量的數據
大數據源於大量、快速產生的數據。從量方面來說,我們可以做個簡單的核算:每一分鐘,人類就會寄出二億四百萬封電子郵件,張貼240萬則貼文到Facebook上,上傳72小時的影片到YouTube,以及把216000張新照片放在Instagram上,這所有的一切都是大數據體系里的基礎細胞。再從速度方面來看,當下全球的數據資料,有90%是在過去兩年的時間裡產生的;每年的數據增量都在50%以上。這一切共同打造了大數據碩大的基石。
有了大量的數據採集之後,大數據已經迅速成為互聯網發展到現今階段的一種表象或特徵,簡單地說,大量的數據通過雲計算、預測分析等技術手段進行梳理歸結,從而成為行為和決策的「指引者」。這也讓大數據有了一層「先知」的光環。但是,保持一份平常心是我們探尋大數據殿堂的基本態度。
大數據,如何才有用?
大數據有用,顯然是毋庸置疑的。但是,是不是只要是數據,就會創造價值呢?甚至部分人認為的,只要收集到大量的數據,就能帶動社會進步。顯然不是這樣的。如果缺乏處理數據資料的基本能力,只有數據量的拚命增長,那麼,這樣的大量數據不僅意義有限,反而只會造成巨大的成本和資源浪費。而大量數據之所以能成為大數據,更重要的是,我們能通過技術手段對這些數據資料進行處理,然後作出更明智有效的決策。如若不然,數據的價值將極為有限。
就比如在我們的童年時代,考試是每個人所必須面對的「麻煩事」。而通過一次次的考試,我們其實累積了許多學業資訊,只不過當時無法把所有資料點連結起來加以分析,所以並沒有產生出有特殊意義的指導性東西。同樣,企業界也是如此。想想看,過去多少企業在發展過程中,寄發了多少報告信件,積累了多少方法經驗,這些又都蘊含了多少商業資訊,卻因無法搜尋,致使無法大規模應用。甚至被誤認為是「沒什麼有價值的」而遭到閑置或丟棄。
大數據成就奧巴馬競選
大數據的作用到底有多大?既然企業都用不起來,那大數據還真的有用嗎?也許你的心裡已經開始犯嘀咕了。不過別急,接下來我們就來看看大數據在大選中是如何成就未來總統——奧巴馬的。
在中國,我們可能比較難體會到國家領導人「競選」是哪門子的事。所以,這裡估且借用美國總統競選的案例,來看看大數據的威力。而當下競爭得如火如荼的希拉里與特朗普之間尚未較量出個結果,所以,我們估且就來看看奧巴馬陣營在競選中打的大數據牌。
2012年,奧巴馬陣營在激烈的競選競爭中,充分運用大數據進行深度分析如何募款、在哪裡舉行選舉活動、如何打廣告等舉措,令對手無從招架。以電郵小組為例,在選戰過程中,奧巴馬的18人電郵小組測試了一萬多種不同版本的電郵訊息。甚至,他們針對單一電郵,發出18個不同版本的郵件,每個版本都附上不同的主旨,以測試哪一種最有效。結果最成功的標題是「對手經費快超前了」,總共募到2673278美元;表現最差的是「民調說中了一件事……」,只募得403603美元。此外,幾百名數據高手和數據分析專家組成的團隊還從募款到現場作戰方式到民調分析等全方面出擊,打得共和黨候選人潰不成軍。
一位電郵小組成員表示,「我們基本上發現,直覺毫無用處。」在競選過程中,奧巴馬陣營通過大數據分析,鎖定目標選民及催票計劃獲得卓越成效;以數據為基礎的募款活動更是創造出非凡成果,總共募得11.23億美元的選舉經費,其中有6億9千萬美元來自440萬民眾的線上捐款。奧巴馬打選戰的規模是共和黨候選人羅姆尼的兩倍,但創造出四位的成果。
大數據,真正意義在哪裡?
奧巴馬大選之戰告捷,大數據功不可沒。當然,大數據的「大」有其客觀價值所在。雖然長期以來,我們一直在收集大量數據。但是,「大數據」的真正意義在於,我們能即時處理某方面的大量資訊,並設法用來做點事情。我們可以根據即時分析,策略性作出不同的決策,而不是純粹仰賴事後的回顧性分析。過去典型的大量數據分析,例如大型研究或有些長期的持續性研究,都是事後才進行回顧性分析,而不是現有策略流程的一部分。想想看,花多年時間分析人口普查資料和打選戰時利用即時分析爭取選票,兩者的差異有多大。
在數據收集量大增的同時,大數據的發展還有賴於電腦運算能力的成長,這兩者可謂是相輔相成,相互補充。數據量日益龐大時,大家為了分析數據,並從中擷取商業情報,就會投入更多資金於強大的電腦,並儲存更豐富的資料。電腦威力愈強,就愈能輕鬆聚積大量數據,產生更多深度資料集。當然,大數據也有其潛在矛盾,因為大數據科技兼具細密和寬廣的特性,會檢視許許多多的小事實,再集合有限的事實成為既觀照全面又個人化的資訊。打個通俗的比方,大數據兼具顯微鏡和望遠鏡的功能:一方面協助我們檢視過去觀察不到的小細節,同時又能理解更大規模的數據,揭露以往因相隔太遠而被忽視的相關性。
大數據的尷尬與蛻變
大數據看起來很厲害,能夠讓你決勝於最高級別的總統競選。事實上也的確如此。到目前為止,大數據帶給真實世界的衝擊,可以說是方方面面的。比如,亞馬遜和Netflix通過「推薦引擎」,為顧客提供更準確的建議;企業通過數據分析,做出相對更精準的決策。但是,就像每個人都會有自己不為人知的痛楚一樣,當前的大數據也有著自己的難堪與尷尬。據最新的調研報告顯示,每天都在鋪天蓋地誕生的大數據,其實有59%的數據量是無效的;我們所採集的70%-85%的數據,因為過於複雜而難以有效使用;而85%的企業靈氣架構無法適應數據量和複雜性增長的需要;甚至,鑒於數據分析的能力,98%的企業尚無法及時、準確地為業務提供正確的信息。
但是,今天的大數據應用還只是開端,再過不了多少年,大數據將不再只是個時髦的名詞,目前似乎和數據分析不相干的生活層面,也都會被大數據一一滲透。甚至,大數據還將改變我們吃的食物,穿的方式,說話的邏輯,並且打破公共領域和私人生活的界線。
推薦閱讀:
※第三節:簡單的數據處理和分析(2)
※「互聯網金融&大數據風控」結合的九大維度
※熱雲數據:數說買量| 買量?你是為啥買不起的!
※從三大關鍵詞解讀我國智能製造產業發展現狀
※大數據「殺熟」,懂你才能更狠的「宰」你,蘋果用戶扎心了。
TAG:大數據 |