數據分享讀書系列篇:《大數據時代》R凸凸d
————————————————收費轉載————————————————————
——作者:麵包君
——知乎專欄:數據分析俠
——時間:2016-4-17
接著讀書分享系列數據讀書分享系列篇:那些年數據分析師必讀書單;開始第一篇的讀書分享,《大數據時代:生活、工作與思維的大變革》。
當時看這本書的時代應該是在2年前了,那時候第一財經《頭腦風暴》把維克托請來大家討論什麼是「大數據時代」,雖然一堆非數據行業的專家都在討論這個話題,但是辯論的內容還是有不少乾貨,優酷上應該現在也還有這個視頻。視頻鏈接:頭腦風暴 2013(有興趣的可以看看),這本書對於小白來說,還是值得推薦。《大數據時代:生活、工作與思維的大變革》.掃描.pdf
維克托在書中介紹了一些數據cases,關於抽樣、誤差、準確度、相關性、數據隱私等幾個問題。讓我們在觀念上有了三大轉變:要全體不要抽樣,要效率不要絕對精確,要相關不要因果。全書介紹了 "大數據"時代三種大的變革:思維變革,商業變革和管理變革。在這些巨大變革如洪水一般的"衝擊"之下,現代社會的運作方式必將有重大的改變,若不順應這種變革的潮流,就像古中國固步自封,最終被堅船利炮打開國門而自己還用著長鉤鐵戟抗爭一樣,不可避免被掠奪,被落於世界進程之後,所以我們必須轉變我們的思想。
————————————————收費轉載————————————————————
————————————————作者簡介————————————————————
作者:(英國)維克托·邁爾-舍恩伯格(Viktor Mayer-Sch?nberger) (英國)肯尼斯·庫克耶(Kenneth Cukier) 譯者:盛楊燕 周濤。
維克托·邁爾-舍恩伯格(Viktor Mayer-Sch?nberger),被譽為「大數據時代的預言家」,也是最受人尊敬的權威發言人之一。現任牛津大學網路學院互聯網研究所治理與監管專業教授,曾任哈佛大學肯尼迪學院信息監管科研項目負責人,新加坡國立大學信息政策研究中心主任。一百多篇論文公開發表在《科學》《自然》等著名學術期刊上。備受眾多世界知名企業、機構和國家政府高層信賴的信息權威與智囊。他的諮詢客戶包括微軟、惠普和IBM等全球頂級企業;他是歐盟互聯網官方政策背後真正的制定者與參與者,也是世界經濟論壇、馬歇爾計劃基金會等重要機構的諮詢顧問;還先後擔任新加坡商務部高層、汶萊國防部高層、科威特商務部高層、迪拜及中東政府高層的諮詢顧問。他所著的《刪除》一書,獲得美國政治科學協會頒發的「唐·K·普賴斯獎」,以及媒介環境學會頒發的「馬歇爾·麥克盧漢獎」。肯尼斯·庫克耶(Kenneth Cukier),《經濟學人》數據編輯,曾任職於《華爾街日報》(亞洲版)和《國際先驅論壇報》。他是美國外交關係協會成員,CNN、BBC和NPR的定期商業和技術評論員之一。周濤,電子科技大學互聯網科學中心主任、教授、博士生導師。發表SCI論文150餘篇、領域一流期刊90餘篇,SCI引用超過2600次,H指數26,Google引用超過6000次。第五屆中國青少年科技創新獎和第十二屆中國青年科技獎得主。
————————————————收費轉載————————————————————
————————————————精彩句子賞析——————————————————
第1句:世界的本質就是數據。(PⅤ)
感悟及喜歡的原因:現今的我們正處於一個時代轉型中,有誰會想到富士、柯達膠捲這樣的百年企業會被時代所淘汰,因為科技的發展與互聯網的日益強大,數據將逐步取代舊事物,創造出新事物。第2句:這是當今社會所獨有的一種新型能力:以一種前所未有的方式,通過對海量數據進行分析,獲得巨大價值的產品和服務,或深刻的洞見。(P4)感悟及喜歡的原因:數據可以反映出很多項指標,特別是海量數據的處理下,如何挖掘獲得價值更是需要一種具有新型的複合能力人才,而得以用數據改變對世界的認知、改變市場、改變關係。第3句:大數據的核心就是預測。(P16)感悟及喜歡的原因:以前單純依靠人類判斷力的領域都會被計算機系統所改變甚至取代,運用大數據的處理與分析,為我們的生活創造出前所未有的可量化的維度。第4句:大數據是指不用隨機分析法這樣的捷徑,而採用所有數據的方法。(P39)感悟及喜歡的原因:「總體=樣本」以前是做不到的,現在對於數據的儲存、處理能力、統計技術與數據資源等各方面都有了飛速的發展,信息總量的變化也導致量變到質變的飛躍,並在其中去捕捉隨機抽樣所無法揭示的細節。
第5句:要想獲得大規模數據帶來的好處,混亂應該是一種標準途徑,而不應該是竭力避免的。(P60)感悟及喜歡的原因:處理海量數據會不可避免地導致部分信息的缺失,錯誤並不是大數據固有的特性,而是一個亟需我們去處理的現實問題。目前,我們正經歷著從數據的精準性到總體即樣本的關注焦點轉變,分析其多樣式與相關關係是這種缺陷的彌補方法。第6句:局限於狹隘的小數據中,我們可以自豪於對精確性的追求,但是就算我們可以分析得到細節中的細節,也依然會錯過事物的全貌。(P66)感悟及喜歡的原因:尋找數據間的關聯並利用,才是大數據超過小數據時代的真正價值。第7句:大數據的相關關係分析法更準確、更快、而且不易受偏見的影響。建立在相關關係分析法基礎上的預測是大數據的核心。(P75)感悟及喜歡的原因:只用知道是什麼,不用知道為什麼,相關關係幫助我們更快、更好地了解了這個世界。第8句:數據化是指一種把現象轉變為可製表分析的量化形式的過程。數字化指的是把模擬數據轉換成用0和1表示的二進位碼。(P104)感悟及喜歡的原因:計量和記錄一起促成了數據的誕生,它們是數據化最早的根基。數字化帶來了數據化,但是數字化無法取代數據化,因為數字化是把模擬數據變成計算機可讀、可處理的數據,和數據化有本質上的不同。第9句:預測給我們知識,而知識賦予我們智慧和洞見。(P117)感悟及喜歡的原因:雖然數據的使用還遠未成熟,但是從潛在的數據中挖掘出巨大的價值,然後揭示出新的深刻洞見,是我們思維方式的發展,同時也是智慧的開啟。
第10句:「現實挖掘」這裡指的是通過處理大量來自手機的數據,發現和預測人類行為。(P118)感悟及喜歡的原因:麻省理工學院媒體實驗室通過分析每個人去了哪裡、見了誰,成功地區分出了感染了流感的人群,而且在感染者還完全不知道自己已經患病之前就做出了區分。比如,伊格爾通過研究關注家庭主婦平均每周去幾次洗衣店,來試圖回答疾病如何傳播和城市如何繁榮。再比如Twitter通過創新,讓人們能輕易記錄以及分享他們零散的想法從而使情緒數據化得以實現。這種種都說明,通過讀取、分析數據,我們可以找出很多相關關係,讓我們對世界、對生活有更深刻的理解。第11句:將世界看作信息,看作可以理解的數據的海洋,為我們提供了一個從未有過的審視現實的視角。它是一種可以滲透到所有生活領域的世界觀。(P126)感悟及喜歡的原因:隨著時代的發展,數據逐漸可以量化一切。數據的價值也從最基本的用途轉變為未來的潛在用途。另外數據不同於物質性的東西,它的價值不會隨著它的使用而減少,而是可以不斷地被處理、再利用,挖掘出更大的未來價值。第12句:數據的潛在價值有三種最為常見的釋放方式:基本再利用、數據集整合和尋找「一份錢兩份貨」。而數據的折舊值、數據廢氣和開放數據則是更為獨特的方式。(P135)感悟及喜歡的原因:通過數據處理、創新再利用來發揮出現實價值,如搜索關鍵詞、推薦引擎、預測住宅的價值、設計店面的最佳布局、判斷營銷活動的有效性等等,從戰爭中學習戰爭,從數據中學習數據。第13句:他們思考的只有可能,而不考慮所謂的可行。(P166)感悟及喜歡的原因:內行與外行最大的區別在於思維不受限,它讓思維方式有更好的延展性、多樣性與豐富性。第14句:一旦得以有效利用,大數據就可以變革公司的贏利模式和傳統交流方式。(P170)感悟及喜歡的原因:大數據的利用,可以重新定位生產商與供應商的關係;可以通過商品本身收集數據並傳回製造商進行研究與開發;可以通過用戶交互提高服務;當文字變成數據,不僅人可以用之閱讀,機器也可用之分析……充分說明,第一,個人也好,公司也好,都需要與時俱進;第二,大數據的多樣性有待於更全面的開發,更好地服務於人們的生活。
第15句:大數據公司的多樣性表明了數據價值的轉移。(P176)感悟及喜歡的原因:隨著數據價值轉移到數據擁有者手上,傳統的商業模式同時也被顛覆了。數據不僅能夠優化生活和服務,甚至還能催生新的行業,催生新時代的人才。第16句:行業專家和技術專家的光芒都會因為統計學家和數據分析家的出現而變暗,因為後者不受舊觀念的影響,能夠聆聽數據發出的聲音。(P180)感悟及喜歡的原因:學會聆聽數據發出的聲音,第一需要與時俱進,跟上時代進步的步伐。第二改變了我們怎樣看待知識的價值。第三了解到,如今不只是專業技能的深度很重要,大數據的廣度也變得很重要。第17句:卓越的才華並不依賴於數據。(P212)感悟及喜歡的原因:大數據的風險是數據主宰一切的隱憂,但是個人的直覺、對市場的敏銳度等獨特個體所展現出來的才華同樣重要,它所呈現出來的強有力的創造力不亞於大數據。第18句:變革並不止於規範。(P219)感悟及喜歡的原因:大數據的運作是在一個超出我們正常理解的範圍之上的。大數據需要被監測並保持透明度,加上使這兩項得以實現的新型專業技術和機構。我們要發展,就必須先有其規模,在規模中去尋找規範的操作手法,才能讓變革立於不敗之地。第19句:莎士比亞曾寫道:「凡是過去,皆為序曲。」(P244)感悟及喜歡的原因:過去的每一點每一滴是為明天的開始打下堅實的基礎,一貫如是地堅持下去才有效力。
第20句:大數據提供的不是最終答案,只是參考答案,為我們提供暫時的幫助,以便等待更好的方法和答案出現。(P247)感悟及喜歡的原因:大數據是一種資源,也是一種工具,這裡引用一句話「混亂構成了世界的本質,也構成了人腦的本質,而無論是世界的混亂還是人腦的混亂,學會接受和應用它們才能得益。」————————————————收費轉載————————————————————
如果覺得有價值,請大家支持!打賞點贊(據說可以加芝麻分喲:D)!另外數據分析聯盟微信群也發展的很快,下面建個5群。
推薦閱讀:
※大咖熱議,大數據把脈,論網劇大風口的機遇與挑戰
※大數據時代,互聯網金融風控如何利用大數據建模而有別於傳統建模方式?
※大數據是不是侵犯隱私?
※入行大數據?
※如何合理搭建大數據分析團隊?需要有哪些背景的人?