《智能時代》讀書筆記&心得
05-24
《智能時代》讀書筆記&心得
◆內容簡介:
推薦閱讀:
大數據和機器智能的出現,對我們的技術發展、商業和社會都會產生重大的影響。作者吳軍在《智能時代:大數據與智能革命重新定義未來》中指出,首先,我們在過去認為非常難以解決的問題,會因為大數據和機器智能的使用而迎刃而解,比如解決癌症個性化治療的難題。同時,大數據和機器智能還會徹底改變未來的商業模式,很多傳統的行業都將採用智能技術實現升級換代,同時改變原有的商業模式。大數據和機器智能對於未來社會的影響是全方位的。
◆作者簡介: 吳軍,博士,與2002年加入谷歌公司,2010年加盟騰訊公司,出任負責搜索和搜索廣告的副總裁。2012-2014年回到谷歌,領導計算機自動問答項目。2014年,他在矽谷創辦了豐元資本風險投資公司。他在美國兩家風險投資基金(中國世紀基金和ZPark風險基金)分別擔任董事和顧問,也是約翰霍普金斯大學工商學院董事會董事,以及該校國際事務委員會的顧問。 ◆目錄:第一章 數據—人類建造文明的基石第二章大數據和機器智能第三章思維的革命第四章大數據與商業
第五章大數據和智能革命的技術挑戰第六章未來智能化產業第七章智能革命和未來社會後 記 ◆讀書心得&筆記: 1997年智能電腦「深藍」在國際象棋棋盤上戰勝了卡斯帕羅夫後,有人就跳出來說,電腦在國際象棋盤上獲勝卻很難在圍棋盤上獲勝,因為圍棋的複雜性要比國際象棋難上6—9個數量級……2016年3月9日,由GOOGLE公司開發的智能電腦ALPHAGO,以4:1的絕對優勢戰勝了當今圍棋第一人李世石,本書作者認為,此事意義非凡,足可宣告智能時代的來臨。
機器智能還有一個特點,那就是一旦它超過了人的智能,人類在此方面的智能要想反超幾乎是不可能的,也就是說,今天的ALPHAGO戰勝了李世石後,此後比分只會比4:1更懸殊(5:0、6:0、7:0),而不會比其更接近。 自古數據的運用 數據和信息雖然有相同之處,但還是不同,信息是關於世界、人和事的描述,它比數據來得抽象。隨著人類的進步以及處理數據和信息的能力不斷增強,人類從數據中獲取有用信息的本事就越來越大,這就是今天所說的大數據應用的基礎,對數據和信息進行處理後,人類就可以獲得知識,知識比信息更高一個層次。 人類的文明基本伴隨這樣一個過程:獲取數據——分析數據——建立模型——預測未知,由此可見,數據在人類文明中起到了基石的作用。印象最深的就是通過文中描述,人類老祖先對天文曆法的觀測及評估,精確到讓人匪夷所思的地步,比如很早的時候就認識到一年不是剛好等於365天,而是在此基礎上要多四分之一天。但同時,受制於其(主要是西方)追求宗教及美感的完美型,而過於僵化的規定了很多法則,比如行星的運行軌跡他們始終認為應該是完美的圓形,從而走了彎路。相關性
相關性是利用及研究數據最原始、最主要的途徑,文中舉例說:日本人通過1964年中國的《人民畫報》上刊登的鐵人王進喜的照片,分析出了關於大慶油田的許多細節信息(這些信息是高度保密的),從而對應的開發出與之適應的開採設備,從而拿到了機器供應的項目。 這種思維方式衍生至今,成為了大數據時代的重要理論基礎,比如GOOGLE在2007年開發出的產品——GOOGLE趨勢,利用這款產品,任何人都可以看到全世界用戶在GOOGLE上搜索的關鍵詞隨著時間和地點變化的趨勢,從而知道大家關注什麼事情,具體到我們最熟悉的購買網站上,就是「猜你喜歡」這類東西,讓你買東西便捷同時也欲罷不能。 同時,相關性具體到具體的學科上,就是當今的概率論與統計學(大學時候學習時簡直痛不欲生)。文中舉了著名的《文學文摘》及「蓋洛普」預測美國總統競選的事情,闡述了其中很多微妙之處(包括數據的代表性),當「蓋洛普」連續預測準確了三次總統獲勝者以後,在杜魯門與杜威的選舉中由於考慮的因素不夠全面導致數據採集與分析失真,直接導致了蔣介石所代表的民國政府押錯了寶,從而其不看好的杜魯門一上台就對蔣政府的反感甚至敵對,削減了對其支持,是導致其內戰失敗的一個重要因素。人工智慧與大數據
顯然,即便計算機戰勝了頂級國際象棋、圍棋高手,我們依然不會覺得它就真的比我們人類聰明,說白了,你計算機在很多方面相對於我們人類來說還是「很笨的」嘛!比如說,目前電腦智能水平對「是什麼」(WHAT) 「什麼時候」(WHEN)、「什麼地點」(WHERE)、「哪一個」(WHICH)、「誰」(WHO)可以對答如流,但面對「WHY」(為什麼)及「HOW」卻很苦惱,舉個具體的例子,電腦即便可以讀懂我們說話的意思,但很難讀懂我們說話語氣的喜怒哀愁,電腦可以識別我們的面容,但很難分析我們此時表情的情緒情感…… 目前比較公認的人工智慧體現的標準就是著名的計算機之父圖靈提出的「圖靈測試」,內容為:如果電腦能在5分鐘內回答由人類測試者提出的一系列問題,且其超過30%的回答讓測試者誤認為是人類所答。將其分解與具體化為:1、語音識別;2、機器翻譯;3、文本的自動摘要或者寫作;4、戰勝人類的國際象棋冠軍;5、自動回答問題。可見,今天的人工智慧水平已經可以解決或者部分解決以上幾點,但要全部解決是需要一個很艱巨的過程,就拿第5點自動回答問題來說,上述已經說到了計算機的苦惱所在,目前普遍認為,對於以上的完成度沒有超過30%。 但是,我們今天處在了智能時代指數化爆棚的時代,一些看似不可能的事情或者說預估需要很長時間完成的事情,卻比我們想像中來得更快。我們再拿一個美國大選的例子說明,如果說預測美國總統的花落誰家在此之前依然有所誤差,而要預測美國51個州的選舉結果簡直就是天方夜譚,但是,在2012年,一個名叫內德.斯維爾的年輕人做到了——成功預測了全部50+1個周的選舉結果,而其最主要的方法就是我們今天掛在嘴邊卻又顯抽象的一個詞——大數據,他在互聯網上,尤其是互聯網的各種社交網路上,儘可能地收集所有美國2012年大選有關的數據,其中包括各地新聞媒體上的數據,留言簿和地方新聞中的數據,FACEBOOK和TWITTER上大家的發言及其朋友的評論,以及候選人選戰的數據等,然後按照州進行整理!請注意,這裡最關鍵的一句話來了:「他的收集反映了選民在沒有壓力的情況下真實的想法,準確性很高」,這一點十分關鍵,這也是我們之前說「蓋洛普」公司預測失敗的根節所在,在我之前關於心理學的文章中反覆提及:人在填寫調查問卷時由於迫於自我幻想及壓力等因素,其表達很可能與其真實想法正好相反,而如今大數據在以「潤物細無聲」的方式收集我們的信息,可見其真實性是非常高的!它剝開了我們的心理防線,收集到了我們最真實的思想數據! 以上說明,人工智慧其實就是大量數據不斷「堆砌」的一個過程與結果!伴隨其數據收集的過程更加高效、龐大與準確,從而形成我們今天郎朗上口的「大數據」!大數據是實行人工智慧的最佳途徑與方法。「機器智能最重要的是能夠解決人腦所能解決的問題,而不在於是否需要採用和人一樣的方法,」個人認為,這句話就是形容人工智慧的精髓所在! 方法論的逆轉 為什麼今天我們引以為豪的華夏文明沒有成為世界文明的主流,為什麼西方的科技文明依然是當今世界的主導?為什麼「科學」是我們今天共同認可的最合理、最可取的接近真理的方法?文中的第三章《思維的革命》通過從歐幾里得、托勒密到牛頓、瓦特、娓娓道來了一段西方人尋找真理的智慧歷史,我們的知識體系中其實最了解、最重視的是其結果,而往往忽視了最重要的東西——方法與論證,這就是為什麼我們今天還在爭辯中醫西醫的話題,中國有句古話「授人以魚不如授人以漁」,其實說的就是方式方法比直接給予結果更重要。 青黴素髮明的偉大之處已經不能用言語去形容,但很多人不知道的是,其實,在1928年亞歷山大.弗萊明就發現黴菌可以殺死細菌,但他並不知道黴菌殺菌的原理,到這裡,也許我們的中醫可能覺得就已經夠了,「你管他為什麼?你只要知道結果就夠了」,這就是問題所在,而西方人卻「知其然還要知道所以然」,在今天我們的製藥行業中依然遵循著「研究病理找到真正致病的原因,然後針對這個原因找到解決方案」,距離弗萊明首次發現青黴素已經過去11年,錢恩和他的同事愛德華等人找到了青黴素的有效成分——一種被稱為青黴烷的物質,這種物質能夠破壞細菌的細胞壁,而任何動物的細胞沒有細胞壁,所以青黴素可以殺死細菌卻不會傷害任何動物,這才算搞清楚青黴素殺菌的原理,才有了後來合成青黴素、研究其抗藥性原理、發明頭孢類的抗生素這才形成一套完整的科學體系! 「青黴素和其抗生素的發明,實際上遵循了「分析找到原因,根據原因得到結果」的思維方式,或者說知其然也知其所以然。這種方法帶來的好處是有目共睹的,工業革命後人類壽命的提高都是依靠這種方法。相反,傳統醫學(中醫)常常不遵循因果關係,是不知其所以然,因此治病的效果有時好有時壞,然後醫生們用一些事實而非的語言解釋他們其實並沒有搞清楚的原因」(原文)
我國的驕傲、諾貝爾獎得主屠呦呦通過在中醫典籍的基礎上提煉出「青蒿素」,就是完成知其然另搞清楚所以然的過程!這就是科學方法論精神的體現! 然後,科學的有意思和殘酷性在於,在某種層面上雖然它是不斷被確定的結果,但同時也會被不斷的否定,正所謂天外有天,牛頓的理論在某種層面上被愛因斯坦推翻,而愛因斯坦在與波爾針對「不確定性」的爭論中說到「上帝不擲骰子」(即否定不確定性),最後卻以波爾獲勝為果,簡而言之,我們今天開始關注於「不確定性」的存在,反映了「機械思維」的兩面性,善於把握確定性而難以解決不確定性問題。 文中總結「很多時候,落後與先進的差距,不是購買一些機器或者引進一些技術就能夠彌補的,落後最可怕的地方時思維方式的落後,西方在近代走在了世界前列,很大程度上靠的是思維方式全面領先。 機械思維曾經是改變人類工作方式的革命性的方法論,並且在工業革命和後來全球工業畫的過程中起到了決定性的作用,今天它在很多地方依然能指導我們的行動。如果我們能夠找到確定性(或者可預測性)和因果關係,這依然是最好的結果。但是,今天我們面臨的複雜情況,已經不是機械時代用幾個定律就能講清楚的了,不確定性,或者說難以找到確定性,是今天社會的常態。在無法確定因果關係時,數據為我們提供了解決問題的新方法,數據中所包含的信息可以幫助我們消除不確定性,而數據之間的相關性在某種程度上面可以替代原來的因果關係,幫助我們得到我們想知道的答案,這便是大數據的核心。大數據思維和原有機械思維並非完全對立,它更多的是對後者的補充,在新的時代,一定需要新的方法論,也一定會有新的方法論」
大數據與革命
文中用了大量的事例告訴我們,大數據來了,它在改變一切,各行各業、傳統思維,有多少算多少,一個也跑不了。 文中談到大數據抓販毒、購物的偏好推演、PRADA的市場分析、GOOGLE的無人駕駛汽車、GE冰箱的智能化等等,大數據與人工智慧也許剛開始來的時候是和風細雨的,為現有行業服務與優化,但是,當量變產生質變的時候,它便會如「洪水猛獸」般「自成一派」,衝擊甚至取代著原有行業,一旦擊倒,即再無翻身之日,就像今天我們還能看見小時候那大街小巷星羅密布的「租碟子店」嗎? 從工業革命開始,幾次主要的技術革命都遵循相似規律。首先是大部分現有產業加上新技術等於新產業,或者說原有產業需要以新的形態出現,其次,並非每一家公司都要從事新技術產品本身的製造,更多時候它們是利用新技術改造原有產業。這次以大數據為核心的革命都會衍生新的思維方式和商業模式,企業只有在思維上跟上新的時代,才能在未來的商業中立於不敗之地。 大數據與隱私記得「羅輯思維」有一期叫做《告別即將逝去的隱私》中提到,大數據將無情的剝奪我們的隱私,除非我們拋棄所有智能設備遠離現代化城市,躲到深山老林去。
今天的我們,已經享受到了大數據給我帶來的便利性,然而,我們為此付出的「貨幣」既是我們的隱私,因為大數據的發展的原動力就是數據採集的全面性與存儲的大容量,應該說,目前看來是利大於弊的,比如,犯罪的風險與成本將大幅度提高、我們因疏忽大意的挽回率將提高、智能分析我們的個性化需求將提高,畢竟,大數據的掌握勢必會在大的機構、單位或企業手裡,而他們迫於社會責任及對隱私的保護,一般而言是不會濫用的,對於正常生活的老百姓個體,影響不會太大。 但同時,我們也能夠在日常生活中感受到隱私被泄露的煩惱,比如,現在的電話推銷讓我們莫名其妙於我們的電話怎麼會掌握到他們手裡,更進一步的是網路詐騙,他可以直呼我們的名字、知道我們的單位、甚至我們目前的需求,其實這些都是小伎倆,書中提到,還有可能商家會掌握那些不怎麼對產品質量斤斤計較的客戶,採取兜售殘次品、假貨的行為,因為他們覺得此類用戶比較大線條、對產品的偽劣不會太計較,而保險公司掌握大量個人的信息後,會對客戶更加挑剔,從而制定更多的標準甚至拒保。 我國對於用戶隱私的法律保護是比較滯後的,相對於美國,比如FBI要求蘋果公司交出用戶數據以便於查找恐怖分子,蘋果公司可以說「不」,而顯然在我們這裡卻不行,當然,對於大多數遵紀守法老百姓來說,我們的隱私給國家交就交吧,清者自清,但是,別忘了,國家機構裡面操作的具體也是人,據我所知,我身邊朋友通過警察朋友查伴侶的開房記錄已經不是什麼新鮮事兒了,雖然這看起來有其正當性,但這種對隱私保護來說,還是顯得有些的輕佻,如果別有用心的人或機構利用這些空蕩,不知道可以玩出多少花樣甚至勾當出來。 今天的各大IT大牌公司,最關心的是什麼?作者坦言到,當然就是用戶的數據,「不怕你消費不起,就怕你不用」,越是大公司的軟體,越是免費甚至倒貼,為什麼?他們要的不是我們的錢,而是我們的數據,對!數據就是一個IT公司最大的財富、最大的資本,從GOOGLE、蘋果、微軟到百度、騰訊、360、小米,一個想長久立於不敗之地的IT企業無一例外的會把用戶數據看成頭等大事,那些年,QQ不免費我們會用?360不免費我們會用?百度不免費我們會用?淘寶不免費我們會用?若干年後,這些「免費公司」成為了其各個版圖的龍頭老大,讓我們養成使用習慣的同時,也讓我們的數據永遠的留在了他們那裡,我們的數據是什麼?其實就是隱私。握著這些數據,「龍頭大哥」就很難被後來居上的「小弟」搞掉,他們趕上了信息時代至智能時代的首發航船,而刺激之處在於,在某個領域很有可能就只發這一班船。 那在這個智能時代的開端,我們可否趕上其他領域的首發航船呢? 飯碗搶不過機器人 接著上面的問題,可能有人會說:「我這人懶,就在我這艘大船裡面過得挺好,也不想挪窩了,也不想趕什麼「首發航船」了。」但是,現在的問題在於,你趟得安穩的那張床、那艘船可能並不安穩,因為很有可能會被連人帶床甚至帶船一同被掀翻,而這個討厭鬼就是「智能機器」。 我7月份寫過的一篇心得叫做《矽谷鋼鐵俠》,講的就是馬斯克與他的那些智能、高科技的「怪獸」們,而目前,其旗下的特斯拉汽車生產線已經不僱傭「人類」工人了,引起了汽車公會的強烈抗議!但那又如何?於情於理、於技術於經濟於發展,特斯拉汽車真的找不到繼續聘用「人類」工人的理由了。機器人要價低、工作勤奮不休假、高效高質量、沒有不良情緒、沒有公會鬧事、不涉及人倫人權、甚至還可以為客服提供個性化服務,你是老闆你會怎麼選擇,我估計當馬斯克看到這些抗議的人群後,一定會會心一笑告訴他的身邊人說「看,這恰恰證明我是對的,機器人才不會這樣」。 何止汽車製造業?書上列舉並解釋智能機器人可逐步替代的行業說出來可以讓人目瞪口呆:製造業、農業、體育、醫療、律師、新聞記者、教育、金融等等,那些純靠體力勞動與簡單智力勞動的行業更是不在話下……(詳見原書) 「在信息時代,適合年輕人的工作越來越少。到了智能革命以後,任何簡單動腦的工作可能都要消失,甚至那些現在從事所謂高大上職業的人,也會失去工作。」 (原文)「智能革命所要替代的是人類最值得自豪的部分——大腦。以前,當各種各樣的機器可以越來越多地從事人類才能做得工作時,人類還保留了最後的尊嚴和自豪——機器不能思考。……不過智能革命的結果是讓計算機替代人去思考,或者說靠計算能夠得到比人類思考更好地結果,能夠更好的解決各種智能問題,這時,人類會突然發現自己還能做得比計算機更好的事情已經所剩不多了。」 做那2%的人 人類歷史上,每一次技術革命,都會造就一大批名利雙收、名存史冊的偉人,同時,也會讓勞動大眾經歷一場浩劫般的遷徙與洗禮,作者認為,這場史無前例的智能革命將會造就2%的成功人士,同時也會讓98%的人「隨風飄蕩」甚至「措手不及」。 「在智能革命到來之際,每一個人有兩個選擇,要麼加入到這一次浪潮中,要麼觀望徘徊,最後被淘汰。當然,大多數人的觀望、猶豫和徘徊,給了2%的人機會,使得願意吃螃蟹的人在奮鬥的道路上少了很多競爭對手。正式因為知道自己不加入進來會被淘汰,馬斯克和蓋茨一方面對機器智能的發展非常擔心,另一方面卻選擇加入到機器智能的大潮中。」 「大數據導致機器革命的到來,這對未來社會的影響不僅僅存在於經濟領域,而是全方位的。儘管總體上這些影響是正面的,從長遠看會使我們未來的社會變得更好;不過,和以往的技術革命一樣,智能革命也會帶來很多負面的影響,特別是在它發展的初期,而這些影響可能會持續很久。 任何一次技術革命,最初受益的都是發展它、使用它的人,而遠離它、拒絕接受它的人,在很長的時間裡都是迷茫的一代。在智能革命到來之際,作為任何企業無疑應該擁抱它,讓自己成為那2%的受益者;而作為國家,則需要未雨綢繆,爭取不要像過去那樣每一次重大的技術革命都伴隨半個多世紀的動蕩。 我們還沒有經歷過機器人在智能上全面超越人類的時代,我們需要在這樣的環境里學會生存。這將是一個讓我們振奮的時代,也是一個給我們帶來空前挑戰的時代。」 智能時代來了,我們到底應該被機器人踩在腳下,還是成為它們的主人?朱江
2016年10月19日星期三推薦閱讀: