大數據真的可以預測未來嗎?

最近一直在考慮這個問題, 因為最近出現很多雲計算公司,那麼我想提問一下:數據達到一定體量之後,可以通過雲計算來預測即將到來的未發生事件嗎?


謝邀!

既然專家們都答能,那我就答不能吧!
比如說,《大數據時代》這本書里很多案例已經被證偽!
未來代表什麼?一半是人性,一半是天意。

人心難測,這句話不會隨著科技的進步而改變!
就算是華爾街精英們,股市的動蕩往往也會被某個突發的、名詞相關的,但是不相干的事件所影響。量化投資在國外是多麼成熟的應用了,都還會出這種問題,就何況其它領域呢?

未來是很難預測的,但是如果短期的趨勢預測,還是有可能呢!比如說,居於你的歷史數據,還是能夠對你這個人大概的模型進行刻畫的,淘寶的千人千面就是這樣玩的。一個新生母親,往往逛的都是嬰兒相關的。像我這樣一個釣魚翁,給我推薦釣魚相關的東西,即便我不需要,也難免有時候會忍不住剁手。這樣來理解一種預測你下一步的購物行為,我覺得是可以做到的!

但是,比如說,居於某些數據,預測比較長遠的事情,真的蠻不靠譜的,不過是忽悠投資人的說辭罷了!


關於預測其實是這樣的?如果預測的結果只有兩種答案,那麼我預測任何一種情況的可能性都有50%的正確性,比如明天下雨和不下雨這件事情。可是如果我地處印度北方,又逢夏季,那麼我預測明天下雨的正確性就會增加到70%甚至更高,因為我知道每年夏天北印度洋季風環流總是會給喜馬拉雅南麓帶來充沛的降雨,無一例外。預測這件事情只和一件事情有關,那就是你對這個事情了解的程度。大數據豐富了我們觀察事物的角度,有助於我們從細節和更多維度了解世界,所以的確是可以幫助我們更好的預測的一些事情。從這個意義上,不是有了大數據我們才可以預測,而是有了大數據,我們可以做更準確的預測。我不知道你所說的未來具體是指什麼?這個範圍太大,你需要劃個界,否則討論毫無意義。


簡單回答:可以。什麼是預測?簡單說就是猜一下,我不用大數據就可以預測很多未來,比如納斯達克明天不會低於5000點,不會高於1萬點。比如明天北京最高氣溫不會高於60度不會低於0度。預測未來有那麼神秘嗎?


多看看當地的天氣預報 這種問題需要問?

問:天氣預報可以預測未來的天氣嘛
答:可以
問:明天什麼天氣?
答:雨天
第二天
問:不是說雨天嘛?怎麼還是晴天!
答:雨天的概率是90%(天不下雨怪我嘍)
同理大數據可以預測未來


自古以來,預測未來運勢一直是人類孜孜以求的目標。

不過可惜的是,迄今為止還沒有任何一種理論或技術可以真正做到預測未來。然而最近,來自麻省理工學院腦與認知科學系的約翰·加布里埃利(John D.E. Gabrieli)教授撰文[1]指出,基於如核磁共振成像(MRI)等的新一代無創神經成像技術(noninvasive neuroimaging)可能為預測個人未來行為趨勢提供新的參考。這篇綜述今天發表在《神經元》(Neuron)上。

從神經活動到個人行為

在過去的幾個世紀里,神經學家通過研究一些特殊的損傷病例了解到了大腦許多腦區的功能。例如上世紀中葉,對因為手術切除海馬結構而無法形成記憶的亨利·莫萊森(Henry Molaison,「病人H.M.」)的研究就揭開了學習記憶的形成機制。此外,對被鐵棒穿過前額葉導致性格大變的菲尼亞斯·蓋奇(Phineas Gage)、對因手術切斷胼胝體而導致大腦兩個半球無法協作的「裂腦人」等案例所進行的研究,為神經科學勾勒出了大腦運作的基本框架,可以說是現代神經科學的基礎。

進入21世紀以後,大量更快、更好、對研究對象影響更小的研究技術被開發出來,神經科學研究也開始從特殊病例轉向一般人群。短短數十年間,一個接一個腦區的功能被相繼破解出來。以這些工作為基礎,科學家得以將大腦某些特定區域和人的行為相關聯起來。舉個例子,人的前額葉(Prefrontal cortex)和高級智力活動密切相關,前額葉損傷的病人會表現出痴呆以及道德感喪失等癥狀;相對而言,前額葉發達的人則往往具有較高的智商和自制力。類似地,中腦腹側被蓋區(VTA)等腦區組成的「獎賞系統」與人的快感有關,這些腦區比較活躍的人往往更容易出現暴飲暴食、酗酒以及濫交等行為,反之,這些腦區特別不活躍者則更有可能出現抑鬱症等問題。

愛因斯坦的大腦較之常人擁有更多的溝回,這個特徵在前額葉表現得尤為顯著。這會不會是他天才智力的緣起呢?

儘管我們現在還難以確認這些神經學特徵(Neuromarker)與人的外在表現之間是否存在因果關係,但加布里埃利教授相信,僅僅依靠統計學上的相關性,這些神經學特徵就已經能為個性化醫療或教育提供重要的參考:「我並不認為我們需要嚴謹的因果關係才能做好我們的工作——當然,如果有的話總是最好的。現在的問題在於,對於許多精神疾病患者而言,幾乎沒有任何信息可以揭示哪一種療法會更加有效。而如果體現相關性信息可以預示何種療法最有可能有效,只要能推廣,那也是很有裨益的事情。」加布里埃利對果殼網科學人說。

無創神經成像技術與大數據分析

從人類意識到大腦是思維的物質基礎開始,就有人試圖通過研究大腦來預測人的行為。但是大腦被完全包裹在顱骨這個「黑匣子」中,早期又沒有合適的透視技術,因此當時人們都寄希望於通過觀測人的頭部特徵來獲取大腦的信息。從風靡於19世紀的顱相學(Phrenology)到給死囚做「死亡面具」[2],無數人在這方面做了各種令人啼笑皆非的嘗試。但從20世紀中葉開始,對大腦的研究開始轉入正軌,人們意識到大腦的特徵不一定能從人的外表體現出來,於是乎那類看臉的研究也就慢慢沉寂了。

到了20世紀後半葉,由於物理學的進步,許多新的研究手段被開發出來,神經科學家們從此終於可以不用開顱也能知道大腦的信息了。其中,基於「核磁共振」原理所製造的核磁共振成像系統(MRI)可以像X光或是CT掃描一樣「透視」大腦,同時還比它們擁有更高的解析度且不會產生任何傷害。MRI目前已世界主流神經科學或心理學研究機構的標準配置。

加布里埃利認為,這種高性能的設備可以從人類大腦當中分析出海量的數據,結合現代的超級計算機與大數據演算法,就可以藉助這些數據對具體個人在未來一段時間內的心理、健康乃至行為作出預測,從而實現個性化的醫療、教育和生活指導。

左圖為一套現代臨床上常用的核磁共振成像設備,右圖為利用核磁共振成像所構建的大腦神經纖維三維結構圖。

「我認為人的行為受到共性因素和個性因素——包括文化、年齡,也許還有遺傳和性別等因素——共同影響。因此我們需要足夠多的樣本來稀釋這其中的某些差異。」加布里埃利在接受果殼網科學人採訪時強調,「不過我認為我們的目標在於做到比當前更好。對預測性神經科學的運用基於以下理念:某些因素對我們尤其重要,這些因素會導致同樣的療法或教育對不同的人產生不同的結果。而我們如果可以從觀測大腦來有效量化這些差異的話,就能更加個性化地為人服務。」

從採集數據到建立預測模型的一般流程。

但即便基於腦成像的行為預測能夠實現,也並不意味著人的「命運」是被預先決定的。 「相反,我認為我的工作實際上是反宿命論的。現在,精神病人接受治療也好,學生接受教育也好,他們所接受的這些手段對他們是否有效現在無從預判。」加布里埃利說,「而有效程度是由個人特質和干預手段之間的相互作用決定的。我們希望可以通過了解何種療法或是教育手段對具體某人的效果最好,從而針對性地選擇有效的方法,而迴避那些無效的。」

通過腦成像預測學習與認知表現

在過去幾年中,已經有過若干試圖利用無創腦成像技術進行預測的研究,其中有不少都是針對成人或兒童的學習和認知表現展開的。加布里埃利指出,這些研究在未來將有助於為每個人量身打造個性化教育。

在2010年到2013年發表的幾項研究表明,大腦背側紋狀體(dorsal striatum)體積較大的人會擁有更善於掌握電子遊戲技巧,而與之相對地,這個腦區受損的病人都會表現出不同程度的學習障礙。在21世紀初的一些研究則表明,大腦頂葉不對稱以及左側哈氏回(Heschl』s gyrus)的白質密度較高的人會擁有較好的外語學習能力。不但如此,還有一些通過對被試者進行實時觀測的研究,更是直接將大腦的某些區域和特定的腦活動信號與特定的學習認知活動相關聯了起來——這些神經學特徵可以很好的反應一個人處於怎樣的精神狀態中。

有證據提示,大約有5%–17%兒童會在剛上學的時候出現發育性閱讀障礙(developmental dyslexia)癥狀,這些孩子的外周器官都沒有明顯的缺陷,但是他們比其他兒童更難學會閱讀。這種現象存在很明顯的家族性。有一些研究指出,使用MRI掃描這些家族的新生兒大腦,經常會發現一類特徵性的電活動。利用這些神經學特徵來預測這個孩子在8歲左右是否會出現發育性閱讀障礙,準確率能達到81%。與此類似,有一項研究表明,通過功能性MRI(fMRI)檢測大腦右側額下回(inferior frontal gyrus)的活躍程度可以預測青少年(8-12歲)在接下去幾個月中的語言學習能力。無獨有偶,在另一項研究兒童數學學習能力的實驗中科學家們也得到了類似的結論,研究人員發現大腦右側海馬灰質較大的學生在解決數學問題時具有優勢。

大腦右側額下回(圖A彩色部分,越紅代表越活躍)越活躍,孩子的閱讀能力就越強(圖B);右側海馬灰質(圖C黃色部分)越大的孩子數學學得越好(圖D)。

通過腦成像預測健康相關行為

除了學習和認知等與大腦直接相關的信息外,通過掃描大腦所能預測的事情還有更多,其中就包括健康預期以及治療手段是否能夠生效這樣的切身大事。加布里埃利教授認為,這些信息可以為個性化治療和保健提供至關重要的參考。

不少人都知道酒精對人,尤其是青少年身體的危害非常巨大。藉助於MRI,研究人員就發現了不少與酗酒相關的神經學特徵。在最近幾年的若干研究中,科學家發現那些大腦前額葉與前扣帶回活躍度較低,而基底神經節比較活躍的青少年更有可能酗酒,之前的研究也提示這兩些腦區和人的自制力密切相關。除了酒精的問題以外,研究人員還對諸如濫用藥物、暴飲暴食以及濫交等危害健康的因素進行了分析,結果都在大腦中尋找了多處與之相關的神經學特徵。

這些對神經學特徵的分析不但可以預測每個人的健康狀況,還可以為療法的選擇提供指導。以抑鬱症為例,當前的治療手段,無論是心理干預還是藥物治療,其療效和副作用都存在很大的個體差異,但傳統的診斷技術並不能很準確地對患者的特質進行分析。加布里埃利相信,如果將預測神經科學手段引入到診療中,那麼這些問題就都能得到很好地解決。

這種想法並非毫無根據。研究人員發現,多種治療抑鬱症的藥物的有效性和大腦中一個叫做前亞屬扣帶皮層(subgenual anterior cingulate cortex)的腦區的代謝水平密切相關。有證據顯示,提升那一片腦區的活躍程度可以大大提升抑鬱症的治療效果。事實上,利用深度腦刺激(DBS)治療抑鬱症的技術就基於這些理論。在其它諸如強迫性官能症(OCD)、焦慮症、社交恐懼症等神經精神類疾病中,藉助於MRI的個性化醫療在這些領域都取得了不俗的成績。

和面對中性表情刺激時相比,社交恐懼症患者在面對憤怒表情刺激時可能呈現兩種截然不同的腦區激活情況。2013年的一項研究發現,激活更強烈的(左)患者對認知行為療法(CBT)有著更好的臨床反應。

通過腦成像預測犯罪行為

至於預測神經科學所面對的最具爭議的話題,可能莫過於對犯罪行為的預測。坦率地說,無論是對司法機關,還是對一般民眾而言,通過技術手段建立一套犯罪預警機制都不算是一件壞事。然而,無論是19世紀末的「天生犯罪人」(born criminal)假說還是20世紀初的「優生學」(Eugenics),人類在這條道路上的嘗試結果都非但沒能阻止或預警犯罪,而且還造成了極為惡劣的倫理困境。可想而知,將利用腦成像預測行為的思路帶入犯罪學領域,是背負著巨大的輿論壓力的。

許多犯罪行為都和人的衝動性、自制力以及暴力傾向等思維活動有關。2013年的一項研究表明,某些慣犯的前扣帶回活躍程度較低,而前扣帶回在處理認知衝突的過程中具有異常重要的作用。加布里埃利認為,這個證據對於犯罪預警具有一定的意義,因為該神經學特徵與其它預警犯罪的因子(年齡,精神疾病檢測分數,藥物濫用等)之間是相互獨立的。

對於將行為預測引入犯罪預警可能導致的倫理困境,加布里埃利表示:「我最感興趣的目標還是幫助所有的孩子更好地學習閱讀與數學,幫助所有的病人更好地接受治療,我相信大多數人都會認可我這種想法的。但重要的是,我們要利用這些信息去幫助需要幫助的人。」他對果殼網科學人說,他所擔心的倫理問題在於這種信息是否會被用作篩選標準,將人分成三六九等而只為少數最可能成功的人服務。

《疑犯追蹤》中的超級電腦程序能通過監視預測犯罪行為。和劇中的「機器」一樣,腦成像技術可能為犯罪行為預測提供某種程度的參考,但它能發揮的作用更會引起的後果無疑都需要慎重考慮。

當然,加布里埃利也清楚地認識到大腦的複雜性,承認有些問題可能並非依靠有限個神經學特徵就能描述清楚的。「理解複雜的大腦與行為的聯繫是一個長期的科學任務,現在最大的瓶頸或許是人類無創腦成像技術的測量精度限制。」加布里埃利對果殼網科學人說,「這篇綜述的重點在於,在現有觀測精度與對大腦理解水平的框架內,這類成像手段可以很好地幫助我們判斷何種方法是最為有效的。我認為已經有足夠的證據表明,這種想法會在不久的將來得到實現。」

作者:鬼谷藏龍,神經科學博士生

編輯:Calo

摘自:果殼


是的,這個問題很泛,所以:可以。

可實際上並不簡單。目前只能說可以預測某一個領域的某一個事件的發生的可能性而已。

要說預測未來,是個笑話。

只要人工智慧學習不到人的意識,那麼都是妄談。


天氣預報不就是大數據的應用嘛,
保險公司也是靠這個賺錢的
未來數據才是王道
再高深的理論不如實際數據有說服力
理論是自洽的,卻不是真實的


不確定性原理


假設有一群牛逼的數據團隊,將一個人全部量化,並得出預測結論:此人在45歲時將患癌症去世。此時,有另外一群世界最頂級的醫學團隊得知這個事情後,將這個人的身體進行徹底改造,然後這個人在45歲時並未患癌去世。那麼就表明,這群牛逼的數據團隊預測錯了,因為此人在45歲時並未患癌去世。所以,未來能不能通過大數據預測呢?


能,至於準不準是另一回事。
預測明天下不下雨之類準確率很高。
預測彩票開哪組數什麼的,想想就好。


推薦閱讀:

張佳瑋說2009年的第一中鋒是姚明是否有失偏頗?
什麼技術可以爬取和分析旅遊網站的信息?(爬蟲,自然語言處理等大數據相關)
大數據時代有沒有哪些讓你覺得不寒而慄的事情?
隱私保護的學術和現實意義?
大數據是否侵犯了個人隱私?

TAG:雲計算 | 數據 | 數據分析 | 爬蟲計算機網路 | 大數據 |