標籤:

大數據驅動的人工智慧時代,如何成為2%不被淘汰的人?

由於前段時間阿爾法狗與李世石的對戰,人工智慧被推上風口浪尖,2016年也被成為稱為人工智慧元年,人工智慧的研究其實很早就開始,但為何今天才實現大爆發呢?

吳軍老師在《智能時代》給了我們答案:因為大數據。

因為有了大數據,人工智慧才能在數據的驅動下,實現深度學習,不斷迭代模型,變得越來越智能。

一、那麼大數據又是如何爆發的呢?

人工智慧是因為大數據實現而爆發,而大數據又是為什麼近年來實現爆發呢?

1、數據採集

以智能手機為代表的各種數據採集設備的普及,電腦、攝像頭、可穿戴設備、智能汽車等等,尤其是RFID晶元普及之後,實現物聯網,數據採集越來越方便,量越來越多,維度越來越多,採集的實時性越來越強。

2、數據存儲

摩爾定律導致存儲成本不斷降低,硬碟代替磁碟,使得數據調用更快捷,尤其是是SSD固態硬碟的出現,速度更快。如今,雲儲存功能更是方便。

3、數據傳輸

寬頻的不斷提速,加上移動通信技術的提速,從2G到如今4G普及,數據傳輸速度加快,5G也即將到來。

4、數據計算

得益於摩爾定律,處理器的性能和成本降低,使得大數據的計算越來越便捷,雲計算,更是可以輕鬆藉助大公司提供的計算能力。

二、大數據的特性

大數據使得人工智慧成為可能,所以我們必須了解大數據的特性才能更好的了解人工智慧。

1、完備性:整體即樣本

傳統統計學中,我們想要使用數據,常常採用抽樣的方式,抽樣就會存在誤差,但是大數據不用擔心這點,因為大數據的完備性,導致數據整體又是數據的樣本,這樣的結果更真實。

2、多維度:交叉驗證(復現),要相關性不要因果性

以前數據的使用,多是單維度,大數據時代的數據維度更多,而且可以交叉復現,好比盲人摸象,每個維度摸到的是一個方面,但是交叉復現後,就越接近事物的真相。

在傳統思維中,數據的使用非常注重數據的因果關係,但是,在大數據中,我們更強調相關性,就像我們知道啤酒和尿布放在一起好賣就行了,不需要去挖掘背後的因果聯繫。

大數據相關性的學科基礎,資訊理論裡面互信息,互信息越大,相關性越強,互信息為零,則沒有相關性。

3、及時性:實時採集與使用

大數據的實時採集才支持數據模型的實時指導性,比如百度地圖正式因為地圖數據實時採集,才能實時告知路況,指導決策。

三、大數據的使用

1、數據驅動:採集物意識,使用無目的

根據最大熵原理:當我們對未知的事件尋找概率模型時,這個模型應當滿足我們所有已經看到的數據,但是對未知的情況不要做任何主觀假設。

也就是說,想比傳統思維我們用先預設目的,再通過數據來驗證,大數據思維要求我們對數據的使用是不預設目的,而是通過對數據的驅動,使模型自己湧現。

在數據的採集方面,也是在用戶無意識使用過程中採集來的更為真實可靠,比如搜索數據。

2、熵增及不確定的世界觀

大數據時代,我們需要拋棄牛頓的機械宇宙世界觀,重新塑造不確定的世界觀,世界的不確定性主要因為以下兩個原因。

1)隨著對世界認識的加深,影響世界的變數非常之多。

2)客觀世界本身的不確性,測量會影響測量結果,詳見量子力學波粒二象性。

根據熱力學第二定律,一個系統內部總是從有序到無序的過程,也就是熵增加的過程,熵就是無序的度量,所以也叫熵增定律。

在資訊理論裡面,上代表著不確性,信息時負熵,就是引入越多的信息,就能降低系統的不確定性。

智能問題,從根本上就是消除不確定性的問題。

四、大數據時代我們如何應對?

根據吳軍老師預測,當人工智慧真正來臨之時,只有2%的人超越,其他人都會被淘汰。

那我們改怎麼辦呢?

是不是都要去學習大數據和人工智慧的專業知識?

不需要,關注是擁有大數據思維,和不確性的世界觀,懂得使用和藉助大數據和人工智慧。

關於大家關心的人工智慧會不會超越人類?會不會替代人的工作?可以查看我上一篇關於人工智慧的文章:

《人工智慧可怕之處不是搶飯碗,而是....》

推薦閱讀:

假如海平面上升100米中國會怎麼樣?
2017年數據分析實踐計劃
鏈家網大數據平台建設,平台樞紐——工具鏈
大數據的本質是消除不確定性
線下大數據驅動營銷新趨勢

TAG:大数据 |