【重磅】《人工智慧標準化白皮書(2018)》發布(完整版)(附下載鏈接)

【導讀】1月18日,召開國家人工智慧標準化總體組、專家諮詢組成立大會,在會上,國家標準化管理委員會宣布成立國家人工智慧標準化總體組、專家諮詢組,負責全面統籌規劃和協調管理我國人工智慧標準化工作。會議貫徹了黨的十九大會議關於推動人工智慧和實體經濟深度融合精神,會議還解讀了《人工智慧標準化助力產業發展》、《促進新一代人工智慧產業發展三年行動計劃(2018-2020)》,全面推進人工智慧標準化工作,促進人工智慧產業發展。

人工智慧標準化白皮書

(2018 版)

指導單位:國家標準化管理委員會工業二部

編寫單位:中國電子技術標準化研究院

二零一八年一月

編寫單位(排名不分先後)



  • 中國電子技術標準化研究院

  • 中國科學院自動化研究所

  • 北京理工大學

  • 清華大學

  • 北京大學

  • 中國人民大學

  • 北京航空航天大學

  • 科大訊飛股份有限公司

  • 華為技術有限公司

  • 國際商業機器(中國)有限公司

  • 阿里雲計算有限公司

  • 中國科學院計算技術研究所

  • 中國電信集團公司

  • 騰訊互聯網加(深圳)有限公司

  • 阿里巴巴網路技術有限公司

  • 上海計算機軟體技術開發中心

  • 上海智臻智能網路科技股份有限公司

  • 北京愛奇藝科技有限公司

  • 北京有生志廣科技有限公司

  • 極限元(北京)智能科技股份有限公司

  • 北京位元組跳動科技有限公司(今日頭條)

  • 北京商湯科技開發有限公司

  • 浙江螞蟻小微金融服務集團有限公司

  • 百度網路技術有限公司

  • 英特爾(中國)有限公司

  • 松下電器(中國)有限公司

  • 重慶凱澤科技股份有限公司

  • 海爾工業智能研究院有限公司

  • 重慶中科雲從科技有限公司

  • 北京格靈深瞳信息技術有限公司

  • 目錄



    1 前言



  • 1.1 研究背景


  • 人工智慧概念誕生於 1956 年,在半個多世紀的發展歷程中,由於受到智能 演算法、計算速度、存儲水平等多方面因素的影響,人工智慧技術和應用發展經歷 了多次高潮和低谷。2006 年以來,以深度學習為代表的機器學習演算法在機器視 覺和語音識別等領域取得了極大的成功,識別準確性大幅提升,使人工智慧再次 受到學術界和產業界的廣泛關注。雲計算、大數據等技術在提升運算速度,降低 計算成本的同時,也為人工智慧發展提供了豐富的數據資源,協助訓練出更加智 能化的演算法模型。人工智慧的發展模式也從過去追求「用計算機模擬人工智慧」, 逐步轉向以機器與人結合而成的增強型混合智能系統,用機器、人、網路結合成 新的群智系統,以及用機器、人、網路和物結合成的更加複雜的智能系統。

    作為新一輪產業變革的核心驅動力,人工智慧在催生新技術、新產品的同時, 對傳統行業也具備較強的賦能作用,能夠引發經濟結構的重大變革,實現社會生 產力的整體躍升。人工智慧將人從枯燥的勞動中解放出來,越來越多的簡單性、 重複性、危險性任務由人工智慧系統完成,在減少人力投入,提高工作效率的同 時,還能夠比人類做得更快、更準確;人工智慧還可以在教育、醫療、養老、環 境保護、城市運行、司法服務等領域得到廣泛應用,能夠極大提高公共服務精準 化水平,全面提升人民生活品質;同時,人工智慧可幫助人類準確感知、預測、 預警基礎設施和社會安全運行的重大態勢,及時把握群體認知及心理變化,主動 作出決策反應,顯著提高社會治理能力和水平,同時保障公共安全。

    人工智慧作為一項引領未來的戰略技術,世界發達國家紛紛在新一輪國際競 爭中爭取掌握主導權,圍繞人工智慧出台規劃和政策,對人工智慧核心技術、頂 尖人才、標準規範等進行部署,加快促進人工智慧技術和產業發展。主要科技企 業不斷加大資金和人力投入,搶佔人工智慧發展制高點。2017 年,我國出台了 《新一代人工智慧發展規劃》(國發〔2017〕35 號)、《促進新一代人工智慧產業 發展三年行動計劃(2018-2020 年)》(工信部科〔2017〕315 號)等政策文件, 推動人工智慧技術研發和產業化發展。目前,國內人工智慧發展已具備一定的技 術和產業基礎,在晶元、數據、平台、應用等領域集聚了一批人工智慧企業,在 部分方向取得階段性成果並向市場化發展。例如,人工智慧在金融、安防、客服 等行業領域已實現應用,在特定任務中語義識別、語音識別、人臉識別、圖像識 別技術的精度和效率已遠超人工。

    標準化工作對人工智慧及其產業發展具有基礎性、支撐性、引領性的作用, 既是推動產業創新發展的關鍵抓手,也是產業競爭的制高點。當前,在我國人工 智能相關產品和服務不斷豐富的同時,也出現了標準化程度不足的問題。人工智 能涉及眾多領域,雖然某些領域已具備一定的標準化基礎,但是這些分散的標準 化工作並不足以完全支撐整個人工智慧領域。另一方面,人工智慧屬於新興領域, 發展方興未艾,從世界範圍來看,標準化工作仍在起步過程中,尚未形成完善的 標準體系,我國基本與國外處於同一起跑線,存在快速突破的機會窗口。只要瞄 准機會,快速布局,完全有可能搶佔標準創新的制高點,反之,則有可能喪失良 機。因此,迫切需要把握機遇,加快對人工智慧技術及產業發展的研究,系統梳 理、加快研製人工智慧各領域的標準體系,明確標準之間的依存性與制約關係, 建立統一完善的標準體系,以標準的手段促進我國人工智慧技術、產業蓬勃發展。

  • 1.2 研究目標及意義


  • 本白皮書前期在國標委工業二部和工信部科技司的指導下,通過梳理人工智 能技術、應用和產業演進情況,分析人工智慧的技術熱點、行業動態和未來趨勢, 從支撐人工智慧產業整體發展的角度出發,研究制定了能夠適應和引導人工智慧 產業發展的標準體系,進而提出近期急需研製的基礎和關鍵標準項目。

    本白皮書並不預期成為人工智慧領域的全面技術和產業綜述,不求面面俱到, 僅針對目前人工智慧領域涵蓋的技術熱點和產業情況進行分析,研究提出人工智 能標準體系。人工智慧標準化工作尚處於起步階段,本白皮書只作為人工智慧領 域技術、產業和標準化之間初始的連接紐帶,並將在今後不斷根據技術、產業和 標準化的發展需求進行修訂。本白皮書不過多地給出人工智慧領域觀點性的陳述, 力求以較為淺顯易懂的語言和方式進行闡述。

    本白皮書的意義在於與業界分享人工智慧領域的研究成果和實踐經驗,呼籲 社會各界共同加強人工智慧領域的技術研究、產業投入、標準建設與服務應用, 共同推動人工智慧及其產業發展。

    2 人工智慧概述



  • 2.1 人工智慧的歷史及概念


  • 2.1.1人工智慧的起源與歷史

    人工智慧始於 20 世紀 50 年代,至今大致分為三個發展階段:第一階段(20 世紀 50 年代——80 年代)。這一階段人工智慧剛誕生,基於抽象數學推理的可 編程數字計算機已經出現,符號主義(Symbolism)快速發展,但由於很多事物 不能形式化表達,建立的模型存在一定的局限性。此外,隨著計算任務的複雜性 不斷加大,人工智慧發展一度遇到瓶頸;第二階段(20 世紀 80 年代——90 年代 末)。在這一階段,專家系統得到快速發展,數學模型有重大突破,但由於專家 系統在知識獲取、推理能力等方面的不足,以及開發成本高等原因,人工智慧的 發展又一次進入低谷期;第三階段(21 世紀初——至今)。隨著大數據的積聚、 理論演算法的革新、計算能力的提升,人工智慧在很多應用領域取得了突破性進展, 迎來了又一個繁榮時期。人工智慧具體的發展歷程如圖 1 所示。

    長期以來,製造具有智能的機器一直是人類的重大夢想。早在 1950 年,Alan Turing 在《計算機器與智能》中就闡述了對人工智慧的思考。他提出的圖靈測試 是機器智能的重要測量手段,後來還衍生出了視覺圖靈測試等測量方法。1956年,「人工智慧」這個詞首次出現在達特茅斯會議上,標誌著其作為一個研究領 域的正式誕生。六十年來,人工智慧發展潮起潮落的同時,基本思想可大致劃分 為四個流派:符號主義(Symbolism)、連接主義(Connectionism)、行為主義 (Behaviourism)和統計主義(Statisticsism)(註:由於篇幅原因,本白皮書不 對四個流派進行詳細闡述)。這四個流派從不同側面抓住了智能的部分特徵,在 「製造」人工智慧方面都取得了里程碑式的成就。

    1959 年,Arthur Samuel 提出了機器學習,機器學習將傳統的製造智能演化 為通過學習能力來獲取智能,推動人工智慧進入了第一次繁榮期。20 世紀 70 年 代末期專家系統的出現,實現了人工智慧從理論研究走向實際應用,從一般思維 規律探索走向專門知識應用的重大突破,將人工智慧的研究推向了新高潮。然而, 機器學習的模型仍然是「人工」的,也有很大的局限性。隨著專家系統應用的不 斷深入,專家系統自身存在的知識獲取難、知識領域窄、推理能力弱、實用性差 等問題逐步暴露。從 1976 年開始,人工智慧的研究進入長達 6 年的蕭瑟期。

    在 80 年代中期,隨著美國、日本立項支持人工智慧研究,以及以知識工程 為主導的機器學習方法的發展,出現了具有更強可視化效果的決策樹模型和突破 早期感知機局限的多層人工神經網路,由此帶來了人工智慧的又一次繁榮期。然 而,當時的計算機難以模擬複雜度高及規模大的神經網路,仍有一定的局限性。 1987 年由於 LISP 機市場崩塌,美國取消了人工智慧預算,日本第五代計算機項 目失敗並退出市場,專家系統進展緩慢,人工智慧又進入了蕭瑟期。

    1997 年,IBM 深藍(Deep Blue)戰勝國際象棋世界冠軍 Garry Kasparov。 這是一次具有里程碑意義的成功,它代表了基於規則的人工智慧的勝利。2006 年,在 Hinton 和他的學生的推動下,深度學習開始備受關注,為後來人工智慧 的發展帶來了重大影響。從 2010 年開始,人工智慧進入爆髮式的發展階段,其 最主要的驅動力是大數據時代的到來,運算能力及機器學習演算法得到提高。人工 智能快速發展,產業界也開始不斷湧現出新的研發成果:2011 年,IBM Waston 在綜藝節目《危險邊緣》中戰勝了最高獎金得主和連勝紀錄保持者;2012 年, 谷歌大腦通過模仿人類大腦在沒有人類指導的情況下,利用非監督深度學習方法 從大量視頻中成功學習到識別出一隻貓的能力;2014 年,微軟公司推出了一款 實時口譯系統,可以模仿說話者的聲音並保留其口音;2014 年,微軟公司發布全球第一款個人智能助理微軟小娜;2014 年,亞馬遜發布至今為止最成功的智 能音箱產品 Echo 和個人助手 Alexa;2016 年,谷歌 AlphaGo 機器人在圍棋比賽 中擊敗了世界冠軍李世石;2017 年,蘋果公司在原來個人助理 Siri 的基礎上推 出了智能私人助理 Siri 和智能音響 HomePod。

    目前,世界各國都開始重視人工智慧的發展。2017 年 6 月 29 日,首屆世界 智能大會在天津召開。中國工程院院士潘雲鶴在大會主論壇作了題為「中國新一 代人工智慧」的主題演講,報告中概括了世界各國在人工智慧研究方面的戰略: 2016 年 5 月,美國白宮發表了《為人工智慧的未來做好準備》;英國 2016 年 12 月發布《人工智慧:未來決策制定的機遇和影響》;法國在 2017 年 4 月制定了《國 家人工智慧戰略》;德國在2017年5月頒布全國第一部自動駕駛的法律;在中國, 據不完全統計,2017 年運營的人工智慧公司接近 400 家,行業巨頭百度、騰訊、 阿里巴巴等都不斷在人工智慧領域發力。從數量、投資等角度來看,自然語言處 理、機器人、計算機視覺成為了人工智慧最為熱門的三個產業方向。

    2.1.2人工智慧的概念

    人工智慧作為一門前沿交叉學科,其定義一直存有不同的觀點:《人工智慧 ——一種現代方法》中將已有的一些人工智慧定義分為四類:像人一樣思考的系 統、像人一樣行動的系統、理性地思考的系統、理性地行動的系統。維基百科上定義「人工智慧就是機器展現出的智能」,即只要是某種機器,具有某種或某些 「智能」的特徵或表現,都應該算作「人工智慧」。大英百科全書則限定人工智 能是數字計算機或者數字計算機控制的機器人在執行智能生物體才有的一些任 務上的能力。百度百科定義人工智慧是「研究、開發用於模擬、延伸和擴展人的 智能的理論、方法、技術及應用系統的一門新的技術科學」,將其視為計算機科 學的一個分支,指出其研究包括機器人、語言識別、圖像識別、自然語言處理和 專家系統等。

    本白皮書認為,人工智慧是利用數字計算機或者數字計算機控制的機器模擬、 延伸和擴展人的智能,感知環境、獲取知識並使用知識獲得最佳結果的理論、 方法、技術及應用系統。

    人工智慧的定義對人工智慧學科的基本思想和內容作出了解釋,即圍繞智能活動而構造的人工系統。人工智慧是知識的工程,是機器模仿人類利用知識完成 一定行為的過程。根據人工智慧是否能真正實現推理、思考和解決問題,可以將 人工智慧分為弱人工智慧和強人工智慧。

    弱人工智慧是指不能真正實現推理和解決問題的智能機器,這些機器表面看 像是智能的,但是並不真正擁有智能,也不會有自主意識。迄今為止的人工智慧 系統都還是實現特定功能的專用智能,而不是像人類智能那樣能夠不斷適應複雜 的新環境並不斷湧現出新的功能,因此都還是弱人工智慧。目前的主流研究仍然 集中於弱人工智慧,並取得了顯著進步,如語音識別、圖像處理和物體分割、機 器翻譯等方面取得了重大突破,甚至可以接近或超越人類水平。

    強人工智慧是指真正能思維的智能機器,並且認為這樣的機器是有知覺的和 自我意識的,這類機器可分為類人(機器的思考和推理類似人的思維)與非類人 (機器產生了和人完全不一樣的知覺和意識,使用和人完全不一樣的推理方式) 兩大類。從一般意義來說,達到人類水平的、能夠自適應地應對外界環境挑戰的、 具有自我意識的人工智慧稱為「通用人工智慧」、「強人工智慧」或「類人智能」。 強人工智慧不僅在哲學上存在巨大爭論(涉及到思維與意識等根本問題的討論), 在技術上的研究也具有極大的挑戰性。強人工智慧當前鮮有進展,美國私營部門 的專家及國家科技委員會比較支持的觀點是,至少在未來幾十年內難以實現。

    靠符號主義、連接主義、行為主義和統計主義這四個流派的經典路線就能設 計製造出強人工智慧嗎?其中一個主流看法是:即使有更高性能的計算平台和更 大規模的大數據助力,也還只是量變,不是質變,人類對自身智能的認識還處在 初級階段,在人類真正理解智能機理之前,不可能製造出強人工智慧。理解大腦 產生智能的機理是腦科學的終極性問題,絕大多數腦科學專家都認為這是一個數 百年乃至數千年甚至永遠都解決不了的問題。

    通向強人工智慧還有一條「新」路線,這裡稱為「模擬主義」。這條新路線 通過製造先進的大腦探測工具從結構上解析大腦,再利用工程技術手段構造出模 仿大腦神經網路基元及結構的仿腦裝置,最後通過環境刺激和交互訓練模擬大腦 實現類人智能,簡言之,「先結構,後功能」。雖然這項工程也十分困難,但都 是有可能在數十年內解決的工程技術問題,而不像「理解大腦」這個科學問題那 樣遙不可及。

    模擬主義可以說是符號主義、連接主義、行為主義和統計主義之後的第五個 流派,和前四個流派有著千絲萬縷的聯繫,也是前四個流派通向強人工智慧的關 鍵一環。經典計算機是數理邏輯的開關電路實現,採用馮·諾依曼體系結構,可以作為邏輯推理等專用智能的實現載體。但要靠經典計算機不可能實現強人工智慧。要按模擬主義的路線「仿腦」,就必須設計製造全新的軟硬體系統,這就是 「類腦計算機」,或者更準確地稱為「仿腦機」。「仿腦機」是「模擬工程」的 標誌性成果,也是「仿腦工程」通向強人工智慧之路的重要里程碑。

  • 2.2 人工智慧的特徵


  • (1)由人類設計,為人類服務,本質為計算,基礎為數據。從根本上說, 人工智慧系統必須以人為本,這些系統是人類設計出的機器,按照人類設定的程 序邏輯或軟體演算法通過人類發明的晶元等硬體載體來運行或工作,其本質體現為 計算,通過對數據的採集、加工、處理、分析和挖掘,形成有價值的信息流和知 識模型,來為人類提供延伸人類能力的服務,來實現對人類期望的一些「智能行 為」的模擬,在理想情況下必須體現服務人類的特點,而不應該傷害人類,特別 是不應該有目的性地做出傷害人類的行為。

    (2)能感知環境,能產生反應,能與人交互,能與人互補。人工智慧系統 應能藉助感測器等器件產生對外界環境(包括人類)進行感知的能力,可以像人 一樣通過聽覺、視覺、嗅覺、觸覺等接收來自環境的各種信息,對外界輸入產生 文字、語音、表情、動作(控制執行機構)等必要的反應,甚至影響到環境或人 類。藉助於按鈕、鍵盤、滑鼠、屏幕、手勢、體態、表情、力反饋、虛擬現實/ 增強現實等方式,人與機器間可以產生交互與互動,使機器設備越來越「理解」 人類乃至與人類共同協作、優勢互補。這樣,人工智慧系統能夠幫助人類做人類 不擅長、不喜歡但機器能夠完成的工作,而人類則適合於去做更需要創造性、洞 察力、想像力、靈活性、多變性乃至用心領悟或需要感情的一些工作。

    (3)有適應特性,有學習能力,有演化迭代,有連接擴展。人工智慧系統 在理想情況下應具有一定的自適應特性和學習能力,即具有一定的隨環境、數據 或任務變化而自適應調節參數或更新優化模型的能力;並且,能夠在此基礎上通 過與雲、端、人、物越來越廣泛深入數字化連接擴展,實現機器客體乃至人類主體的演化迭代,以使系統具有適應性、魯棒性、靈活性、擴展性,來應對不斷變化的現實環境,從而使人工智慧系統在各行各業產生豐富的應用。

  • 2.3 人工智慧參考框架


  • 目前,人工智慧領域尚未形成完善的參考框架。因此,本章基於人工智慧的 發展狀況和應用特徵,從人工智慧信息流動的角度出發,提出一種人工智慧參考 框架(如圖 2 所示),力圖搭建較為完整的人工智慧主體框架,描述人工智慧系 統總體工作流程,不受具體應用所限,適用於通用的人工智慧領域需求。

    人工智慧參考框架提供了基於「角色—活動—功能」的層級分類體系,從 「智能信息鏈」(水平軸)和「IT 價值鏈」(垂直軸)兩個維度闡述了人工智 能系統框架。「智能信息鏈」反映從智能信息感知、智能信息表示與形成、智能 推理、智能決策、智能執行與輸出的一般過程。在這個過程中,智能信息是流動 的載體,經歷了「數據—信息—知識—智慧」的凝練過程。「IT 價值鏈」從人 工智能的底層基礎設施、信息(提供和處理技術實現)到系統的產業生態過程, 反映人工智慧為信息技術產業帶來的價值。此外,人工智慧系統還有其它非常重 要的框架構件:安全、隱私、倫理和管理。人工智慧系統主要由基礎設施提供者、 信息提供者、信息處理者和系統協調者 4 個角色組成。

    (1)基礎設施提供者

    基礎設施提供者為人工智慧系統提供計算能力支持,實現與外部世界的溝通, 並通過基礎平台實現支撐。計算能力由智能晶元(CPU、GPU、ASIC、FPGA 等 硬體加速晶元以及其它智能晶元)等硬體系統開發商提供;與外部世界的溝通通 過新型感測器製造商提供;基礎平台包括分散式計算框架提供商及網路提供商提 供平台保障和支持,即包括雲存儲和計算、互聯互通網路等。

    (2)信息提供者

    信息提供者在人工智慧領域是智能信息的來源。通過知識信息感知過程由數 據提供商提供智能感知信息,包括原始數據資源和數據集。原始數據資源的感知 涉及到圖形、圖像、語音、文本的識別,還涉及到傳統設備的物聯網數據,包括 已有系統的業務數據以及力、位移、液位、溫度、濕度等感知數據。

    (3)信息處理者

    信息處理者是指人工智慧領域中技術和服務提供商。信息處理者的主要活動 包括智能信息表示與形成、智能推理、智能決策及智能執行與輸出。智能信息處 理者通常是演算法工程師及技術服務提供商,通過計算框架、模型及通用技術,例 如一些深度學習框架和機器學習演算法模型等功能進行支撐。

    智能信息表示與形成是指為描述外圍世界所作的一組約定,分階段對智能信 息進行符號化和形式化的智能信息建模、抽取、預處理、訓練數據等。

    智能信息推理是指在計算機或智能系統中,模擬人類的智能推理方式,依據 推理控制策略,利用形式化的信息進行機器思維和求解問題的過程,典型的功能 是搜索與匹配。

    智能信息決策是指智能信息經過推理後進行決策的過程,通常提供分類、排 序、預測等功能。

    智能執行與輸出作為智能信息輸出的環節,是對輸入作出的響應,輸出整個 智能信息流動過程的結果,包括運動、顯示、發聲、交互、合成等功能。

    (4)系統協調者

    系統協調者提供人工智慧系統必須滿足的整體要求,包括政策、法律、資源和業務需求,以及為確保系統符合這些需求而進行的監控和審計活動。由於人工 智能是多學科交叉領域,需要系統協調者定義和整合所需的應用活動,使其在人 工智能領域的垂直系統中運行。系統協調者的功能之一是配置和管理人工智慧參 考框架中的其他角色來執行一個或多個功能,並維持人工智慧系統的運行。

    (5)安全、隱私、倫理 安全、隱私、倫理覆蓋了人工智慧領域的其他 4 個主要角色,對每個角色都 有重要的影響作用。同時,安全、隱私、倫理處於管理角色的覆蓋範圍之內,與 全部角色和活動都建立了相關聯繫。在安全、隱私、倫理模塊,需要通過不同的 技術手段和安全措施,構築全方位、立體的安全防護體系,保護人工智慧領域參 與者的安全和隱私。

    (6)管理 管理角色承擔系統管理活動,包括軟體調配、資源管理等內容,管理的功能 是監視各種資源的運行狀況,應對出現的性能或故障事件,使得各系統組件透明 且可觀。

    (7)智能產品及行業應用 智能產品及行業應用指人工智慧系統的產品和應用,是對人工智慧整體解決 方案的封裝,將智能信息決策產品化、實現落地應用,其應用領域主要包括:智 能製造、智能交通、智能家居、智能醫療、智能安防等。

    3 人工智慧發展現狀及趨勢



    依據參考框架中所涉及到的人工智慧相關技術,本節重點介紹近二十年來人 工智能領域關鍵技術的發展狀況,包括機器學習、知識圖譜、自然語言處理、計 算機視覺、人機交互、生物特徵識別、虛擬現實/增強現實等關鍵技術。

  • 3.1 人工智慧關鍵技術


  • 3.1.1 機器學習

    機器學習(Machine Learning)是一門涉及統計學、系統辨識、逼近理論、 神經網路、優化理論、計算機科學、腦科學等諸多領域的交叉學科,研究計算機 怎樣模擬或實現人類的學習行為,以獲取新的知識或技能,重新組織已有的知識 結構使之不斷改善自身的性能,是人工智慧技術的核心。基於數據的機器學習是 現代智能技術中的重要方法之一,研究從觀測數據(樣本)出發尋找規律,利用 這些規律對未來數據或無法觀測的數據進行預測。根據學習模式、學習方法以及 演算法的不同,機器學習存在不同的分類方法。

    (1)根據學習模式將機器學習分類為監督學習、無監督學習和強化學習等。

  • 監督學習

  • 監督學習是利用已標記的有限訓練數據集,通過某種學習策略/方法建立一 個模型,實現對新數據/實例的標記(分類)/映射,最典型的監督學習演算法包括 回歸和分類。監督學習要求訓練樣本的分類標籤已知,分類標籤精確度越高,樣 本越具有代表性,學習模型的準確度越高。監督學習在自然語言處理、信息檢索、 文本挖掘、手寫體辨識、垃圾郵件偵測等領域獲得了廣泛應用。

  • 無監督學習

  • 無監督學習是利用無標記的有限數據描述隱藏在未標記數據中的結構/規律, 最典型的非監督學習演算法包括單類密度估計、單類數據降維、聚類等。無監督學 習不需要訓練樣本和人工標註數據,便於壓縮數據存儲、減少計算量、提升演算法 速度,還可以避免正、負樣本偏移引起的分類錯誤問題。主要用於經濟預測、異 常檢測、數據挖掘、圖像處理、模式識別等領域,例如組織大型計算機集群、社 交網路分析、市場分割、天文數據分析等。

  • 強化學習

  • 強化學習是智能系統從環境到行為映射的學習,以使強化信號函數值最大。 由於外部環境提供的信息很少,強化學習系統必須靠自身的經歷進行學習。強化 學習的目標是學習從環境狀態到行為的映射,使得智能體選擇的行為能夠獲得環 境最大的獎賞,使得外部環境對學習系統在某種意義下的評價為最佳。其在機器 人控制、無人駕駛、下棋、工業控制等領域獲得成功應用。

    (2)根據學習方法可以將機器學習分為傳統機器學習和深度學習。

  • 傳統機器學習

  • 傳統機器學習從一些觀測(訓練)樣本出發,試圖發現不能通過原理分析獲 得的規律,實現對未來數據行為或趨勢的準確預測。相關演算法包括邏輯回歸、隱 馬爾科夫方法、支持向量機方法、K 近鄰方法、三層人工神經網路方法、Adaboost 演算法、貝葉斯方法以及決策樹方法等。傳統機器學習平衡了學習結果的有效性與 學習模型的可解釋性,為解決有限樣本的學習問題提供了一種框架,主要用於有 限樣本情況下的模式分類、回歸分析、概率密度估計等。傳統機器學習方法共同 的重要理論基礎之一是統計學,在自然語言處理、語音識別、圖像識別、信息檢 索和生物信息等許多計算機領域獲得了廣泛應用。

  • 深度學習

  • 深度學習是建立深層結構模型的學習方法,典型的深度學習演算法包括深度置 信網路、卷積神經網路、受限玻爾茲曼機和循環神經網路等。深度學習又稱為深 度神經網路(指層數超過 3 層的神經網路)。深度學習作為機器學習研究中的一 個新興領域,由 Hinton 等人於 2006 年提出。深度學習源於多層神經網路,其實 質是給出了一種將特徵表示和學習合二為一的方式。深度學習的特點是放棄了可 解釋性,單純追求學習的有效性。經過多年的摸索嘗試和研究,已經產生了諸多 深度神經網路的模型,其中卷積神經網路、循環神經網路是兩類典型的模型。卷 積神經網路常被應用於空間性分布數據;循環神經網路在神經網路中引入了記憶 和反饋,常被應用於時間性分布數據。深度學習框架是進行深度學習的基礎底層 框架,一般包含主流的神經網路演算法模型,提供穩定的深度學習 API,支持訓練 模型在伺服器和 GPU、TPU 間的分散式學習,部分框架還具備在包括移動設備、雲平台在內的多種平台上運行的移植能力,從而為深度學習演算法帶來前所未有的 運行速度和實用性。目前主流的開源演算法框架有 TensorFlow、Caffe/Caffe2、CNTK、 MXNet、Paddle-paddle、Torch/PyTorch、Theano 等。

    (3)此外,機器學習的常見演算法還包括遷移學習、主動學習和演化學習等。

  • 遷移學習

  • 遷移學習是指當在某些領域無法取得足夠多的數據進行模型訓練時,利用另 一領域數據獲得的關係進行的學習。遷移學習可以把已訓練好的模型參數遷移到 新的模型指導新模型訓練,可以更有效的學習底層規則、減少數據量。目前的遷 移學習技術主要在變數有限的小規模應用中使用,如基於感測器網路的定位,文 字分類和圖像分類等。未來遷移學習將被廣泛應用於解決更有挑戰性的問題,如 視頻分類、社交網路分析、邏輯推理等。

  • 主動學習

  • 主動學習通過一定的演算法查詢最有用的未標記樣本,並交由專家進行標記, 然後用查詢到的樣本訓練分類模型來提高模型的精度。主動學習能夠選擇性地獲 取知識,通過較少的訓練樣本獲得高性能的模型,最常用的策略是通過不確定性 準則和差異性準則選取有效的樣本。

  • 演化學習

  • 演化學習對優化問題性質要求極少,只需能夠評估解的好壞即可,適用於求 解複雜的優化問題,也能直接用於多目標優化。演化演算法包括粒子群優化演算法、 多目標演化演算法等。目前針對演化學習的研究主要集中在演化數據聚類、對演化 數據更有效的分類,以及提供某種自適應機制以確定演化機制的影響等。

    3.1.2 知識圖譜

    知識圖譜本質上是結構化的語義知識庫,是一種由節點和邊組成的圖數據結 構,以符號形式描述物理世界中的概念及其相互關係,其基本組成單位是「實體 —關係—實體」三元組,以及實體及其相關「屬性—值」對。不同實體之間通過 關係相互聯結,構成網狀的知識結構。在知識圖譜中,每個節點表示現實世界的 「實體」,每條邊為實體與實體之間的「關係」。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關係網路,提供了從「關係」的角度 去分析問題的能力。

    知識圖譜可用於反欺詐、不一致性驗證、組團欺詐等公共安全保障領域,需 要用到異常分析、靜態分析、動態分析等數據挖掘方法。特別地,知識圖譜在搜 索引擎、可視化展示和精準營銷方面有很大的優勢,已成為業界的熱門工具。但 是,知識圖譜的發展還有很大的挑戰,如數據的雜訊問題,即數據本身有錯誤或 者數據存在冗餘。隨著知識圖譜應用的不斷深入,還有一系列關鍵技術需要突破。

    3.1.3 自然語言處理

    自然語言處理是計算機科學領域與人工智慧領域中的一個重要方向,研究能 實現人與計算機之間用自然語言進行有效通信的各種理論和方法,涉及的領域較 多,主要包括機器翻譯、機器閱讀理解和問答系統等。

    (1)機器翻譯

    機器翻譯技術是指利用計算機技術實現從一種自然語言到另外一種自然語 言的翻譯過程。基於統計的機器翻譯方法突破了之前基於規則和實例翻譯方法的 局限性,翻譯性能取得巨大提升。基於深度神經網路的機器翻譯在日常口語等一 些場景的成功應用已經顯現出了巨大的潛力。隨著上下文的語境表徵和知識邏輯 推理能力的發展,自然語言知識圖譜不斷擴充,機器翻譯將會在多輪對話翻譯及 篇章翻譯等領域取得更大進展。

    目前非限定領域機器翻譯中性能較佳的一種是統計機器翻譯,包括訓練及解 碼兩個階段。訓練階段的目標是獲得模型參數,解碼階段的目標是利用所估計的 參數和給定的優化目標,獲取待翻譯語句的最佳翻譯結果。統計機器翻譯主要包 括語料預處理、詞對齊、短語抽取、短語概率計算、最大熵調序等步驟。基於神 經網路的端到端翻譯方法不需要針對雙語句子專門設計特徵模型,而是直接把源 語言句子的詞串送入神經網路模型,經過神經網路的運算,得到目標語言句子的 翻譯結果。在基於端到端的機器翻譯系統中,通常採用遞歸神經網路或卷積神經 網路對句子進行表徵建模,從海量訓練數據中抽取語義信息,與基於短語的統計 翻譯相比,其翻譯結果更加流暢自然,在實際應用中取得了較好的效果。

    (2)語義理解

    語義理解技術是指利用計算機技術實現對文本篇章的理解,並且回答與篇章 相關問題的過程。語義理解更注重於對上下文的理解以及對答案精準程度的把控。 隨著 MCTest 數據集的發布,語義理解受到更多關注,取得了快速發展,相關數 據集和對應的神經網路模型層出不窮。語義理解技術將在智能客服、產品自動問 答等相關領域發揮重要作用,進一步提高問答與對話系統的精度。

    在數據採集方面,語義理解通過自動構造數據方法和自動構造填空型問題的 方法來有效擴充數據資源。為了解決填充型問題,一些基於深度學習的方法相繼 提出,如基於注意力的神經網路方法。當前主流的模型是利用神經網路技術對篇 章、問題建模,對答案的開始和終止位置進行預測,抽取出篇章片段。對於進一 步泛化的答案,處理難度進一步提升,目前的語義理解技術仍有較大的提升空間。

    (3)問答系統

    問答系統分為開放領域的對話系統和特定領域的問答系統。問答系統技術是 指讓計算機像人類一樣用自然語言與人交流的技術。人們可以向問答系統提交用 自然語言表達的問題,系統會返回關聯性較高的答案。儘管問答系統目前已經有 了不少應用產品出現,但大多是在實際信息服務系統和智能手機助手等領域中的 應用,在問答系統魯棒性方面仍然存在著問題和挑戰。

    自然語言處理面臨四大挑戰:一是在詞法、句法、語義、語用和語音等不同 層面存在不確定性;二是新的辭彙、術語、語義和語法導致未知語言現象的不可 預測性;三是數據資源的不充分使其難以覆蓋複雜的語言現象;四是語義知識的 模糊性和錯綜複雜的關聯性難以用簡單的數學模型描述,語義計算需要參數龐大 的非線性計算。

    3.1.4 人機交互

    人機交互主要研究人和計算機之間的信息交換,主要包括人到計算機和計算 機到人的兩部分信息交換,是人工智慧領域的重要的外圍技術。人機交互是與認知心理學、人機工程學、多媒體技術、虛擬現實技術等密切相關的綜合學科。傳統的人與計算機之間的信息交換主要依靠交互設備進行,主要包括鍵盤、滑鼠、 操縱桿、數據服裝、眼動跟蹤器、位置跟蹤器、數據手套、壓力筆等輸入設備,以及印表機、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出設備。人機交互技術 除了傳統的基本交互和圖形交互外,還包括語音交互、情感交互、體感交互及腦 機交互等技術,以下對後四種與人工智慧關聯密切的典型交互手段進行介紹。

    (1)語音交互

    語音交互是一種高效的交互方式,是人以自然語音或機器合成語音同計算機 進行交互的綜合性技術,結合了語言學、心理學、工程和計算機技術等領域的知 識。語音交互不僅要對語音識別和語音合成進行研究,還要對人在語音通道下的 交互機理、行為方式等進行研究。語音交互過程包括四部分:語音採集、語音識 別、語義理解和語音合成。語音採集完成音頻的錄入、採樣及編碼;語音識別完 成語音信息到機器可識別的文本信息的轉化;語義理解根據語音識別轉換後的文 本字元或命令完成相應的操作;語音合成完成文本信息到聲音信息的轉換。作為 人類溝通和獲取信息最自然便捷的手段,語音交互比其他交互方式具備更多優勢, 能為人機交互帶來根本性變革,是大數據和認知計算時代未來發展的制高點,具 有廣闊的發展前景和應用前景。

    (2)情感交互

    情感是一種高層次的信息傳遞,而情感交互是一種交互狀態,它在表達功能 和信息時傳遞情感,勾起人們的記憶或內心的情愫。傳統的人機交互無法理解和 適應人的情緒或心境,缺乏情感理解和表達能力,計算機難以具有類似人一樣的 智能,也難以通過人機交互做到真正的和諧與自然。情感交互就是要賦予計算機 類似於人一樣的觀察、理解和生成各種情感的能力,最終使計算機像人一樣能進 行自然、親切和生動的交互。情感交互已經成為人工智慧領域中的熱點方向,旨 在讓人機交互變得更加自然。目前,在情感交互信息的處理方式、情感描述方式、 情感數據獲取和處理過程、情感表達方式等方面還有諸多技術挑戰。

    (3)體感交互

    體感交互是個體不需要藉助任何複雜的控制系統,以體感技術為基礎,直接 通過肢體動作與周邊數字設備裝置和環境進行自然的交互。依照體感方式與原理 的不同,體感技術主要分為三類:慣性感測、光學感測以及光學聯合感測。體感 交互通常由運動追蹤、手勢識別、運動捕捉、面部表情識別等一系列技術支撐。與其他交互手段相比,體感交互技術無論是硬體還是軟體方面都有了較大的提升, 交互設備向小型化、便攜化、使用方便化等方面發展,大大降低了對用戶的約束, 使得交互過程更加自然。目前,體感交互在遊戲娛樂、醫療輔助與康復、全自動 三維建模、輔助購物、眼動儀等領域有了較為廣泛的應用。

    (4)腦機交互

    腦機交互又稱為腦機介面,指不依賴於外圍神經和肌肉等神經通道,直接實 現大腦與外界信息傳遞的通路。腦機介面系統檢測中樞神經系統活動,並將其轉 化為人工輸出指令,能夠替代、修復、增強、補充或者改善中樞神經系統的正常 輸出,從而改變中樞神經系統與內外環境之間的交互作用。腦機交互通過對神經 信號解碼,實現腦信號到機器指令的轉化,一般包括信號採集、特徵提取和命令 輸出三個模塊。從腦電信號採集的角度,一般將腦機介面分為侵入式和非侵入式 兩大類。除此之外,腦機介面還有其他常見的分類方式:按照信號傳輸方向可以 分為腦到機、機到腦和腦機雙向介面;按照信號生成的類型,可分為自髮式腦機 介面和誘髮式腦機介面;按照信號源的不同還可分為基於腦電的腦機介面、基於 功能性核磁共振的腦機介面以及基於近紅外光譜分析的腦機介面。

    3.1.5 計算機視覺

    計算機視覺是使用計算機模仿人類視覺系統的科學,讓計算機擁有類似人類 提取、處理、理解和分析圖像以及圖像序列的能力。自動駕駛、機器人、智能醫 療等領域均需要通過計算機視覺技術從視覺信號中提取並處理信息。近來隨著深 度學習的發展,預處理、特徵提取與演算法處理漸漸融合,形成端到端的人工智慧 演算法技術。根據解決的問題,計算機視覺可分為計算成像學、圖像理解、三維視 覺、動態視覺和視頻編解碼五大類。

    (1)計算成像學

    計算成像學是探索人眼結構、相機成像原理以及其延伸應用的科學。在相機 成像原理方面,計算成像學不斷促進現有可見光相機的完善,使得現代相機更加 輕便,可以適用於不同場景。同時計算成像學也推動著新型相機的產生,使相機 超出可見光的限制。在相機應用科學方面,計算成像學可以提升相機的能力,從 而通過後續的演算法處理使得在受限條件下拍攝的圖像更加完善,例如圖像去噪、去模糊、暗光增強、去霧霾等,以及實現新的功能,例如全景圖、軟體虛化、超 解析度等。

    (2)圖像理解

    圖像理解是通過用計算機系統解釋圖像,實現類似人類視覺系統理解外部世 界的一門科學。通常根據理解信息的抽象程度可分為三個層次:淺層理解,包括 圖像邊緣、圖像特徵點、紋理元素等;中層理解,包括物體邊界、區域與平面等; 高層理解,根據需要抽取的高層語義信息,可大致分為識別、檢測、分割、姿態 估計、圖像文字說明等。目前高層圖像理解演算法已逐漸廣泛應用於人工智慧系統, 如刷臉支付、智慧安防、圖像搜索等。

    (3)三維視覺

    三維視覺即研究如何通過視覺獲取三維信息(三維重建)以及如何理解所獲 取的三維信息的科學。三維重建可以根據重建的信息來源,分為單目圖像重建、 多目圖像重建和深度圖像重建等。三維信息理解,即使用三維信息輔助圖像理解 或者直接理解三維信息。三維信息理解可分為,淺層:角點、邊緣、法向量等; 中層:平面、立方體等;高層:物體檢測、識別、分割等。三維視覺技術可以廣 泛應用於機器人、無人駕駛、智慧工廠、虛擬/增強現實等方向。

    (4)動態視覺

    動態視覺即分析視頻或圖像序列,模擬人處理時序圖像的科學。通常動態視 覺問題可以定義為尋找圖像元素,如像素、區域、物體在時序上的對應,以及提 取其語義信息的問題。動態視覺研究被廣泛應用在視頻分析以及人機交互等方面。

    (5)視頻編解碼

    視頻編解碼是指通過特定的壓縮技術,將視頻流進行壓縮。視頻流傳輸中最 為重要的編解碼標準有國際電聯的 H.261、H.263、H.264、H.265、M-JPEG 和 MPEG 系列標準。視頻壓縮編碼主要分為兩大類:無損壓縮和有損壓縮。無損壓 縮指使用壓縮後的數據進行重構時,重構後的數據與原來的數據完全相同,例如 磁碟文件的壓縮。有損壓縮也稱為不可逆編碼,指使用壓縮後的數據進行重構時, 重構後的數據與原來的數據有差異,但不會影響人們對原始資料所表達的信息產 生誤解。有損壓縮的應用範圍廣泛,例如視頻會議、可視電話、視頻廣播、視頻監控等。

    目前,計算機視覺技術發展迅速,已具備初步的產業規模。未來計算機視覺 技術的發展主要面臨以下挑戰:一是如何在不同的應用領域和其他技術更好的結 合,計算機視覺在解決某些問題時可以廣泛利用大數據,已經逐漸成熟並且可以 超過人類,而在某些問題上卻無法達到很高的精度;二是如何降低計算機視覺算 法的開發時間和人力成本,目前計算機視覺演算法需要大量的數據與人工標註,需 要較長的研發周期以達到應用領域所要求的精度與耗時;三是如何加快新型演算法 的設計開發,隨著新的成像硬體與人工智慧晶元的出現,針對不同晶元與數據采 集設備的計算機視覺演算法的設計與開發也是挑戰之一。

    3.1.6 生物特徵識別

    生物特徵識別技術是指通過個體生理特徵或行為特徵對個體身份進行識別 認證的技術。從應用流程看,生物特徵識別通常分為註冊和識別兩個階段。註冊 階段通過感測器對人體的生物表徵信息進行採集,如利用圖像感測器對指紋和人 臉等光學信息、麥克風對說話聲等聲學信息進行採集,利用數據預處理以及特徵 提取技術對採集的數據進行處理,得到相應的特徵進行存儲。識別過程採用與注 冊過程一致的信息採集方式對待識別人進行信息採集、數據預處理和特徵提取, 然後將提取的特徵與存儲的特徵進行比對分析,完成識別。從應用任務看,生物 特徵識別一般分為辨認與確認兩種任務,辨認是指從存儲庫中確定待識別人身份 的過程,是一對多的問題;確認是指將待識別人信息與存儲庫中特定單人信息進 行比對,確定身份的過程,是一對一的問題。

    生物特徵識別技術涉及的內容十分廣泛,包括指紋、掌紋、人臉、虹膜、指 靜脈、聲紋、步態等多種生物特徵,其識別過程涉及到圖像處理、計算機視覺、 語音識別、機器學習等多項技術。目前生物特徵識別作為重要的智能化身份認證 技術,在金融、公共安全、教育、交通等領域得到廣泛的應用。下面將對指紋識 別、人臉識別、虹膜識別、指靜脈識別、聲紋識別以及步態識別等技術進行介紹。

    (1)指紋識別 指紋識別過程通常包括數據採集、數據處理、分析判別三個過程。數據採集 通過光、電、力、熱等物理感測器獲取指紋圖像;數據處理包括預處理、畸變校正、特徵提取三個過程;分析判別是對提取的特徵進行分析判別的過程。

    (2)人臉識別 人臉識別是典型的計算機視覺應用,從應用過程來看,可將人臉識別技術劃 分為檢測定位、面部特徵提取以及人臉確認三個過程。人臉識別技術的應用主要 受到光照、拍攝角度、圖像遮擋、年齡等多個因素的影響,在約束條件下人臉識 別技術相對成熟,在自由條件下人臉識別技術還在不斷改進。

    (3)虹膜識別 虹膜識別的理論框架主要包括虹膜圖像分割、虹膜區域歸一化、特徵提取和 識別四個部分,研究工作大多是基於此理論框架發展而來。虹膜識別技術應用的 主要難題包含感測器和光照影響兩個方面:一方面,由於虹膜尺寸小且受黑色素 遮擋,需在近紅外光源下採用高分辨圖像感測器才可清晰成像,對感測器質量和 穩定性要求比較高;另一方面,光照的強弱變化會引起瞳孔縮放,導致虹膜紋理 產生複雜形變,增加了匹配的難度。

    (4)指靜脈識別 指靜脈識別是利用了人體靜脈血管中的脫氧血紅蛋白對特定波長範圍內的 近紅外線有很好的吸收作用這一特性,採用近紅外光對指靜脈進行成像與識別的 技術。由於指靜脈血管分布隨機性很強,其網路特徵具有很好的唯一性,且屬於 人體內部特徵,不受到外界影響,因此模態特性十分穩定。指靜脈識別技術應用 面臨的主要難題來自於成像單元。

    (5)聲紋識別 聲紋識別是指根據待識別語音的聲紋特徵識別說話人的技術。聲紋識別技術 通常可以分為前端處理和建模分析兩個階段。聲紋識別的過程是將某段來自某個 人的語音經過特徵提取後與多複合聲紋模型庫中的聲紋模型進行匹配,常用的識 別方法可以分為模板匹配法、概率模型法等。

    (6)步態識別 步態是遠距離複雜場景下唯一可清晰成像的生物特徵,步態識別是指通過身 體體型和行走姿態來識別人的身份。相比上述幾種生物特徵識別,步態識別的技術難度更大,體現在其需要從視頻中提取運動特徵,以及需要更高要求的預處理 演算法,但步態識別具有遠距離、跨角度、光照不敏感等優勢。

    3.1.7 虛擬現實/增強現實

    虛擬現實(VR)/增強現實(AR)是以計算機為核心的新型視聽技術。結合 相關科學技術,在一定範圍內生成與真實環境在視覺、聽覺、觸感等方面高度近 似的數字化環境。用戶藉助必要的裝備與數字化環境中的對象進行交互,相互影 響,獲得近似真實環境的感受和體驗,通過顯示設備、跟蹤定位設備、觸力覺交 互設備、數據獲取設備、專用晶元等實現。

    虛擬現實/增強現實從技術特徵角度,按照不同處理階段,可以分為獲取與 建模技術、分析與利用技術、交換與分發技術、展示與交互技術以及技術標準與 評價體系五個方面。獲取與建模技術研究如何把物理世界或者人類的創意進行數 字化和模型化,難點是三維物理世界的數字化和模型化技術;分析與利用技術重 點研究對數字內容進行分析、理解、搜索和知識化方法,其難點是在於內容的語 義表示和分析;交換與分發技術主要強調各種網路環境下大規模的數字化內容流 通、轉換、集成和面向不同終端用戶的個性化服務等,其核心是開放的內容交換 和版權管理技術;展示與交換技術重點研究符合人類習慣數字內容的各種顯示技 術及交互方法,以期提高人對複雜信息的認知能力,其難點在於建立自然和諧的 人機交互環境;標準與評價體系重點研究虛擬現實/增強現實基礎資源、內容編 目、信源編碼等的規範標準以及相應的評估技術。

    目前虛擬現實/增強現實面臨的挑戰主要體現在智能獲取、普適設備、自由 交互和感知融合四個方面。在硬體平台與裝置、核心晶元與器件、軟體平台與工 具、相關標準與規範等方面存在一系列科學技術問題。總體來說虛擬現實/增強 現實呈現虛擬現實系統智能化、虛實環境對象無縫融合、自然交互全方位與舒適 化的發展趨勢。

    3.1.8 人工智慧技術發展趨勢

    綜上所述,人工智慧技術在以下方面的發展有顯著的特點,是進一步研究人 工智能趨勢的重點。

    (1)技術平台開源化 開源的學習框架在人工智慧領域的研發成績斐然,對深度學習領域影響巨大。 開源的深度學習框架使得開發者可以直接使用已經研發成功的深度學習工具,減 少二次開發,提高效率,促進業界緊密合作和交流。國內外產業巨頭也紛紛意識 到通過開源技術建立產業生態,是搶佔產業制高點的重要手段。通過技術平台的 開源化,可以擴大技術規模,整合技術和應用,有效布局人工智慧全產業鏈。谷 歌、百度等國內外龍頭企業紛紛布局開源人工智慧生態,未來將有更多的軟硬體 企業參與開源生態。

    (2)專用智能向通用智能發展 目前的人工智慧發展主要集中在專用智能方面,具有領域局限性。隨著科技 的發展,各領域之間相互融合、相互影響,需要一種範圍廣、集成度高、適應能 力強的通用智能,提供從輔助性決策工具到專業性解決方案的升級。通用人工智 能具備執行一般智慧行為的能力,可以將人工智慧與感知、知識、意識和直覺等 人類的特徵互相連接,減少對領域知識的依賴性、提高處理任務的普適性,這將 是人工智慧未來的發展方向。未來的人工智慧將廣泛的涵蓋各個領域,消除各領 域之間的應用壁壘。

    (3)智能感知向智能認知方向邁進 人工智慧的主要發展階段包括:運算智能、感知智能、認知智能,這一觀點 得到業界的廣泛認可。早期階段的人工智慧是運算智能,機器具有快速計算和記 憶存儲能力。當前大數據時代的人工智慧是感知智能,機器具有視覺、聽覺、觸 覺等感知能力。隨著類腦科技的發展,人工智慧必然向認知智能時代邁進,即讓 機器能理解會思考。

  • 3.2 人工智慧產業現狀及趨勢


  • 人工智慧作為新一輪產業變革的核心驅動力,將催生新的技術、產品、產業、 業態、模式,從而引發經濟結構的重大變革,實現社會生產力的整體提升。麥肯 錫預計,到 2025 年全球人工智慧應用市場規模總值將達到 1270 億美元,人工智 能將是眾多智能產業發展的突破點。

    通過對人工智慧產業分布進行梳理,提出了人工智慧產業生態圖,主要分為 核心業態、關聯業態、衍生業態三個層次,如圖 3 所示。

    下面將重點對核心業態包含的智能基礎設施建設、智能信息及數據、智能技 術服務、智能產品四個方面展開介紹,並總結人工智慧行業應用及產業發展趨勢。

    3.2.1 智能基礎設施

    智能基礎設施為人工智慧產業提供計算能力支撐,其範圍包括智能感測器、 智能晶元、分散式計算框架等,是人工智慧產業發展的重要保障。

    (1)智能晶元

    智能晶元從應用角度可以分為訓練和推理兩種類型。從部署場景來看,可以 分為雲端和設備端兩步大類。訓練過程由於涉及海量的訓練數據和複雜的深度神 經網路結構,需要龐大的計算規模,主要使用智能晶元集群來完成。與訓練的計 算量相比,推理的計算量較少,但仍然涉及大量的矩陣運算。目前,訓練和推理 通常都在雲端實現,只有對實時性要求很高的設備會交由設備端進行處理。

    按技術架構來看,智能晶元可以分為通用類晶元(CPU、GPU、FPGA)、基於 FPGA 的半定製化晶元、全定製化 ASIC 晶元、類腦計算晶元(IBM TrueNorth)。 另外,主要的人工智慧處理器還有 DPU、BPU、NPU、EPU 等適用於不同場景 和功能的人工智慧晶元。

    隨著互聯網用戶量和數據規模的急劇膨脹,人工智慧發展對計算性能的要求 迫切增長,對 CPU 計算性能提升的需求超過了摩爾定律的增長速度。同時,受 限於技術原因,傳統處理器性能也無法按照摩爾定律繼續增長,發展下一代智能 晶元勢在必行。未來的智能晶元主要是在兩個方向發展:一是模仿人類大腦結構 的晶元,二是量子晶元。智能晶元是人工智慧時代的戰略制高點,預計到 2020 年人工智慧晶元全球市場規模將突破百億美元。

    (2)智能感測器

    智能感測器是具有信息處理功能的感測器。智能感測器帶有微處理機,具備 採集、處理、交換信息等功能,是感測器集成化與微處理機相結合的產物。智能 感測器屬於人工智慧的神經末梢,用於全面感知外界環境。各類感測器的大規模 部署和應用為實現人工智慧創造了不可或缺的條件。不同應用場景,如智能安防、 智能家居、智能醫療等對感測器應用提出了不同的要求。未來,隨著人工智慧應 用領域的不斷拓展,市場對感測器的需求將不斷增多,2020 年市場規模有望突 破 4600 億美元。未來,高敏度、高精度、高可靠性、微型化、集成化將成為智 能感測器發展的重要趨勢。

    (3)分散式計算框架

    面對海量的數據處理、複雜的知識推理,常規的單機計算模式已經不能支撐。 所以,計算模式必須將巨大的計算任務分成小的單機可以承受的計算任務,即雲 計算、邊緣計算、大數據技術提供了基礎的計算框架。目前流行的分散式計算框 架如 OpenStack、Hadoop、Storm、Spark、Samza、Bigflow 等。各種開源深度學 習框架也層出不窮,其中包括 TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、 Leaf、Theano、DeepLearning4、Lasagne、Neon 等等。

    3.2.2 智能信息及數據

    信息數據是人工智慧創造價值的關鍵要素之一。我國龐大的人口和產業基數 帶來了數據方面的天生優勢。隨著演算法、算力技術水平的提升,圍繞數據的採集、 分析、處理產生了眾多的企業。目前,在人工智慧數據採集、分析、處理方面的 企業主要有兩種:一種是數據集提供商,以提供數據為自身主要業務,為需求方 提供機器學習等技術所需要的不同領域的數據集;另一種是數據採集、分析、處理綜合性廠商,自身擁有獲取數據的途徑,並對採集到的數據進行分析處理,最 終將處理後的結果提供給需求方進行使用。對於一些大型企業,企業本身也是數 據分析處理結果的需求方。

    3.2.3 智能技術服務

    智能技術服務主要關注如何構建人工智慧的技術平台,並對外提供人工智慧 相關的服務。此類廠商在人工智慧產業鏈中處於關鍵位置,依託基礎設施和大量 的數據,為各類人工智慧的應用提供關鍵性的技術平台、解決方案和服務。目前, 從提供服務的類型來看,提供技術服務廠商包括以下幾類:

    (1)提供人工智慧的技術平台和演算法模型。此類廠商主要針對用戶或者行 業需求,提供人工智慧技術平台以及演算法模型。用戶可以在人工智慧平台之上, 通過一系列的演算法模型來進行人工智慧的應用開發。此類廠商主要關注人工智慧 的通用計算框架、演算法模型、通用技術等關鍵領域。

    (2)提供人工智慧的整體解決方案。此類廠商主要針對用戶或者行業需求, 設計和提供包括軟、硬體一體的行業人工智慧解決方案,整體方案中集成多種人 工智能演算法模型以及軟、硬體環境,幫助用戶或行業解決特定的問題。此類廠商 重點關注人工智慧在特定領域或者特定行業的應用。

    (3)提供人工智慧在線服務。此類廠商一般為傳統的雲服務提供廠商,主 要依託其已有的雲計算和大數據應用的用戶資源,聚集用戶的需求和行業屬性, 為客戶提供多類型的人工智慧服務;從各類模型演算法和計算框架的 API 等特定 應用平台到特定行業的整體解決方案等,進一步吸引大量的用戶使用,從而進一 步完善其提供的人工智慧服務。此類廠商主要提供相對通用的人工智慧服務,同 時也會關注一些重點行業和領域。

    需要指出的是,上述三類角色並不是嚴格區分開的,很多情況下會出現重疊, 隨著技術的發展成熟,在人工智慧產業鏈中已有大量的廠商同時具備上述兩類或 者三類角色的特徵。

    3.2.4 智能產品

    智能產品是指將人工智慧領域的技術成果集成化、產品化,具體的分類如表 1 所示。

    表 1 人工智慧的產品

    隨著製造強國、網路強國、數字中國建設進程的加快,在製造、家居、金融、 教育、交通、安防、醫療、物流等領域對人工智慧技術和產品的需求將進一步釋 放,相關智能產品的種類和形態也將越來越豐富。

    3.2.5 人工智慧行業應用

    人工智慧與行業領域的深度融合將改變甚至重新塑造傳統行業,本節重點介 紹人工智慧在製造、家居、金融、交通、安防、醫療、物流行業的應用,由於篇 幅有限,其它很多重要的行業應用在這裡不展開論述。

    (1)智能製造

    智能製造是基於新一代信息通信技術與先進位造技術深度融合,貫穿於設計、 生產、管理、服務等製造活動的各個環節,具有自感知、自學習、自決策、自執 行、自適應等功能的新型生產方式。智能製造對人工智慧的需求主要表現在以下 三個方面:一是智能裝備,包括自動識別設備、人機交互系統、工業機器人以及 數控機床等具體設備,涉及到跨媒體分析推理、自然語言處理、虛擬現實智能建 模及自主無人系統等關鍵技術。二是智能工廠,包括智能設計、智能生產、智能 管理以及集成優化等具體內容,涉及到跨媒體分析推理、大數據智能、機器學習 等關鍵技術。三是智能服務,包括大規模個性化定製、遠程運維以及預測性維護 等具體服務模式,涉及到跨媒體分析推理、自然語言處理、大數據智能、高級機 器學習等關鍵技術。例如,現有涉及智能裝備故障問題的紙質化文件,可通過自 然語言處理,形成數字化資料,再通過非結構化數據向結構化數據的轉換,形成 深度學習所需的訓練數據,從而構建設備故障分析的神經網路,為下一步故障診 斷、優化參數設置提供決策依據。

    (2)智能家居

    參照工業和信息化部印發的《智慧家庭綜合標準化體系建設指南》,智能家 居是智慧家庭八大應用場景之一。受產業環境、價格、消費者認可度等因素影響, 我國智能家居行業經歷了漫長的探索期。至 2010 年,隨著物聯網技術的發展以 及智慧城市概念的出現,智能家居概念逐步有了清晰的定義並隨之湧現出各類產 品,軟體系統也經歷了若干輪升級。

    智能家居以住宅為平台,基於物聯網技術,由硬體(智能家電、智能硬體、 安防控制設備、傢具等)、軟體系統、雲計算平台構成的家居生態圈,實現人遠 程式控制制設備、設備間互聯互通、設備自我學習等功能,並通過收集、分析用戶行 為數據為用戶提供個性化生活服務,使家居生活安全、節能、便捷等。例如,藉助智能語音技術,用戶應用自然語言實現對家居系統各設備的操控,如開關窗帘 (窗戶)、操控家用電器和照明系統、打掃衛生等操作;藉助機器學習技術,智 能電視可以從用戶看電視的歷史數據中分析其興趣和愛好,並將相關的節目推薦 給用戶。通過應用聲紋識別、臉部識別、指紋識別等技術進行開鎖等;通過大數 據技術可以使智能家電實現對自身狀態及環境的自我感知,具有故障診斷能力。 通過收集產品運行數據,發現產品異常,主動提供服務,降低故障率。還可以通 過大數據分析、遠程監控和診斷,快速發現問題、解決問題及提高效率。

    (3)智能金融

    人工智慧的飛速發展將對身處服務價值鏈高端的金融業帶來深刻影響,人工 智能逐步成為決定金融業溝通客戶、發現客戶金融需求的重要因素。人工智慧技 術在金融業中可以用於服務客戶,支持授信、各類金融交易和金融分析中的決策, 並用於風險防控和監督,將大幅改變金融現有格局,金融服務將會更加地個性化 與智能化。智能金融對於金融機構的業務部門來說,可以幫助獲客,精準服務客 戶,提高效率;對於金融機構的風控部門來說,可以提高風險控制,增加安全性; 對於用戶來說,可以實現資產優化配置,體驗到金融機構更加完美地服務。人工 智能在金融領域的應用主要包括:智能獲客,依託大數據,對金融用戶進行畫像, 通過需求響應模型,極大地提升獲客效率;身份識別,以人工智慧為內核,通過 人臉識別、聲紋識別、指靜脈識別等生物識別手段,再加上各類票據、身份證、 銀行卡等證件票據的 OCR 識別等技術手段,對用戶身份進行驗證,大幅降低核 驗成本,有助於提高安全性;大數據風控,通過大數據、算力、演算法的結合,搭 建反欺詐、信用風險等模型,多維度控制金融機構的信用風險和操作風險,同時 避免資產損失;智能投顧,基於大數據和演算法能力,對用戶與資產信息進行標籤 化,精準匹配用戶與資產;智能客服,基於自然語言處理能力和語音識別能力, 拓展客服領域的深度和廣度,大幅降低服務成本,提升服務體驗;金融雲,依託 雲計算能力的金融科技,為金融機構提供更安全高效的全套金融解決方案。

    (4)智能交通

    智能交通系統(Intelligent Traffic System,ITS)是通信、信息和控制技術在 交通系統中集成應用的產物。ITS 藉助現代科技手段和設備,將各核心交通元素 聯通,實現信息互通與共享以及各交通元素的彼此協調、優化配置和高效使用,形成人、車和交通的一個高效協同環境,建立安全、高效、便捷和低碳的交通。 例如通過交通信息採集系統採集道路中的車輛流量、行車速度等信息,信息分析 處理系統處理後形成實時路況,決策系統據此調整道路紅綠燈時長,調整可變車 道或潮汐車道的通行方向等,通過信息發布系統將路況推送到導航軟體和廣播中, 讓人們合理規划行駛路線。通過不停車收費系統(ETC),實現對通過 ETC 入口 站的車輛身份及信息自動採集、處理、收費和放行,有效提高通行能力、簡化收 費管理、降低環境污染。

    ITS 應用最廣泛的地區是日本,其次是美國、歐洲等地區。中國的智能交通 系統近幾年也發展迅速,在北京、上海、廣州、杭州等大城市已經建設了先進的 智能交通系統;其中,北京建立了道路交通控制、公共交通指揮與調度、高速公 路管理和緊急事件管理等四大 ITS 系統;廣州建立了交通信息共用主平台、物流 信息平台和靜態交通管理系統等三大 ITS 系統。

    (5)智能安防

    智能安防技術是一種利用人工智慧對視頻、圖像進行存儲和分析,從中識別 安全隱患並對其進行處理的技術。智能安防與傳統安防的最大區別在於智能化, 傳統安防對人的依賴性比較強,非常耗費人力,而智能安防能夠通過機器實現智 能判斷,從而儘可能實現實時地安全防範和處理。

    當前,高清視頻、智能分析等技術的發展,使得安防從傳統的被動防禦向主 動判斷和預警發展,行業也從單一的安全領域向多行業應用發展,進而提升生產 效率並提高生活智能化程度,為更多的行業和人群提供可視化及智能化方案。用 戶面對海量的視頻數據,已無法簡單利用人海戰術進行檢索和分析,需要採用人 工智能技術作專家系統或輔助手段,實時分析視頻內容,探測異常信息,進行風 險預測。從技術方面來講,目前國內智能安防分析技術主要集中在兩大類:一類 是採用畫面分割前景提取等方法對視頻畫面中的目標進行提取檢測,通過不同的 規則來區分不同的事件,從而實現不同的判斷併產生相應的報警聯動等,例如: 區域入侵分析、打架檢測、人員聚集分析、交通事件檢測等;另一類是利用模式 識別技術,對畫面中特定的物體進行建模,並通過大量樣本進行訓練,從而達到 對視頻畫面中的特定物體進行識別,如車輛檢測、人臉檢測、人頭檢測(人流統 計)等應用。

    智能安防目前涵蓋眾多的領域,如街道社區、道路、樓宇建築、機動車輛的 監控,移動物體監測等。今後智能安防還要解決海量視頻數據分析、存儲控制及 傳輸問題,將智能視頻分析技術、雲計算及雲存儲技術結合起來,構建智慧城市 下的安防體系。

    (6)智能醫療

    人工智慧的快速發展,為醫療健康領域向更高的智能化方向發展提供了非常 有利的技術條件。近幾年,智能醫療在輔助診療、疾病預測、醫療影像輔助診斷、 藥物開發等方面發揮重要作用。

    在輔助診療方面,通過人工智慧技術可以有效提高醫護人員工作效率,提升 一線全科醫生的診斷治療水平。如利用智能語音技術可以實現電子病歷的智能語 音錄入;利用智能影像識別技術,可以實現醫學圖像自動讀片;利用智能技術和 大數據平台,構建輔助診療系統。

    在疾病預測方面,人工智慧藉助大數據技術可以進行疫情監測,及時有效地 預測並防止疫情的進一步擴散和發展。以流感為例,很多國家都有規定,當醫生 發現新型流感病例時需告知疾病控制與預防中心。但由於人們可能患病不及時就 醫,同時信息傳達回疾控中心也需要時間,因此,通告新流感病例時往往會有一 定的延遲,人工智慧通過疫情監測能夠有效縮短響應時間。

    在醫療影像輔助診斷方面,影像判讀系統的發展是人工智慧技術的產物。早 期的影像判讀系統主要靠人手工編寫判定規則,存在耗時長、臨床應用難度大等 問題,從而未能得到廣泛推廣。影像組學是通過醫學影像對特徵進行提取和分析, 為患者預前和預後的診斷和治療提供評估方法和精準診療決策。這在很大程度上 簡化了人工智慧技術的應用流程,節約了人力成本。

    (7)智能物流

    傳統物流企業在利用條形碼、射頻識別技術、感測器、全球定位系統等方面 優化改善運輸、倉儲、配送裝卸等物流業基本活動,同時也在嘗試使用智能搜索、 推理規劃、計算機視覺以及智能機器人等技術,實現貨物運輸過程的自動化運作 和高效率優化管理,提高物流效率。例如,在倉儲環節,利用大數據智能通過分 析大量歷史庫存數據,建立相關預測模型,實現物流庫存商品的動態調整。大數據智能也可以支撐商品配送規劃,進而實現物流供給與需求匹配、物流資源優化 與配置等。在貨物搬運環節,載入計算機視覺、動態路徑規劃等技術的智能搬運 機器人(如搬運機器人、貨架穿梭車、分揀機器人等)得到廣泛應用,大大減少 了訂單出庫時間,使物流倉庫的存儲密度、搬運的速度、揀選的精度均有大幅度 提升。

    3.2.6 人工智慧產業發展趨勢

    從人工智慧產業進程來看,技術突破是推動產業升級的核心驅動力。數據資 源、運算能力、核心演算法共同發展,掀起人工智慧第三次新浪潮。人工智慧產業 正處於從感知智能向認知智能的進階階段,前者涉及的智能語音、計算機視覺及 自然語言處理等技術,已具有大規模應用基礎,但後者要求的「機器要像人一樣 去思考及主動行動」仍尚待突破,諸如無人駕駛、全自動智能機器人等仍處於開 發中,與大規模應用仍有一定距離。

    (1)智能服務呈現線下和線上的無縫結合

    分散式計算平台的廣泛部署和應用,增大了線上服務的應用範圍。同時人工 智能技術的發展和產品不斷湧現,如智能家居、智能機器人、自動駕駛汽車等, 為智能服務帶來新的渠道或新的傳播模式,使得線上服務與線下服務的融合進程 加快,促進多產業升級。

    (2)智能化應用場景從單一向多元發展

    目前人工智慧的應用領域還多處於專用階段,如人臉識別、視頻監控、語音 識別等都主要用於完成具體任務,覆蓋範圍有限,產業化程度有待提高。隨著智 能家居、智慧物流等產品的推出,人工智慧的應用終將進入面向複雜場景,處理 複雜問題,提高社會生產效率和生活質量的新階段。

    (3)人工智慧和實體經濟深度融合進程將進一步加快

    黨的十九大報告提出「推動互聯網、大數據、人工智慧和實體經濟深度融合」, 一方面,隨著製造強國建設的加快將促進人工智慧等新一代信息技術產品發展和 應用,助推傳統產業轉型升級,推動戰略性新興產業實現整體性突破。另一方面, 隨著人工智慧底層技術的開源化,傳統行業將有望加快掌握人工智慧基礎技術並依託其積累的行業數據資源實現人工智慧與實體經濟的深度融合創新。

  • 3.3 安全、倫理、隱私問題


  • 歷史經驗表明新技術常常能夠提高生產效率,促進社會進步。但與此同時, 由於人工智慧尚處於初期發展階段,該領域的安全、倫理、隱私的政策、法律和 標準問題值得關注。就人工智慧技術而言,安全、倫理和隱私問題直接影響人們 與人工智慧工具交互經驗中對人工智慧技術的信任。社會公眾必須信任人工智慧 技術能夠給人類帶來的安全利益遠大於傷害,才有可能發展人工智慧。要保障安 全,人工智慧技術本身及在各個領域的應用應遵循人類社會所認同的倫理原則, 其中應特別關注的是隱私問題,因為人工智慧的發展伴隨著越來越多的個人數據 被記錄和分析,而在這個過程中保障個人隱私則是社會信任能夠增加的重要條件。 總之,建立一個令人工智慧技術造福於社會、保護公眾利益的政策、法律和標準 化環境,是人工智慧技術持續、健康發展的重要前提。為此,本章集中討論與人 工智能技術相關的安全、倫理、隱私的政策和法律問題。

    3.3.1 人工智慧的安全問題

    人工智慧最大的特徵是能夠實現無人類干預的,基於知識並能夠自我修正地 自動化運行。在開啟人工智慧系統後,人工智慧系統的決策不再需要操控者進一 步的指令,這種決策可能會產生人類預料不到的結果。設計者和生產者在開發人 工智能產品的過程中可能並不能準確預知某一產品會存在的可能風險。因此,對 於人工智慧的安全問題不容忽視。

    與傳統的公共安全(例如核技術)需要強大的基礎設施作為支撐不同,人工 智能以計算機和互聯網為依託,無需昂貴的基礎設施就能造成安全威脅。掌握相 關技術的人員可以在任何時間、地點且沒有昂貴基礎設施的情況下做出人工智慧 產品。人工智慧的程序運行並非公開可追蹤,其擴散途徑和速度也難以精確控制。 在無法利用已有傳統管制技術的條件下,對人工智慧技術的管制必須另闢蹊徑。 換言之,管制者必須考慮更為深層的倫理問題,保證人工智慧技術及其應用均應 符合倫理要求,才能真正實現保障公共安全的目的。

    由於人工智慧技術的目標實現受其初始設定的影響,必須能夠保障人工智慧設計的目標與大多數人類的利益和倫理道德一致,即使在決策過程中面對不同的 環境,人工智慧也能做出相對安全的決定。從人工智慧的技術應用方面看,要充 分考慮到人工智慧開發和部署過程中的責任和過錯問題,通過為人工智慧技術開 發者、產品生產者或者服務提供者、最終使用者設定權利和義務的具體內容,來 達到落實安全保障要求的目的。

    此外,考慮到目前世界各國關於人工智慧管理的規定尚不統一,相關標準也 處於空白狀態,同一人工智慧技術的參與者可能來自不同國家,而這些國家尚未 簽署針對人工智慧的共有合約。為此,我國應加強國際合作,推動制定一套世界 通用的管制原則和標準來保障人工智慧技術的安全性。

    3.3.2 人工智慧的倫理問題

    人工智慧是人類智能的延伸,也是人類價值系統的延伸。在其發展的過程中, 應當包含對人類倫理價值的正確考量。設定人工智慧技術的倫理要求,要依託於 社會和公眾對人工智慧倫理的深入思考和廣泛共識,並遵循一些共識原則:

    一是人類利益原則,即人工智慧應以實現人類利益為終極目標。這一原則體 現對人權的尊重、對人類和自然環境利益最大化以及降低技術風險和對社會的負 面影響。在此原則下,政策和法律應致力於人工智慧發展的外部社會環境的構建, 推動對社會個體的人工智慧倫理和安全意識教育,讓社會警惕人工智慧技術被濫 用的風險。此外,還應該警惕人工智慧系統作出與倫理道德偏差的決策。例如, 大學利用機器學習演算法來評估入學申請,假如用於訓練演算法的歷史入學數據(有 意或無意)反映出之前的錄取程序的某些偏差(如性別歧視),那麼機器學習可 能會在重複累計的運算過程中惡化這些偏差,造成惡性循環。如果沒有糾正,偏 差會以這種方式在社會中永久存在。

    二是責任原則,即在技術開發和應用兩方面都建立明確的責任體系,以便在 技術層面可以對人工智慧技術開發人員或部門問責,在應用層面可以建立合理的 責任和賠償體系。在責任原則下,在技術開發方面應遵循透明度原則;在技術應 用方面則應當遵循權責一致原則。

    其中,透明度原則要求了解系統的工作原理從而預測未來發展,即人類應當 知道人工智慧如何以及為何做出特定決定,這對於責任分配至關重要。例如,在神經網路這個人工智慧的重要議題中,人們需要知道為什麼會產生特定的輸出結 果。另外,數據來源透明度也同樣非常重要。即便是在處理沒有問題的數據集時, 也有可能面臨數據中隱含的偏見問題。透明度原則還要求開發技術時注意多個人 工智能系統協作產生的危害。

    權責一致原則,指的是未來政策和法律應該做出明確規定:一方面必要的商 業數據應被合理記錄、相應演算法應受到監督、商業應用應受到合理審查;另一方 面商業主體仍可利用合理的知識產權或者商業秘密來保護本企業的核心參數。在 人工智慧的應用領域,權利和責任一致的原則尚未在商界、政府對倫理的實踐中 完全實現。主要是由於在人工智慧產品和服務的開發和生產過程中,工程師和設 計團隊往往忽視倫理問題,此外人工智慧的整個行業尚未習慣於綜合考量各個利 益相關者需求的工作流程,人工智慧相關企業對商業秘密的保護也未與透明度相 平衡。

    3.3.3 人工智慧的隱私問題

    人工智慧的近期發展是建立在大量數據的信息技術應用之上,不可避免地涉 及到個人信息的合理使用問題,因此對於隱私應該有明確且可操作的定義。人工 智能技術的發展也讓侵犯個人隱私(的行為)更為便利,因此相關法律和標準應 該為個人隱私提供更強有力的保護。已有的對隱私信息的管制包括對使用者未明 示同意的收集,以及使用者明示同意條件下的個人信息收集兩種類型的處理。人 工智能技術的發展對原有的管制框架帶來了新的挑戰,原因是使用者所同意的個 人信息收集範圍不再有確定的界限。利用人工智慧技術很容易推導出公民不願意 泄露的隱私,例如從公共數據中推導出私人信息,從個人信息中推導出和個人有 關的其他人員(如朋友、親人、同事)信息(在線行為、人際關係等)。這類信 息超出了最初個人同意披露的個人信息範圍。

    此外,人工智慧技術的發展使得政府對於公民個人數據信息的收集和使用更 加便利。大量個人數據信息能夠幫助政府各個部門更好地了解所服務的人群狀態, 確保個性化服務的機會和質量。但隨之而來的是,政府部門和政府工作人員個人 不恰當使用個人數據信息的風險和潛在的危害應當得到足夠的重視。

    人工智慧語境下的個人數據的獲取和知情同意應該重新進行定義。首先,相關政策、法律和標準應直接對數據的收集和使用進行規制,而不能僅僅徵得數據 所有者的同意;其次,應當建立實用、可執行的、適應於不同使用場景的標準流 程以供設計者和開發者保護數據來源的隱私;再次,對於利用人工智慧可能推導 出超過公民最初同意披露的信息的行為應該進行規制。最後,政策、法律和標準 對於個人數據管理應該採取延伸式保護,鼓勵發展相關技術,探索將演算法工具作 為個體在數字和現實世界中的代理人。這種方式使得控制和使用兩者得以共存, 因為演算法代理人可以根據不同的情況,設定不同的使用許可權,同時管理個人同意 與拒絕分享的信息。

    本章節所涉及的安全、倫理和隱私問題是人工智慧發展面臨的挑戰。安全問 題是讓技術能夠持續發展的前提。技術的發展給社會信任帶來了風險,如何增加 社會信任,讓技術發展遵循倫理要求,特別是保障隱私不會被侵犯是亟需解決的 問題。為此,需要(制訂)合理的政策、法律、標準基礎,並與國際社會協作。 在制訂政策、法律和標準時,應當擺脫膚淺的新聞炒作和廣告式的熱點宣傳,必 須促進對人工智慧技術產品更深層地理解,聚焦這一新技術給社會產生重大利益 的同時也帶來的巨大挑戰。作為國際社會的重要成員,中國對保障人工智慧技術 應用在正確的道路上、基於正確的理由得到健康發展擔負重要的責任。

  • 3.4 人工智慧標準化的重要作用


  • 當今,經濟全球化和市場國際化深入發展,標準作為經濟和社會活動的主要 技術依據,已成為衡量國家或地區技術發展水平的重要標誌、產品進入市場的基 本準則、企業市場競爭力的具體體現。標準化工作對人工智慧及其產業發展具有 基礎性、支撐性、引領性的作用,既是推動產業創新發展的關鍵抓手,也是產業 競爭的制高點。人工智慧標準的先進與完善與否,關係到產業的健康發展、以及 產品國際市場競爭力的強弱。

    美國、歐盟、日本等發達國家高度重視人工智慧標準化工作。美國發布的《國 家人工智慧研究與發展策略規劃》,歐盟發布的「人腦計劃」,日本實施的「人工 智能/大數據/物聯網/網路安全綜合項目」,均提出圍繞核心技術、頂尖人才、標 准規範等強化部署,力圖搶佔新一輪科技主導權。 我國高度重視人工智慧標準化工作。在國務院《新一代人工智慧發展規劃》中將人工智慧標準化作為重要支撐保障,提出要「加強人工智慧標準框架體系研 究。堅持安全性、可用性、互操作性、可追溯性原則,逐步建立並完善人工智慧 基礎共性、互聯互通、行業應用、網路安全、隱私保護等技術標準。加快推動無 人駕駛、服務機器人等細分應用領域的行業協會和聯盟制定相關標準」。工信部 在《促進新一代人工智慧產業發展三年行動計劃(2018-2020 年)》中指出,要建 設人工智慧產業標準規範體系,建立並完善基礎共性、互聯互通、安全隱私、行 業應用等技術標準;同時構建人工智慧產品評估評測體系。

    我國雖然在人工智慧領域雖然具備了良好基礎,語音識別、視覺識別、中文 信息處理等核心技術實現了突破,也具有巨大的應用市場環境,但整體發展水平 仍落後於發達國家,在核心演算法、關鍵設備、高端晶元、重大產品與系統等方面 差距較大,適應人工智慧發展的基礎設施、政策法規、標準體系亟待完善。

    綜上分析,更應重視人工智慧標準化工作對於促進技術創新、支撐產業發展 具有的重要引領作用:

    (一)標準化工作有利於加快人工智慧技術創新和成果轉化。現階段人工智 能技術發展迅速,市場上逐步出現了可規模化、可商業化的產品和應用,需要以 標準化的手段固化技術成果,實現快速創新推廣;

    (二)標準化工作有助於提升人工智慧產品和服務質量。如市場上出現的人 臉識別系統、智能音箱、服務機器人等產品,質量殘次不齊,需要標準的統一規 范,並配合以開展符合性測試評估的方式,提升產品和服務質量;

    (三)標準化工作有助於切實保障用戶安全。例如自動駕駛領域的「電車難 題」倫理難題、蘋果手機指紋泄露用戶隱私等問題,引起了人們的廣泛關注。如 何保護用戶權益是難點也是重點,這需要通過建立以人為本的原則,制定相關安 全標準規範,確保智能系統遵從並服務於人類倫理,並確保信息安全;

    (四)標準化工作有助於營造公平開放的人工智慧產業生態。當前,行業巨 頭以開源演算法、平台介面綁定等方式,打造自有深度學習框架等生態體系,造成 用戶數據信息較難遷移。這需要統一的標準實現廠商之間的互操作與協同工作, 防止行業壟斷、用戶綁定,形成良性的產業生態。


    推薦閱讀:

    Duplex AI演示驚為天人,對於真實性谷歌拒不回應
    人工智慧再次突破!診斷皮膚癌精準率可與醫生媲美
    通過圖靈測試!Google掌舵人說「打電話AI」是一次非凡突破
    醫療AI:人工智慧增量先行,中國醫生不用擔心自己的金飯碗了
    破解AI大腦黑盒邁出新一步!谷歌現在更懂機器,還開源了研究工具

    TAG:人工智慧 | 智慧 | 下載 | 標準化 | 標準 | 鏈接 | 下載鏈接 | 白皮書 | 人工 | 發布 |