1月18日,召開國家人工智能標準化總體組、專家咨詢組成立大會,在會上,國家標準化管理委員會宣布成立國家人工智能標準化總體組、專家咨詢組,負責全面統(tǒng)籌規(guī)劃和協(xié)調管理我國人工智能標準化工作。會議貫徹了黨的十九大會議關于推動人工智能和實體經濟深度融合精神,會議還解讀了《人工智能標準化助力產業(yè)發(fā)展》、《促進新一代人工智能產業(yè)發(fā)展三年行動計劃(2018-2020)》,全面推進人工智能標準化工作,促進人工智能產業(yè)發(fā)展。
人工智能標準化白皮書
(2018 版)
指導單位:國家標準化管理委員會工業(yè)二部
編寫單位:中國電子技術標準化研究院
二零一八年一月
▌編寫單位(排名不分先后)
中國電子技術標準化研究院
中國科學院自動化研究所
北京理工大學
清華大學
北京大學
中國人民大學
北京航空航天大學
科大訊飛股份有限公司
華為技術有限公司
國際商業(yè)機器(中國)有限公司
阿里云計算有限公司
中國科學院計算技術研究所
中國電信集團公司
騰訊互聯(lián)網加(深圳)有限公司
阿里巴巴網絡技術有限公司
上海計算機軟件技術開發(fā)中心
上海智臻智能網絡科技股份有限公司
北京愛奇藝科技有限公司
北京有生志廣科技有限公司
極限元(北京)智能科技股份有限公司
北京字節(jié)跳動科技有限公司(今日頭條)
北京商湯科技開發(fā)有限公司
浙江螞蟻小微金融服務集團有限公司
百度網絡技術有限公司
英特爾(中國)有限公司
松下電器(中國)有限公司
重慶凱澤科技股份有限公司
海爾工業(yè)智能研究院有限公司
重慶中科云從科技有限公司
北京格靈深瞳信息技術有限公司
▌目錄
▌1 前言
1.1 研究背景
人工智能概念誕生于 1956 年,在半個多世紀的發(fā)展歷程中,由于受到智能 算法、計算速度、存儲水平等多方面因素的影響,人工智能技術和應用發(fā)展經歷 了多次高潮和低谷。2006 年以來,以深度學習為代表的機器學習算法在機器視 覺和語音識別等領域取得了極大的成功,識別準確性大幅提升,使人工智能再次 受到學術界和產業(yè)界的廣泛關注。云計算、大數(shù)據(jù)等技術在提升運算速度,降低 計算成本的同時,也為人工智能發(fā)展提供了豐富的數(shù)據(jù)資源,協(xié)助訓練出更加智 能化的算法模型。人工智能的發(fā)展模式也從過去追求“用計算機模擬人工智能”, 逐步轉向以機器與人結合而成的增強型混合智能系統(tǒng),用機器、人、網絡結合成 新的群智系統(tǒng),以及用機器、人、網絡和物結合成的更加復雜的智能系統(tǒng)。
作為新一輪產業(yè)變革的核心驅動力,人工智能在催生新技術、新產品的同時, 對傳統(tǒng)行業(yè)也具備較強的賦能作用,能夠引發(fā)經濟結構的重大變革,實現(xiàn)社會生 產力的整體躍升。人工智能將人從枯燥的勞動中解放出來,越來越多的簡單性、 重復性、危險性任務由人工智能系統(tǒng)完成,在減少人力投入,提高工作效率的同 時,還能夠比人類做得更快、更準確;人工智能還可以在教育、醫(yī)療、養(yǎng)老、環(huán) 境保護、城市運行、司法服務等領域得到廣泛應用,能夠極大提高公共服務精準 化水平,全面提升人民生活品質;同時,人工智能可幫助人類準確感知、預測、 預警基礎設施和社會安全運行的重大態(tài)勢,及時把握群體認知及心理變化,主動 作出決策反應,顯著提高社會治理能力和水平,同時保障公共安全。
人工智能作為一項引領未來的戰(zhàn)略技術,世界發(fā)達國家紛紛在新一輪國際競 爭中爭取掌握主導權,圍繞人工智能出臺規(guī)劃和政策,對人工智能核心技術、頂 尖人才、標準規(guī)范等進行部署,加快促進人工智能技術和產業(yè)發(fā)展。主要科技企 業(yè)不斷加大資金和人力投入,搶占人工智能發(fā)展制高點。2017 年,我國出臺了 《新一代人工智能發(fā)展規(guī)劃》(國發(fā)〔2017〕35 號)、《促進新一代人工智能產業(yè) 發(fā)展三年行動計劃(2018-2020 年)》(工信部科〔2017〕315 號)等政策文件, 推動人工智能技術研發(fā)和產業(yè)化發(fā)展。目前,國內人工智能發(fā)展已具備一定的技 術和產業(yè)基礎,在芯片、數(shù)據(jù)、平臺、應用等領域集聚了一批人工智能企業(yè),在 部分方向取得階段性成果并向市場化發(fā)展。例如,人工智能在金融、安防、客服 等行業(yè)領域已實現(xiàn)應用,在特定任務中語義識別、語音識別、人臉識別、圖像識 別技術的精度和效率已遠超人工。
標準化工作對人工智能及其產業(yè)發(fā)展具有基礎性、支撐性、引領性的作用, 既是推動產業(yè)創(chuàng)新發(fā)展的關鍵抓手,也是產業(yè)競爭的制高點。當前,在我國人工 智能相關產品和服務不斷豐富的同時,也出現(xiàn)了標準化程度不足的問題。人工智 能涉及眾多領域,雖然某些領域已具備一定的標準化基礎,但是這些分散的標準 化工作并不足以完全支撐整個人工智能領域。另一方面,人工智能屬于新興領域, 發(fā)展方興未艾,從世界范圍來看,標準化工作仍在起步過程中,尚未形成完善的 標準體系,我國基本與國外處于同一起跑線,存在快速突破的機會窗口。只要瞄 準機會,快速布局,完全有可能搶占標準創(chuàng)新的制高點,反之,則有可能喪失良 機。因此,迫切需要把握機遇,加快對人工智能技術及產業(yè)發(fā)展的研究,系統(tǒng)梳 理、加快研制人工智能各領域的標準體系,明確標準之間的依存性與制約關系, 建立統(tǒng)一完善的標準體系,以標準的手段促進我國人工智能技術、產業(yè)蓬勃發(fā)展。
1.2 研究目標及意義
本白皮書前期在國標委工業(yè)二部和工信部科技司的指導下,通過梳理人工智 能技術、應用和產業(yè)演進情況,分析人工智能的技術熱點、行業(yè)動態(tài)和未來趨勢, 從支撐人工智能產業(yè)整體發(fā)展的角度出發(fā),研究制定了能夠適應和引導人工智能 產業(yè)發(fā)展的標準體系,進而提出近期急需研制的基礎和關鍵標準項目。
本白皮書并不預期成為人工智能領域的全面技術和產業(yè)綜述,不求面面俱到, 僅針對目前人工智能領域涵蓋的技術熱點和產業(yè)情況進行分析,研究提出人工智 能標準體系。人工智能標準化工作尚處于起步階段,本白皮書只作為人工智能領 域技術、產業(yè)和標準化之間初始的連接紐帶,并將在今后不斷根據(jù)技術、產業(yè)和 標準化的發(fā)展需求進行修訂。本白皮書不過多地給出人工智能領域觀點性的陳述, 力求以較為淺顯易懂的語言和方式進行闡述。
本白皮書的意義在于與業(yè)界分享人工智能領域的研究成果和實踐經驗,呼吁 社會各界共同加強人工智能領域的技術研究、產業(yè)投入、標準建設與服務應用, 共同推動人工智能及其產業(yè)發(fā)展。
▌2 人工智能概述
2.1 人工智能的歷史及概念
2.1.1人工智能的起源與歷史
人工智能始于 20 世紀 50 年代,至今大致分為三個發(fā)展階段:第一階段(20 世紀 50 年代——80 年代)。這一階段人工智能剛誕生,基于抽象數(shù)學推理的可 編程數(shù)字計算機已經出現(xiàn),符號主義(Symbolism)快速發(fā)展,但由于很多事物 不能形式化表達,建立的模型存在一定的局限性。此外,隨著計算任務的復雜性 不斷加大,人工智能發(fā)展一度遇到瓶頸;第二階段(20 世紀 80 年代——90 年代 末)。在這一階段,專家系統(tǒng)得到快速發(fā)展,數(shù)學模型有重大突破,但由于專家 系統(tǒng)在知識獲取、推理能力等方面的不足,以及開發(fā)成本高等原因,人工智能的 發(fā)展又一次進入低谷期;第三階段(21 世紀初——至今)。隨著大數(shù)據(jù)的積聚、 理論算法的革新、計算能力的提升,人工智能在很多應用領域取得了突破性進展, 迎來了又一個繁榮時期。人工智能具體的發(fā)展歷程如圖 1 所示。
長期以來,制造具有智能的機器一直是人類的重大夢想。早在 1950 年,Alan Turing 在《計算機器與智能》中就闡述了對人工智能的思考。他提出的圖靈測試 是機器智能的重要測量手段,后來還衍生出了視覺圖靈測試等測量方法。1956年,“人工智能”這個詞首次出現(xiàn)在達特茅斯會議上,標志著其作為一個研究領 域的正式誕生。六十年來,人工智能發(fā)展潮起潮落的同時,基本思想可大致劃分 為四個流派:符號主義(Symbolism)、連接主義(Connectionism)、行為主義 (Behaviourism)和統(tǒng)計主義(Statisticsism)(注:由于篇幅原因,本白皮書不 對四個流派進行詳細闡述)。這四個流派從不同側面抓住了智能的部分特征,在 “制造”人工智能方面都取得了里程碑式的成就。
1959 年,Arthur Samuel 提出了機器學習,機器學習將傳統(tǒng)的制造智能演化 為通過學習能力來獲取智能,推動人工智能進入了第一次繁榮期。20 世紀 70 年 代末期專家系統(tǒng)的出現(xiàn),實現(xiàn)了人工智能從理論研究走向實際應用,從一般思維 規(guī)律探索走向專門知識應用的重大突破,將人工智能的研究推向了新高潮。然而, 機器學習的模型仍然是“人工”的,也有很大的局限性。隨著專家系統(tǒng)應用的不 斷深入,專家系統(tǒng)自身存在的知識獲取難、知識領域窄、推理能力弱、實用性差 等問題逐步暴露。從 1976 年開始,人工智能的研究進入長達 6 年的蕭瑟期。
在 80 年代中期,隨著美國、日本立項支持人工智能研究,以及以知識工程 為主導的機器學習方法的發(fā)展,出現(xiàn)了具有更強可視化效果的決策樹模型和突破 早期感知機局限的多層人工神經網絡,由此帶來了人工智能的又一次繁榮期。然 而,當時的計算機難以模擬復雜度高及規(guī)模大的神經網絡,仍有一定的局限性。 1987 年由于 LISP 機市場崩塌,美國取消了人工智能預算,日本第五代計算機項 目失敗并退出市場,專家系統(tǒng)進展緩慢,人工智能又進入了蕭瑟期。
1997 年,IBM 深藍(Deep Blue)戰(zhàn)勝國際象棋世界冠軍 Garry Kasparov。 這是一次具有里程碑意義的成功,它代表了基于規(guī)則的人工智能的勝利。2006 年,在 Hinton 和他的學生的推動下,深度學習開始備受關注,為后來人工智能 的發(fā)展帶來了重大影響。從 2010 年開始,人工智能進入爆發(fā)式的發(fā)展階段,其 最主要的驅動力是大數(shù)據(jù)時代的到來,運算能力及機器學習算法得到提高。人工 智能快速發(fā)展,產業(yè)界也開始不斷涌現(xiàn)出新的研發(fā)成果:2011 年,IBM Waston 在綜藝節(jié)目《危險邊緣》中戰(zhàn)勝了最高獎金得主和連勝紀錄保持者;2012 年, 谷歌大腦通過模仿人類大腦在沒有人類指導的情況下,利用非監(jiān)督深度學習方法 從大量視頻中成功學習到識別出一只貓的能力;2014 年,微軟公司推出了一款 實時口譯系統(tǒng),可以模仿說話者的聲音并保留其口音;2014 年,微軟公司發(fā)布全球第一款個人智能助理微軟小娜;2014 年,亞馬遜發(fā)布至今為止最成功的智 能音箱產品 Echo 和個人助手 Alexa;2016 年,谷歌 AlphaGo 機器人在圍棋比賽 中擊敗了世界冠軍李世石;2017 年,蘋果公司在原來個人助理 Siri 的基礎上推 出了智能私人助理 Siri 和智能音響 HomePod。
目前,世界各國都開始重視人工智能的發(fā)展。2017 年 6 月 29 日,首屆世界 智能大會在天津召開。中國工程院院士潘云鶴在大會主論壇作了題為“中國新一 代人工智能”的主題演講,報告中概括了世界各國在人工智能研究方面的戰(zhàn)略: 2016 年 5 月,美國白宮發(fā)表了《為人工智能的未來做好準備》;英國 2016 年 12 月發(fā)布《人工智能:未來決策制定的機遇和影響》;法國在 2017 年 4 月制定了《國 家人工智能戰(zhàn)略》;德國在2017年5月頒布全國第一部自動駕駛的法律;在中國, 據(jù)不完全統(tǒng)計,2017 年運營的人工智能公司接近 400 家,行業(yè)巨頭百度、騰訊、 阿里巴巴等都不斷在人工智能領域發(fā)力。從數(shù)量、投資等角度來看,自然語言處 理、機器人、計算機視覺成為了人工智能最為熱門的三個產業(yè)方向。
2.1.2人工智能的概念
人工智能作為一門前沿交叉學科,其定義一直存有不同的觀點:《人工智能 ——一種現(xiàn)代方法》中將已有的一些人工智能定義分為四類:像人一樣思考的系 統(tǒng)、像人一樣行動的系統(tǒng)、理性地思考的系統(tǒng)、理性地行動的系統(tǒng)。維基百科上定義“人工智能就是機器展現(xiàn)出的智能”,即只要是某種機器,具有某種或某些 “智能”的特征或表現(xiàn),都應該算作“人工智能”。大英百科全書則限定人工智 能是數(shù)字計算機或者數(shù)字計算機控制的機器人在執(zhí)行智能生物體才有的一些任 務上的能力。百度百科定義人工智能是“研究、開發(fā)用于模擬、延伸和擴展人的 智能的理論、方法、技術及應用系統(tǒng)的一門新的技術科學”,將其視為計算機科 學的一個分支,指出其研究包括機器人、語言識別、圖像識別、自然語言處理和 專家系統(tǒng)等。
本白皮書認為,人工智能是利用數(shù)字計算機或者數(shù)字計算機控制的機器模擬、 延伸和擴展人的智能,感知環(huán)境、獲取知識并使用知識獲得最佳結果的理論、 方法、技術及應用系統(tǒng)。
人工智能的定義對人工智能學科的基本思想和內容作出了解釋,即圍繞智能活動而構造的人工系統(tǒng)。人工智能是知識的工程,是機器模仿人類利用知識完成 一定行為的過程。根據(jù)人工智能是否能真正實現(xiàn)推理、思考和解決問題,可以將 人工智能分為弱人工智能和強人工智能。
弱人工智能是指不能真正實現(xiàn)推理和解決問題的智能機器,這些機器表面看 像是智能的,但是并不真正擁有智能,也不會有自主意識。迄今為止的人工智能 系統(tǒng)都還是實現(xiàn)特定功能的專用智能,而不是像人類智能那樣能夠不斷適應復雜 的新環(huán)境并不斷涌現(xiàn)出新的功能,因此都還是弱人工智能。目前的主流研究仍然 集中于弱人工智能,并取得了顯著進步,如語音識別、圖像處理和物體分割、機 器翻譯等方面取得了重大突破,甚至可以接近或超越人類水平。
強人工智能是指真正能思維的智能機器,并且認為這樣的機器是有知覺的和 自我意識的,這類機器可分為類人(機器的思考和推理類似人的思維)與非類人 (機器產生了和人完全不一樣的知覺和意識,使用和人完全不一樣的推理方式) 兩大類。從一般意義來說,達到人類水平的、能夠自適應地應對外界環(huán)境挑戰(zhàn)的、 具有自我意識的人工智能稱為“通用人工智能”、“強人工智能”或“類人智能”。 強人工智能不僅在哲學上存在巨大爭論(涉及到思維與意識等根本問題的討論), 在技術上的研究也具有極大的挑戰(zhàn)性。強人工智能當前鮮有進展,美國私營部門 的專家及國家科技委員會比較支持的觀點是,至少在未來幾十年內難以實現(xiàn)。
靠符號主義、連接主義、行為主義和統(tǒng)計主義這四個流派的經典路線就能設 計制造出強人工智能嗎?其中一個主流看法是:即使有更高性能的計算平臺和更 大規(guī)模的大數(shù)據(jù)助力,也還只是量變,不是質變,人類對自身智能的認識還處在 初級階段,在人類真正理解智能機理之前,不可能制造出強人工智能。理解大腦 產生智能的機理是腦科學的終極性問題,絕大多數(shù)腦科學專家都認為這是一個數(shù) 百年乃至數(shù)千年甚至永遠都解決不了的問題。
通向強人工智能還有一條“新”路線,這里稱為“仿真主義”。這條新路線 通過制造先進的大腦探測工具從結構上解析大腦,再利用工程技術手段構造出模 仿大腦神經網絡基元及結構的仿腦裝置,最后通過環(huán)境刺激和交互訓練仿真大腦 實現(xiàn)類人智能,簡言之,“先結構,后功能”。雖然這項工程也十分困難,但都 是有可能在數(shù)十年內解決的工程技術問題,而不像“理解大腦”這個科學問題那 樣遙不可及。
仿真主義可以說是符號主義、連接主義、行為主義和統(tǒng)計主義之后的第五個 流派,和前四個流派有著千絲萬縷的聯(lián)系,也是前四個流派通向強人工智能的關 鍵一環(huán)。經典計算機是數(shù)理邏輯的開關電路實現(xiàn),采用馮?諾依曼體系結構,可以作為邏輯推理等專用智能的實現(xiàn)載體。但要靠經典計算機不可能實現(xiàn)強人工智能。要按仿真主義的路線“仿腦”,就必須設計制造全新的軟硬件系統(tǒng),這就是 “類腦計算機”,或者更準確地稱為“仿腦機”?!胺履X機”是“仿真工程”的 標志性成果,也是“仿腦工程”通向強人工智能之路的重要里程碑。
2.2 人工智能的特征
(1)由人類設計,為人類服務,本質為計算,基礎為數(shù)據(jù)。從根本上說, 人工智能系統(tǒng)必須以人為本,這些系統(tǒng)是人類設計出的機器,按照人類設定的程 序邏輯或軟件算法通過人類發(fā)明的芯片等硬件載體來運行或工作,其本質體現(xiàn)為 計算,通過對數(shù)據(jù)的采集、加工、處理、分析和挖掘,形成有價值的信息流和知 識模型,來為人類提供延伸人類能力的服務,來實現(xiàn)對人類期望的一些“智能行 為”的模擬,在理想情況下必須體現(xiàn)服務人類的特點,而不應該傷害人類,特別 是不應該有目的性地做出傷害人類的行為。
(2)能感知環(huán)境,能產生反應,能與人交互,能與人互補。人工智能系統(tǒng) 應能借助傳感器等器件產生對外界環(huán)境(包括人類)進行感知的能力,可以像人 一樣通過聽覺、視覺、嗅覺、觸覺等接收來自環(huán)境的各種信息,對外界輸入產生 文字、語音、表情、動作(控制執(zhí)行機構)等必要的反應,甚至影響到環(huán)境或人 類。借助于按鈕、鍵盤、鼠標、屏幕、手勢、體態(tài)、表情、力反饋、虛擬現(xiàn)實/ 增強現(xiàn)實等方式,人與機器間可以產生交互與互動,使機器設備越來越“理解” 人類乃至與人類共同協(xié)作、優(yōu)勢互補。這樣,人工智能系統(tǒng)能夠幫助人類做人類 不擅長、不喜歡但機器能夠完成的工作,而人類則適合于去做更需要創(chuàng)造性、洞 察力、想象力、靈活性、多變性乃至用心領悟或需要感情的一些工作。
(3)有適應特性,有學習能力,有演化迭代,有連接擴展。人工智能系統(tǒng) 在理想情況下應具有一定的自適應特性和學習能力,即具有一定的隨環(huán)境、數(shù)據(jù) 或任務變化而自適應調節(jié)參數(shù)或更新優(yōu)化模型的能力;并且,能夠在此基礎上通 過與云、端、人、物越來越廣泛深入數(shù)字化連接擴展,實現(xiàn)機器客體乃至人類主體的演化迭代,以使系統(tǒng)具有適應性、魯棒性、靈活性、擴展性,來應對不斷變化的現(xiàn)實環(huán)境,從而使人工智能系統(tǒng)在各行各業(yè)產生豐富的應用。
2.3 人工智能參考框架
目前,人工智能領域尚未形成完善的參考框架。因此,本章基于人工智能的 發(fā)展狀況和應用特征,從人工智能信息流動的角度出發(fā),提出一種人工智能參考 框架(如圖 2 所示),力圖搭建較為完整的人工智能主體框架,描述人工智能系 統(tǒng)總體工作流程,不受具體應用所限,適用于通用的人工智能領域需求。
人工智能參考框架提供了基于“角色—活動—功能”的層級分類體系,從 “智能信息鏈”(水平軸)和“IT 價值鏈”(垂直軸)兩個維度闡述了人工智 能系統(tǒng)框架?!爸悄苄畔㈡湣狈从硰闹悄苄畔⒏兄⒅悄苄畔⒈硎九c形成、智能 推理、智能決策、智能執(zhí)行與輸出的一般過程。在這個過程中,智能信息是流動 的載體,經歷了“數(shù)據(jù)—信息—知識—智慧”的凝練過程?!癐T 價值鏈”從人 工智能的底層基礎設施、信息(提供和處理技術實現(xiàn))到系統(tǒng)的產業(yè)生態(tài)過程, 反映人工智能為信息技術產業(yè)帶來的價值。此外,人工智能系統(tǒng)還有其它非常重 要的框架構件:安全、隱私、倫理和管理。人工智能系統(tǒng)主要由基礎設施提供者、 信息提供者、信息處理者和系統(tǒng)協(xié)調者 4 個角色組成。
(1)基礎設施提供者
基礎設施提供者為人工智能系統(tǒng)提供計算能力支持,實現(xiàn)與外部世界的溝通, 并通過基礎平臺實現(xiàn)支撐。計算能力由智能芯片(CPU、GPU、ASIC、FPGA 等 硬件加速芯片以及其它智能芯片)等硬件系統(tǒng)開發(fā)商提供;與外部世界的溝通通 過新型傳感器制造商提供;基礎平臺包括分布式計算框架提供商及網絡提供商提 供平臺保障和支持,即包括云存儲和計算、互聯(lián)互通網絡等。
(2)信息提供者
信息提供者在人工智能領域是智能信息的來源。通過知識信息感知過程由數(shù) 據(jù)提供商提供智能感知信息,包括原始數(shù)據(jù)資源和數(shù)據(jù)集。原始數(shù)據(jù)資源的感知 涉及到圖形、圖像、語音、文本的識別,還涉及到傳統(tǒng)設備的物聯(lián)網數(shù)據(jù),包括 已有系統(tǒng)的業(yè)務數(shù)據(jù)以及力、位移、液位、溫度、濕度等感知數(shù)據(jù)。
(3)信息處理者
信息處理者是指人工智能領域中技術和服務提供商。信息處理者的主要活動 包括智能信息表示與形成、智能推理、智能決策及智能執(zhí)行與輸出。智能信息處 理者通常是算法工程師及技術服務提供商,通過計算框架、模型及通用技術,例 如一些深度學習框架和機器學習算法模型等功能進行支撐。
智能信息表示與形成是指為描述外圍世界所作的一組約定,分階段對智能信 息進行符號化和形式化的智能信息建模、抽取、預處理、訓練數(shù)據(jù)等。
智能信息推理是指在計算機或智能系統(tǒng)中,模擬人類的智能推理方式,依據(jù) 推理控制策略,利用形式化的信息進行機器思維和求解問題的過程,典型的功能 是搜索與匹配。
智能信息決策是指智能信息經過推理后進行決策的過程,通常提供分類、排 序、預測等功能。
智能執(zhí)行與輸出作為智能信息輸出的環(huán)節(jié),是對輸入作出的響應,輸出整個 智能信息流動過程的結果,包括運動、顯示、發(fā)聲、交互、合成等功能。
(4)系統(tǒng)協(xié)調者
系統(tǒng)協(xié)調者提供人工智能系統(tǒng)必須滿足的整體要求,包括政策、法律、資源和業(yè)務需求,以及為確保系統(tǒng)符合這些需求而進行的監(jiān)控和審計活動。由于人工 智能是多學科交叉領域,需要系統(tǒng)協(xié)調者定義和整合所需的應用活動,使其在人 工智能領域的垂直系統(tǒng)中運行。系統(tǒng)協(xié)調者的功能之一是配置和管理人工智能參 考框架中的其他角色來執(zhí)行一個或多個功能,并維持人工智能系統(tǒng)的運行。
(5)安全、隱私、倫理 安全、隱私、倫理覆蓋了人工智能領域的其他 4 個主要角色,對每個角色都 有重要的影響作用。同時,安全、隱私、倫理處于管理角色的覆蓋范圍之內,與 全部角色和活動都建立了相關聯(lián)系。在安全、隱私、倫理模塊,需要通過不同的 技術手段和安全措施,構筑全方位、立體的安全防護體系,保護人工智能領域參 與者的安全和隱私。
(6)管理 管理角色承擔系統(tǒng)管理活動,包括軟件調配、資源管理等內容,管理的功能 是監(jiān)視各種資源的運行狀況,應對出現(xiàn)的性能或故障事件,使得各系統(tǒng)組件透明 且可觀。
(7)智能產品及行業(yè)應用 智能產品及行業(yè)應用指人工智能系統(tǒng)的產品和應用,是對人工智能整體解決 方案的封裝,將智能信息決策產品化、實現(xiàn)落地應用,其應用領域主要包括:智 能制造、智能交通、智能家居、智能醫(yī)療、智能安防等。
▌3 人工智能發(fā)展現(xiàn)狀及趨勢
依據(jù)參考框架中所涉及到的人工智能相關技術,本節(jié)重點介紹近二十年來人 工智能領域關鍵技術的發(fā)展狀況,包括機器學習、知識圖譜、自然語言處理、計 算機視覺、人機交互、生物特征識別、虛擬現(xiàn)實/增強現(xiàn)實等關鍵技術。
3.1 人工智能關鍵技術
3.1.1 機器學習
機器學習(Machine Learning)是一門涉及統(tǒng)計學、系統(tǒng)辨識、逼近理論、 神經網絡、優(yōu)化理論、計算機科學、腦科學等諸多領域的交叉學科,研究計算機 怎樣模擬或實現(xiàn)人類的學習行為,以獲取新的知識或技能,重新組織已有的知識 結構使之不斷改善自身的性能,是人工智能技術的核心。基于數(shù)據(jù)的機器學習是 現(xiàn)代智能技術中的重要方法之一,研究從觀測數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,利用 這些規(guī)律對未來數(shù)據(jù)或無法觀測的數(shù)據(jù)進行預測。根據(jù)學習模式、學習方法以及 算法的不同,機器學習存在不同的分類方法。
(1)根據(jù)學習模式將機器學習分類為監(jiān)督學習、無監(jiān)督學習和強化學習等。
監(jiān)督學習
監(jiān)督學習是利用已標記的有限訓練數(shù)據(jù)集,通過某種學習策略/方法建立一 個模型,實現(xiàn)對新數(shù)據(jù)/實例的標記(分類)/映射,最典型的監(jiān)督學習算法包括 回歸和分類。監(jiān)督學習要求訓練樣本的分類標簽已知,分類標簽精確度越高,樣 本越具有代表性,學習模型的準確度越高。監(jiān)督學習在自然語言處理、信息檢索、 文本挖掘、手寫體辨識、垃圾郵件偵測等領域獲得了廣泛應用。
無監(jiān)督學習
無監(jiān)督學習是利用無標記的有限數(shù)據(jù)描述隱藏在未標記數(shù)據(jù)中的結構/規(guī)律, 最典型的非監(jiān)督學習算法包括單類密度估計、單類數(shù)據(jù)降維、聚類等。無監(jiān)督學 習不需要訓練樣本和人工標注數(shù)據(jù),便于壓縮數(shù)據(jù)存儲、減少計算量、提升算法 速度,還可以避免正、負樣本偏移引起的分類錯誤問題。主要用于經濟預測、異 常檢測、數(shù)據(jù)挖掘、圖像處理、模式識別等領域,例如組織大型計算機集群、社 交網絡分析、市場分割、天文數(shù)據(jù)分析等。
強化學習
強化學習是智能系統(tǒng)從環(huán)境到行為映射的學習,以使強化信號函數(shù)值最大。 由于外部環(huán)境提供的信息很少,強化學習系統(tǒng)必須靠自身的經歷進行學習。強化 學習的目標是學習從環(huán)境狀態(tài)到行為的映射,使得智能體選擇的行為能夠獲得環(huán) 境最大的獎賞,使得外部環(huán)境對學習系統(tǒng)在某種意義下的評價為最佳。其在機器 人控制、無人駕駛、下棋、工業(yè)控制等領域獲得成功應用。
(2)根據(jù)學習方法可以將機器學習分為傳統(tǒng)機器學習和深度學習。
傳統(tǒng)機器學習
傳統(tǒng)機器學習從一些觀測(訓練)樣本出發(fā),試圖發(fā)現(xiàn)不能通過原理分析獲 得的規(guī)律,實現(xiàn)對未來數(shù)據(jù)行為或趨勢的準確預測。相關算法包括邏輯回歸、隱 馬爾科夫方法、支持向量機方法、K 近鄰方法、三層人工神經網絡方法、Adaboost 算法、貝葉斯方法以及決策樹方法等。傳統(tǒng)機器學習平衡了學習結果的有效性與 學習模型的可解釋性,為解決有限樣本的學習問題提供了一種框架,主要用于有 限樣本情況下的模式分類、回歸分析、概率密度估計等。傳統(tǒng)機器學習方法共同 的重要理論基礎之一是統(tǒng)計學,在自然語言處理、語音識別、圖像識別、信息檢 索和生物信息等許多計算機領域獲得了廣泛應用。
深度學習
深度學習是建立深層結構模型的學習方法,典型的深度學習算法包括深度置 信網絡、卷積神經網絡、受限玻爾茲曼機和循環(huán)神經網絡等。深度學習又稱為深 度神經網絡(指層數(shù)超過 3 層的神經網絡)。深度學習作為機器學習研究中的一 個新興領域,由 Hinton 等人于 2006 年提出。深度學習源于多層神經網絡,其實 質是給出了一種將特征表示和學習合二為一的方式。深度學習的特點是放棄了可 解釋性,單純追求學習的有效性。經過多年的摸索嘗試和研究,已經產生了諸多 深度神經網絡的模型,其中卷積神經網絡、循環(huán)神經網絡是兩類典型的模型。卷 積神經網絡常被應用于空間性分布數(shù)據(jù);循環(huán)神經網絡在神經網絡中引入了記憶 和反饋,常被應用于時間性分布數(shù)據(jù)。深度學習框架是進行深度學習的基礎底層 框架,一般包含主流的神經網絡算法模型,提供穩(wěn)定的深度學習 API,支持訓練 模型在服務器和 GPU、TPU 間的分布式學習,部分框架還具備在包括移動設備、云平臺在內的多種平臺上運行的移植能力,從而為深度學習算法帶來前所未有的 運行速度和實用性。目前主流的開源算法框架有 TensorFlow、Caffe/Caffe2、CNTK、 MXNet、Paddle-paddle、Torch/PyTorch、Theano 等。
(3)此外,機器學習的常見算法還包括遷移學習、主動學習和演化學習等。
遷移學習
遷移學習是指當在某些領域無法取得足夠多的數(shù)據(jù)進行模型訓練時,利用另 一領域數(shù)據(jù)獲得的關系進行的學習。遷移學習可以把已訓練好的模型參數(shù)遷移到 新的模型指導新模型訓練,可以更有效的學習底層規(guī)則、減少數(shù)據(jù)量。目前的遷 移學習技術主要在變量有限的小規(guī)模應用中使用,如基于傳感器網絡的定位,文 字分類和圖像分類等。未來遷移學習將被廣泛應用于解決更有挑戰(zhàn)性的問題,如 視頻分類、社交網絡分析、邏輯推理等。
主動學習
主動學習通過一定的算法查詢最有用的未標記樣本,并交由專家進行標記, 然后用查詢到的樣本訓練分類模型來提高模型的精度。主動學習能夠選擇性地獲 取知識,通過較少的訓練樣本獲得高性能的模型,最常用的策略是通過不確定性 準則和差異性準則選取有效的樣本。
演化學習
演化學習對優(yōu)化問題性質要求極少,只需能夠評估解的好壞即可,適用于求 解復雜的優(yōu)化問題,也能直接用于多目標優(yōu)化。演化算法包括粒子群優(yōu)化算法、 多目標演化算法等。目前針對演化學習的研究主要集中在演化數(shù)據(jù)聚類、對演化 數(shù)據(jù)更有效的分類,以及提供某種自適應機制以確定演化機制的影響等。
3.1.2 知識圖譜
知識圖譜本質上是結構化的語義知識庫,是一種由節(jié)點和邊組成的圖數(shù)據(jù)結 構,以符號形式描述物理世界中的概念及其相互關系,其基本組成單位是“實體 —關系—實體”三元組,以及實體及其相關“屬性—值”對。不同實體之間通過 關系相互聯(lián)結,構成網狀的知識結構。在知識圖譜中,每個節(jié)點表示現(xiàn)實世界的 “實體”,每條邊為實體與實體之間的“關系”。通俗地講,知識圖譜就是把所有不同種類的信息連接在一起而得到的一個關系網絡,提供了從“關系”的角度 去分析問題的能力。
知識圖譜可用于反欺詐、不一致性驗證、組團欺詐等公共安全保障領域,需 要用到異常分析、靜態(tài)分析、動態(tài)分析等數(shù)據(jù)挖掘方法。特別地,知識圖譜在搜 索引擎、可視化展示和精準營銷方面有很大的優(yōu)勢,已成為業(yè)界的熱門工具。但 是,知識圖譜的發(fā)展還有很大的挑戰(zhàn),如數(shù)據(jù)的噪聲問題,即數(shù)據(jù)本身有錯誤或 者數(shù)據(jù)存在冗余。隨著知識圖譜應用的不斷深入,還有一系列關鍵技術需要突破。
3.1.3 自然語言處理
自然語言處理是計算機科學領域與人工智能領域中的一個重要方向,研究能 實現(xiàn)人與計算機之間用自然語言進行有效通信的各種理論和方法,涉及的領域較 多,主要包括機器翻譯、機器閱讀理解和問答系統(tǒng)等。
(1)機器翻譯
機器翻譯技術是指利用計算機技術實現(xiàn)從一種自然語言到另外一種自然語 言的翻譯過程?;诮y(tǒng)計的機器翻譯方法突破了之前基于規(guī)則和實例翻譯方法的 局限性,翻譯性能取得巨大提升?;谏疃壬窠浘W絡的機器翻譯在日常口語等一 些場景的成功應用已經顯現(xiàn)出了巨大的潛力。隨著上下文的語境表征和知識邏輯 推理能力的發(fā)展,自然語言知識圖譜不斷擴充,機器翻譯將會在多輪對話翻譯及 篇章翻譯等領域取得更大進展。
目前非限定領域機器翻譯中性能較佳的一種是統(tǒng)計機器翻譯,包括訓練及解 碼兩個階段。訓練階段的目標是獲得模型參數(shù),解碼階段的目標是利用所估計的 參數(shù)和給定的優(yōu)化目標,獲取待翻譯語句的最佳翻譯結果。統(tǒng)計機器翻譯主要包 括語料預處理、詞對齊、短語抽取、短語概率計算、最大熵調序等步驟。基于神 經網絡的端到端翻譯方法不需要針對雙語句子專門設計特征模型,而是直接把源 語言句子的詞串送入神經網絡模型,經過神經網絡的運算,得到目標語言句子的 翻譯結果。在基于端到端的機器翻譯系統(tǒng)中,通常采用遞歸神經網絡或卷積神經 網絡對句子進行表征建模,從海量訓練數(shù)據(jù)中抽取語義信息,與基于短語的統(tǒng)計 翻譯相比,其翻譯結果更加流暢自然,在實際應用中取得了較好的效果。
(2)語義理解
語義理解技術是指利用計算機技術實現(xiàn)對文本篇章的理解,并且回答與篇章 相關問題的過程。語義理解更注重于對上下文的理解以及對答案精準程度的把控。 隨著 MCTest 數(shù)據(jù)集的發(fā)布,語義理解受到更多關注,取得了快速發(fā)展,相關數(shù) 據(jù)集和對應的神經網絡模型層出不窮。語義理解技術將在智能客服、產品自動問 答等相關領域發(fā)揮重要作用,進一步提高問答與對話系統(tǒng)的精度。
在數(shù)據(jù)采集方面,語義理解通過自動構造數(shù)據(jù)方法和自動構造填空型問題的 方法來有效擴充數(shù)據(jù)資源。為了解決填充型問題,一些基于深度學習的方法相繼 提出,如基于注意力的神經網絡方法。當前主流的模型是利用神經網絡技術對篇 章、問題建模,對答案的開始和終止位置進行預測,抽取出篇章片段。對于進一 步泛化的答案,處理難度進一步提升,目前的語義理解技術仍有較大的提升空間。
(3)問答系統(tǒng)
問答系統(tǒng)分為開放領域的對話系統(tǒng)和特定領域的問答系統(tǒng)。問答系統(tǒng)技術是 指讓計算機像人類一樣用自然語言與人交流的技術。人們可以向問答系統(tǒng)提交用 自然語言表達的問題,系統(tǒng)會返回關聯(lián)性較高的答案。盡管問答系統(tǒng)目前已經有 了不少應用產品出現(xiàn),但大多是在實際信息服務系統(tǒng)和智能手機助手等領域中的 應用,在問答系統(tǒng)魯棒性方面仍然存在著問題和挑戰(zhàn)。
自然語言處理面臨四大挑戰(zhàn):一是在詞法、句法、語義、語用和語音等不同 層面存在不確定性;二是新的詞匯、術語、語義和語法導致未知語言現(xiàn)象的不可 預測性;三是數(shù)據(jù)資源的不充分使其難以覆蓋復雜的語言現(xiàn)象;四是語義知識的 模糊性和錯綜復雜的關聯(lián)性難以用簡單的數(shù)學模型描述,語義計算需要參數(shù)龐大 的非線性計算。
3.1.4 人機交互
人機交互主要研究人和計算機之間的信息交換,主要包括人到計算機和計算 機到人的兩部分信息交換,是人工智能領域的重要的外圍技術。人機交互是與認知心理學、人機工程學、多媒體技術、虛擬現(xiàn)實技術等密切相關的綜合學科。傳統(tǒng)的人與計算機之間的信息交換主要依靠交互設備進行,主要包括鍵盤、鼠標、 操縱桿、數(shù)據(jù)服裝、眼動跟蹤器、位置跟蹤器、數(shù)據(jù)手套、壓力筆等輸入設備,以及打印機、繪圖儀、顯示器、頭盔式顯示器、音箱等輸出設備。人機交互技術 除了傳統(tǒng)的基本交互和圖形交互外,還包括語音交互、情感交互、體感交互及腦 機交互等技術,以下對后四種與人工智能關聯(lián)密切的典型交互手段進行介紹。
(1)語音交互
語音交互是一種高效的交互方式,是人以自然語音或機器合成語音同計算機 進行交互的綜合性技術,結合了語言學、心理學、工程和計算機技術等領域的知 識。語音交互不僅要對語音識別和語音合成進行研究,還要對人在語音通道下的 交互機理、行為方式等進行研究。語音交互過程包括四部分:語音采集、語音識 別、語義理解和語音合成。語音采集完成音頻的錄入、采樣及編碼;語音識別完 成語音信息到機器可識別的文本信息的轉化;語義理解根據(jù)語音識別轉換后的文 本字符或命令完成相應的操作;語音合成完成文本信息到聲音信息的轉換。作為 人類溝通和獲取信息最自然便捷的手段,語音交互比其他交互方式具備更多優(yōu)勢, 能為人機交互帶來根本性變革,是大數(shù)據(jù)和認知計算時代未來發(fā)展的制高點,具 有廣闊的發(fā)展前景和應用前景。
(2)情感交互
情感是一種高層次的信息傳遞,而情感交互是一種交互狀態(tài),它在表達功能 和信息時傳遞情感,勾起人們的記憶或內心的情愫。傳統(tǒng)的人機交互無法理解和 適應人的情緒或心境,缺乏情感理解和表達能力,計算機難以具有類似人一樣的 智能,也難以通過人機交互做到真正的和諧與自然。情感交互就是要賦予計算機 類似于人一樣的觀察、理解和生成各種情感的能力,最終使計算機像人一樣能進 行自然、親切和生動的交互。情感交互已經成為人工智能領域中的熱點方向,旨 在讓人機交互變得更加自然。目前,在情感交互信息的處理方式、情感描述方式、 情感數(shù)據(jù)獲取和處理過程、情感表達方式等方面還有諸多技術挑戰(zhàn)。
(3)體感交互
體感交互是個體不需要借助任何復雜的控制系統(tǒng),以體感技術為基礎,直接 通過肢體動作與周邊數(shù)字設備裝置和環(huán)境進行自然的交互。依照體感方式與原理 的不同,體感技術主要分為三類:慣性感測、光學感測以及光學聯(lián)合感測。體感 交互通常由運動追蹤、手勢識別、運動捕捉、面部表情識別等一系列技術支撐。與其他交互手段相比,體感交互技術無論是硬件還是軟件方面都有了較大的提升, 交互設備向小型化、便攜化、使用方便化等方面發(fā)展,大大降低了對用戶的約束, 使得交互過程更加自然。目前,體感交互在游戲娛樂、醫(yī)療輔助與康復、全自動 三維建模、輔助購物、眼動儀等領域有了較為廣泛的應用。
(4)腦機交互
腦機交互又稱為腦機接口,指不依賴于外圍神經和肌肉等神經通道,直接實 現(xiàn)大腦與外界信息傳遞的通路。腦機接口系統(tǒng)檢測中樞神經系統(tǒng)活動,并將其轉 化為人工輸出指令,能夠替代、修復、增強、補充或者改善中樞神經系統(tǒng)的正常 輸出,從而改變中樞神經系統(tǒng)與內外環(huán)境之間的交互作用。腦機交互通過對神經 信號解碼,實現(xiàn)腦信號到機器指令的轉化,一般包括信號采集、特征提取和命令 輸出三個模塊。從腦電信號采集的角度,一般將腦機接口分為侵入式和非侵入式 兩大類。除此之外,腦機接口還有其他常見的分類方式:按照信號傳輸方向可以 分為腦到機、機到腦和腦機雙向接口;按照信號生成的類型,可分為自發(fā)式腦機 接口和誘發(fā)式腦機接口;按照信號源的不同還可分為基于腦電的腦機接口、基于 功能性核磁共振的腦機接口以及基于近紅外光譜分析的腦機接口。
3.1.5 計算機視覺
計算機視覺是使用計算機模仿人類視覺系統(tǒng)的科學,讓計算機擁有類似人類 提取、處理、理解和分析圖像以及圖像序列的能力。自動駕駛、機器人、智能醫(yī) 療等領域均需要通過計算機視覺技術從視覺信號中提取并處理信息。近來隨著深 度學習的發(fā)展,預處理、特征提取與算法處理漸漸融合,形成端到端的人工智能 算法技術。根據(jù)解決的問題,計算機視覺可分為計算成像學、圖像理解、三維視 覺、動態(tài)視覺和視頻編解碼五大類。
(1)計算成像學
計算成像學是探索人眼結構、相機成像原理以及其延伸應用的科學。在相機 成像原理方面,計算成像學不斷促進現(xiàn)有可見光相機的完善,使得現(xiàn)代相機更加 輕便,可以適用于不同場景。同時計算成像學也推動著新型相機的產生,使相機 超出可見光的限制。在相機應用科學方面,計算成像學可以提升相機的能力,從 而通過后續(xù)的算法處理使得在受限條件下拍攝的圖像更加完善,例如圖像去噪、去模糊、暗光增強、去霧霾等,以及實現(xiàn)新的功能,例如全景圖、軟件虛化、超 分辨率等。
(2)圖像理解
圖像理解是通過用計算機系統(tǒng)解釋圖像,實現(xiàn)類似人類視覺系統(tǒng)理解外部世 界的一門科學。通常根據(jù)理解信息的抽象程度可分為三個層次:淺層理解,包括 圖像邊緣、圖像特征點、紋理元素等;中層理解,包括物體邊界、區(qū)域與平面等; 高層理解,根據(jù)需要抽取的高層語義信息,可大致分為識別、檢測、分割、姿態(tài) 估計、圖像文字說明等。目前高層圖像理解算法已逐漸廣泛應用于人工智能系統(tǒng), 如刷臉支付、智慧安防、圖像搜索等。
(3)三維視覺
三維視覺即研究如何通過視覺獲取三維信息(三維重建)以及如何理解所獲 取的三維信息的科學。三維重建可以根據(jù)重建的信息來源,分為單目圖像重建、 多目圖像重建和深度圖像重建等。三維信息理解,即使用三維信息輔助圖像理解 或者直接理解三維信息。三維信息理解可分為,淺層:角點、邊緣、法向量等; 中層:平面、立方體等;高層:物體檢測、識別、分割等。三維視覺技術可以廣 泛應用于機器人、無人駕駛、智慧工廠、虛擬/增強現(xiàn)實等方向。
(4)動態(tài)視覺
動態(tài)視覺即分析視頻或圖像序列,模擬人處理時序圖像的科學。通常動態(tài)視 覺問題可以定義為尋找圖像元素,如像素、區(qū)域、物體在時序上的對應,以及提 取其語義信息的問題。動態(tài)視覺研究被廣泛應用在視頻分析以及人機交互等方面。
(5)視頻編解碼
視頻編解碼是指通過特定的壓縮技術,將視頻流進行壓縮。視頻流傳輸中最 為重要的編解碼標準有國際電聯(lián)的 H.261、H.263、H.264、H.265、M-JPEG 和 MPEG 系列標準。視頻壓縮編碼主要分為兩大類:無損壓縮和有損壓縮。無損壓 縮指使用壓縮后的數(shù)據(jù)進行重構時,重構后的數(shù)據(jù)與原來的數(shù)據(jù)完全相同,例如 磁盤文件的壓縮。有損壓縮也稱為不可逆編碼,指使用壓縮后的數(shù)據(jù)進行重構時, 重構后的數(shù)據(jù)與原來的數(shù)據(jù)有差異,但不會影響人們對原始資料所表達的信息產 生誤解。有損壓縮的應用范圍廣泛,例如視頻會議、可視電話、視頻廣播、視頻監(jiān)控等。
目前,計算機視覺技術發(fā)展迅速,已具備初步的產業(yè)規(guī)模。未來計算機視覺 技術的發(fā)展主要面臨以下挑戰(zhàn):一是如何在不同的應用領域和其他技術更好的結 合,計算機視覺在解決某些問題時可以廣泛利用大數(shù)據(jù),已經逐漸成熟并且可以 超過人類,而在某些問題上卻無法達到很高的精度;二是如何降低計算機視覺算 法的開發(fā)時間和人力成本,目前計算機視覺算法需要大量的數(shù)據(jù)與人工標注,需 要較長的研發(fā)周期以達到應用領域所要求的精度與耗時;三是如何加快新型算法 的設計開發(fā),隨著新的成像硬件與人工智能芯片的出現(xiàn),針對不同芯片與數(shù)據(jù)采 集設備的計算機視覺算法的設計與開發(fā)也是挑戰(zhàn)之一。
3.1.6 生物特征識別
生物特征識別技術是指通過個體生理特征或行為特征對個體身份進行識別 認證的技術。從應用流程看,生物特征識別通常分為注冊和識別兩個階段。注冊 階段通過傳感器對人體的生物表征信息進行采集,如利用圖像傳感器對指紋和人 臉等光學信息、麥克風對說話聲等聲學信息進行采集,利用數(shù)據(jù)預處理以及特征 提取技術對采集的數(shù)據(jù)進行處理,得到相應的特征進行存儲。識別過程采用與注 冊過程一致的信息采集方式對待識別人進行信息采集、數(shù)據(jù)預處理和特征提取, 然后將提取的特征與存儲的特征進行比對分析,完成識別。從應用任務看,生物 特征識別一般分為辨認與確認兩種任務,辨認是指從存儲庫中確定待識別人身份 的過程,是一對多的問題;確認是指將待識別人信息與存儲庫中特定單人信息進 行比對,確定身份的過程,是一對一的問題。
生物特征識別技術涉及的內容十分廣泛,包括指紋、掌紋、人臉、虹膜、指 靜脈、聲紋、步態(tài)等多種生物特征,其識別過程涉及到圖像處理、計算機視覺、 語音識別、機器學習等多項技術。目前生物特征識別作為重要的智能化身份認證 技術,在金融、公共安全、教育、交通等領域得到廣泛的應用。下面將對指紋識 別、人臉識別、虹膜識別、指靜脈識別、聲紋識別以及步態(tài)識別等技術進行介紹。
(1)指紋識別 指紋識別過程通常包括數(shù)據(jù)采集、數(shù)據(jù)處理、分析判別三個過程。數(shù)據(jù)采集 通過光、電、力、熱等物理傳感器獲取指紋圖像;數(shù)據(jù)處理包括預處理、畸變校正、特征提取三個過程;分析判別是對提取的特征進行分析判別的過程。
(2)人臉識別 人臉識別是典型的計算機視覺應用,從應用過程來看,可將人臉識別技術劃 分為檢測定位、面部特征提取以及人臉確認三個過程。人臉識別技術的應用主要 受到光照、拍攝角度、圖像遮擋、年齡等多個因素的影響,在約束條件下人臉識 別技術相對成熟,在自由條件下人臉識別技術還在不斷改進。
(3)虹膜識別 虹膜識別的理論框架主要包括虹膜圖像分割、虹膜區(qū)域歸一化、特征提取和 識別四個部分,研究工作大多是基于此理論框架發(fā)展而來。虹膜識別技術應用的 主要難題包含傳感器和光照影響兩個方面:一方面,由于虹膜尺寸小且受黑色素 遮擋,需在近紅外光源下采用高分辨圖像傳感器才可清晰成像,對傳感器質量和 穩(wěn)定性要求比較高;另一方面,光照的強弱變化會引起瞳孔縮放,導致虹膜紋理 產生復雜形變,增加了匹配的難度。
(4)指靜脈識別 指靜脈識別是利用了人體靜脈血管中的脫氧血紅蛋白對特定波長范圍內的 近紅外線有很好的吸收作用這一特性,采用近紅外光對指靜脈進行成像與識別的 技術。由于指靜脈血管分布隨機性很強,其網絡特征具有很好的唯一性,且屬于 人體內部特征,不受到外界影響,因此模態(tài)特性十分穩(wěn)定。指靜脈識別技術應用 面臨的主要難題來自于成像單元。
(5)聲紋識別 聲紋識別是指根據(jù)待識別語音的聲紋特征識別說話人的技術。聲紋識別技術 通??梢苑譃榍岸颂幚砗徒7治鰞蓚€階段。聲紋識別的過程是將某段來自某個 人的語音經過特征提取后與多復合聲紋模型庫中的聲紋模型進行匹配,常用的識 別方法可以分為模板匹配法、概率模型法等。
(6)步態(tài)識別 步態(tài)是遠距離復雜場景下唯一可清晰成像的生物特征,步態(tài)識別是指通過身 體體型和行走姿態(tài)來識別人的身份。相比上述幾種生物特征識別,步態(tài)識別的技術難度更大,體現(xiàn)在其需要從視頻中提取運動特征,以及需要更高要求的預處理 算法,但步態(tài)識別具有遠距離、跨角度、光照不敏感等優(yōu)勢。
3.1.7 虛擬現(xiàn)實/增強現(xiàn)實
虛擬現(xiàn)實(VR)/增強現(xiàn)實(AR)是以計算機為核心的新型視聽技術。結合 相關科學技術,在一定范圍內生成與真實環(huán)境在視覺、聽覺、觸感等方面高度近 似的數(shù)字化環(huán)境。用戶借助必要的裝備與數(shù)字化環(huán)境中的對象進行交互,相互影 響,獲得近似真實環(huán)境的感受和體驗,通過顯示設備、跟蹤定位設備、觸力覺交 互設備、數(shù)據(jù)獲取設備、專用芯片等實現(xiàn)。
虛擬現(xiàn)實/增強現(xiàn)實從技術特征角度,按照不同處理階段,可以分為獲取與 建模技術、分析與利用技術、交換與分發(fā)技術、展示與交互技術以及技術標準與 評價體系五個方面。獲取與建模技術研究如何把物理世界或者人類的創(chuàng)意進行數(shù) 字化和模型化,難點是三維物理世界的數(shù)字化和模型化技術;分析與利用技術重 點研究對數(shù)字內容進行分析、理解、搜索和知識化方法,其難點是在于內容的語 義表示和分析;交換與分發(fā)技術主要強調各種網絡環(huán)境下大規(guī)模的數(shù)字化內容流 通、轉換、集成和面向不同終端用戶的個性化服務等,其核心是開放的內容交換 和版權管理技術;展示與交換技術重點研究符合人類習慣數(shù)字內容的各種顯示技 術及交互方法,以期提高人對復雜信息的認知能力,其難點在于建立自然和諧的 人機交互環(huán)境;標準與評價體系重點研究虛擬現(xiàn)實/增強現(xiàn)實基礎資源、內容編 目、信源編碼等的規(guī)范標準以及相應的評估技術。
目前虛擬現(xiàn)實/增強現(xiàn)實面臨的挑戰(zhàn)主要體現(xiàn)在智能獲取、普適設備、自由 交互和感知融合四個方面。在硬件平臺與裝置、核心芯片與器件、軟件平臺與工 具、相關標準與規(guī)范等方面存在一系列科學技術問題??傮w來說虛擬現(xiàn)實/增強 現(xiàn)實呈現(xiàn)虛擬現(xiàn)實系統(tǒng)智能化、虛實環(huán)境對象無縫融合、自然交互全方位與舒適 化的發(fā)展趨勢。
3.1.8 人工智能技術發(fā)展趨勢
綜上所述,人工智能技術在以下方面的發(fā)展有顯著的特點,是進一步研究人 工智能趨勢的重點。
(1)技術平臺開源化 開源的學習框架在人工智能領域的研發(fā)成績斐然,對深度學習領域影響巨大。 開源的深度學習框架使得開發(fā)者可以直接使用已經研發(fā)成功的深度學習工具,減 少二次開發(fā),提高效率,促進業(yè)界緊密合作和交流。國內外產業(yè)巨頭也紛紛意識 到通過開源技術建立產業(yè)生態(tài),是搶占產業(yè)制高點的重要手段。通過技術平臺的 開源化,可以擴大技術規(guī)模,整合技術和應用,有效布局人工智能全產業(yè)鏈。谷 歌、百度等國內外龍頭企業(yè)紛紛布局開源人工智能生態(tài),未來將有更多的軟硬件 企業(yè)參與開源生態(tài)。
(2)專用智能向通用智能發(fā)展 目前的人工智能發(fā)展主要集中在專用智能方面,具有領域局限性。隨著科技 的發(fā)展,各領域之間相互融合、相互影響,需要一種范圍廣、集成度高、適應能 力強的通用智能,提供從輔助性決策工具到專業(yè)性解決方案的升級。通用人工智 能具備執(zhí)行一般智慧行為的能力,可以將人工智能與感知、知識、意識和直覺等 人類的特征互相連接,減少對領域知識的依賴性、提高處理任務的普適性,這將 是人工智能未來的發(fā)展方向。未來的人工智能將廣泛的涵蓋各個領域,消除各領 域之間的應用壁壘。
(3)智能感知向智能認知方向邁進 人工智能的主要發(fā)展階段包括:運算智能、感知智能、認知智能,這一觀點 得到業(yè)界的廣泛認可。早期階段的人工智能是運算智能,機器具有快速計算和記 憶存儲能力。當前大數(shù)據(jù)時代的人工智能是感知智能,機器具有視覺、聽覺、觸 覺等感知能力。隨著類腦科技的發(fā)展,人工智能必然向認知智能時代邁進,即讓 機器能理解會思考。
3.2 人工智能產業(yè)現(xiàn)狀及趨勢
人工智能作為新一輪產業(yè)變革的核心驅動力,將催生新的技術、產品、產業(yè)、 業(yè)態(tài)、模式,從而引發(fā)經濟結構的重大變革,實現(xiàn)社會生產力的整體提升。麥肯 錫預計,到 2025 年全球人工智能應用市場規(guī)模總值將達到 1270 億美元,人工智 能將是眾多智能產業(yè)發(fā)展的突破點。
通過對人工智能產業(yè)分布進行梳理,提出了人工智能產業(yè)生態(tài)圖,主要分為 核心業(yè)態(tài)、關聯(lián)業(yè)態(tài)、衍生業(yè)態(tài)三個層次,如圖 3 所示。
下面將重點對核心業(yè)態(tài)包含的智能基礎設施建設、智能信息及數(shù)據(jù)、智能技 術服務、智能產品四個方面展開介紹,并總結人工智能行業(yè)應用及產業(yè)發(fā)展趨勢。
3.2.1 智能基礎設施
智能基礎設施為人工智能產業(yè)提供計算能力支撐,其范圍包括智能傳感器、 智能芯片、分布式計算框架等,是人工智能產業(yè)發(fā)展的重要保障。
(1)智能芯片
智能芯片從應用角度可以分為訓練和推理兩種類型。從部署場景來看,可以 分為云端和設備端兩步大類。訓練過程由于涉及海量的訓練數(shù)據(jù)和復雜的深度神 經網絡結構,需要龐大的計算規(guī)模,主要使用智能芯片集群來完成。與訓練的計 算量相比,推理的計算量較少,但仍然涉及大量的矩陣運算。目前,訓練和推理 通常都在云端實現(xiàn),只有對實時性要求很高的設備會交由設備端進行處理。
按技術架構來看,智能芯片可以分為通用類芯片(CPU、GPU、FPGA)、基于 FPGA 的半定制化芯片、全定制化 ASIC 芯片、類腦計算芯片(IBM TrueNorth)。 另外,主要的人工智能處理器還有 DPU、BPU、NPU、EPU 等適用于不同場景 和功能的人工智能芯片。
隨著互聯(lián)網用戶量和數(shù)據(jù)規(guī)模的急劇膨脹,人工智能發(fā)展對計算性能的要求 迫切增長,對 CPU 計算性能提升的需求超過了摩爾定律的增長速度。同時,受 限于技術原因,傳統(tǒng)處理器性能也無法按照摩爾定律繼續(xù)增長,發(fā)展下一代智能 芯片勢在必行。未來的智能芯片主要是在兩個方向發(fā)展:一是模仿人類大腦結構 的芯片,二是量子芯片。智能芯片是人工智能時代的戰(zhàn)略制高點,預計到 2020 年人工智能芯片全球市場規(guī)模將突破百億美元。
(2)智能傳感器
智能傳感器是具有信息處理功能的傳感器。智能傳感器帶有微處理機,具備 采集、處理、交換信息等功能,是傳感器集成化與微處理機相結合的產物。智能 傳感器屬于人工智能的神經末梢,用于全面感知外界環(huán)境。各類傳感器的大規(guī)模 部署和應用為實現(xiàn)人工智能創(chuàng)造了不可或缺的條件。不同應用場景,如智能安防、 智能家居、智能醫(yī)療等對傳感器應用提出了不同的要求。未來,隨著人工智能應 用領域的不斷拓展,市場對傳感器的需求將不斷增多,2020 年市場規(guī)模有望突 破 4600 億美元。未來,高敏度、高精度、高可靠性、微型化、集成化將成為智 能傳感器發(fā)展的重要趨勢。
(3)分布式計算框架
面對海量的數(shù)據(jù)處理、復雜的知識推理,常規(guī)的單機計算模式已經不能支撐。 所以,計算模式必須將巨大的計算任務分成小的單機可以承受的計算任務,即云 計算、邊緣計算、大數(shù)據(jù)技術提供了基礎的計算框架。目前流行的分布式計算框 架如 OpenStack、Hadoop、Storm、Spark、Samza、Bigflow 等。各種開源深度學 習框架也層出不窮,其中包括 TensorFlow、Caffe、Keras、CNTK、Torch7、MXNet、 Leaf、Theano、DeepLearning4、Lasagne、Neon 等等。
3.2.2 智能信息及數(shù)據(jù)
信息數(shù)據(jù)是人工智能創(chuàng)造價值的關鍵要素之一。我國龐大的人口和產業(yè)基數(shù) 帶來了數(shù)據(jù)方面的天生優(yōu)勢。隨著算法、算力技術水平的提升,圍繞數(shù)據(jù)的采集、 分析、處理產生了眾多的企業(yè)。目前,在人工智能數(shù)據(jù)采集、分析、處理方面的 企業(yè)主要有兩種:一種是數(shù)據(jù)集提供商,以提供數(shù)據(jù)為自身主要業(yè)務,為需求方 提供機器學習等技術所需要的不同領域的數(shù)據(jù)集;另一種是數(shù)據(jù)采集、分析、處理綜合性廠商,自身擁有獲取數(shù)據(jù)的途徑,并對采集到的數(shù)據(jù)進行分析處理,最 終將處理后的結果提供給需求方進行使用。對于一些大型企業(yè),企業(yè)本身也是數(shù) 據(jù)分析處理結果的需求方。
3.2.3 智能技術服務
智能技術服務主要關注如何構建人工智能的技術平臺,并對外提供人工智能 相關的服務。此類廠商在人工智能產業(yè)鏈中處于關鍵位置,依托基礎設施和大量 的數(shù)據(jù),為各類人工智能的應用提供關鍵性的技術平臺、解決方案和服務。目前, 從提供服務的類型來看,提供技術服務廠商包括以下幾類:
(1)提供人工智能的技術平臺和算法模型。此類廠商主要針對用戶或者行 業(yè)需求,提供人工智能技術平臺以及算法模型。用戶可以在人工智能平臺之上, 通過一系列的算法模型來進行人工智能的應用開發(fā)。此類廠商主要關注人工智能 的通用計算框架、算法模型、通用技術等關鍵領域。
(2)提供人工智能的整體解決方案。此類廠商主要針對用戶或者行業(yè)需求, 設計和提供包括軟、硬件一體的行業(yè)人工智能解決方案,整體方案中集成多種人 工智能算法模型以及軟、硬件環(huán)境,幫助用戶或行業(yè)解決特定的問題。此類廠商 重點關注人工智能在特定領域或者特定行業(yè)的應用。
(3)提供人工智能在線服務。此類廠商一般為傳統(tǒng)的云服務提供廠商,主 要依托其已有的云計算和大數(shù)據(jù)應用的用戶資源,聚集用戶的需求和行業(yè)屬性, 為客戶提供多類型的人工智能服務;從各類模型算法和計算框架的 API 等特定 應用平臺到特定行業(yè)的整體解決方案等,進一步吸引大量的用戶使用,從而進一 步完善其提供的人工智能服務。此類廠商主要提供相對通用的人工智能服務,同 時也會關注一些重點行業(yè)和領域。
需要指出的是,上述三類角色并不是嚴格區(qū)分開的,很多情況下會出現(xiàn)重疊, 隨著技術的發(fā)展成熟,在人工智能產業(yè)鏈中已有大量的廠商同時具備上述兩類或 者三類角色的特征。
3.2.4 智能產品
智能產品是指將人工智能領域的技術成果集成化、產品化,具體的分類如表 1 所示。
表 1 人工智能的產品
隨著制造強國、網絡強國、數(shù)字中國建設進程的加快,在制造、家居、金融、 教育、交通、安防、醫(yī)療、物流等領域對人工智能技術和產品的需求將進一步釋 放,相關智能產品的種類和形態(tài)也將越來越豐富。
3.2.5 人工智能行業(yè)應用
人工智能與行業(yè)領域的深度融合將改變甚至重新塑造傳統(tǒng)行業(yè),本節(jié)重點介 紹人工智能在制造、家居、金融、交通、安防、醫(yī)療、物流行業(yè)的應用,由于篇 幅有限,其它很多重要的行業(yè)應用在這里不展開論述。
(1)智能制造
智能制造是基于新一代信息通信技術與先進制造技術深度融合,貫穿于設計、 生產、管理、服務等制造活動的各個環(huán)節(jié),具有自感知、自學習、自決策、自執(zhí) 行、自適應等功能的新型生產方式。智能制造對人工智能的需求主要表現(xiàn)在以下 三個方面:一是智能裝備,包括自動識別設備、人機交互系統(tǒng)、工業(yè)機器人以及 數(shù)控機床等具體設備,涉及到跨媒體分析推理、自然語言處理、虛擬現(xiàn)實智能建 模及自主無人系統(tǒng)等關鍵技術。二是智能工廠,包括智能設計、智能生產、智能 管理以及集成優(yōu)化等具體內容,涉及到跨媒體分析推理、大數(shù)據(jù)智能、機器學習 等關鍵技術。三是智能服務,包括大規(guī)模個性化定制、遠程運維以及預測性維護 等具體服務模式,涉及到跨媒體分析推理、自然語言處理、大數(shù)據(jù)智能、高級機 器學習等關鍵技術。例如,現(xiàn)有涉及智能裝備故障問題的紙質化文件,可通過自 然語言處理,形成數(shù)字化資料,再通過非結構化數(shù)據(jù)向結構化數(shù)據(jù)的轉換,形成 深度學習所需的訓練數(shù)據(jù),從而構建設備故障分析的神經網絡,為下一步故障診 斷、優(yōu)化參數(shù)設置提供決策依據(jù)。
(2)智能家居
參照工業(yè)和信息化部印發(fā)的《智慧家庭綜合標準化體系建設指南》,智能家 居是智慧家庭八大應用場景之一。受產業(yè)環(huán)境、價格、消費者認可度等因素影響, 我國智能家居行業(yè)經歷了漫長的探索期。至 2010 年,隨著物聯(lián)網技術的發(fā)展以 及智慧城市概念的出現(xiàn),智能家居概念逐步有了清晰的定義并隨之涌現(xiàn)出各類產 品,軟件系統(tǒng)也經歷了若干輪升級。
智能家居以住宅為平臺,基于物聯(lián)網技術,由硬件(智能家電、智能硬件、 安防控制設備、家具等)、軟件系統(tǒng)、云計算平臺構成的家居生態(tài)圈,實現(xiàn)人遠 程控制設備、設備間互聯(lián)互通、設備自我學習等功能,并通過收集、分析用戶行 為數(shù)據(jù)為用戶提供個性化生活服務,使家居生活安全、節(jié)能、便捷等。例如,借助智能語音技術,用戶應用自然語言實現(xiàn)對家居系統(tǒng)各設備的操控,如開關窗簾 (窗戶)、操控家用電器和照明系統(tǒng)、打掃衛(wèi)生等操作;借助機器學習技術,智 能電視可以從用戶看電視的歷史數(shù)據(jù)中分析其興趣和愛好,并將相關的節(jié)目推薦 給用戶。通過應用聲紋識別、臉部識別、指紋識別等技術進行開鎖等;通過大數(shù) 據(jù)技術可以使智能家電實現(xiàn)對自身狀態(tài)及環(huán)境的自我感知,具有故障診斷能力。 通過收集產品運行數(shù)據(jù),發(fā)現(xiàn)產品異常,主動提供服務,降低故障率。還可以通 過大數(shù)據(jù)分析、遠程監(jiān)控和診斷,快速發(fā)現(xiàn)問題、解決問題及提高效率。
(3)智能金融
人工智能的飛速發(fā)展將對身處服務價值鏈高端的金融業(yè)帶來深刻影響,人工 智能逐步成為決定金融業(yè)溝通客戶、發(fā)現(xiàn)客戶金融需求的重要因素。人工智能技 術在金融業(yè)中可以用于服務客戶,支持授信、各類金融交易和金融分析中的決策, 并用于風險防控和監(jiān)督,將大幅改變金融現(xiàn)有格局,金融服務將會更加地個性化 與智能化。智能金融對于金融機構的業(yè)務部門來說,可以幫助獲客,精準服務客 戶,提高效率;對于金融機構的風控部門來說,可以提高風險控制,增加安全性; 對于用戶來說,可以實現(xiàn)資產優(yōu)化配置,體驗到金融機構更加完美地服務。人工 智能在金融領域的應用主要包括:智能獲客,依托大數(shù)據(jù),對金融用戶進行畫像, 通過需求響應模型,極大地提升獲客效率;身份識別,以人工智能為內核,通過 人臉識別、聲紋識別、指靜脈識別等生物識別手段,再加上各類票據(jù)、身份證、 銀行卡等證件票據(jù)的 OCR 識別等技術手段,對用戶身份進行驗證,大幅降低核 驗成本,有助于提高安全性;大數(shù)據(jù)風控,通過大數(shù)據(jù)、算力、算法的結合,搭 建反欺詐、信用風險等模型,多維度控制金融機構的信用風險和操作風險,同時 避免資產損失;智能投顧,基于大數(shù)據(jù)和算法能力,對用戶與資產信息進行標簽 化,精準匹配用戶與資產;智能客服,基于自然語言處理能力和語音識別能力, 拓展客服領域的深度和廣度,大幅降低服務成本,提升服務體驗;金融云,依托 云計算能力的金融科技,為金融機構提供更安全高效的全套金融解決方案。
(4)智能交通
智能交通系統(tǒng)(Intelligent Traffic System,ITS)是通信、信息和控制技術在 交通系統(tǒng)中集成應用的產物。ITS 借助現(xiàn)代科技手段和設備,將各核心交通元素 聯(lián)通,實現(xiàn)信息互通與共享以及各交通元素的彼此協(xié)調、優(yōu)化配置和高效使用,形成人、車和交通的一個高效協(xié)同環(huán)境,建立安全、高效、便捷和低碳的交通。 例如通過交通信息采集系統(tǒng)采集道路中的車輛流量、行車速度等信息,信息分析 處理系統(tǒng)處理后形成實時路況,決策系統(tǒng)據(jù)此調整道路紅綠燈時長,調整可變車 道或潮汐車道的通行方向等,通過信息發(fā)布系統(tǒng)將路況推送到導航軟件和廣播中, 讓人們合理規(guī)劃行駛路線。通過不停車收費系統(tǒng)(ETC),實現(xiàn)對通過 ETC 入口 站的車輛身份及信息自動采集、處理、收費和放行,有效提高通行能力、簡化收 費管理、降低環(huán)境污染。
ITS 應用最廣泛的地區(qū)是日本,其次是美國、歐洲等地區(qū)。中國的智能交通 系統(tǒng)近幾年也發(fā)展迅速,在北京、上海、廣州、杭州等大城市已經建設了先進的 智能交通系統(tǒng);其中,北京建立了道路交通控制、公共交通指揮與調度、高速公 路管理和緊急事件管理等四大 ITS 系統(tǒng);廣州建立了交通信息共用主平臺、物流 信息平臺和靜態(tài)交通管理系統(tǒng)等三大 ITS 系統(tǒng)。
(5)智能安防
智能安防技術是一種利用人工智能對視頻、圖像進行存儲和分析,從中識別 安全隱患并對其進行處理的技術。智能安防與傳統(tǒng)安防的最大區(qū)別在于智能化, 傳統(tǒng)安防對人的依賴性比較強,非常耗費人力,而智能安防能夠通過機器實現(xiàn)智 能判斷,從而盡可能實現(xiàn)實時地安全防范和處理。
當前,高清視頻、智能分析等技術的發(fā)展,使得安防從傳統(tǒng)的被動防御向主 動判斷和預警發(fā)展,行業(yè)也從單一的安全領域向多行業(yè)應用發(fā)展,進而提升生產 效率并提高生活智能化程度,為更多的行業(yè)和人群提供可視化及智能化方案。用 戶面對海量的視頻數(shù)據(jù),已無法簡單利用人海戰(zhàn)術進行檢索和分析,需要采用人 工智能技術作專家系統(tǒng)或輔助手段,實時分析視頻內容,探測異常信息,進行風 險預測。從技術方面來講,目前國內智能安防分析技術主要集中在兩大類:一類 是采用畫面分割前景提取等方法對視頻畫面中的目標進行提取檢測,通過不同的 規(guī)則來區(qū)分不同的事件,從而實現(xiàn)不同的判斷并產生相應的報警聯(lián)動等,例如: 區(qū)域入侵分析、打架檢測、人員聚集分析、交通事件檢測等;另一類是利用模式 識別技術,對畫面中特定的物體進行建模,并通過大量樣本進行訓練,從而達到 對視頻畫面中的特定物體進行識別,如車輛檢測、人臉檢測、人頭檢測(人流統(tǒng) 計)等應用。
智能安防目前涵蓋眾多的領域,如街道社區(qū)、道路、樓宇建筑、機動車輛的 監(jiān)控,移動物體監(jiān)測等。今后智能安防還要解決海量視頻數(shù)據(jù)分析、存儲控制及 傳輸問題,將智能視頻分析技術、云計算及云存儲技術結合起來,構建智慧城市 下的安防體系。
(6)智能醫(yī)療
人工智能的快速發(fā)展,為醫(yī)療健康領域向更高的智能化方向發(fā)展提供了非常 有利的技術條件。近幾年,智能醫(yī)療在輔助診療、疾病預測、醫(yī)療影像輔助診斷、 藥物開發(fā)等方面發(fā)揮重要作用。
在輔助診療方面,通過人工智能技術可以有效提高醫(yī)護人員工作效率,提升 一線全科醫(yī)生的診斷治療水平。如利用智能語音技術可以實現(xiàn)電子病歷的智能語 音錄入;利用智能影像識別技術,可以實現(xiàn)醫(yī)學圖像自動讀片;利用智能技術和 大數(shù)據(jù)平臺,構建輔助診療系統(tǒng)。
在疾病預測方面,人工智能借助大數(shù)據(jù)技術可以進行疫情監(jiān)測,及時有效地 預測并防止疫情的進一步擴散和發(fā)展。以流感為例,很多國家都有規(guī)定,當醫(yī)生 發(fā)現(xiàn)新型流感病例時需告知疾病控制與預防中心。但由于人們可能患病不及時就 醫(yī),同時信息傳達回疾控中心也需要時間,因此,通告新流感病例時往往會有一 定的延遲,人工智能通過疫情監(jiān)測能夠有效縮短響應時間。
在醫(yī)療影像輔助診斷方面,影像判讀系統(tǒng)的發(fā)展是人工智能技術的產物。早 期的影像判讀系統(tǒng)主要靠人手工編寫判定規(guī)則,存在耗時長、臨床應用難度大等 問題,從而未能得到廣泛推廣。影像組學是通過醫(yī)學影像對特征進行提取和分析, 為患者預前和預后的診斷和治療提供評估方法和精準診療決策。這在很大程度上 簡化了人工智能技術的應用流程,節(jié)約了人力成本。
(7)智能物流
傳統(tǒng)物流企業(yè)在利用條形碼、射頻識別技術、傳感器、全球定位系統(tǒng)等方面 優(yōu)化改善運輸、倉儲、配送裝卸等物流業(yè)基本活動,同時也在嘗試使用智能搜索、 推理規(guī)劃、計算機視覺以及智能機器人等技術,實現(xiàn)貨物運輸過程的自動化運作 和高效率優(yōu)化管理,提高物流效率。例如,在倉儲環(huán)節(jié),利用大數(shù)據(jù)智能通過分 析大量歷史庫存數(shù)據(jù),建立相關預測模型,實現(xiàn)物流庫存商品的動態(tài)調整。大數(shù)據(jù)智能也可以支撐商品配送規(guī)劃,進而實現(xiàn)物流供給與需求匹配、物流資源優(yōu)化 與配置等。在貨物搬運環(huán)節(jié),加載計算機視覺、動態(tài)路徑規(guī)劃等技術的智能搬運 機器人(如搬運機器人、貨架穿梭車、分揀機器人等)得到廣泛應用,大大減少 了訂單出庫時間,使物流倉庫的存儲密度、搬運的速度、揀選的精度均有大幅度 提升。
3.2.6 人工智能產業(yè)發(fā)展趨勢
從人工智能產業(yè)進程來看,技術突破是推動產業(yè)升級的核心驅動力。數(shù)據(jù)資 源、運算能力、核心算法共同發(fā)展,掀起人工智能第三次新浪潮。人工智能產業(yè) 正處于從感知智能向認知智能的進階階段,前者涉及的智能語音、計算機視覺及 自然語言處理等技術,已具有大規(guī)模應用基礎,但后者要求的“機器要像人一樣 去思考及主動行動”仍尚待突破,諸如無人駕駛、全自動智能機器人等仍處于開 發(fā)中,與大規(guī)模應用仍有一定距離。
(1)智能服務呈現(xiàn)線下和線上的無縫結合
分布式計算平臺的廣泛部署和應用,增大了線上服務的應用范圍。同時人工 智能技術的發(fā)展和產品不斷涌現(xiàn),如智能家居、智能機器人、自動駕駛汽車等, 為智能服務帶來新的渠道或新的傳播模式,使得線上服務與線下服務的融合進程 加快,促進多產業(yè)升級。
(2)智能化應用場景從單一向多元發(fā)展
目前人工智能的應用領域還多處于專用階段,如人臉識別、視頻監(jiān)控、語音 識別等都主要用于完成具體任務,覆蓋范圍有限,產業(yè)化程度有待提高。隨著智 能家居、智慧物流等產品的推出,人工智能的應用終將進入面向復雜場景,處理 復雜問題,提高社會生產效率和生活質量的新階段。
(3)人工智能和實體經濟深度融合進程將進一步加快
黨的十九大報告提出“推動互聯(lián)網、大數(shù)據(jù)、人工智能和實體經濟深度融合”, 一方面,隨著制造強國建設的加快將促進人工智能等新一代信息技術產品發(fā)展和 應用,助推傳統(tǒng)產業(yè)轉型升級,推動戰(zhàn)略性新興產業(yè)實現(xiàn)整體性突破。另一方面, 隨著人工智能底層技術的開源化,傳統(tǒng)行業(yè)將有望加快掌握人工智能基礎技術并依托其積累的行業(yè)數(shù)據(jù)資源實現(xiàn)人工智能與實體經濟的深度融合創(chuàng)新。
3.3 安全、倫理、隱私問題
歷史經驗表明新技術常常能夠提高生產效率,促進社會進步。但與此同時, 由于人工智能尚處于初期發(fā)展階段,該領域的安全、倫理、隱私的政策、法律和 標準問題值得關注。就人工智能技術而言,安全、倫理和隱私問題直接影響人們 與人工智能工具交互經驗中對人工智能技術的信任。社會公眾必須信任人工智能 技術能夠給人類帶來的安全利益遠大于傷害,才有可能發(fā)展人工智能。要保障安 全,人工智能技術本身及在各個領域的應用應遵循人類社會所認同的倫理原則, 其中應特別關注的是隱私問題,因為人工智能的發(fā)展伴隨著越來越多的個人數(shù)據(jù) 被記錄和分析,而在這個過程中保障個人隱私則是社會信任能夠增加的重要條件。 總之,建立一個令人工智能技術造福于社會、保護公眾利益的政策、法律和標準 化環(huán)境,是人工智能技術持續(xù)、健康發(fā)展的重要前提。為此,本章集中討論與人 工智能技術相關的安全、倫理、隱私的政策和法律問題。
3.3.1 人工智能的安全問題
人工智能最大的特征是能夠實現(xiàn)無人類干預的,基于知識并能夠自我修正地 自動化運行。在開啟人工智能系統(tǒng)后,人工智能系統(tǒng)的決策不再需要操控者進一 步的指令,這種決策可能會產生人類預料不到的結果。設計者和生產者在開發(fā)人 工智能產品的過程中可能并不能準確預知某一產品會存在的可能風險。因此,對 于人工智能的安全問題不容忽視。
與傳統(tǒng)的公共安全(例如核技術)需要強大的基礎設施作為支撐不同,人工 智能以計算機和互聯(lián)網為依托,無需昂貴的基礎設施就能造成安全威脅。掌握相 關技術的人員可以在任何時間、地點且沒有昂貴基礎設施的情況下做出人工智能 產品。人工智能的程序運行并非公開可追蹤,其擴散途徑和速度也難以精確控制。 在無法利用已有傳統(tǒng)管制技術的條件下,對人工智能技術的管制必須另辟蹊徑。 換言之,管制者必須考慮更為深層的倫理問題,保證人工智能技術及其應用均應 符合倫理要求,才能真正實現(xiàn)保障公共安全的目的。
由于人工智能技術的目標實現(xiàn)受其初始設定的影響,必須能夠保障人工智能設計的目標與大多數(shù)人類的利益和倫理道德一致,即使在決策過程中面對不同的 環(huán)境,人工智能也能做出相對安全的決定。從人工智能的技術應用方面看,要充 分考慮到人工智能開發(fā)和部署過程中的責任和過錯問題,通過為人工智能技術開 發(fā)者、產品生產者或者服務提供者、最終使用者設定權利和義務的具體內容,來 達到落實安全保障要求的目的。
此外,考慮到目前世界各國關于人工智能管理的規(guī)定尚不統(tǒng)一,相關標準也 處于空白狀態(tài),同一人工智能技術的參與者可能來自不同國家,而這些國家尚未 簽署針對人工智能的共有合約。為此,我國應加強國際合作,推動制定一套世界 通用的管制原則和標準來保障人工智能技術的安全性。
3.3.2 人工智能的倫理問題
人工智能是人類智能的延伸,也是人類價值系統(tǒng)的延伸。在其發(fā)展的過程中, 應當包含對人類倫理價值的正確考量。設定人工智能技術的倫理要求,要依托于 社會和公眾對人工智能倫理的深入思考和廣泛共識,并遵循一些共識原則:
一是人類利益原則,即人工智能應以實現(xiàn)人類利益為終極目標。這一原則體 現(xiàn)對人權的尊重、對人類和自然環(huán)境利益最大化以及降低技術風險和對社會的負 面影響。在此原則下,政策和法律應致力于人工智能發(fā)展的外部社會環(huán)境的構建, 推動對社會個體的人工智能倫理和安全意識教育,讓社會警惕人工智能技術被濫 用的風險。此外,還應該警惕人工智能系統(tǒng)作出與倫理道德偏差的決策。例如, 大學利用機器學習算法來評估入學申請,假如用于訓練算法的歷史入學數(shù)據(jù)(有 意或無意)反映出之前的錄取程序的某些偏差(如性別歧視),那么機器學習可 能會在重復累計的運算過程中惡化這些偏差,造成惡性循環(huán)。如果沒有糾正,偏 差會以這種方式在社會中永久存在。
二是責任原則,即在技術開發(fā)和應用兩方面都建立明確的責任體系,以便在 技術層面可以對人工智能技術開發(fā)人員或部門問責,在應用層面可以建立合理的 責任和賠償體系。在責任原則下,在技術開發(fā)方面應遵循透明度原則;在技術應 用方面則應當遵循權責一致原則。
其中,透明度原則要求了解系統(tǒng)的工作原理從而預測未來發(fā)展,即人類應當 知道人工智能如何以及為何做出特定決定,這對于責任分配至關重要。例如,在神經網絡這個人工智能的重要議題中,人們需要知道為什么會產生特定的輸出結 果。另外,數(shù)據(jù)來源透明度也同樣非常重要。即便是在處理沒有問題的數(shù)據(jù)集時, 也有可能面臨數(shù)據(jù)中隱含的偏見問題。透明度原則還要求開發(fā)技術時注意多個人 工智能系統(tǒng)協(xié)作產生的危害。
權責一致原則,指的是未來政策和法律應該做出明確規(guī)定:一方面必要的商 業(yè)數(shù)據(jù)應被合理記錄、相應算法應受到監(jiān)督、商業(yè)應用應受到合理審查;另一方 面商業(yè)主體仍可利用合理的知識產權或者商業(yè)秘密來保護本企業(yè)的核心參數(shù)。在 人工智能的應用領域,權利和責任一致的原則尚未在商界、政府對倫理的實踐中 完全實現(xiàn)。主要是由于在人工智能產品和服務的開發(fā)和生產過程中,工程師和設 計團隊往往忽視倫理問題,此外人工智能的整個行業(yè)尚未習慣于綜合考量各個利 益相關者需求的工作流程,人工智能相關企業(yè)對商業(yè)秘密的保護也未與透明度相 平衡。
3.3.3 人工智能的隱私問題
人工智能的近期發(fā)展是建立在大量數(shù)據(jù)的信息技術應用之上,不可避免地涉 及到個人信息的合理使用問題,因此對于隱私應該有明確且可操作的定義。人工 智能技術的發(fā)展也讓侵犯個人隱私(的行為)更為便利,因此相關法律和標準應 該為個人隱私提供更強有力的保護。已有的對隱私信息的管制包括對使用者未明 示同意的收集,以及使用者明示同意條件下的個人信息收集兩種類型的處理。人 工智能技術的發(fā)展對原有的管制框架帶來了新的挑戰(zhàn),原因是使用者所同意的個 人信息收集范圍不再有確定的界限。利用人工智能技術很容易推導出公民不愿意 泄露的隱私,例如從公共數(shù)據(jù)中推導出私人信息,從個人信息中推導出和個人有 關的其他人員(如朋友、親人、同事)信息(在線行為、人際關系等)。這類信 息超出了最初個人同意披露的個人信息范圍。
此外,人工智能技術的發(fā)展使得政府對于公民個人數(shù)據(jù)信息的收集和使用更 加便利。大量個人數(shù)據(jù)信息能夠幫助政府各個部門更好地了解所服務的人群狀態(tài), 確保個性化服務的機會和質量。但隨之而來的是,政府部門和政府工作人員個人 不恰當使用個人數(shù)據(jù)信息的風險和潛在的危害應當?shù)玫阶銐虻闹匾暋?/span>
人工智能語境下的個人數(shù)據(jù)的獲取和知情同意應該重新進行定義。首先,相關政策、法律和標準應直接對數(shù)據(jù)的收集和使用進行規(guī)制,而不能僅僅征得數(shù)據(jù) 所有者的同意;其次,應當建立實用、可執(zhí)行的、適應于不同使用場景的標準流 程以供設計者和開發(fā)者保護數(shù)據(jù)來源的隱私;再次,對于利用人工智能可能推導 出超過公民最初同意披露的信息的行為應該進行規(guī)制。最后,政策、法律和標準 對于個人數(shù)據(jù)管理應該采取延伸式保護,鼓勵發(fā)展相關技術,探索將算法工具作 為個體在數(shù)字和現(xiàn)實世界中的代理人。這種方式使得控制和使用兩者得以共存, 因為算法代理人可以根據(jù)不同的情況,設定不同的使用權限,同時管理個人同意 與拒絕分享的信息。
本章節(jié)所涉及的安全、倫理和隱私問題是人工智能發(fā)展面臨的挑戰(zhàn)。安全問 題是讓技術能夠持續(xù)發(fā)展的前提。技術的發(fā)展給社會信任帶來了風險,如何增加 社會信任,讓技術發(fā)展遵循倫理要求,特別是保障隱私不會被侵犯是亟需解決的 問題。為此,需要(制訂)合理的政策、法律、標準基礎,并與國際社會協(xié)作。 在制訂政策、法律和標準時,應當擺脫膚淺的新聞炒作和廣告式的熱點宣傳,必 須促進對人工智能技術產品更深層地理解,聚焦這一新技術給社會產生重大利益 的同時也帶來的巨大挑戰(zhàn)。作為國際社會的重要成員,中國對保障人工智能技術 應用在正確的道路上、基于正確的理由得到健康發(fā)展擔負重要的責任。
3.4 人工智能標準化的重要作用
當今,經濟全球化和市場國際化深入發(fā)展,標準作為經濟和社會活動的主要 技術依據(jù),已成為衡量國家或地區(qū)技術發(fā)展水平的重要標志、產品進入市場的基 本準則、企業(yè)市場競爭力的具體體現(xiàn)。標準化工作對人工智能及其產業(yè)發(fā)展具有 基礎性、支撐性、引領性的作用,既是推動產業(yè)創(chuàng)新發(fā)展的關鍵抓手,也是產業(yè) 競爭的制高點。人工智能標準的先進與完善與否,關系到產業(yè)的健康發(fā)展、以及 產品國際市場競爭力的強弱。
美國、歐盟、日本等發(fā)達國家高度重視人工智能標準化工作。美國發(fā)布的《國 家人工智能研究與發(fā)展策略規(guī)劃》,歐盟發(fā)布的“人腦計劃”,日本實施的“人工 智能/大數(shù)據(jù)/物聯(lián)網/網絡安全綜合項目”,均提出圍繞核心技術、頂尖人才、標 準規(guī)范等強化部署,力圖搶占新一輪科技主導權。 我國高度重視人工智能標準化工作。在國務院《新一代人工智能發(fā)展規(guī)劃》中將人工智能標準化作為重要支撐保障,提出要“加強人工智能標準框架體系研 究。堅持安全性、可用性、互操作性、可追溯性原則,逐步建立并完善人工智能 基礎共性、互聯(lián)互通、行業(yè)應用、網絡安全、隱私保護等技術標準。加快推動無 人駕駛、服務機器人等細分應用領域的行業(yè)協(xié)會和聯(lián)盟制定相關標準”。工信部 在《促進新一代人工智能產業(yè)發(fā)展三年行動計劃(2018-2020 年)》中指出,要建 設人工智能產業(yè)標準規(guī)范體系,建立并完善基礎共性、互聯(lián)互通、安全隱私、行 業(yè)應用等技術標準;同時構建人工智能產品評估評測體系。
我國雖然在人工智能領域雖然具備了良好基礎,語音識別、視覺識別、中文 信息處理等核心技術實現(xiàn)了突破,也具有巨大的應用市場環(huán)境,但整體發(fā)展水平 仍落后于發(fā)達國家,在核心算法、關鍵設備、高端芯片、重大產品與系統(tǒng)等方面 差距較大,適應人工智能發(fā)展的基礎設施、政策法規(guī)、標準體系亟待完善。
綜上分析,更應重視人工智能標準化工作對于促進技術創(chuàng)新、支撐產業(yè)發(fā)展 具有的重要引領作用:
(一)標準化工作有利于加快人工智能技術創(chuàng)新和成果轉化。現(xiàn)階段人工智 能技術發(fā)展迅速,市場上逐步出現(xiàn)了可規(guī)?;?、可商業(yè)化的產品和應用,需要以 標準化的手段固化技術成果,實現(xiàn)快速創(chuàng)新推廣;
(二)標準化工作有助于提升人工智能產品和服務質量。如市場上出現(xiàn)的人 臉識別系統(tǒng)、智能音箱、服務機器人等產品,質量殘次不齊,需要標準的統(tǒng)一規(guī) 范,并配合以開展符合性測試評估的方式,提升產品和服務質量;
(三)標準化工作有助于切實保障用戶安全。例如自動駕駛領域的“電車難 題”倫理難題、蘋果手機指紋泄露用戶隱私等問題,引起了人們的廣泛關注。如 何保護用戶權益是難點也是重點,這需要通過建立以人為本的原則,制定相關安 全標準規(guī)范,確保智能系統(tǒng)遵從并服務于人類倫理,并確保信息安全;
(四)標準化工作有助于營造公平開放的人工智能產業(yè)生態(tài)。當前,行業(yè)巨 頭以開源算法、平臺接口綁定等方式,打造自有深度學習框架等生態(tài)體系,造成 用戶數(shù)據(jù)信息較難遷移。這需要統(tǒng)一的標準實現(xiàn)廠商之間的互操作與協(xié)同工作, 防止行業(yè)壟斷、用戶綁定,形成良性的產業(yè)生態(tài)。
(審核編輯: 智匯張瑜)
分享