fyty8888@163.com

人工智能相關(guān)技術(shù)研究與發(fā)展

作者:
安徽新天源建設咨詢有限公司
最后修訂:
2020-07-04 09:18:39

摘要:

目錄

【簡介】

 

人工智能(AI — Artificial Intelligence)是研究用計算機來模擬人的某些思維過程和智能行為(如學習、推理、思考、規(guī)劃等)的一門新的技術(shù)科學,是計算機科學的一個分支。它的目標是使計算機完成類似人類智能的工作,實現(xiàn)更高層次的應用。近年來人工智能技術(shù)有了很大發(fā)展,世界上一些主要大國都把人工智能納入國家戰(zhàn)略給予高度重視。2015年,我國制定的《中國制造2025》制造強國戰(zhàn)略中,“智能制造”被定位為中國制造的主攻方向。2017年,國務院印發(fā)的《“互聯(lián)網(wǎng)+”行動指導意見》中,人工智能領(lǐng)域被列為重點發(fā)展領(lǐng)域。人工智能技術(shù)成為國際競爭新的制高點。本次沙龍討論了人工智能的發(fā)展現(xiàn)狀和未來的發(fā)展展望,為人工智能的研究和發(fā)展提出了建議。

[返回]

 

【主持人致辭】

 

趙永濤:今天的沙龍是我們成都分院老科協(xié)舉辦的第五次學術(shù)沙龍,主題是“人工智能相關(guān)技術(shù)研究與發(fā)展”。人工智能是當前一個熱門話題,我們邀請了中科院成都信息技術(shù)股份有限公司(原中科院成都計算所)劉紹中研究員作主旨報告。劉紹中研究員長期從事計算機技術(shù)的研究開發(fā),對人工智能有深入研究。我們還邀請了川大、西南交大、電子科大、西南民院等單位人工智能研究領(lǐng)域的老師,希望大家進行交流討論。今天參加沙龍活動的還有院離退休干部工作局、院老科協(xié)的有關(guān)領(lǐng)導以及省老科協(xié)、分院的有關(guān)領(lǐng)導,我們表示熱烈歡迎。下面有請劉紹中研究員作報告。

[返回]

 

【主旨報告】

 

劉紹中:人工智能相關(guān)技術(shù)研究與發(fā)展

一、從AlphaGo(阿爾法狗)談起

AlphaGo是人工智能里程碑式的進步。近年來人工智能給人們帶來的沖擊,莫過于AlphaGo戰(zhàn)勝世界圍棋大師的事件。AlphaGo是一款計算機下圍棋的程序。大家都知道,圍棋的棋盤是一個由縱橫各19條線組成的正方形網(wǎng)格,共有361個格點。它的規(guī)則很簡單:對弈雙方分別持黑白棋子,黑子181枚,白子180枚,共361枚;雙方輪流把棋子落在棋盤的格點上,落子后不能移動,如果一方的棋子被另一方的棋子圍住,即為“死子”,可以被提走。這樣下去,直至局終,以盤面上的活子圍地多少來定勝負。

為了寫出計算機下圍棋的程序,需要進行一些形式化處理。我們把棋盤定義為一個“類”,棋盤上每個格點的“狀態(tài)”用一個三維數(shù)組表示,前兩項定義格點的坐標位置,第三項定義當前格點的狀況(黑、白、空)。再把棋盤上內(nèi)部連通的格點集合且集合中格點具有相同狀態(tài)(黑、白)定義為棋盤類的“子類”。子類的實例就是圍棋的塊。塊中不完全與其塊內(nèi)格點連通的格點是塊的邊界格點。邊界格點要不自己就是棋盤邊界,要不就是與它相連的外部與塊本身對象顏色不同的格點(另外一種顏色、或空),如果所有與塊相鄰的外部格點都是另外一種顏色的話,那么這個塊就沒氣了,就死掉了。所以可以定義它的幾個操作。塊的連通或“增操作”就是要把它增加或者合并。如果它被吃掉了,定義它的操作就是顏色變成空了,黑的變成空的或者是白的變成空了。

由于圍棋的規(guī)則并不復雜,一般說來,一個初等的程序員就可以寫出一個圍棋游戲的程序。問題在這兒,如果要機器下圍棋,如果不計算死活,一方一步,圍棋的狀態(tài)空間是361的階乘這樣一個數(shù)量級。如果是加上下棋過程中被吃掉的,被替掉的塊,狀態(tài)空間的數(shù)量級還要增加很多,它的數(shù)量實在太大了。我們平時下棋實際上就是在這樣一個大的狀態(tài)空間去搜索它的路徑,從一個狀態(tài)到另一個狀態(tài)、現(xiàn)在這個狀態(tài)和下面一個狀態(tài)的搜索。我們知道以前在搜索的時候,采用的是廣度搜索和深度搜索(所謂暴力搜索)?,F(xiàn)在這么巨大的量,如果完全是暴力搜索方式的話,肯定是處理不了的。怎么樣減少它的搜索呢?人們在幾千年的博弈歷史中,總結(jié)了很多經(jīng)驗性的知識,比如棋譜、比如定式、比如各種棋經(jīng)之類等等。棋手就是參考這些知識來判斷局勢、幫助自己做出路徑設計。

圖1  圍棋

1997年,IBM的深藍(Deep Blue)跟卡斯巴羅夫下國際象棋,深藍就是以這樣的巨量暴力搜索形式,取勝了卡斯巴羅夫,而且贏得他心服口服。當時我們認為人工智能搜索方式是:它總結(jié)所有國際象棋的棋手經(jīng)驗,在此基礎(chǔ)上來進行啟發(fā)式的暴力搜索,也就是在已有的知識基礎(chǔ)上進行搜索。

而現(xiàn)在的AlphaGo,我們看到是另外一個方式。它與李世乭對弈的時候,下到第四盤輸了。當時國內(nèi)的棋手界,包括聶衛(wèi)平后來評價說,這個棋是多少臺機器在運算,其中有一臺機器斷電了,因為不像是機器在其余幾盤中應有的水平。給李世乭下的是AlphaGo-Lee,這個版本是建立在兩個神經(jīng)網(wǎng)絡的基礎(chǔ)上,一個策略網(wǎng)絡,還有一個是評價網(wǎng)絡。一個網(wǎng)絡評價輸贏的概率。然后另一個網(wǎng)絡來決定它下一步怎么走。

后來出了一個改進版本,叫AlphaGo-Master,與柯杰下,完敗柯杰。Alpha-Lee和李世乭下的時候,說它輸入了很多既有的知識。但是到AlphaGo-Master的時候,它已經(jīng)基本上完全不需要前面的知識了。

當AlphaGo再升級的時候,叫AlphaGo-zero,AlphaGo-zero是什么呢?它自己跟自己下,開始它只知道圍棋的規(guī)則,它完全沒有圍棋所有幾千年累計的知識,完全沒有。它就自己同自己下,很快它就掌握了我們幾千年的知識,AlphaGo-Zero顯示的就是自學習功能,它自己學會了怎么樣積累圍棋的知識。

棋譜是幾千年累計下來的,AlphaGo-Zero完全不知道,它通過自學習就學會了,太厲害了,所以我覺得它給我們帶來一種全新的考慮。我們以前做程序的時候都知道,要讓程序靈活的話,可以用參數(shù)來改變它,讓它自己在運行過程中修改參數(shù)。AlphaGo不僅修改參數(shù),而且還修改神經(jīng)網(wǎng)絡本身。AlphaGo-Master和AlphaGo-zero只用圍棋規(guī)則作為輸入,一點也沒有用其他的圍棋知識輸入。

AlphaGo-master還包括了少量的設計者掌握的知識特征。AlphaGo-zero不用這些知識,隨機地扔幾個棋子下去,看它的結(jié)果。它是先來評估,評估當前的狀況是什么樣的,再來預測下一個落子的位置。它在運行的時候,AlphaGo根據(jù)它應用的對象,然后積累對象的知識,這很厲害。算法定了,AlphaGo神經(jīng)網(wǎng)絡就已經(jīng)有了,它也用這個神經(jīng)網(wǎng)絡來計算別的東西。前幾天才公布的一件成果,他們用Alpha-Fold 來預測蛋白質(zhì)的空間結(jié)構(gòu),3維空間的折疊,就是用這個算法來做的。這個算法與物理的東西沒有關(guān)系,跟蛋白質(zhì)的空間折疊的物理基礎(chǔ)沒什么關(guān)系,它用這個算法來做,非常讓人震驚。

總結(jié)一下:在AlphaGo-Master基礎(chǔ)上,DeepMind利用了一種新的強化學習方式,開發(fā)了更進一步的AlphaGo-zero。AlphaGo-zero 自己成為自己的老師。從一個對圍棋游戲完全沒有任何知識的神經(jīng)網(wǎng)絡開始。通過將這個神經(jīng)網(wǎng)絡與一種強大的搜索算法相結(jié)合,就可以自己和自己下棋了。在它自我對弈的過程中,神經(jīng)網(wǎng)絡被調(diào)整、更新,以預測下一個落子位置以及對局的最終贏家。

這個更新后的神經(jīng)網(wǎng)絡又將與搜索算法重新組合,進而創(chuàng)建一個新的、更強大的 AlphaGo-zero 版本,再次重復這個過程。在每一次迭代中,系統(tǒng)的性能都得到一點兒的提高,自我對弈的質(zhì)量也在提高,這就使得神經(jīng)網(wǎng)絡的預測越來越準確,得到更加強大的 AlphaGo-zero 版本。這種技術(shù)使得它不再受限于人類知識的局限。相反,它可以從一張白紙的狀態(tài)開始,從世界上最強大的圍棋玩家AlphaGo 自身進行學習。

AlphaGo-zero與之前的版本不同的是:

AlphaGo-zero只使用圍棋棋盤上的黑子和白子作為輸入,而之前版本的的輸入包含了少量人工設計的特征。

AlphaGo-zero只使用一個神經(jīng)網(wǎng)絡。之前的版本使用兩個神經(jīng)網(wǎng)絡,一個是“策略網(wǎng)絡”(policy network),用來選擇下一個落子位置;另一個是“評價網(wǎng)絡”(value network),用來預測游戲的贏家。在AlphaGo-zero 中這些是聯(lián)合進行的,這使得它能夠更有效地進行訓練和評價。

AlphaGo-zero不使用“走子演算”(rollout)——這是其他圍棋程序使用的快速隨機游戲,用來預測哪一方將從當前的棋局中獲勝。相反,它只依賴于高質(zhì)量的神經(jīng)網(wǎng)絡來評估落子位置。

在進行了三天的自我訓練后,AlphaGo-zero在100局比賽中以100:0擊敗了上一版本的 AlphaGo——而上一版本的 AlphaGo 擊敗了曾18次獲得圍棋世界冠軍的韓國九段棋士李世乭。經(jīng)過 40 天的自我訓練后,AlphaGo-zero變得更加強大,超越了曾擊敗世界上最優(yōu)秀、世界第一的柯潔的AlphaGo-Master。

在經(jīng)過數(shù)以百萬計的自我對弈后,從零開始,Alpha-zero在短短幾天內(nèi)積累了人類數(shù)千年積累的知識。Alpha-zero也發(fā)現(xiàn)了新的知識,開發(fā)出非常規(guī)的策略和創(chuàng)造性的新下法,這些新下法超越了它在與柯潔和李世乭比賽時發(fā)明的新技巧。DeepMind 聯(lián)合創(chuàng)始人兼 CEO Demis Hassabis 評論稱:“AlphaGo短短兩年里取得了如此令人驚嘆的成果?,F(xiàn)在,Alpha-zero是我們項目中最強大的版本,它展示了我們在更少的計算能力,而且完全不使用人類數(shù)據(jù)的情況下可以取得如此大的進展。

二、人工智能(AI)技術(shù)的回顧

我們來討論一下人工智能發(fā)展過程中間涉及到哪些技術(shù),以前我們做過一些什么事。

1. 專家系統(tǒng)

我記得以前有一段時間“專家系統(tǒng)”很流行,現(xiàn)在好像不太時興了。1982年在我們所,朱學曾和中醫(yī)學院搞了一個中醫(yī)痺癥的專家系統(tǒng),后來我們在1982巴基斯坦伊斯蘭堡“The 7th nassalgali international summer college on physics and contemporary needs”會議上,公布了我所開發(fā)的中醫(yī)痺癥專家系統(tǒng)?,F(xiàn)在看來它就是一個簡單的if…then…的判別程序,其中判別條件就是預先設定的專家的知識。

專家系統(tǒng)主要研究:怎么收集專家知識,怎樣把專家知識把它表達出來,知識表達方式,怎么樣存儲,怎么檢索。當時專家系統(tǒng)就包括知識庫,知識庫。知識表示方式有產(chǎn)生式規(guī)則、語義網(wǎng)絡、框架、狀態(tài)空間、邏輯模式、腳本、過程、面向?qū)ο蟮?。基于?guī)則的產(chǎn)生式系統(tǒng)是目前實現(xiàn)知識運用最基本的方法。主要就是專家的知識怎么樣進去,就是把專家的知識數(shù)字化。我們做了很多這種項目,讓專家對某一個問題打分,完全把它數(shù)字化,然后把專家的設計到的各方面的東西集中起來,用數(shù)學的方法找出最優(yōu)的結(jié)果。

專家系統(tǒng)通常由人機交互界面、知識庫、推理機、解釋器、綜合數(shù)據(jù)庫、知識獲取等6個部分構(gòu)成。

其中推理機(又稱規(guī)則解釋器)的任務是運用控制策略找到可以應用的規(guī)則。推理機針對當前問題的條件或已知信息,反復匹配知識庫中的規(guī)則,獲得新的結(jié)論,以得到問題求解結(jié)果。推理方式可以有正向和反向推理兩種。正向鏈的策略是尋找出前提可以同數(shù)據(jù)庫中的事實或斷言相匹配的那些規(guī)則,并運用沖突的消除策略,從這些都可滿足的規(guī)則中挑選出一個執(zhí)行,從而改變原來數(shù)據(jù)庫的內(nèi)容。這樣反復地進行尋找,直到數(shù)據(jù)庫的事實與目標一致即找到解答,或者到?jīng)]有規(guī)則可以與之匹配時才停止。逆向鏈的策略是從選定的目標出發(fā),尋找執(zhí)行后果可以達到目標的規(guī)則;如果這條規(guī)則的前提與數(shù)據(jù)庫中的事實相匹配,問題就得到解決;否則把這條規(guī)則的前提作為新的子目標,并對新的子目標尋找可以運用的規(guī)則,執(zhí)行逆向序列的前提,直到最后運用的規(guī)則的前提可以與數(shù)據(jù)庫中的事實相匹配,或者直到?jīng)]有規(guī)則再可以應用時,系統(tǒng)便以對話形式請求用戶回答并輸入必需的事實。

2. 大數(shù)據(jù)

AI的另一技術(shù)基礎(chǔ)依賴大數(shù)據(jù)。大數(shù)據(jù)怎么來的呢?最早我們所里搞關(guān)系數(shù)據(jù)庫(32位微小型機上的關(guān)系數(shù)據(jù)庫,獲得四川省軟件一等獎),是定義和管理早期結(jié)構(gòu)化數(shù)據(jù)的數(shù)據(jù)庫。以后發(fā)展到現(xiàn)在的大型關(guān)系數(shù)據(jù)庫,起初數(shù)據(jù)庫只能處理同源的結(jié)構(gòu)化的數(shù)據(jù),以后擴展到異構(gòu)的結(jié)構(gòu)化數(shù)據(jù)。再以后由于處理多媒體信息和網(wǎng)絡數(shù)據(jù)的需要,進入網(wǎng)絡多媒體數(shù)據(jù)庫、數(shù)據(jù)倉庫、……的時代,數(shù)據(jù)存儲、檢索、挖掘和分析的技術(shù)獲得飛速發(fā)展。

數(shù)據(jù)檢索,就是給一個條件,然后從數(shù)據(jù)庫找出來滿足這一條件的數(shù)據(jù)。后來到網(wǎng)絡數(shù)據(jù)的時候,網(wǎng)絡數(shù)據(jù)和非結(jié)構(gòu)化的數(shù)據(jù),比如說文本、圖像這種數(shù)據(jù)的時候,這種數(shù)據(jù)檢索就發(fā)展成了數(shù)據(jù)挖掘。實際上我們在網(wǎng)絡檢索數(shù)據(jù)時就是發(fā)出很多代理,發(fā)到網(wǎng)上,讓它去找相應的數(shù)據(jù)。到網(wǎng)絡數(shù)據(jù)的階段,就給非結(jié)構(gòu)化的數(shù)據(jù)與提供了很大的空間的。

大數(shù)據(jù)現(xiàn)在的定義需要新的處理模式,需要更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化的能力來適應海量的高增長率的多樣化的數(shù)據(jù)信息。多樣化的信息資產(chǎn)包括結(jié)構(gòu)化的數(shù)據(jù),非結(jié)構(gòu)化的數(shù)據(jù),還有圖像、聲音等各種媒體。什么結(jié)構(gòu)的信息都能夠檢索,而且都是在網(wǎng)絡上面數(shù)據(jù)。這種數(shù)據(jù)的檢索在挖掘的過程中間,就會產(chǎn)生很多新的知識,比如最早的數(shù)據(jù)挖掘,在挖掘數(shù)據(jù)的過程中,發(fā)現(xiàn)信息之間有一些以前你不知道的關(guān)聯(lián)性,關(guān)聯(lián)規(guī)則。一個著名的例子,男的到超市去買東西,啤酒和尿布的關(guān)聯(lián)就是在挖掘過程中發(fā)現(xiàn)的。這個關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)就是產(chǎn)生知識的來源,不斷產(chǎn)生新的知識。所以大數(shù)據(jù)是我們新的知識的來源之一。從技術(shù)上看,大數(shù)據(jù)與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。大數(shù)據(jù)必然無法用單臺的計算機進行處理,必須采用分布式架構(gòu)。它的特色在于對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術(shù)。大數(shù)據(jù)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù),大數(shù)據(jù)分析常和云計算聯(lián)系到一起,實時的大型數(shù)據(jù)集分析需要建立有效的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。適用于大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理(MPP)數(shù)據(jù)庫、數(shù)據(jù)挖掘、分布式文件系統(tǒng)、分布式數(shù)據(jù)庫、云計算平臺、互聯(lián)網(wǎng)和可擴展的存儲系統(tǒng)。

由于大數(shù)據(jù)技術(shù)的發(fā)展,各類以前看似完全不搭界的事物潛在的關(guān)聯(lián)、規(guī)則正在不斷的發(fā)掘出來,新的知識正在不斷發(fā)現(xiàn)。

3. 神經(jīng)網(wǎng)絡

還有一個AI的重要技術(shù)就是神經(jīng)網(wǎng)絡。原理來自動物的神經(jīng)系統(tǒng),輸入相當于給系統(tǒng)一個刺激,然后根據(jù)神經(jīng)的生理模式的模擬它的刺激傳遞方式,離它遠的地方,神經(jīng)源對刺激的反映就要弱一些,一直到最后得到一個輸出。根據(jù)你現(xiàn)有的知識,對它進行訓練,然后讓它能夠符合人在遇到問題的時候的判斷方式,讓它更能符合實際,這就是神經(jīng)網(wǎng)絡的大概原理。

更嚴格的定義應該是:神經(jīng)網(wǎng)絡(Neural Networks,NN)是由大量的、簡單的處理單元(稱為神經(jīng)元)廣泛地互相連接而形成的復雜網(wǎng)絡系統(tǒng),它反映了人腦功能的許多基本特征,是一個高度復雜的非線性動力學習系統(tǒng)。神經(jīng)網(wǎng)絡具有大規(guī)模并行、分布式存儲和處理、自組織、自適應和自學能力,特別適合處理需要同時考慮許多因素和條件的、不精確和模糊的信息處理問題。神經(jīng)網(wǎng)絡的發(fā)展與神經(jīng)科學、數(shù)理科學、認知科學、計算機科學、人工智能、信息科學、控制論、機器人學、微電子學、心理學、光計算、分子生物學等有關(guān),是一門新興的邊緣交叉學科。

神經(jīng)網(wǎng)絡的基礎(chǔ)是神經(jīng)元。神經(jīng)網(wǎng)絡模型是以神經(jīng)元的數(shù)學模型為基礎(chǔ)來描述的。人工神經(jīng)網(wǎng)絡(Artificial NuearlNewtokr)是對人類大腦系統(tǒng)的一階特性的一種描。簡單地講,它是一個數(shù)學模型。神經(jīng)網(wǎng)絡模型由網(wǎng)絡拓撲.節(jié)點特點和學習規(guī)則來表示。神經(jīng)網(wǎng)絡是一個高度非線性動力學系統(tǒng)。雖然,每個神經(jīng)元的結(jié)構(gòu)和功能都不復雜,但是神經(jīng)網(wǎng)絡的動態(tài)行為則是十分復雜的;因此,用神經(jīng)網(wǎng)絡可以表達實際物理世界的各種現(xiàn)象。

人工神經(jīng)網(wǎng)絡的模型現(xiàn)在有數(shù)十種之多,應用較多的典型的神經(jīng)網(wǎng)絡模型包括BP神經(jīng)網(wǎng)絡、Hopfield網(wǎng)絡、ART網(wǎng)絡和Kohonen網(wǎng)絡。下圖是一種簡單的線性神經(jīng)網(wǎng)絡模型:

圖2 線性神經(jīng)網(wǎng)絡結(jié)構(gòu)

4. 自學習

學習是神經(jīng)網(wǎng)絡一種最重要也最令人注目的特點。在神經(jīng)網(wǎng)絡的發(fā)展過程中,學習算法的研究有著十分重要的地位。目前,人們所提出的神經(jīng)網(wǎng)絡模型都是和學習算法相應的。所以,有時人們并不去祈求對模型和算法進行嚴格的定義或區(qū)分。有的模型可以有多種算法。而有的算法可能可用于多種模型。在神經(jīng)網(wǎng)絡中,對外部環(huán)境提供的模式樣本進行學習訓練,并能存儲這種模式,則稱為感知器;對外部環(huán)境有適應能力,能自動提取外部環(huán)境變化特征,則稱為認知器。神經(jīng)網(wǎng)絡在學習中,一般分為有教師和無教師學習兩種。感知器采用有教師信號進行學習,而認知器則采用無教師信號學習的。在主要神經(jīng)網(wǎng)絡如Bp網(wǎng)絡,Hopfield網(wǎng)絡,ART絡和Kohonen網(wǎng)絡中;Bp網(wǎng)絡和Hopfield網(wǎng)絡是需要教師信號才能進行學習的;而ART網(wǎng)絡和Khonone網(wǎng)絡則無需教師信號就可以學習。所謂教師信號,就是在神經(jīng)網(wǎng)絡學習中由外部提供的模式樣本信號。

神經(jīng)網(wǎng)絡的算法與傳統(tǒng)的問題求解方式完全不一樣。我們經(jīng)典的處理問題的辦法,比如說我們處理力學的問題,首先根據(jù)物理定律(牛頓定律),和介質(zhì)材料的性質(zhì),建立物理模型。然后就可以推出一大堆公式,建立數(shù)學的模型,最后求解。但是神經(jīng)網(wǎng)絡求解方式就可能就跟物理模型沒關(guān)系,完全是一個數(shù)學的試探過程。我們以前幾百年來的求解方式是把所有的影響因素逐步孤立化,比方說力的因素、電的因素,把它分開來建立它的模型,最后才來匯總綜合考慮整體的影響。然而現(xiàn)在AI解決問題的方式就可能不是這樣了?,F(xiàn)在是把所有的影響的因素、約束條件、目標需求數(shù)字化。比方說電流,從一安到多少安,反正按電流的因素把它數(shù)字化。然后力學的因素,光學的因素,或者別的什么因素全部數(shù)字化以后,就變成一個很多維的狀態(tài)空間。所以問題求解就是在這樣一個多維的狀態(tài)空間去搜索尋找它的滿足條件的結(jié)果。而這樣的狀態(tài)空間中,相關(guān)的因素(即其中某些維)跟物理模型隔得有點遠了,有的可能有嚴格的物理模型、也可能只有一些經(jīng)驗的數(shù)學模型、甚至只有一些零星的參考數(shù)據(jù)。AI就可以在這樣的狀態(tài)空間中,通過搜索、評估、預測來進行路徑探索,最終向與其結(jié)果逼近。就像AlphaGo現(xiàn)在這樣。AlphaGo做蛋白質(zhì)的空間折疊跟下圍棋一樣,用基本類似的一個網(wǎng)絡Alpha-Fold在做。很奇怪的,我也不知道我們將來會不會也有類似的這樣一個結(jié)果。

以AlphaGo-zero為例,其自學習機制可以描述為:

AlphaGo-zero 的神經(jīng)網(wǎng)絡使用自我對弈數(shù)據(jù)做訓練,這些自我對弈是在一種新的強化學習算法下完成的。在每個位置 s,神經(jīng)網(wǎng)絡 fθ都會進行蒙特卡洛樹搜索(MCTS)。MCTS 輸出下每步棋的落子概率 π。這樣搜索得出的概率通常比神經(jīng)網(wǎng)絡 fθ(s) 的原始落子概率 p 要更加強一些;MCTS 也因此可以被視為一個更加強大的策略提升運算。這一新的強化學習算法的核心思想是,在策略迭代的過程中,反復使用這些搜索運算,神經(jīng)網(wǎng)絡的參數(shù)就不斷更新,讓落子概率和評價 (p,v)= fθ(s) 越來越接近改善后的搜索概率和自我對弈贏家 (π, z)。這些新的參數(shù)也被用于下一次自我對弈的迭代,讓搜索越來越強。

這里的自學習功能表現(xiàn)為:1、數(shù)據(jù)和算法參數(shù)的自動更新;2、策略的迭代和更新。顯然策略更新還有更多的想象空間。

一般而言,常規(guī)神經(jīng)網(wǎng)絡的學習功能包括:三層神經(jīng)網(wǎng)絡、K近鄰、Adaboost、貝葉斯、決策樹等常規(guī)方法。深度學習方法包括:深度置信網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、受限波爾茲曼機、循環(huán)神經(jīng)網(wǎng)絡等。此外,常見的涉及利用既有知識的算法還有:遷移學習、主動學習、演化學習等。

三、AI未來發(fā)展展望

下面講一點我們對AI的一些展望。

1. 新知識的產(chǎn)生

1)完全依靠公理和邏輯推理的科學領(lǐng)域未來將可能沒有人類領(lǐng)先的空間。數(shù)學就是這樣一門科學,數(shù)學的基礎(chǔ)建立在一系列公理之上,通過邏輯推理向各個方向無限延伸。構(gòu)成數(shù)學推理的語言是一套符號運算系統(tǒng),在基本公理的基礎(chǔ)上,人們可以依靠邏輯遞歸地推導出一系列毋庸置疑的結(jié)論。按照哥德爾不完備定理,通過添加任意多與之前的公理獨立且自洽的公理,就可以得到更多全新的知識。建立在公理系統(tǒng)的邏輯推理的領(lǐng)域,就是一個符號系統(tǒng),它的所有的符號推理的東西,比如說我們楊路老師以前搞過多項式的辨別式,給出了任意多項式的判別式,建立在一個新的符號系統(tǒng)基礎(chǔ)上。該符號系統(tǒng)除了+、-、×、/,它加上了一個程序判別。AlphaGo-zero三天的自我訓練得到的圍棋知識就遠遠超過了人類幾千年得到的圍棋知識??梢韵胂?,如果我們建立了一個公理系統(tǒng)和邏輯推理規(guī)則,將會有機器來自動產(chǎn)生所有的推論。很難的問題,它都會給你推出來。將來肯定是這樣的。因此在這些領(lǐng)域,未來將可能沒有人類領(lǐng)先的空間。

2)大批跨領(lǐng)域的新知識將不斷出現(xiàn)。幾千年來的實證科學研究方法,講究盡可能研究單一因素對結(jié)果的影響,在此基礎(chǔ)上考慮各種可能的影響。所以在很多領(lǐng)域需要根據(jù)物理定律建立數(shù)學模型,進而求解。而AI提供了以前看似完全無關(guān)領(lǐng)域的關(guān)聯(lián)研究方法,使用的方法就是搜索、評估、調(diào)整等看似與物理模型關(guān)系不強的方法,卻可以得到相對最優(yōu)的結(jié)果。我們以前學應用數(shù)學的時候,首先我們要把方程列出來,再把它的數(shù)據(jù)解求出來?,F(xiàn)在不是這樣的,現(xiàn)在就是把這些可能的這些因素數(shù)據(jù)化,然后去搜索,全部一個點一個點去找它的結(jié)果,這個跟我們原先的方程不一樣了。

3)由于計算機的信息可以永久儲存,所有的既有的知識將永久存在,不再需要重新發(fā)現(xiàn)。這會對人類的學習和創(chuàng)造新知識產(chǎn)生巨大影響。

4)由于AI系統(tǒng)的廣泛應用,由此將產(chǎn)生大量新的符號系統(tǒng)。這意味著人類的知識系統(tǒng)會產(chǎn)生巨大變化。

5)語言、文字、及所有的人類交流方式將出現(xiàn)根本性變化。比如,據(jù)說臉書定義了一種語法和簡單的單詞,讓AI系統(tǒng)自己在類似實際的環(huán)境中進行訓練。最后產(chǎn)生了一種誰也不懂得語言,嚇得開發(fā)者趕快拔電源關(guān)機。

2. 新方法的產(chǎn)生

1)新的符號系統(tǒng)及符號運算方法。這是必然的趨勢。

2)新的趨勢評估方法 。以前我們評估趨勢的方法是生成一個曲面,然后在曲面上面找這些點?,F(xiàn)在不是這樣,這個點比這個點高,我們就往這個方向走,這個點比這個點低,我覺得這個方向我就放棄了,或者說幾個點它的梯度什么的,它前進的方向不一樣。它的路徑,搜索的路徑不一樣。

3)新的路徑搜索算法。就是怎么樣使你搜索的路徑優(yōu)化,減少你的無效的搜索,還有就是你的算法的并行性,盡量并行處理。

4) 新的優(yōu)化算法。算法的框架和參數(shù)的迭代優(yōu)化,這個優(yōu)化過程,這個是從AlphaGo-zero來的,它在自己學習過程中間,會把它的參數(shù),甚至框架都優(yōu)化了。我覺得現(xiàn)在還沒看到我們這個領(lǐng)域里面有人在做這個東西,怎么樣去把整個框架迭代優(yōu)化,AlphaGo就做這些??赡苓@個東西涉及到它的技術(shù)秘密,但是這個東西是很有意思的,不光是參數(shù)優(yōu)化。

5) 跨學科領(lǐng)域的綜合集成算法。由于神經(jīng)網(wǎng)絡本身并不去祈求對模型和算法進行嚴格的定義或區(qū)分。有的模型可以有多種算法。而有的算法可能可用于多種模型。而采用神經(jīng)網(wǎng)絡對于現(xiàn)有的各類模型和算法進行評價顯然會產(chǎn)生新的方法。

3. 新的應用

新的應用會很多,這里舉一些例子:

1) 自動駕駛。新應用第一個方面就是自動駕駛。自動駕駛現(xiàn)在很熱,實際上飛機的自動駕駛肯定是最成熟的,民航飛行員上天以后基本上不再人工駕駛了,都是自動駕駛。它的環(huán)境是相對要簡單一些。汽車的自動駕駛的環(huán)境要復雜一些,要估計許多其他的環(huán)境因素,人工智能就是專門處理這些問題的。比方說路邊有一個人,你圖像采集到了,他站在那兒,他有一些什么動作,你就能夠估計出他的下一步動作,這個就是AlphaGo的用法。原先覺得這個很難,現(xiàn)在看起來還會出問題,肯定最終會把這個問題處理好。

2)自然語言理解。新應用的第二個方面是自然語言的理解和翻譯。原先覺得這是很難的,現(xiàn)在已經(jīng)有非常大的進步了。一般的自然語言,AI不但能夠理解,能夠越來越細膩的理解,原來它要求很標準的輸入,它現(xiàn)在能夠理解到你很獨特的口音。你的表達的很細微的地方它會找出來,這種表達和那種表達的中間的差別也會找出來,這是發(fā)展方向。而且現(xiàn)在實用的東西已經(jīng)很多了。

3)基因的研究?,F(xiàn)在這個比較熱,尤其是國外很熱門,我目前還不清楚我們中國怎么樣。最近我看到很多材料,生物醫(yī)學的靶向治療已經(jīng)精準到必須要跟你基因進行匹配,原來的靶向治療根據(jù)你的病的位置來確定它的靶向,而現(xiàn)在它要精確到你的基因,用AI分析你的基因來確定你的靶向,這個是很厲害的,一家波士頓的醫(yī)療研究機構(gòu)在進行這方面的臨床研究。當然現(xiàn)在很貴,它要去分析你的基因,這是生物技術(shù)的尖端科技應用。

4)語言、文字、及所有的人類交流方式將出現(xiàn)根本性變化?,F(xiàn)在人類文明所有的東西,包括語言,包括文字,包括各種文物的東西,將來都會數(shù)字化。數(shù)字化以后,各種文明因子就變成了數(shù)字因素,加上時間的因素,就會構(gòu)造一個文明的進化圖。據(jù)此是否可以算出目前是不是最優(yōu)的?它中間還包含了一些其他的東西,肯定可以研究出很多東西來,這就是一個人類的文明的進展密碼破譯過程。

5) 各種智能決策支持。以前我們是決策支持系統(tǒng),決策支持系統(tǒng)是什么呢?我提供決策的數(shù)據(jù)支持和方案,制定一串方案以供決策者選擇。而現(xiàn)在能夠自動決策。像AlphaGo決策完全是自動的,不用人來選擇的。

6) 信用系統(tǒng)的全覆蓋 。區(qū)鏈塊和AI技術(shù)的發(fā)展將最終可以使每個人的價值完全由個人信用決定,完全由算法提供保證,與任何其它人為因素無關(guān)。

7)情緒的數(shù)字化。情緒表現(xiàn)在你的人的肢體的語言,你的面部表情,這些都可以數(shù)字化。數(shù)字化就可以判斷你的情緒,情緒細化到什么程度,表示你這個人是一個什么情緒狀態(tài)。人和機器的關(guān)系都可以把它細化到那種程度,人與人之間的關(guān)系,通過你自己肢體的語言全部數(shù)字化以后,全部細化了以后,你可以研究出你這個人你的喜好,或者你對它的這種感覺什么的,都可以讓機器算出來,這個挺可怕的。

4. AI發(fā)展帶來的思考

情緒表達的數(shù)字化。當所有外在的知識表達都可以由機器獲得以后,自然人的情感是否可以由其外部表現(xiàn)(比如面部表情、姿態(tài)語言、所處環(huán)境、等等)的數(shù)字化完全表達,這成為AI的終極問題。一些數(shù)學家認為人類具有“直覺”,而計算機沒有,所以計算機永遠不可能具有人腦的能力。人工智能無論如何發(fā)展,也無法具備人類的智慧。但另外一些研究指出人類思維也是不完備的,人腦的“思考”和電腦的“運算”基本原理一致。這種相似的聯(lián)系直接導致人腦的思考也是符合哥德爾不完備定理的條件的,因此人類的思維系統(tǒng)也是不完備的。

電腦用電子元件的“開、閉”和電信號的傳遞,人腦則相應表現(xiàn)為神經(jīng)原的“沖動、抑制”和化學信號的傳遞。在生活實踐中,人們是通過思考來建立對世界的客觀認識和描述的,而語言則是人們彼此交流思考結(jié)果的有力工具。對人腦而言,思維推理系統(tǒng)的不完備也就意味著存在不能用思維證實的題。簡而言之,現(xiàn)實中總有那么一些問題或者想法,我們無法用思維來證實或者否定它,從而也就無法用語言來完全準確的表達我們的思想。由于思維是客觀實在的近似反映,語言則是思維的近似表達。這就是我們“只可意會、不可言傳”背后的數(shù)學原因。

人工智能的發(fā)展將帶來人與人的關(guān)系、人與機器的關(guān)系深刻的變化,將對人類社會的發(fā)展產(chǎn)生巨大影響?,F(xiàn)在人工智能已經(jīng)可以在許多事情上超過人類,可以在許多工作上幫助或是取代人類,為人類造福;但是它的發(fā)展也帶來人們對AI安全和未來走向的擔憂。因此,人工智能倫理的問題已經(jīng)引起學界和政府的高度關(guān)注。

這是從AlphaGo出來以后,我對人工智能的一些想法和感覺。有人說人工智能是不是開啟了什么魔鬼,打開魔鬼的瓶子,放出了什么東西來?誰知道呢?人工智能可以將人的所有的東西模仿出來,包括人的智慧、情緒,人類的表達……人工智能是未來發(fā)展的必然趨勢,但是人工智能最終將要走向哪里,是值得大家思考的問題。以上是我的一些體會,希望大家覺得有興趣的話一起研究討論。謝謝!

[返回]

 

 

【討論與交流】

 

趙永濤(主持人):劉教授從人工智能的概念和技術(shù),以及發(fā)展前景三個方面給大家作了精彩的報告。下面我們請大家討論。

彭德中(四川大學):人工智能現(xiàn)在已有廣泛應用。一個例子是核磁共振的影像資料的識別。新生兒視網(wǎng)膜病變是一種常見病,新生兒早產(chǎn)了,要放到氧艙里面,后期發(fā)育會對他的視網(wǎng)膜產(chǎn)生影響,可以通過核磁影像來識別。現(xiàn)在我們?nèi)∧軌蜃鲞@件事的醫(yī)生并不是很多,主要集中在華西和省醫(yī)院。在很多邊遠地區(qū),雖然有這樣的影像的設備,但是它識別不了。我們通過一個神經(jīng)網(wǎng)絡就能夠進行影像資料的識別,能夠判別出視網(wǎng)膜病變。

在視頻的監(jiān)測和識別方面,我們和中科院光電所合作,用神經(jīng)網(wǎng)絡做了無人機的識別。我們用視頻實時地進行監(jiān)測、跟蹤,然后判別它的類型,識別哪些地方是電池,哪些地方有故障,對故障進行定位。

在自然語言處理方面,我們做了客戶機器人,可以根據(jù)用戶的問題,判斷他的意圖,識別他的情感,然后自動生成一個回答,而不像以前進行抽取式的回答。這種應答對客戶更為友好,能夠更準確地理解用戶的意圖,取得很好的用戶體驗。

我們在人工智能解決實際問題時也遇到一些問題,最主要的就是小樣本學習。例如在無機人的探測和識別中,由于各種空管限制,無人機多次都不能飛。我們只好在大廠房里面讓無人機試飛,利用多部攝像機捕捉它的影像資料,為機器學習提供素材。

現(xiàn)在神經(jīng)網(wǎng)絡被看成一個黑盒子,輸入被映射到輸出上,它是怎么進行影射的,它是怎么進行工作的,目前還有許多理論問題有待探討。AlphaGo是一種機器博弈,但是它屬于具有完備性系統(tǒng)的博弈,就是我可以看到對方的牌,對方的棋譜是怎么樣的。還有一種博弈,非完備信息的博弈,就像打撲克打麻將,我不知道對方手上是什么樣的牌,下什么樣的局。在這種情況下像兵器推演,像在電子空間對抗里面,很多時候都涉及非完備信息的博弈。所以目前一個主要研究對象就是針對新一代的神經(jīng)網(wǎng)絡針對小樣本學習,非完備信息博弈。

吳  曉(西南交大):剛才劉教授已經(jīng)說了,人工智能發(fā)展比較好的,第一個是自然語言處理?,F(xiàn)在的問答機器人,其實是在智能回答。問答機器人首先需要語音識別,科大訊飛的語音識別已經(jīng)做得很好了。其次是機器人的機械手臂監(jiān)測等等,包括圖像和視頻,包括現(xiàn)在的攝像頭,這塊兒的需求非常強勁。剛才彭老師說了醫(yī)學圖像處理,包括輔助的智能醫(yī)生,還包括智能像閱讀這些,其實已經(jīng)有很大發(fā)展,所以很多技術(shù)已經(jīng)實用化了。

存在的主要問題,許多是數(shù)據(jù)樣本的問題。剛才彭老師也說過了,許多異常事件都是小樣本,包括監(jiān)控的視頻。在深度學習的過程中,缺少樣本,就造成一系列的問題,造成了不準,出現(xiàn)了誤報。另外是小目標的問題。在監(jiān)控視頻里面,有很多是小樣本,在監(jiān)控過程中還有其他一些抖動,都可能造成我們的準確性下降的問題。

在深度學習中,還有一個科學問題是,對我輸入問題最后得出的結(jié)果,我無法判斷為什么這個結(jié)果好,為什么這個結(jié)果差,為什么我們不能解釋它,原因在哪里?人工智能還有許多問題的研究,包括圖像生成技術(shù),原來沒有樣本,我們可以自動圖像生成。但是這個技術(shù)怎么用,能不能彌補樣本比較少的情況,我們還不清楚。

符紅光(電子科大):在座很多都是我的老領(lǐng)導。最近幾年,我跟張景中院士研發(fā)高考機器人。當前這次人工智能的浪潮主要是靠數(shù)據(jù)推動,算法推動。整個世界本質(zhì)是數(shù),數(shù)據(jù)的重要性是基本的,只要你有數(shù)據(jù)你就會有發(fā)展前景。中國和美國人工智能的優(yōu)勢在于數(shù)據(jù)和計算能力,兩國都很強。但我們的計算能力的芯片還是用國外的,我們目前的算法還有差距。這次人工智能浪潮主要靠數(shù)據(jù)和算力推動,機器實際上沒有懂意思。下一步競爭的制高點在認知智能,像人一樣學會學習,要學會邏輯推理,不僅僅是模擬?,F(xiàn)在的神經(jīng)網(wǎng)絡還是模擬,但是已經(jīng)取得非常不錯的效果了。

顛覆性技術(shù)不得了,顛覆性技術(shù)一出來,以前都不用了。深度學習就是顛覆性技術(shù)。以前我們的翻譯做了很多,現(xiàn)在深度學習用上后,以前做的都沒用了。普通一個大學生都可以做以前非常難的事情。張院士我們團隊一直在堅持做認知智能,我們做的高考機器人,讓機器參加高考,這幾年成績都是在100多分左右。語文文字表達,叫機器人寫作文,由人類來判斷。我相信未來競爭還是數(shù)據(jù),是0和1,不僅僅再做一個AlphaGo,沒意義,我們要在認知智能方面取得突破,首先得突破自然語言。所以有句話叫做“得自然語言者得天下”,誰把自然語言徹底解決了,人工智能就控制住了。

另外劉老師也說得非常好,用AlphaGo預測3D結(jié)構(gòu)。最近我們跟華西重點實驗室合作,把深度學習用在基因編輯上,基因優(yōu)化是基因編輯中的一步,國外有很多在做,包括一些頂級公司。他們以前都是用規(guī)則做的,這次用深度學習做,數(shù)據(jù)一比試,一下就超過了他們。還有化學反應,大家知道的很難的,比方給一個化學物質(zhì)你怎么做它的反應,新藥怎么設計出來做出來,上海的一家公司就是為全球做小分子的生成的,外包,是個大工廠?,F(xiàn)在我們有深度學習,機器就可以在很短時間內(nèi)給你找?guī)资畻l合成路線,專家判斷,準確率已經(jīng)超過人類專家。人類專家都是行內(nèi)的專家了,至少是博士以上水平。我們的系統(tǒng)現(xiàn)在已經(jīng)能達到博士水平,隨著數(shù)據(jù)越來越多,還能進一步提高,因為剩下就是數(shù)據(jù)問題。我們國家在數(shù)據(jù)方面積累不夠,我非常擔心,如果人家真的把數(shù)據(jù)庫一卡,我們就無法工作了。我們國家要抓緊數(shù)據(jù)建設,數(shù)據(jù)太重要了,有數(shù)據(jù)你就好辦事了。

王  鵬(西南民族大學):劉教授是我們的老前輩了,今天我聽了劉教授的報告,使我非常感動的是他在退休以后還關(guān)注著學科的前沿,他在報告里回顧了人工智能的發(fā)展歷史,對現(xiàn)在的各個熱點也進行了展望。我有一個問題想請教一下劉教授。我以前是學物理的,剛才劉教授談到了優(yōu)化算法,我們整個團隊正在研究優(yōu)化算法,我們的研究思路是想用以前我們發(fā)現(xiàn)的優(yōu)化算法模型來做,雖然說取得了一些成果,但是我們對這個方向是不是今后能夠長期發(fā)展,能不能走到一定的高度,我們還有一點點沒數(shù)。希望劉教授站在戰(zhàn)略的高度幫我們把關(guān)。

劉紹中:優(yōu)化算法現(xiàn)在是把問題數(shù)據(jù)化以后全部是試,看這種算法對不對,不是說給一個概率。原則上是這個概念吧。

王  鵬:量子計算要用概率,用波函數(shù)來優(yōu)化它的算法。

劉教授:整個算法是數(shù)字化以后,我找來一個方向,然后計算可能成功的方向,是這樣的吧。效果怎么樣不敢說。

桂文莊:還是基于物理的規(guī)律。純粹用神經(jīng)網(wǎng)絡,拋掉了物理規(guī)律恐怕不行。

王  鵬:非常感謝劉教授。

朱學增:人工智能技術(shù),現(xiàn)在有個趨勢是集成。有很多方法,現(xiàn)在都用來研究針對一個問題,現(xiàn)在一個主要的思維是集成的思維。我就想問在座的各位專家,你們有的是專注于針對一個對象用人工智能技術(shù)。能不能說人工智能發(fā)展到今天已經(jīng)不是單一的東西,是長遠的去開發(fā)人的腦力,需要各種人工智能的集成,不是單一,靠單一去帶動不行。對不對?

符紅光:人工智能有通用人工智能,通用人工智能很遙遠,我覺得集成是可以的。比方說符號學派,現(xiàn)在是連接主義,還有控制學,現(xiàn)在做機器人的都是控制學派,人工智能是反饋,現(xiàn)在就是集成的問題。但是不能要求太高,現(xiàn)在人工智能離通用人工智能還很遙遠,都是端對端的,沒有真正理解。對話機器人,能讓它回答你的話,但是它并沒有理解你的話的意思,而是純粹從概率的角度找了一個最匹配你的話,不管你的感受和情感,但是可以通過上下文找到概率最大的結(jié)果,所以本質(zhì)是數(shù)據(jù)。從應用的角度,比方說翻譯機器,涉及到硬件,速度問題,芯片,人工智能計算能力要起來,另外還有很多是邏輯問題。一是深度學習要用,二是傳統(tǒng)的規(guī)則,傳統(tǒng)的圖像也可以用,不是說你有了一個深度學習,就像AlphaGo就可以解決很多的問題,AlphaGo解決的問題是邊界清晰問題,對邊界不清晰的問題,對那些信息非常不對稱的,常識的問題,道理非常難的問題,還是沒辦法。

朱學增:“批量”提高效益,“定制”適應個性,“批量定制”這種生產(chǎn)模式我認為是不管對任何行業(yè)都是一個發(fā)展趨勢。教學也是這樣,個性化教育。我想問,人工智能的技術(shù),哪一項能解決“批量定制”?在國外叫組裝器,實際上就是講的平臺,我搞一個平臺,搞一個開發(fā)環(huán)境,站在這個開發(fā)平臺上有一個環(huán)境,提供各種數(shù)據(jù)包和格式,達到的目的不外乎就是功能的集成,數(shù)據(jù)的集成,過程的集成。任何事情都是這樣,不是講的兩個空間狀態(tài),有一些操作,一個狀態(tài)經(jīng)過一個操作就變了。不是這么簡單,比如說網(wǎng)絡化,互聯(lián)網(wǎng)時代的網(wǎng)絡,框架早就有了,僅僅是圖譜的概念。美國就不講,就講組裝器。我們國內(nèi)有沒有人搞組裝器呢?包括我們的電子科大、川大,你們對組裝感不感興趣,組裝就是集成的概念,裝備的概念。既然一談組裝,談集成,談裝備,就必然有拆分,就必然有模塊,必然是模塊化的,必然涉及到系統(tǒng)工程。

符紅光:已經(jīng)開始模塊化了。

左  齊:劉教授講了很多好的方向,我從應用工作者的角度來補充一下。第一個是關(guān)于情感。我覺得現(xiàn)在人工智能在情感研究上面,大家非常關(guān)注的是人在情緒上的反應或者說視覺的反應;另一方面,我們很關(guān)心輿情里面所包含的情感。我覺得現(xiàn)在自然語言識別里面也是包含兩個部分,一個是語音識別,還有一個情感識別。這個輿情到底是正面輿情還是負面輿情?從一段文字里面能不能反應游客的評價?我是搞旅游的,游客的評價到底是好的評價還是差的評價?實際上不是簡單根據(jù)語音就能夠識別,需要通過一些自學習或者一些規(guī)則的提取,然后建立新的規(guī)則對這個做出一個判斷。我覺得這是一個方向。

第二個說到醫(yī)學,醫(yī)學里面,我知道加拿大這塊兒做得很好,但是他們的電子數(shù)據(jù)積累了幾十年的經(jīng)驗。我非常贊成符教授剛才說的,現(xiàn)在的人工智能是建立在大數(shù)據(jù)的基礎(chǔ)上的。我們國家最重要的問題就是大數(shù)據(jù)的基礎(chǔ)建設。到現(xiàn)在為止,有的地方花了很多錢,實際上并不知道大數(shù)據(jù)是什么,他們要求數(shù)據(jù)展示出來的界面,做幾個大屏就是大數(shù)據(jù),他不知道數(shù)據(jù)本身。因為沒有數(shù)據(jù)基礎(chǔ),我們現(xiàn)在在醫(yī)學人工智能上面,不管是臨床還是治療,現(xiàn)在要做的難度其實非常大。我覺得現(xiàn)在有一個方向,特別適合于機器深度學習去做,就是康復訓練。界于治療和常規(guī)健身之間的,又要專業(yè)性,又要輔助,是一個長期的過程。很多病人偏癱以后在家康復訓練,沒有專業(yè)支持,我覺得這件事特別適合于人工智能的研究。這個方面我們現(xiàn)也非常關(guān)注,因為我們現(xiàn)在做大健康,特別是今后老齡化時代,這種康復訓練的需求會越來越大。

第三,我們進入5G時代以后,交通還是一個核心問題?,F(xiàn)在景區(qū)里面最大的一個問題就是交通和出行。我們在景區(qū)上面的智能化投入非常大,但是應用的效果非常差,可以說基本上沒有發(fā)揮作用,花了非常多的冤枉錢。我們?nèi)ミ^很多景區(qū),景區(qū)里面最大的關(guān)注點,一定要看它的痛點,基本上每個景區(qū)的交通都是一個問題,但是感覺好像束手無策。我感覺傳統(tǒng)技術(shù)做不到,一定要有新技術(shù)。這里面我認為交通的引導很重要,這是人工智能能夠發(fā)揮很大作用的地方。到現(xiàn)在為止,我們所有的交通引導系統(tǒng)都是基于高德、百度,基于大數(shù)據(jù)做的,實際上計算出來的結(jié)果,實時性很差,準確度還不很高。這就是我們迫切的需求。我就補充這三點。

張文敬:我是搞科普的。比如像前不久的《流浪地球》,制作非?;趾?,中國科普科幻的大家們思維非常巧妙,他們的內(nèi)容試圖用很多智能東西。劉教授講的AlphaGo,對我的啟發(fā)非常深。我們四川未來準備打造科幻科普大省,準備在新機場附近建立一個具有國際影響力的科幻城。但是目前就我所知道的科普科幻,有很多東西屬于魔幻??苹脩撌怯每茖W的東西,用文學的東西寫未來的東西,但是我們寫的是未來達不到的東西,容易把我們年輕一代引向一些歧途。盡管《流浪地球》票房達到驚人的高度,但是里面的科學不是我們未來所預期的。這里引出一個問題,希望有機會請劉教授團隊,還有今天到會的川大、科大等專家,有機會能夠為我們四川打造科幻城做些貢獻,把中國的科幻和未來的科學結(jié)合起來,而不是魔幻的東西。

李榮佳:我提一點建議。我更關(guān)心人工智能技術(shù)的應用前景和實際應用的案例,比如剛才川大老師提到的,現(xiàn)在的疾病診斷,還有剛才那位說到的現(xiàn)在的些實際應用方面的成效,還有張文靜老師提高的信息化的應用。作為學術(shù)方面的討論交流以外,我覺得今后是不是在沙龍內(nèi)容里面可以注入一些實際應用和應用前景的討論,以及實際應用反過來對我們?nèi)斯ぶ悄芗夹g(shù)的推動。

姚漢民:大家都在搞研究。應用前景在哪兒?現(xiàn)在主攻什么樣的目標?這些事情是應該探討的?,F(xiàn)在大家看到人工智能正在進入家庭,各種家庭電器包括電視、洗衣機,都可以有人工智能,這個應用前景是相當大的。各研究所也好,大學、企業(yè)也好,肯定是做了很多工作。但是現(xiàn)在要把它深化,要高端化。比如我們光電所,那么復雜的光學技術(shù),光刻機,也有很多人工智能技術(shù),但是現(xiàn)在把它提高,要深化。所以我昨天參加了光電所新班子的講話,光電技術(shù),光電所今后如何向人工智能發(fā)展,創(chuàng)新發(fā)展,我覺得現(xiàn)在所長有思路,我很支持這個事情。

朱學增:這種沙龍的形式非常好,希望以后形式要多樣化,專業(yè)性一定要強,要同行在一起才講得起來。所以我希望以后我們建立一些聯(lián)系,有企業(yè)的公司,有研究所的人,大家一起討論。我可以介紹一下斯坦福的企業(yè)跟學校的情況,他們的企業(yè)跟學校相當緊密,有時企業(yè)就提出了很好的意見。所以我希望院里面組織沙龍形式要多樣化,專業(yè)性一定要強,我們只要一杯咖啡和一個房間,就談起來了,越談越有勁。

鐘  勇:第一次參加科學院科技沙龍,我談幾點感受:

第一,沙龍體現(xiàn)了我們科學院和科學家的精神,在座的很多科學家不在崗位以后,還在科技領(lǐng)域發(fā)揮了重要作用。

第二,我覺得這種沙龍還是非常重要,因為對我們的年輕人和中年人還是有很好現(xiàn)實指導意義。從2017年國家發(fā)布人工智能發(fā)展規(guī)劃以后,到今年中國政府工作報告,又把智能+作為重要內(nèi)容,打造數(shù)據(jù)經(jīng)濟。我認為這種情況下人工智能已在國家、地方層面全面地爆發(fā),從這個角度上講我們每個人都離不開。今天的沙龍就有許多別的領(lǐng)域的老教授在場,說明與我們每個人都相關(guān)。

今天劉教授的報告做得非常精彩,從AlphaGo這個案例出發(fā),對整個人工智能的相關(guān)技術(shù),包括大數(shù)據(jù)、神經(jīng)網(wǎng)絡、以及深度學習等等做了比較系統(tǒng)的介紹。我覺得非常好。當然從我的認識角度,我也從自己的認識談點看法。

人工智能發(fā)展到現(xiàn)在,新一代人工智能已經(jīng)不太一樣了。人工智能發(fā)展到現(xiàn)在有幾十年歷史了,為什么現(xiàn)在引起大家這樣的關(guān)注,我想有幾個原因:一是是思維模式變了,以前科學研究最多的是機械思維的模式,現(xiàn)在的新模式是數(shù)據(jù)模式或者大數(shù)據(jù)思維模式,從數(shù)據(jù)中發(fā)現(xiàn)一些客觀規(guī)律,包括用數(shù)據(jù)來表示確定性,用數(shù)據(jù)關(guān)系表示因果關(guān)系?,F(xiàn)在是用數(shù)據(jù)來說話,或者用數(shù)據(jù)發(fā)現(xiàn)新知識規(guī)律。二是相關(guān)技術(shù)發(fā)生了巨大變化,這里面包括三個方面技術(shù):一個是算力,第二個是算法,第三個是大數(shù)據(jù)。AlphaGo只是一個引爆點,我認為是這么一個概念,詳細的不談了。從人工智能發(fā)展的角度看,人工智能不是一個點,它的范圍越來越大,而且是多科學的融合,我覺得這是一個發(fā)展趨勢。神經(jīng)網(wǎng)絡已經(jīng)發(fā)明很久了,深度學習出現(xiàn)以后,許多事情,包括圖像識別的確達到了非常好的效果。例如說人民幣識別,用深度學習以后準確率提高了一個級別。這個過程如何理解,實際上就是大數(shù)據(jù)處理的思維問題?,F(xiàn)在人工智能發(fā)展已經(jīng)深入到我們國家社會生活的方方面面,而且產(chǎn)生了一種融合的效果。剛才朱老師談到一個很關(guān)鍵的問題,集成,我認為實際上是融合。比如說現(xiàn)在工業(yè)互聯(lián)網(wǎng),不只是單純的軟件,傳感等問題,而是多種技術(shù)的融合。現(xiàn)在互聯(lián)網(wǎng)向邊緣計算和云計算發(fā)展,人工智能、物聯(lián)網(wǎng)和大數(shù)據(jù)、智能、理解等等融合以后,就可以解決我們現(xiàn)實生活中存在一些比較大的問題。比如說自動駕駛,現(xiàn)在5G出現(xiàn)了,以后到了6G,自動駕駛就可能廣泛應用。比如說,我不會駕車,想到南京去,我小孩又不能陪我,我可以自己駕駛過去。半自動可以完全實現(xiàn),比如說我小孩在辦公室或者家里就可以把那部車開到南京去。傳輸加快了,我們在車上看到是完全一致的,沒有延時,包括醫(yī)療和健康,包括辦公,家用電器,都有非常好的應用前景。所以人工智能的發(fā)展一定對全人類有巨大貢獻。

最后,感謝老教授對智能開發(fā)、社會服務等等方面的努力,你們的精神值得我們中年或年輕一代學習。謝謝你們!祝你們身體健康!小孩在辦公室或者家里就可以把那部車開到南京去。傳輸加快了,我們在車上看到是完全一致的,沒有延時,包括醫(yī)療和健康,包括辦公,家用電器,都有非常好的應用前景。所以人工智能的發(fā)展一定對全人類有巨大貢獻。

劉紹中:大家對我報告給了很高的評價,我是關(guān)心這個事情,到底不是直接在一線工作,所以肯定很多地方顯得很膚淺。在座的專家在第一線工作,考慮問題很深,接觸到很深的東西,我也很有啟發(fā)。謝謝大家!

翟占一:今天的沙龍是一次很好的學習機會,很受益。我也談點體會。

現(xiàn)在人工智能進入了尋常百姓家,觸手可即,我覺得現(xiàn)在已經(jīng)進入到人工智能的時代,這也是我們科學技術(shù)發(fā)展到一定時期的一個產(chǎn)物。人工智能是一種集成技術(shù)。過去廣泛應用于軍事、醫(yī)藥,還有科學,現(xiàn)在更多是造福人類,服務我們尋常的百姓。比如說,最近巴黎圣母院發(fā)生了火災,我注意一個細節(jié),火撲滅以后,三分之二都已經(jīng)燒毀了,但是中樓還保存好了。其中是用了兩個機器人,到大樓中間去進行噴灑消滅液,因為人進不去的,也不容易從空中澆水,這樣容易破壞文物。

人工智能是造福人類的東西。這里我作為一個消費者提一個建議,我覺得現(xiàn)在人工智能的一些產(chǎn)品接地氣不夠。我們現(xiàn)在人工智能要說多高端,航母、大飛機、衛(wèi)星上天都需要它;但是生活中小產(chǎn)品,有一些不接地氣,我家里買了個掃地機器人,原來的一款很復雜,除了掃地、吸附灰塵,還可以拖地,但是價格高,不太方便,老年人不會用。后來買的一臺機器人很方便,5公分高,可以到你的床下面去掃,但是用了一年就壞了。我最近買了一臺,專門去找,我就說要最簡單的,就掃地,不要遙控板,不要自動充電,結(jié)果幾百塊,我現(xiàn)在一直用得很好。以前遙控的老人根本不會用,拖地現(xiàn)在還不現(xiàn)實,吸附灰塵很好,吸滿了打開蓋沖一沖就好。我們的人工智能還是要根據(jù)不同消費群體去做,因為中國人口太多了,農(nóng)村很大的消費市場。我原來地方工作有一家搞洗衣機的廠,它的產(chǎn)品很好,就是瞄準了低端市場農(nóng)村,簡單,能洗干凈,而且當時還不是現(xiàn)在觸摸式的開關(guān),是按紐,開關(guān)就是下面的要粗一些,用2萬次就行了,但它用10萬次都沒問題。所以我覺得還是要接地氣,要考慮怎么樣服務家庭。當然也要服務我們尖端的科學,但是我們更多的是要搞一些服務大眾的,這樣我們?nèi)斯ぶ悄芗夹g(shù)才能更好地服務社會,更好發(fā)揮它的作用。我做過一些調(diào)查,我們的大專院校專利很多,但是真正轉(zhuǎn)化的可能不到三分之二,要做好轉(zhuǎn)化這篇文章。我希望我們的科學家能夠更多地利用自己的知識去造福社會,去對接社會,讓人工智能更多進入我們的尋常百姓家。

桂文莊:今天到這兒來確實學了很多東西,劉教授講得很深刻。今天來還有一點,使我非常感動,我見了很多老同志,特別是我們的張禮堂老所長,今年已經(jīng)85歲高齡了,仍然積極參加我們的沙龍。我在這兒談談感想吧。

劉教授從AlphaGo開始談,AlphaGo一出來,全世界轟動,我們中國也是非常轟動。我記得最清楚的是什么呢?有人提出來是不是人工智能快要發(fā)展到奇點了?到奇點后,機器人可能會超過人類,不受人類控制,最后把人類消滅了。這個問題帶來了人工智能發(fā)展會毀滅人類這樣一個危險前景,各方面議論很多。這些議論對我們搞人工智能的人來說,第一是這個東西不大現(xiàn)實,因為現(xiàn)在的人工智能和真正人的智能還是有差別。有一些東西它是行的,比方說是由于它可以用非常快速的計算,所以在一些模型之下進行決策判斷或者搜索可能比人快很多。但是人還是很特別的,人的智能有些時候是一種頓悟,目前人工智能還沒有辦法解釋和處理。人有一些依靠靈感的事情,人工智能恐怕也很難實現(xiàn)?,F(xiàn)在人工智能還不能像人的大腦一樣去思考,因為人類還沒有明白人的大腦是怎么思考的,你怎么能說人工智能像人一樣呢?但是人工智能處理一些事情確實比大腦快。飛機是人學鳥的發(fā)明,我們知道鳥的飛行是撲翼,翅膀搧著飛,但是速度比我們飛機差遠了。人工智能在某些方面能夠超過人,包括下圍棋,但是不是全面。所以我認為,在某些點上它會比人強,會有很多發(fā)展和應用的前景,會給人帶來非常重大的應用,成為人的智能的延伸和補充沒有問題。

今天討論的主題,大家非常關(guān)心,是社會熱點,同時大家都知道現(xiàn)在人工智能已經(jīng)上升到國家戰(zhàn)略,已經(jīng)成為世界上先進國家之間競爭的一個制高點了。過去咱們提互聯(lián)網(wǎng)+,現(xiàn)在咱們講人工智能+,就是說人工智能要應用到各種各樣的領(lǐng)域去,促使我們各種各樣的處理模式發(fā)生顛覆性的變革,使得我們能夠在各種領(lǐng)域里面上一個新層次。我覺得人工智能的重要性在這兒。所以我們今天討論的內(nèi)容既有戰(zhàn)略意義又有社會意義。

另外,人工智能還是正在發(fā)展中,不是像人腦那樣,因為對腦的理解現(xiàn)在還早著呢。人的大腦復雜程度非常不得了。有人形容人的大腦像一個宇宙,里面的東西太多,現(xiàn)在能理解和知道的東西還是非常少。人工智能的發(fā)展空間非常大。人工智能在某些方面的發(fā)展,比方說深度學習的帶來的進步,大家都知道,深度學習有非常好的應用,而且產(chǎn)生新的效果。但是將來會不會有新的模式發(fā)現(xiàn)呢,會不會有新的算法出現(xiàn)呢?剛才有專家講,我們國家在數(shù)據(jù)處理方面做得比較好,但是在算法方面還是有差距。我覺得這兩個方面都不可偏廢。為什么深度學習這樣的先進算法在中國沒有出現(xiàn),這是值得我們科技人員深思的問題。我們現(xiàn)在要講創(chuàng)新驅(qū)動發(fā)展,講自主創(chuàng)新的能力,那就要看我們在對人類的知識進步中,我們中國人到底有多少貢獻?我們可以很自豪地講我們古代中國人的貢獻很多,但是在近代,只要一看教科書,有幾樣東西是我們中國人的?這是我們未來科技界未來發(fā)展非常重要的目標。

人工智能怎么發(fā)展?一方面我們知道了人工智能還有很多很多的問題沒有解決,還有很多很多的發(fā)展空間,還有很多很多的前沿的事情,今天劉教授談了很多。但是另一方面人工智能應用會帶來非常多的應用,自動駕駛是一個,還有很多的應用出來。想想國家的戰(zhàn)略,我們怎么做?科學院怎么做?剛才有兩位老師都提到了要我們科技人員加強人工智能在應用領(lǐng)域的工作,我覺得兩方面不可偏廢:一方面,我們要把很大的力量放在人工智能的應用上去,解決我們很多現(xiàn)在沒有解決的問題;同時,至少要有一部分人一定要在前沿工作,進行理論和方法的研究和創(chuàng)新,我們中國人將來一定要給世界知識寶庫貢獻我們獨特的東西,這個不搞研究不行,兩方面不可偏廢。最近國家在科研基礎(chǔ)研究方面也制定了發(fā)展規(guī)劃,我覺得在這個時候提出來非常正確,我們已經(jīng)在經(jīng)濟上達到世界的第二位,我們做很多方面都變成世界第一了,但是我們在知識創(chuàng)新上,在原創(chuàng)技術(shù)創(chuàng)新上還是很少,雖然我們已經(jīng)有很大進步。基礎(chǔ)研究是發(fā)展原創(chuàng)技術(shù)的源泉,國家在這個時候提出加強基礎(chǔ)研究,我覺得是非常適當?shù)摹?/p>

人工智能現(xiàn)在發(fā)展起來了,也是一個社會熱點,同時也成為某些商業(yè)炒作的賣點,什么都是“智能”的,包括配鑰匙的也是智能配鑰匙。還有納米、量子,都成了商業(yè)炒作的內(nèi)容,什么納米水、量子水,等等,打上這個符號以后就好賣東西了。這說明我們需要對人工智能進行更加廣泛和深度的宣傳,好好搞科普。張老師提出科普的問題,我贊成人工智能是非常好的科普的題目。還有些科幻故事非常玄妙,像張老師說的可能會誤導。我們要用真用科學的東西來引導青年,所以科普工作非常重要。我們老科協(xié)的一個重要的任務就是做好科普。所以在這方面,我們希望我們的分院的老同志,特別是計算所的老同志,能夠在人工智能科普方面做出我們應有的貢獻。

另外,大家還談到了一些非常重要的事情。比方說加強人工智能研究應用的基礎(chǔ)設施建設,就是數(shù)據(jù)庫的問題。我們國家的數(shù)據(jù)庫,實際上已經(jīng)搞很多年了,科學院搞數(shù)據(jù)庫40年,我們現(xiàn)在的數(shù)據(jù)庫也不少了,但是在有些領(lǐng)域里面數(shù)據(jù)庫還是非常薄弱的。國家科技部有專門的項目支持科技基礎(chǔ)設施建設,其中也有科學數(shù)據(jù)庫,包括醫(yī)療大數(shù)據(jù)。但是這些東西都需要很大的努力來發(fā)展,而且需要數(shù)據(jù)保密、數(shù)據(jù)共享等等這些數(shù)據(jù)應用的政策和法規(guī)。其實現(xiàn)在數(shù)據(jù)應用有很多問題,就是因為在數(shù)據(jù)共享、數(shù)據(jù)保密、數(shù)據(jù)產(chǎn)權(quán)等問題上產(chǎn)生的,隱私的問題也是一大問題。所以怎樣發(fā)展數(shù)據(jù)還是一個比較大的事情,但是無論如何數(shù)據(jù)確確實實是我們將來人工智能發(fā)展的一個非常重要的基礎(chǔ)設施。

今天的沙龍非常好,大家討論很熱烈,時間好像不是太夠,希望下去以后能夠繼續(xù)交流。我贊成除由分院直接組織的沙龍以外,我們分院各研究所可以組織一些小型的專題化的沙龍,解決一些大家特別感興趣的問題。像今天這樣規(guī)模的沙龍很難深入進行專業(yè)討論,但是大家可以談很多想法,可以碰撞新的火花,可以為我們國家為我們院提出想法和建議。今天沙龍題目大了一點,核心問題不是新的應用和研究,而是宏觀了解人工智能技術(shù),討論它應該怎么看待和發(fā)展,我覺得今天沙龍的目的達到了。

主持人:今天我們的沙龍討論會就這里結(jié)束,感謝我們省里和院里各位領(lǐng)導和專家,我們今天沙龍開展比較圓滿和成功。會議到此結(jié)束,謝謝!