CHINESE  INSTITUTE  OF  COMMAND  AND  CONTROL

李德毅:腦認知的形式化 ——從研發機器駕駛腦談開去

發表時間:2020-02-24 00:00

\

國工程院院士、大发棋牌官网登录名譽理事長、中國人工智能學會理事長李德毅

(根據李德毅院士演講內容整理)


  我報告的題目是《腦認知的形式化》,從腦認知到人的智能,顯然就是評估。所以我們現在這個時代到了人工智能的時代。我這個報告還有副標題叫從研發機器駕駛腦。跟Google一樣搞無人駕駛,無人駕駛怎麽搞,到底是搞機器人,還是搞個輪式機器人,隱性的幫著我們開車,還是搞一個雙駕雙控的輪式機器人,讓人和我們機器人和諧相處,這裏涉及到人和機器人如何打交道。


解釋腦認知之謎的兩種方法

  這個形式化有很多方法,從目前人們最關心的各個學科交叉點談,要想解釋□ 腦認知之謎,我個人認為有兩條路,一種是腦認知的神經學方法,這個現在非常火,像奧巴馬的腦計劃,東盟的及日本的,中國的腦計劃,還有李彥宏的¤中國大腦計劃等等。我記得李彥宏講你不大,作為中國腦認知小腦和大腦,所以你看搞生↘命科學的人搞IT是小腦。人的想法,腦認知能不能從生理或者ζ身體上找到原因?我這個IT人有一個正常的本能,遺忘、排斥,拒絕接受,這是人的腦的本能。當一個人對一個事情認識了,對另外一個事情認知度不夠。講到生理和身體學,人的意識,性格,和思維,能不能在人腦中找到定義,用什麽樣的尺度去刻劃特定記憶,這就◎變成了一個基本問題,就是腦認知的形式化。

  腦子裏有多少尺度?北京大學院長說腦組織機構圖,我說無人駕駛腦畫一個功能機構圖,他說老李,你要給我畫一個腦認知圖,一百年也■畫不出來,你看到底分多少塊?18世紀最早的顱相學,他把顱骨中的26個骨和認知建々立一一對應幹系,後來被認知為偽科學。大腦神經區域與認知行為相關性研究,晚源於癲癇病人腦手術︽,不同區域不同頻率的腦電波湧現為整個大腦服從同一振蕩,病人表現為抽搐。這可認為是認知神經學的起點。當今有人通過FMRI觀察,將人腦可以分為116和252個功能區加以研究。人腦不2千克,其中有一小辦在小腦內,以不同拓撲形態分布在不同區域,每個神經元平均和7千多個』神經元,構建在人腦中最復雜的圖。我看我們這個圖有一個毛病,不同的顏色代表不同的神經組,這是對的,它起碼畫著紅顏色、白顏色、藍顏色,但是它的拓撲結構沒有多樣性。就是人腦有的地方是不同的網,是不同的拓撲形態。有一條,世界上沒有微觀組織完全々相同的兩個人腦。生來就可以控制你的功能核磁共振圖,你如何辨認。你今天的腦變化不一樣。

  腦認知是被感知和記憶的編碼表達以及對感知的理◥解和想象,它和腦勝利以及腦成長史相關。大家說看到一個人和認出一個人,可能代表不同的腦神經功能回路,大腦中很多部位可能都參與了對絨毛影響性格的信息處理,成人腦中有記憶功能的大腦皮層大約有22平方厘米。世界上專門有人研究愛因斯坦腦,腦子大,腦子大就聰█明嗎?不一定。我們說腦子進水了,那就是有問題了。

  神經生物學家試圖用精神病患者細胞在培養皿中種出一個大腦皮層,器官在培養皿中被有道成為能夠長◥成任何細胞的多能幹細胞,又進而通過幹細胞誘導技術使其成為腦細胞。同時造出神經元和膠質細胞,極具挑戰性,當時生物神經回路和大規模神經網絡成為腦認知神經學研究的熱點,所以我認為腦認知的形式化第一個方法就是▓認知神經學。任何學科在什麽尺度上形式化至關重要。尺度越細,結構越復雜,形式化越難。例如生命科學在胰島素和消化酶的水平上用數百萬細胞來研究胰島素的運作過程其難度遠遠小於研究單一胰島素細胞尺度的運作過程。我們這個世界宏觀更宏觀,微觀更微觀,尺度可以說相當大的尺度,怎麽把這個尺度畫出來◣?我自己畫一個臺階,底下是基因,比基因大一點是分子大圖,有神經網絡,有腦區域圖,有是你的認知行為,基因,我們從微觀或者介觀或者宏觀程度上研究※神經元。我們看到奧巴馬2013年啟動的腦計劃,大腦中有9個點,我們看一看,我認為這9個點有不同的選擇策略。比如說大腦認知統計顯然是介觀層面。我這裏拿了奧巴馬的9個點6個點打出來,好像有的靠近微觀,有的靠近宏觀※,基本上介觀。這個方法有風險,我們做個評估,我說據稱黑猩猩、長頸鹿和海豚腦與人腦的生物結構組成較為接近,但認知水平迥然不同。如果僅在微觀和介觀尺度上研究生物腦,會不會研發粗一個長頸鹿腦不具備人腦的認知嫩裏。無論是人造個長頸鹿腦還是嬰兒絳或者愛因斯坦腦,使勁人們的夢境、睡眠依然認知任重道〖遠。

  第二個腦認知物理學方法。我在想認得想法和智慧導帶從何而來?是天生就有還是後來的學習積累?我們經常把人腦比成一個小塊,為什麽不基於物理學的研究方法】研究腦認知?因為我們把它叫做大眾的物理學,人腦中的物理學】。哪個不是從物理學出來?電子學會,計算機學會,後來產生人工智能學會,歸根到底還是物理世界。我舉一個典型的案例,1920年在印度米德納波效果城附近人們在狼窩裏發現兩個裸體女孩,大的七八歲,小的約兩歲,分別被取名Kamala和Aamala,送到孤兒院撫養小的第二年就死了,大的兩年後才會直⌒ 立,也只活到16歲,4年學會6個單詞及智力相當於三四歲的孩子。所以在座的年輕的父母們建議你們回家一定要做兒童腦成長示例,除了狼羊,熊樣,猴養,養的最成功的就是狼養,百度查一查,說的比我還生動。狼孩在狼群裏長大,無法具有人的心理,錯過了大腦學習語言和文字的最佳生長發育期。因此我們研究人腦成長和認知的群居性和社會性,如果研究人腦社會※學,只研究了一半。

  我1944年出生,讀毛澤東紅論長大,毛主席1936年就寫的《實踐論》,新三論老三論,尤其是1963年說的《人的正確思想是從哪裏來的》,這是取決於由於你看到什麽,就想看到什麽。有的時候我們看開車,他不看路看美女,所以★你看腦還不行,看腦還得認識腦。毛主席感官的東西你不一定能夠深刻認識,只有深刻認識才能很好的感覺它。那就是《毛澤東語錄》。

  Google公司最近的一則報道談起,Google無人駕駛汽車有上百萬盈利的測試經驗,大致相當於人類75年的駕齡,一個美國成年人15歲開車,到90歲開車,也不高啊,90歲眼睛也花了,也不方便了。所以人類75年駕齡的水平是什麽?你把它上升到更到一層就是腦認知如何度量。世界上人類張三李四王五,他們總稱叫人類。

  腦認知是生物屬性和社會屬性,先天屬性和後天屬性相互結合而產生的整合行★認知過程。研究生物腦叫形式化,腦認知的形式化可以不可以先關註腦認知的社會屬性,作為主管世人腦是如何反應客觀物理世界的?人腦是如何從外部環境中獲得知識和技能的?人腦是如何根據已知解決未知的?人腦的想象力即如何形成創新的?就是這後面三條是全部∏內容。我們想辦法把腦認知形式化,腦認知物理學習法,以物理學為基礎的神經成像技術,如核磁共振,腦袋天,掃描,電位變化、信號分析等使得人類不再需要開顱才能認識大腦。還是在符號級?這就到我們講的語言概念,語義或行為級,我是把物理學當中也畫了一張圖,那就是信號級別,符號級別,語義級別,行為級別。像FMIR這個設備我把它叫做宏觀設備,或者叫微觀設備。或者我們理解語義編碼那就是符號級別。以後不同力度的概念圖像、信息,語義,就是不同的情節和動物。

  我有一本書叫《不確定性人工智〖能》,解決的就是數據和語義之間▆的能力。我們希望用定型概念和定量數據之間的等量關系,發現的元⌒ 雲模型、雲推理、雲數據、雲變化等。

  腦認知的物理學方法我們將客觀世界的認知隱身到主觀世界,將物理學中的場引入到認知空間,填補數據模型和認知模型之間的鴻溝,用數據場描述個體,神經元,結合予或↓者智能體,之間的相互作用。我跟一個人說↓讓他看我們的書,不要一定想洋文是好的,中文也是一種語言表達。如果把我們的語言翻譯成英語我們也很驕傲。


腦認知的三個內涵

  大腦◥成像技術、人腦數據搜集、知識傳播與培∏訓,這三大塊是奧巴馬講的。當然納悶在腦數據科學化有九個點。認知神經學和認知物理學的研究方法不同的側重。這個是叫隱言,腦認知的形態和拓撲。腦認知的主要外在表現是聽和說和如何看。因此我們要研究語言認知,圖像認知。當然語言也是一種特殊的圖像,腦認知的內涵怎麽想?我個人認為很重要,這是我今№天的話題。第一個,記憶力,第二個計算認知,第三個交互認知。

  請大家註意,我把記憶放在認知之前,這是我主要表達的觀點,我認為計算固然重要,記憶更重要。腦認知的本質是統計認知,對世界的認知不是一次完成,需要多次反復,在不停的感知、認知行動過程中形成不確定性,這就是進╱化。因此動態演化過程從時間上看是積分,就變成你的記憶。核心是記憶認知,記憶是腦認知的核心,是人類智能◆的顯著表現,記憶力強,記憶力大是↓認知。圖靈科學家說腦認知的核心是記憶認知。

  下面這一段也很重要,這是我們IT人跟生命科學家們取得的共識,腦認知是核心,是人類智能的顯著表現,記憶力力,記憶量大,記憶力強,這三個動態感知。記憶不是簡單的存儲,它伴卐隨有一定的取舍,取舍過程就是計算、就是簡約和抽象。你拿一本書放一百年,那個書裏面◢還有一點點痕跡,它是個抽象,是個簡約。記憶和計算總是同時發生的億通常時間越長丟失信息越多,記憶常常有聯想和搜索,聯想和搜索也是計算。看Google,越長期反復的信息越難以往。無論語言記憶還是圖像記憶本質上就是通知記憶。這是我今天講的最重要的數據,記憶的度量。假如H是個函數,它應該是認知函數跟遺忘函數的卷積,我問到一個問題,卷積神經網絡多寬?為什麽多∑寬?這個很科學。我不知道有多少人跟我一樣。有麻省,也香港大學的。幾分對套積分就是圖量,F卷積等於卷積F乘以F的馬斯乘以F的馬斯。

  人在周邊環境世界裏經常有瞬間的、豐富的感覺記憶,短期的、較豐富的工作記憶,以及反復多次的簡約的長期記憶,海馬題在工作記憶和學習中具有重要作用,瞬間的、豐富的初次感覺記憶在前腦中很快以往,較豐富的偶爾短期記憶在丘腦中容易忘卻,反復的簡約的長期記憶留在大腦皮質中難以以往,相對短期的記憶如果反復被檢索可演變為更長期的記憶。感覺記憶前饋是工●作記憶,工作記憶反饋◥回來是感覺記憶,工作記憶前虧饋是長期建議,長期記憶反饋過來是工作記憶。這個是抽象和演繹的。我們就把感覺記憶、工作記憶和長期記憶來形式化的力度,用不同的力度來表述它,形式化是這樣的。所以你們看看這個字符,如果再融合到一起,它就是卷積的神經網。這太讓我興奮了。

  計算認知,從∏感知到認知是抽象,從認知到感知是理論。我們專家說認知計算只有一種算法,我們計算機裏做算法做的很多,我認為人腦沒有多種計算,只有一個計算方法——相似計算,所有的計算都是相似計算。所以我在另外一個會議上講到聚類是大數據的認知拓撲。實際上我們做的就是相似計算,無論是排序算法還是廣告位置四退位算法,只不過在不同力度上做的算法。

第三個要素叫交互認知,不是簡單的張三負責張三李四負責李四,他們之間要交換,不同的交◣換他們有不同的現象。我記得十幾年前講一個報告,我在講不同的異構頻率沒有人同步指揮情況下怎麽同步,這是神經網絡裏的交互。當然我個人◥認為交互認知的二重性,除了腦認知的另外一個重要特點是腦通過感知系外部世界交互,這是另外一種交互。用這種觀點來看馮·諾伊曼計算機的局限性,他把計算※分成兩大部分:計算和存儲。如果我們能找到一個基本的單元又能夠既計算又交互又存儲,這就叫新進計算機。


駕駛腦的研究進展▓

  有了三個奠基【,我們就做機◥器駕駛,機器識別。我個人認為腦認知的形式化也許一↘開始就糾結腦的微功能、微結構大腦內各種連接關系的復雜組織,不必一開始就糾結高並發、大流量、大數據信息編碼以及腦精細組織跨區域的關聯,我認為要懂得忽略和聚焦,懂得抽象和分離。我看一個圖想出別的事情你知道嗎,這是經常發生的。忽略腦認知對人體內分泌系統,對軀體〓神經系統、對心肺機能、對自身生存相關行為的控制和調節等。我的駕駛要註意力集中。如果一個機器人不代表主人的行為性格好像不太好↘,全世界一@個德行實在太單調,所以我認為要自學習。強調了機器駕駛選↓擇性註意,只關註安全駕駛這個特定註意。那你這樣把它做到一個板卡上,能做嗎?我知道頻分多址等技術體現了並行通信的機理。如果微電子器件和裝置的反應表現為納秒級◇串行,人的感知和認知的反應表現為亞秒並行,可先利用微電子技術生產轉用芯片和板卡,在一個知道微秒的合適尺度級並行,模擬人腦的記憶認知、計算認〗知和交互認知,體現出三位一體應該是可行的,同時尋找新的替代物,如憶阻器,回憶計算機的發生。

  從人的視聽覺感知切入研究腦認知,尤其是模擬人腦中的記憶智能、計算智能和交互智能@ ,用機器模擬人腦對安全駕駛的自學習和駕駛技能積累能力,尤其重要的是駕駛腦並不模擬在駕駛過程中與安全駕駛無關的駕駛員的其他認知活動,如機器駕駛腦對路邊美女、對周邊¤車輛品牌得的認知,都不會有任何興趣。一定要註意力選擇,沒有註意力選擇就會有事情發生。精細動作△技能是人的認知和行為反復執行和學習的特定能力表現,對於熟練技工、手術師、舞者、司機、雜技因緣、魔術師、體操運動員等,他的小腦一定有過人之處。我們認為大腦小腦既有協同也有分工,用我的口語說大腦出智能小腦出技能,大腦出戰略,小腦出戰術。因此我們︼看看,駕駛員開車開到小學旁的操場的時候,我們看小孩並沒有在大腦中建立模型。它實際上本能甚至是個技能,所以司機開車如同自己左路一樣,你左路↑需要大腦和小腦思考嗎?本能是生下來⌒就有的,開車是後來的。所以我們就形成新的本■能,開車作為本能。這句話很重要,我們做了形式化分工,把駕駛協調性技術和相關的小腦自動化,駕駛腦承擔駕駛這個特定問題域視覺聽覺認知、註意、記憶、思維決策、交互等任務。在長期的智能駕駛試驗活動中我們將控制模塊歸於智能車的動力學試驗,嘗到了甜頭,你不懂得Ψ 腦認知,不懂得微積分,那怎麽行為如果把腦認知分為長期記憶、工作記憶、性格、冬季、學習和市委、瞬間行為,我們不斷的認@知、感知、行動,再知再感知。動態感知,態勢分析,自主側,精準控制,在線執行。這三個啟動,感覺記憶,工作記憶和長期記憶。因此我們中國形成駕駛車的傳≡感圖,一個是雷達,包括機關雷達,毫米波雷達,我們做各種攝像頭,再加上我ぷ們有看錄音裏面的汽車本身自帶的↘技術,再加上導航數據,以及我們地圖數據,這四大◥傳感器,你說我們把它放到哪個領☆域中?我們看這是不同的態勢圖。這一塊是感知。而人的頭腦包括哪個動作好找,哪個動作不好找,我們有記憶。比如說路口記憶,駕駛困境記【憶,駕駛顯型記憶,我們有路口記憶,其他的記憶。也就是說我們把我們腦功能跟地圖對接,同時定位和映射,這樣子形成當前工作區的實況,根據最近這一端剛剛發生過去的駕駛態勢圖,根據這個態勢圖來形成決策,為了避免不同的傳感器采樣不同,我們就做駕駛態勢CT圖,不同◥的更換記憶信息,不同的保持長期〓意義。這就◥是功能記憶。感覺記憶交互。所以這樣一來就形成我們整個的自動駕駛的板卡一個機構功能圖。當時我找院長要圖要不到,我自己做了一個自動駕駛。

  大概就是三大→塊,一塊叫做感知,一塊叫做認知,尤其最重要的就是長期記憶,工作記憶,動作記憶,思維,小腦,這些動作形成了縱向和橫向的記憶不同的感知、認知、行動,再感知、再認知』再行動。我們把這個形成50萬的知識產權。它還是】在感覺記憶裏和工作記憶和長期記憶如何發展的問題。

  你看前面這一塊我們把它叫偵查圖,前面叫感知理解,認知理解是工況理解,長期記憶是大腦中。不同↙的時間我們有不同的重復區域去跟它進行關聯分析。好比說正確理解和感知理解和認知理解,我們叫做態勢㊣分析。當然這是駕駛圖,如果你雲感々知,假如說我們放無人機,那就是放跟雲計算和人工智能結合,我的這個車水平和張三和李四的兩個水平相當,但是我沒有辦法代表人類,只能ω代表幾個人的駕駛情況,或者駕駛超腦。我們利用微電子技術,采用GPU加CPU加FPGA加ASIC,這就是我們做的。2012年我們成功的設計了北京到天津高速公路全程的無人駕駛,無一次︽人工幹預,由中央電視臺全程報道,這是2012年報道的。這就是我們車,大家都知道我們從北京到天津,不知道我們用多少雷達,我們最高的雷達是四◢千雷達,這個相對來看比較好做。北京和天津的車道畫的◢清楚的很,所→以我們討了點巧。另外沒有人行橫♀道線。

  無人車人機交互,他累了就自己駕駛。這是我們2015年4月420日開展的上海汽車博覽課題組做的無□ 人駕駛轎車演示,18米繞撞,形成雷達導航,在這個導航當中速度越高駕駛水平越高,如果一個駕駛員從起點到重點它是13分鐘,我開了12分鐘,我就說我的水平比它差很多,就這麽簡單,這就叫測ξ試。你看有一個地方離錐形道很近,管道塊就形成彎道超車。這個車子□到整機場,你看美國車貴,70萬,老百姓買不起。所以我們現在基本上用時間發現。

  最近我們做了鄭ζ州無人駕駛客車演示,公共汽車,42公裏,他們工廠的員工,該停就停,該開就開,周邊其他︼的車還在開。這輛車是我們制造我們國內第一輛大車。你說大車和小車有什麽不同?差別大海了去了,你們快過大車嗎?大車和小車電通道和傳動方式不一樣,去委內瑞拉打了1200臺,習近平親自站臺。我們在今年在鄭州開,現♂在已經在做試驗了。


從機器駕駛談開去

  最後講一講從機器駕駛談開去,機器腦認知形式化的普適性。你剛才講的駕駛腦有普遍性嗎?如果有不同的特定問題,或者是不同的結構,你的腦駕駛形式化能夠◢可行嗎?我們做一個農業的苗圃¤栽培管理,苗圃栽培大概是這幾個環節,第一個墑情、氣候、病蟲害等環境感知,然後就是苗圃植物長勢分析★,然後就◥是灌溉施肥,殺蟲等自主決策。噴灑精準控制☆,在線執行。我們現∮在用雲計算,你手上加四個APP,你』在這裏開會就可以控制家裏。所以我覺得把駕駛問題又改成典型苗圃智能管理,這個圖卐是可以用的。我們就不開始做一個試驗,這是機器人在做花卉的批處理,於是我們把剛剛那個圖用不同的傳感器又形成這樣一張圖,形成苗圃的生長態勢圖,有工作記憶和長期記憶,什麽叫長期記憶?去年的今天你澆水怎麽澆的,前年你怎麽澆的,就這麽算。而且差別問題不大,所以那個圖好做。所以我們得到一張圖,我們現在在園〓博園,有◤一個花卉,各省的花卉在那裏,我們想在那裏搞一個智能交互系統,想把攝像頭用智能腦袋控制起來。所以看起來如々果我們把這個弄清楚了,好像這個還是可行。就是感知、認知、理解。這樣一來機器換人的時代就到來了,一個農場,多少農民工他們將來就修機器人。

  咱們再換一個問題,對於醫療問題而言,以認知障礙病人的治療為例,研發一個典型的癡呆病人語療機器人,老年癡呆很正常,因為腦子』不行,怎麽樣延緩他的癡呆,或者怎麽樣測試他的癡呆?假如說把癡呆分成十度,一個年輕人∏跟老人聊天一會兒就八度癡呆,三度癡呆。用一個語療機器人,看他怎麽反應,我根據他的長期工作經驗,也有我的決策。也變成我的機器人的發音。很多人都看他們的系統,叫問題回答系統,全是文字。我說你得有『聲音,聲音有語調,語調裏有情感,這才行。有文字有圖像有聲音最好,咱們搞個機器人,我有個觀點,中國搞機器人,不要搞人型機器人,中國人太多了,家裏機器人住不夠啊。機器寵物,代替生物寵物,這就完了,多好啊。所以我覺得市場很大↙。

  你們看看醫療機器人,我們又把這個圖弄上面,還可以做。我參加上海神經組和中國科學院自動化組國一個瑞療,他們要在商業雜誌上發表文●章,我說為什麽要在商業雜誌發表,但是商業雜誌也不●差,也不排斥。我說老百姓【要看到的是怎麽樣延緩我們▽的老年癡呆。我跟他們講一個故事,我的母親93歲去世,老年癡呆,他區分不出哪個人。但是他說一句話,你們都一樣。他還沒有完全癡呆。這個問題要研究。所以我認為腦科學家一定要跟人工智能科學家站在同一道戰線上來研究老年癡呆人,小孩,病人,這三個解決了。

  腦科學和人工智能交叉研究載體的建議,利用大數據模擬從正常認知到認知障礙。我們醫學有那麽多的老年癡呆人,把這些數據搜集起來,用我們的感覺記憶、工作記憶和長期記憶表現出來,反應它的動√態演化,就可以研發一個癡呆機器人,研發一個抑郁癥機器人,這多好。你找一個醫生他看不出來這個是癡呆機器人還是癡呆病人,這個機器人〗幹啥?第一用來診斷,第二是用機器人。利用大數據模擬從認知障礙到〖正常認知,老年癡呆機器人如何延緩癡呆?這是我們的長項。為什麽在商業雜☆誌發表文章,老百姓沒有獲得利益。再一個你發表文☉章要靠關系。

  如果人腦特定問題域的認知能力〖可以先局部地形式化,哪怕在微觀上不具有組織結構的相似形,所以我不主張人像的機器人,當千千萬萬的特定機器認知腦,逐步●形式化之後,通過移動互聯網、雲計算和大數據,是否可以倒逼並逼近一個人造生物腦嗎。你叫他講什麽他就講什麽,這不就是人造生物腦嗎。

凡悠久強大的學科,如生命科學和物理學,一定都是有個性的※學科,學科壁壘森嚴,存在生殖隔離現象,長期以來腦科學研究和人工智能研究猶如兩條平行線,沒有發生實質※性的交集,就是證明。然而一旦碳基生物研發出◥來,勢不可當。謝謝大家!

來源:中國學網


版權所有:大发棋牌官网登录     京ICP備14022516號-1
會員登錄
登錄
其他帳號登錄:
留言
回到頂部