目前的機(jī)器人已經(jīng)能夠勝任、重復(fù)性的工作,但很多時(shí)候,它還不能夠靈活地為新任務(wù)進(jìn)行自我調(diào)整,也不能應(yīng)付一個(gè)不熟悉的或不確定的情景。不過(guò),這些情況都在發(fā)生改變,機(jī)器人正在變得更加智能。我們不禁要問(wèn),讓機(jī)器人實(shí)現(xiàn)智能的關(guān)鍵技術(shù)到底是什么?這些技術(shù)在近十年會(huì)發(fā)展到什么程度?整個(gè)產(chǎn)業(yè)的應(yīng)用前景將會(huì)如何?
隨著家用機(jī)器人的應(yīng)用需求不斷增加,人工智能相關(guān)技術(shù)不斷進(jìn)步,硬件性能的增長(zhǎng),服務(wù)機(jī)器人近年來(lái)開(kāi)始從實(shí)驗(yàn)室走向家庭,并從掃地機(jī)器人等單一功能向多功能的個(gè)人機(jī)器人發(fā)展。
感知、認(rèn)知和行為控制
機(jī)器人的技術(shù)按照通常的理解分為三個(gè)部分,感知、認(rèn)知和行為控制。感知主要是基于視覺(jué),聽(tīng)覺(jué)及各種傳感器的信息處理;認(rèn)知部分則負(fù)責(zé)更高層的語(yǔ)義處理,如推理,規(guī)劃,記憶,學(xué)習(xí)等;行為控制部分專(zhuān)門(mén)對(duì)機(jī)器人的行為進(jìn)行控制。
提到機(jī)器人,一個(gè)近經(jīng)常提及的詞是人工智能。人工智能是用計(jì)算機(jī)來(lái)實(shí)現(xiàn)類(lèi)似于人的智能行為的一門(mén)學(xué)科。機(jī)器人本身即是人工智能的一個(gè)應(yīng)用目標(biāo)之一。所以談到機(jī)器人,人們很容易聯(lián)想到人工智能。人工智能的確對(duì)于機(jī)器人非常重要,上面提到的三個(gè)部分的技術(shù)都與人工智能相關(guān)。
從應(yīng)用角度看,機(jī)器人由于有一定的自主性,能與人和環(huán)境交互,與之前的計(jì)算設(shè)備(包括電腦,手機(jī)等)相比,對(duì)智能的要求較高,這也是人工智能逐漸受到關(guān)注的一個(gè)原因。
傳統(tǒng)的人工智能做為一門(mén)學(xué)科,起源于20世紀(jì)50年代的達(dá)特茅斯會(huì)議,后來(lái)經(jīng)過(guò)幾次大起大落,在基礎(chǔ)理論和方法上積累了豐富的成果。從早期的符號(hào)計(jì)算系統(tǒng),到專(zhuān)家系統(tǒng),再到90年代發(fā)展起來(lái)的機(jī)器學(xué)習(xí),大數(shù)據(jù)分析,都可以算是人工智能的范疇。在圖像、語(yǔ)音、搜索、數(shù)據(jù)挖掘、社會(huì)計(jì)算等領(lǐng)域,又派生出了一些相關(guān)的應(yīng)用研究。其中與機(jī)器人聯(lián)系較為緊密的包括計(jì)算機(jī)視覺(jué),語(yǔ)音和自然語(yǔ)言處理,還有智能體(agent)等。
從技術(shù)上看,人工智能要達(dá)到人類(lèi)級(jí)別的智能,要走的路還非常遠(yuǎn),因?yàn)槟壳皩?duì)人的智能機(jī)理尚未研究清楚。但從實(shí)用角度看,根據(jù)目前技術(shù)的進(jìn)展,如果能夠部分模擬人的智能行為(比如認(rèn)出主人并進(jìn)行相應(yīng)的交互)并達(dá)到較好的用戶體驗(yàn),將會(huì)在短期內(nèi)取得突破性進(jìn)展。當(dāng)然這在技術(shù)研發(fā)上還需進(jìn)一步解決技術(shù)的實(shí)用性、魯棒性問(wèn)題。畢竟以往的不少機(jī)器人都還在實(shí)驗(yàn)室或者受限的環(huán)境中(比如養(yǎng)老院)進(jìn)行研發(fā)和測(cè)試,而新興的家庭服務(wù)機(jī)器人,將在家庭環(huán)境中獨(dú)立或者半獨(dú)立地(通過(guò)與人的協(xié)作)完成某些服務(wù),這對(duì)技術(shù)的魯棒性提出了更高要求。其中的一些,如計(jì)算機(jī)視覺(jué)、語(yǔ)音識(shí)別等核心技術(shù)還在不斷地改進(jìn)中,還沒(méi)有發(fā)展到完全成熟。所有這些,都決定了需相當(dāng)深入的研發(fā)工作,才能實(shí)現(xiàn)真正的實(shí)用化、智能化的家庭服務(wù)機(jī)器人系統(tǒng)。
機(jī)器人不是一堆機(jī)械和芯片
在以往對(duì)服務(wù)機(jī)器人的研究中,一個(gè)典型的目標(biāo)應(yīng)用是機(jī)器人可以做家務(wù)勞動(dòng),這就要求機(jī)器人可以用手臂去操作物體(抓放)。在這些方面的研究雖然較多,但從目前的技術(shù)進(jìn)展看,在幾年內(nèi)實(shí)現(xiàn)機(jī)器人做家務(wù)勞動(dòng),仍有諸多的挑戰(zhàn)。
1、目前的機(jī)器人,尤其是人形機(jī)器人的成本過(guò)高。舉例說(shuō),一條機(jī)器人的手臂可能需幾萬(wàn)美元,而機(jī)器人的手部就需要1萬(wàn)多美元,整個(gè)機(jī)器人的造價(jià),更是普通家庭無(wú)法承受的。
2、機(jī)械手的靈巧程度,仍然難以和人手相媲美。
3、在安全性方面也存在需要解決的問(wèn)題。有著鋼鐵之軀的機(jī)器人一旦進(jìn)入家庭,由于程序錯(cuò)誤,不小心揮揮手、伸伸胳膊,都可能對(duì)血肉之軀的人造成巨大傷害。
機(jī)器人如果暫時(shí)不能做家務(wù)勞動(dòng)那又有何用,這是不少人關(guān)心的一個(gè)問(wèn)題。如果不能應(yīng)用,機(jī)器人不過(guò)是一堆機(jī)械和芯片而已。目前除了類(lèi)似掃地機(jī)器人這樣能夠?qū)崿F(xiàn)比較單一功能的機(jī)器人外,還有不少機(jī)器人的用途正在發(fā)展之中。
機(jī)器人作為一個(gè)新型智能設(shè)備,普通用戶關(guān)心的是機(jī)器人可以為他們做些什么?如前文所述,機(jī)器人目前還難以實(shí)現(xiàn)類(lèi)似做家務(wù)這樣的應(yīng)用。而要達(dá)到人的智力水平,也還需要較長(zhǎng)的發(fā)展時(shí)間。所以在應(yīng)用方面也需要針對(duì)人工智能技術(shù),特別是感知認(rèn)知技術(shù)的現(xiàn)狀進(jìn)行設(shè)計(jì),要充分利用新技術(shù),實(shí)現(xiàn)在過(guò)去看來(lái)不可能實(shí)現(xiàn)的功能。預(yù)計(jì)未來(lái)十年,市場(chǎng)上出現(xiàn)的服務(wù)機(jī)器人將具有以下特點(diǎn)。
1、機(jī)器人將實(shí)現(xiàn)低成本。在前文中提到,如果讓服務(wù)機(jī)器人進(jìn)入專(zhuān)業(yè)或家庭服務(wù)領(lǐng)域,成本需足夠低。專(zhuān)業(yè)服務(wù)機(jī)器人的成本可以相對(duì)高些,而家庭服機(jī)器人則需嚴(yán)格控制成本。
2、機(jī)器人將擁有多功能特點(diǎn)。目前在家庭中使用的服務(wù)機(jī)器人主要是掃地機(jī)器人這樣能夠?qū)崿F(xiàn)單一功能的機(jī)器人。未來(lái)多功能的機(jī)器人將有較大的發(fā)展,出于成本考慮,機(jī)器人中的某些處理器將可以用于多種應(yīng)用。同時(shí)隨著技術(shù)的發(fā)展,機(jī)器人的應(yīng)用將越來(lái)越多,機(jī)器人將可以像人一樣完成不同的任務(wù)。
3、具有獨(dú)特的應(yīng)用。這是用戶購(gòu)買(mǎi)使用服務(wù)機(jī)器人的主要?jiǎng)訖C(jī),這些應(yīng)用不是簡(jiǎn)單移植已有的電腦或手機(jī)的應(yīng)用,而是具有獨(dú)特的機(jī)器人應(yīng)用的特點(diǎn),如自主性,操控類(lèi)似于人并能夠與人進(jìn)行互動(dòng)等。
4、可與人協(xié)作完成任務(wù)。因?yàn)闄C(jī)器人是為人服務(wù)的,所以需要與人進(jìn)行多方面的互動(dòng),以了解主人對(duì)服務(wù)的需求。另一方面是受制于機(jī)器人的智能和人相比還是有很大差距,所以有些任務(wù)還不能獨(dú)立完成,需借助于人的幫助才能完成。
5、機(jī)器人將有高安全性特點(diǎn)。這包含信息安全和物理安全兩方面。即不給用戶帶來(lái)安全隱患,甚至能主動(dòng)檢測(cè)并制止一些有潛在安全威脅的行為。的阿西莫夫三大定律,規(guī)定了基本的機(jī)器人安全規(guī)則。當(dāng)然如何具體實(shí)現(xiàn)這些安全性,尤其是物理安全,還需要在機(jī)器人硬件和軟件上下功夫。
家庭服務(wù)機(jī)器人和專(zhuān)業(yè)服務(wù)機(jī)器人的未來(lái)將會(huì)如何發(fā)展,已成為業(yè)界關(guān)心的話題。
家庭服務(wù)機(jī)器人將會(huì)實(shí)現(xiàn)如下幾類(lèi)較典型的應(yīng)用。
1、家庭服務(wù)機(jī)器人將實(shí)現(xiàn)各種助手類(lèi)的應(yīng)用。智能手機(jī)上流行的個(gè)人助理軟件(siri,cortana等),將從虛擬的無(wú)形演變?yōu)橛形锢硗庑蔚臋C(jī)器人能夠?qū)崿F(xiàn)的功能??梢栽O(shè)想,機(jī)器人助手可以幫用戶查詢一些如:天氣,限行尾號(hào)等信息,或?qū)τ脩暨M(jìn)行提醒。聽(tīng)上去好像與手機(jī)上的體驗(yàn)并無(wú)區(qū)別,但實(shí)際上在體驗(yàn)上已有不少改變。用戶和機(jī)器人互動(dòng)的時(shí)候可用更自然的方式,像和人交流一樣,甚至可以看到機(jī)器人的表情,使服務(wù)顯得更加個(gè)性化。除了這些應(yīng)用,服務(wù)機(jī)器人還可在更多的場(chǎng)景中作為人的助手。比如服務(wù)機(jī)器人可以作為人的健身助手,當(dāng)人在健身的時(shí)候,機(jī)器人可像健身教練一樣提供一些建議。相信此類(lèi)應(yīng)用隨著技術(shù)的發(fā)展,將會(huì)越來(lái)越豐富。
2、家庭服務(wù)機(jī)器人將助力少兒教育。因?yàn)榉?wù)機(jī)器人具有自主性和移動(dòng)性,將會(huì)為少兒教育帶來(lái)無(wú)限的可能和更廣泛的應(yīng)用空間。
3、家庭服務(wù)機(jī)器人將可實(shí)現(xiàn)老人看護(hù)。包括中國(guó)在內(nèi)的許多,正在或?qū)⒁饺肜淆g化社會(huì)。中國(guó)的老人一般希望居家養(yǎng)老,而子女又忙于工作,即使住在一起也無(wú)法一直在身邊照看老人。諸如提醒老人吃藥或緊急情況時(shí)及時(shí)救助等,如果能由家庭服務(wù)機(jī)器人來(lái)完成,將大大提高老人居家養(yǎng)老的生活質(zhì)量,也使得子女更放心。老人看護(hù)將是未來(lái)機(jī)器人的一個(gè)應(yīng)用熱點(diǎn),具有*的社會(huì)價(jià)值。機(jī)器人能完成的事還有很多,除了與健康輔助直接相關(guān)的功能,還可幫助老人讀書(shū)讀報(bào),與老人簡(jiǎn)單聊天等,進(jìn)行情感方面的關(guān)懷。
對(duì)于專(zhuān)業(yè)服務(wù)機(jī)器人,其應(yīng)用根據(jù)專(zhuān)業(yè)應(yīng)用領(lǐng)域的不同,而有較大區(qū)分。
1、在物流中心進(jìn)行貨物分發(fā)。據(jù)悉,這項(xiàng)應(yīng)用已開(kāi)始在亞馬遜等公司實(shí)際使用。未來(lái)將不斷地升級(jí),如能夠自動(dòng)取貨等。
2、在零售店,柜臺(tái),前臺(tái)等處為客戶服務(wù)。這些服務(wù)機(jī)器人能夠和客人打招呼,并回答一些基本問(wèn)題,還可以幫客戶提包,端茶送水,并為客戶指路。
3、機(jī)器人攝影師。機(jī)器人攝影師可以不知疲倦地穿梭于賓客之間,幫人們拍出高質(zhì)量的照片。當(dāng)然此功能在家庭服務(wù)機(jī)器人上,同樣是個(gè)新鮮的功能。
4、智能安防機(jī)器人。在一些警力不足的地方,如果有智能安防機(jī)器人24小時(shí)巡邏,則會(huì)有很好的震懾力,減少犯罪的發(fā)生。
關(guān)鍵技術(shù)與挑戰(zhàn)
可以預(yù)見(jiàn),未來(lái)服務(wù)機(jī)器人有不少有趣的應(yīng)用,但從技術(shù)實(shí)現(xiàn)的角度看還存在諸多挑戰(zhàn)。
前面提到過(guò)機(jī)器人的三大技術(shù)領(lǐng)域,包括感知、認(rèn)知和行為控制。其中行為控制技術(shù)相對(duì)來(lái)說(shuō),已經(jīng)有不少技術(shù)積累。而對(duì)于在不久的將來(lái)可以實(shí)際大規(guī)模應(yīng)用的服務(wù)機(jī)器人,將會(huì)更偏向于發(fā)展低成本的機(jī)器人。諸如機(jī)械結(jié)構(gòu)比較簡(jiǎn)單的輪式機(jī)器人(只有輪式移動(dòng)平臺(tái)加上一個(gè)可活動(dòng)的頭,一般沒(méi)有手臂或者手臂比較簡(jiǎn)單),由于其控制部分較為簡(jiǎn)單,因此在感知和認(rèn)知方面的技術(shù),顯得尤為重要。根據(jù)以往機(jī)器人領(lǐng)域的研究進(jìn)展和對(duì)應(yīng)用的初步分析可以認(rèn)為如下的感知、認(rèn)知技術(shù),將是實(shí)現(xiàn)應(yīng)用的關(guān)鍵。
1、三維導(dǎo)航定位技術(shù)。不管什么機(jī)器人,只要可移動(dòng),即需要在家庭或其他環(huán)境中進(jìn)行導(dǎo)航定位。其中slam(simultaneous localization and mapping)技術(shù)可同時(shí)進(jìn)行定位和建圖,在學(xué)術(shù)研究方面已經(jīng)有不少技術(shù)積累。但對(duì)于實(shí)際系統(tǒng),由于實(shí)時(shí)性低成本(比如無(wú)法采用比較昂貴的雷達(dá)設(shè)備)的要求和家庭環(huán)境的動(dòng)態(tài)變化(物品的擺放),因而對(duì)導(dǎo)航定位技術(shù)提出了更高要求,仍需進(jìn)一步研發(fā)。
2、視覺(jué)感知技術(shù)。其中包含人臉識(shí)別、手勢(shì)識(shí)別、物體識(shí)別和情緒識(shí)別等相關(guān)技術(shù)。視覺(jué)感知技術(shù),是機(jī)器人和人交互的一個(gè)非常重要的技術(shù)。
3、語(yǔ)言交互技術(shù)。其中包含語(yǔ)音識(shí)別、語(yǔ)音生成、自然語(yǔ)言理解和智能對(duì)話系統(tǒng)等。
4、文字識(shí)別技術(shù)。生活中有不少文字信息,如書(shū)報(bào)和物體的標(biāo)簽信息,這也要求機(jī)器人能夠通過(guò)攝像頭來(lái)進(jìn)行文字識(shí)別。與傳統(tǒng)的掃描后識(shí)別文字相比,其可通過(guò)攝像頭來(lái)進(jìn)行文字的識(shí)別。
5、認(rèn)知技術(shù)。機(jī)器人需要逐步實(shí)現(xiàn)規(guī)劃、推理、記憶、學(xué)習(xí)和預(yù)測(cè)等認(rèn)知功能,從而變得更加智能。
從目前的研究現(xiàn)狀看,服務(wù)機(jī)器人面對(duì)的關(guān)鍵技術(shù)均有了長(zhǎng)足進(jìn)步,但還有相當(dāng)多的問(wèn)題要解決。
推動(dòng)技術(shù)的研發(fā)與實(shí)際應(yīng)用結(jié)合
英特爾中國(guó)研究院的一個(gè)重要研究方向是服務(wù)機(jī)器人,研究范圍主要包括魯棒的三維導(dǎo)航定位、人和環(huán)境的視覺(jué)感知以及人-機(jī)器人交互(包含感知、認(rèn)知、行為控制的結(jié)合)等領(lǐng)域,致力于為英特爾的合作伙伴提供*的服務(wù)機(jī)器人技術(shù)。
研究方法以特定的目標(biāo)應(yīng)用領(lǐng)域?yàn)槌霭l(fā)點(diǎn),并以此來(lái)推動(dòng)技術(shù)的研發(fā)和在實(shí)際應(yīng)用中的測(cè)試。前面提到的助手類(lèi)應(yīng)用、少兒教育應(yīng)用、老人看護(hù)應(yīng)用,是研究重點(diǎn)。
為了進(jìn)行應(yīng)用測(cè)試,英特爾中國(guó)研究院建立了實(shí)際的機(jī)器人硬件原型。左邊是其內(nèi)部結(jié)構(gòu),由一個(gè)帶有英特爾realsense攝像頭的電腦來(lái)控制一個(gè)全向移動(dòng)底盤(pán)和頭部的轉(zhuǎn)動(dòng),其高度可調(diào),以便適應(yīng)成人與兒童的互動(dòng)要求。
目前研究院已經(jīng)在視覺(jué)感知等領(lǐng)域取得了階段性成果。顯示了利用realsense攝像頭和slam技術(shù)生成家庭環(huán)境地圖,這在后續(xù)就可用來(lái)定位導(dǎo)航。研究院還開(kāi)發(fā)了魯棒的跟蹤技術(shù),可在多人同時(shí)出現(xiàn)的情況下,長(zhǎng)時(shí)間正確地跟蹤一個(gè)特定用戶。在未來(lái)還會(huì)研發(fā)出更多相關(guān)技術(shù)和應(yīng)用,這些技術(shù)也將服務(wù)于業(yè)界的合作伙伴助力開(kāi)發(fā)出*的服務(wù)機(jī)器人產(chǎn)品。
對(duì)于機(jī)器人技術(shù),大家關(guān)心的一個(gè)問(wèn)題是,是否需要采用*的人工智能芯片。
目前探索的一個(gè)方向被稱(chēng)作混血計(jì)算(hybrid computing),其是指用通用處理器和其他架構(gòu)一起合作來(lái)進(jìn)行計(jì)算。不過(guò),還處于早期探索的階段。
一個(gè)架構(gòu)是否能成功地應(yīng)用于服務(wù)機(jī)器人,需要看性能是否滿足應(yīng)用的需求,功耗等是否合適,這是一個(gè)考慮多種因素平衡的選擇。
可以說(shuō)現(xiàn)在的通用處理器與已有的一些其他計(jì)算單元(如向量處理單元、gpu),已經(jīng)可以為服務(wù)機(jī)器人提供一個(gè)理想的硬件架構(gòu),尤其是多功能的具有感知、認(rèn)知功能的服務(wù)機(jī)器人。目前機(jī)器人主要的瓶頸,還是在應(yīng)用需求的開(kāi)發(fā)和感知、認(rèn)知技術(shù)上。當(dāng)然,未來(lái)的架構(gòu),也會(huì)隨著對(duì)應(yīng)用的深入開(kāi)發(fā)而不斷創(chuàng)新。硬件設(shè)計(jì)面臨的挑戰(zhàn)越來(lái)越大,需要不斷地適應(yīng)未來(lái)發(fā)展的演變。同時(shí)也可以考慮用fpga架構(gòu)來(lái)為一些比較專(zhuān)門(mén)的應(yīng)用提供加速,這樣在應(yīng)用發(fā)生變化的時(shí)候,將具有更多的靈活性。
(原標(biāo)題:人工智能關(guān)鍵技術(shù)決定機(jī)器人產(chǎn)業(yè)前途)