繼AIGC及大模型后 被英偉達(dá)帶火的“具身智能”能否推動(dòng)AI新浪潮?
2023-05-24 16:52:20    華夏時(shí)報(bào)

近日,“具身智能”刷屏網(wǎng)絡(luò)。

在ITF World 2023半導(dǎo)體大會(huì)上,“算力霸主”英偉達(dá)創(chuàng)始人兼首席執(zhí)行官黃仁勛表示,人工智能的下一個(gè)浪潮將是具身智能(embodied AI),即能理解、推理、并與物理世界互動(dòng)的智能系統(tǒng)。同時(shí),他也公布了NvidiaVIMA,這是一個(gè)多模態(tài)具身人工智能系統(tǒng),能夠在視覺文本提示的指導(dǎo)下執(zhí)行復(fù)雜的任務(wù)。


(相關(guān)資料圖)

“具身智能的發(fā)展對(duì)人工智能和機(jī)器人等行業(yè)將產(chǎn)生重大影響,它將推動(dòng)機(jī)器人技術(shù)向更智能、靈活和自主的方向發(fā)展。同時(shí),具身智能的發(fā)展也將提供更多的交互方式,使人與機(jī)器之間的交流更加自然和高效。”全聯(lián)并購公會(huì)信用管理委員會(huì)專家安光勇對(duì)《華夏時(shí)報(bào)》記者表示。

備受關(guān)注后,“具身智能能否成為下一個(gè)人工智能浪潮”引發(fā)市場(chǎng)討論。對(duì)此,受訪專家表示,目前具身智能的發(fā)展仍處于初級(jí)階段,或成AI發(fā)展的下一個(gè)浪潮,但有待時(shí)間觀察。

那么,它與AIGC/AI大模型相比如何?“具身智能使用了與GPT同一個(gè)流派的相似的技術(shù)來構(gòu)建機(jī)器人大腦,以便于讓機(jī)器人具備說話認(rèn)字作圖等等的交流能力。”深度科技研究院院長(zhǎng)張孝榮對(duì)本報(bào)記者表示。

中國民協(xié)元宇宙工委副會(huì)長(zhǎng)兼創(chuàng)會(huì)秘書長(zhǎng)吳高斌則在接受《華夏時(shí)報(bào)》記者采訪時(shí)指出,具身智能具有更高的智能水平,與AIGC/AI大模型最大的差異在于其能夠與物理世界互動(dòng)。

然而,具身智能的發(fā)展也存在一些阻力。天使投資人、資深人工智能專家郭濤對(duì)本報(bào)記者指出,具身智能(EI)技術(shù)還處于早期的孵化階段,存在關(guān)鍵核心技術(shù)不成熟、制造成本較高、應(yīng)用場(chǎng)景落地難、相關(guān)法律法規(guī)和標(biāo)準(zhǔn)體系不健全等突出問題,距離大規(guī)模商業(yè)化落地應(yīng)用還有很長(zhǎng)一段距離。

能否成為下一個(gè)AI浪潮?

在德州當(dāng)?shù)貢r(shí)間5月16日的特斯拉股東大會(huì)上,其CEO馬斯克再度表示,特斯拉正在開發(fā)的人形機(jī)器人“擎天柱”(Optimus),馬斯克稱,“未來每個(gè)人都會(huì)擁有一個(gè)人形機(jī)器人,這個(gè)市場(chǎng)將會(huì)超過電動(dòng)車的需求。”

同時(shí),國內(nèi)也對(duì)具身智能予以關(guān)注。北京市日前發(fā)布《北京市促進(jìn)通用人工智能創(chuàng)新發(fā)展的若干措施(2023—2025年)(征求意見稿)》,其中提出探索具身智能、通用智能體和類腦智能等通用人工智能新路徑,包括推動(dòng)具身智能系統(tǒng)研究及應(yīng)用,突破機(jī)器人在開放環(huán)境、泛化場(chǎng)景、連續(xù)任務(wù)等復(fù)雜條件下的感知、認(rèn)知、決策技術(shù)。

“具身智能”備受關(guān)注后,“具身智能是什么”“具身智能能否成為下一個(gè)人工智能浪潮?”引發(fā)市場(chǎng)討論。

吳高斌表示,具身智能是指能夠理解、推理、并與物理世界互動(dòng)的智能系統(tǒng)。與傳統(tǒng)的AI系統(tǒng)相比,具身智能更加注重對(duì)于環(huán)境的感知和理解,能夠更好地適應(yīng)復(fù)雜、不確定的環(huán)境,具有更高的智能水平。

在張孝榮看來,具身智能是AI研究中的一個(gè)新興領(lǐng)域,屬于行為主義流派和聯(lián)結(jié)主義流派的一個(gè)交叉地帶,即把近年來大火的聯(lián)結(jié)主義流派中的神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)技術(shù)引入到行為主義流派的仿生機(jī)器人中,使機(jī)器人不光具有運(yùn)動(dòng)功能,還具有一定的大腦思維功能。

同時(shí),不少受訪專家均表示,具身智能的研究目前剛剛萌芽。

“目前,具身智能的發(fā)展仍處于初期階段,但它已經(jīng)引起了廣泛的關(guān)注和研究,許多創(chuàng)新公司和研究機(jī)構(gòu)都在積極探索這個(gè)領(lǐng)域?!卑补庥卤硎?。

郭濤表示,隨著人工智能、交互技術(shù)、新材料、機(jī)器人學(xué)等相關(guān)技術(shù)的高速發(fā)展及日趨成熟,機(jī)器將具備良好的環(huán)境交互感知能力、推理和判斷能力,并模擬人類做出決策和行動(dòng),未來具備自主決策和行動(dòng)能力的機(jī)器智能的具身智能將成為人工智能重要的發(fā)展方向之一。

同時(shí),上海社會(huì)科學(xué)院經(jīng)濟(jì)學(xué)博士王瀅波對(duì)本報(bào)記者表示,具體的技術(shù)發(fā)展方向是難以預(yù)測(cè)的,但是整體智能化的大方向是可以確定的,只是時(shí)間早晚問題。

但張孝榮也指出,關(guān)于具身智能的研究目前剛剛萌芽,未來能否成為一個(gè)浪潮需要時(shí)間觀察。

與AIGC/AI大模型相比如何?

然而,AIGC、AI大模型發(fā)展方興未艾,具身智能又突然興起,它與此前大火的AIGC、AI大模型相比有何差異?

“具身智能技術(shù)是技術(shù)大融合的綜合系統(tǒng),涉及人工智能、人機(jī)交互、新材料、機(jī)器人學(xué)等多個(gè)領(lǐng)域,技術(shù)負(fù)責(zé)程度遠(yuǎn)超AIGC(人工智能生成內(nèi)容)和AI大模型;具身智能擁有自主決策和行動(dòng)能力,相對(duì)于AIGC和AI大模型來說應(yīng)用場(chǎng)景更加廣泛,在家務(wù)市場(chǎng)、商務(wù)市場(chǎng)及工業(yè)生產(chǎn)市場(chǎng)應(yīng)用場(chǎng)景眾多?!惫鶟硎尽?/p>

安光勇表示,具身智能與基于大規(guī)模數(shù)據(jù)訓(xùn)練的語言模型(如AIGC或GPT)在技術(shù)和應(yīng)用方面存在明顯差異。AIGC和GPT等模型是基于自然語言處理(NLP)技術(shù)的,主要用于處理和生成文本,它們?cè)诶斫庹Z言、回答問題和生成文本方面表現(xiàn)出色;而具身智能則更加注重感知、推理和互動(dòng)能力,它需要結(jié)合傳感器、機(jī)器視覺、運(yùn)動(dòng)控制等技術(shù),能夠感知物理世界并進(jìn)行交互操作。

“具身智能使用了與GPT同一個(gè)流派的相似的技術(shù)來構(gòu)建機(jī)器人大腦,以便于讓機(jī)器人具備說話認(rèn)字作圖等等的交流能力?!睆埿s指出。

在吳高斌看來,在技術(shù)、應(yīng)用等方面,具身智能與AIGC或GPT相比,最大的差異在于其能夠與物理世界互動(dòng),具有更高的智能水平。這意味著,具身智能可以應(yīng)用于更廣泛的領(lǐng)域,如機(jī)器人、智能家居、智能交通等。同時(shí),具身智能的應(yīng)用也更加實(shí)用,可以更好地服務(wù)于人類社會(huì)。

有何阻力?

“目前,具身智能的發(fā)展還處于初級(jí)階段,尚未達(dá)到大規(guī)模應(yīng)用的水平。但是,一些相關(guān)技術(shù)已經(jīng)開始落地,如機(jī)器人、智能家居等領(lǐng)域。隨著技術(shù)的不斷進(jìn)步,具身智能的應(yīng)用將會(huì)越來越廣泛,對(duì)于人工智能、機(jī)器人等行業(yè)格局也將產(chǎn)生深遠(yuǎn)的影響?!眳歉弑蟊硎?。

然而,具身智能的發(fā)展也存在一些阻力。郭濤指出,具身智能技術(shù)還處于早期的孵化階段,存在關(guān)鍵核心技術(shù)不成熟、制造成本較高、應(yīng)用場(chǎng)景落地難、相關(guān)法律法規(guī)和標(biāo)準(zhǔn)體系不健全等突出問題,距離大規(guī)模商業(yè)化落地應(yīng)用還有很長(zhǎng)一段距離。

就技術(shù)難題,張孝榮指出,“首先,具身智能需要龐大的算力,其次是如何解決能量問題,‘大腦’增加了機(jī)器人的能耗,供電續(xù)航將會(huì)是個(gè)大問題。”

就法律風(fēng)險(xiǎn)方面,海華永泰律師事務(wù)所高級(jí)合伙人孫宇昊對(duì)《華夏時(shí)報(bào)》記者表示,具身智能可能會(huì)引起個(gè)人數(shù)據(jù)泄露、產(chǎn)品安全責(zé)任歸屬、著作權(quán)歸屬與知識(shí)產(chǎn)權(quán)侵權(quán)等風(fēng)險(xiǎn)。

他表示,具身智能設(shè)備可能具有收集、儲(chǔ)存和處理個(gè)人信息(如面部識(shí)別、語音識(shí)別等)的能力,這可能導(dǎo)致個(gè)人隱私數(shù)據(jù)等被泄露,給用戶帶來法律風(fēng)險(xiǎn);同時(shí),其設(shè)備在操作過程中可能發(fā)生意外事故,例如對(duì)人造成傷害和對(duì)財(cái)物造成損失等。則應(yīng)當(dāng)明確具身AI的責(zé)任歸屬,可能涉及制造商、開發(fā)者、用戶等多方的法律責(zé)任;此外,著作權(quán)歸屬與知識(shí)產(chǎn)權(quán)侵權(quán)。具身智能設(shè)備可能會(huì)自動(dòng)創(chuàng)作作品,則涉及著作權(quán)歸屬的問題。當(dāng)然,設(shè)備在執(zhí)行任務(wù)時(shí)可能會(huì)侵犯他人的專利、商標(biāo)、版權(quán)等知識(shí)產(chǎn)權(quán)。

(文章來源:華夏時(shí)報(bào))

關(guān)鍵詞: