繼大模型后,“具身智能”成為今年科技界的新熱點,被認(rèn)為是新一波人工智能(AI)浪潮中的重點方向,。眾多初創(chuàng)公司涌現(xiàn),、融資屢創(chuàng)新高、技術(shù)不斷突破……人形機(jī)器人作為該領(lǐng)域最具代表性的實體,,正在大模型催化下加速產(chǎn)業(yè)化落地,。
如果將大模型視為“有趣的靈魂”,“具身智能”賦能的人形機(jī)器人則有了“好看的皮囊”,,已在多個領(lǐng)域成為人類的有力助手,。
重新定義機(jī)器人
作為連接虛擬空間和現(xiàn)實空間的橋梁,“具身智能”是指將AI融入機(jī)器人等物理實體,,賦予它們像人一樣感知,、學(xué)習(xí)和與環(huán)境動態(tài)交互的能力。
“具身智能”一詞本身具有濃厚的技術(shù)哲學(xué)色彩,。1945年,,法國哲學(xué)家莫里斯·梅洛-蓬蒂提出“具身性”概念,認(rèn)為人類需通過身體與周圍環(huán)境進(jìn)行互動和感知,,進(jìn)而理解世界,。1950年,被稱為“AI之父”的英國計算機(jī)科學(xué)家圖靈在論文《計算機(jī)器與智能》中首次提出“具身智能”這一概念,。
事實上,,智能化水平相對較低的工業(yè)機(jī)器人(機(jī)械臂)早已在制造業(yè)廣泛應(yīng)用,帶來質(zhì)效提升,。但傳統(tǒng)工業(yè)機(jī)器人是“固定程序+機(jī)械臂”的組合,,而“具身智能”賦能的機(jī)器人則是“多模態(tài)感知+大腦決策”的迭代。
清華大學(xué)交叉信息研究院助理教授許華哲認(rèn)為,,未來機(jī)器人將呈現(xiàn)多姿多彩的形態(tài):雙足,、四足、輪式,,機(jī)械狗,、智能無人機(jī)甚至機(jī)械小蜜蜂,,但人形機(jī)器人對人類社會適配性最佳,將成為最能夠幫助人類的機(jī)器人,。
人形機(jī)器人可解決生產(chǎn)線“最后一公里”的問題,。很多個性化、定制化的產(chǎn)品無法靠流水線統(tǒng)一組裝,,這就需要具有泛化能力的人形機(jī)器人來“幫忙”,,把批量生產(chǎn)的零部件按客戶的定制需求組裝成產(chǎn)品。在家庭服務(wù),、公共服務(wù)等更復(fù)雜多變的場景中,,人形機(jī)器人也更具優(yōu)勢,可適應(yīng)不同的環(huán)境和需求完成多種任務(wù),。
三大難點待突破
人形機(jī)器人研發(fā)始于對人類的學(xué)習(xí)與模仿,,其研發(fā)難點也可以比照人類的大腦、小腦和本體來理解,?!按竽X”主要是機(jī)器人負(fù)責(zé)自主學(xué)習(xí)、規(guī)劃和決策的中樞,;“小腦”負(fù)責(zé)運(yùn)動控制,,包括從行走到跑跳,以及從簡單抓取到復(fù)雜的手部動作等,;而“本體”部分則包括軀干四肢結(jié)構(gòu)和靈巧手設(shè)計,。
優(yōu)必選科技副總裁、研究院院長焦繼超告訴記者,,目前這三大領(lǐng)域都有較多技術(shù)難點有待突破:“大腦”方面,,云邊端一體計算架構(gòu)、多模態(tài)感知與環(huán)境建模等是近年技術(shù)焦點,,“仿人最大難點在于對人腦的模仿,,現(xiàn)有科學(xué)理論對人腦的研究遠(yuǎn)遠(yuǎn)不足”;“小腦”方面,,人機(jī)交互能力,、復(fù)雜地形通過、全身協(xié)同精細(xì)作業(yè)等是重要方向,;“本體”方面,,剛?cè)狁詈戏律鷤鲃訖C(jī)構(gòu)、高緊湊機(jī)器人四肢結(jié)構(gòu)與靈巧手設(shè)計等關(guān)鍵技術(shù),,是人形機(jī)器人靈活運(yùn)動所需的重要硬件基礎(chǔ),。
大模型的出現(xiàn)讓機(jī)器人“大腦”顯著“進(jìn)化”,大大提升了機(jī)器人的通用性和泛化性,,有望降低人形機(jī)器人開發(fā)成本,,加速其走入千家萬戶,。
據(jù)優(yōu)理奇機(jī)器人科技公司創(chuàng)始人兼首席執(zhí)行官楊豐瑜介紹,現(xiàn)在業(yè)界主要使用預(yù)訓(xùn)練大模型對機(jī)器人進(jìn)行預(yù)訓(xùn)練,,讓其具備更強(qiáng)學(xué)習(xí)能力,;大模型可將特定任務(wù)的學(xué)習(xí)遷移到機(jī)器人任務(wù)上,提高其適應(yīng)能力,;另外還可利用大模型的多模態(tài)處理能力,,結(jié)合視覺、聽覺,、觸覺等各種輸入,,提升機(jī)器人對復(fù)雜場景的理解。
中國起跑不落后
環(huán)顧全球,,人形機(jī)器人已進(jìn)入產(chǎn)業(yè)化落地初期階段,,在工業(yè)制造、商用服務(wù)和家庭陪伴領(lǐng)域開始“試水”,。無論是技術(shù)突破、落地進(jìn)展還是融資規(guī)模,,人形機(jī)器人研發(fā)競賽基本以中美為主導(dǎo),。
優(yōu)必選人形機(jī)器人Walker今年聚焦汽車、消費(fèi)電子等制造業(yè)重點領(lǐng)域,,已進(jìn)入多家車廠實訓(xùn),;宇樹科技的機(jī)器人實現(xiàn)了完全仿人的自然行走;優(yōu)理奇機(jī)器人正在醞釀“進(jìn)家”計劃,;波士頓動力的新版Atlas機(jī)器人實現(xiàn)了在工廠中不同儲物柜之間靈活搬動零件,;特斯拉人形機(jī)器人“擎天柱”計劃2025年開始量產(chǎn)……
焦繼超說:“如果把人形機(jī)器人行業(yè)比喻成一場馬拉松,中國和歐美國家,,目前幾乎都處在前面1000米的起跑階段,。”
楊豐瑜持同樣觀點,,大模型研發(fā)能力,、感知技術(shù)的領(lǐng)先使美國企業(yè)在機(jī)器人決策系統(tǒng)和復(fù)雜任務(wù)處理方面具有更強(qiáng)競爭力。而中國的優(yōu)勢更多體現(xiàn)在工業(yè)機(jī)器人領(lǐng)域,,特別是在制造業(yè)中的應(yīng)用較為成熟,。在人形機(jī)器人技術(shù)專利方面,中國也已走在前列,。
雖然機(jī)器人“大腦”的核心算法和高端芯片仍存在挑戰(zhàn),,但中國機(jī)器人行業(yè)擁有豐富的應(yīng)用場景和龐大的潛在用戶人口,數(shù)據(jù)是最大競爭優(yōu)勢之一,。
如何在真實世界場景中采集大量數(shù)據(jù),,并將數(shù)據(jù)統(tǒng)籌流通和供給人形機(jī)器人行業(yè)是關(guān)鍵,。許華哲介紹說,真實世界的數(shù)據(jù)一般都靠各家機(jī)器人公司自己采集,。北京人形機(jī)器人創(chuàng)新中心有限公司正計劃打造一個開源數(shù)據(jù)集供學(xué)界和業(yè)界使用,。未來,高質(zhì)量的共享數(shù)據(jù)集將大大助力行業(yè)發(fā)展,。