記者3月12日從北京人形機器人創(chuàng)新中心(國家地方共建具身智能機器人創(chuàng)新中心)獲悉,,該創(chuàng)新中心當天正式推出“一腦多能”“一腦多機”的通用具身智能平臺“慧思開物”。據(jù)介紹,,“慧思開物”是對“基于單一場景單一任務(wù)做專項開發(fā)”這一傳統(tǒng)機器人應(yīng)用開發(fā)模式的顛覆,,填補了具身智能領(lǐng)域在通用軟件系統(tǒng)方面的空白,推動智能機器人從單一任務(wù)執(zhí)行向復雜環(huán)境下的自主決策與執(zhí)行能力躍升,。
整體來看,,具身智能在“智能化”方面仍處于初級階段,。該創(chuàng)新中心總經(jīng)理熊友軍表示,行業(yè)亟需一個具備多本體兼容性,、多場景適應(yīng)性和強大泛化能力的通用智能平臺,。
據(jù)介紹,作為支持各類機器人與物理世界交互的開放平臺,,“慧思開物”由AI大模型驅(qū)動的任務(wù)規(guī)劃具身“大腦”以及數(shù)據(jù)驅(qū)動的端到端技能執(zhí)行具身“小腦”構(gòu)成,。
其中,具身“大腦”具備自然交互,、空間感知,、意圖理解、分層規(guī)劃和錯誤反思等能力,,具身“小腦”分為具身操作和具身運控兩個子平臺:具身操作涵蓋元技能庫,、泛化抓取、技能拆解和錯誤處理等功能,,具身運控則負責實現(xiàn)全身控制、雙臂協(xié)作,、穩(wěn)定行走和移動導航等任務(wù),。在執(zhí)行任務(wù)過程中,由具身“大腦”進行任務(wù)規(guī)劃,,再調(diào)用具身“小腦”技能庫執(zhí)行具體動作,,并將執(zhí)行反饋傳遞給具身“大腦”,形成任務(wù)閉環(huán),。
此外,,“慧思開物”能夠?qū)崿F(xiàn)從任務(wù)理解到執(zhí)行的全流程智能化,具備處理多場景復雜任務(wù)的泛化能力,,實現(xiàn)了單個軟件系統(tǒng)在機械臂,、輪式機器人、人形機器人等多構(gòu)型本體上的兼容,,能夠適應(yīng)多樣化的應(yīng)用場景和任務(wù),。
例如,在人形機器人積木搭建任務(wù)這一場景中,,記者看到,,工作人員與人形機器人“天工”閑聊的過程中隨機搭建了一個積木樣例,隨后“天工”利用視覺大模型(VLM)對樣例進行拆解,,精確規(guī)劃每一層的搭建順序,,準確拾取相應(yīng)積木,并按次序完成了3層積木的毫米級精準搭建,?!斑@一過程實現(xiàn)了基于視覺空間思維鏈的復雜任務(wù)智能化拆解與執(zhí)行,以及強大的擬人交互能力和執(zhí)行精度,展現(xiàn)了具身智能在教育娛樂,、精密制造等領(lǐng)域的應(yīng)用潛力,。”工作人員介紹,。
該創(chuàng)新中心首席技術(shù)官唐劍說,,作為機器人中樞神經(jīng)系統(tǒng),“慧思開物”集成感知,、決策,、語言、學習及運動控制等高級認知功能,,并且通過低代碼方式降低機器人開發(fā)門檻,,簡化開發(fā)流程。
值得關(guān)注的是,,強大的感知,、決策與執(zhí)行能力離不開高質(zhì)量具身智能數(shù)據(jù)的支撐。據(jù)介紹,,“慧思開物”依托創(chuàng)新中心構(gòu)建的具身智能數(shù)據(jù)全鏈路解決方案,,以及行業(yè)標準化通用具身智能數(shù)據(jù)集和Benchmark RoboMIND,實現(xiàn)了對多模態(tài)數(shù)據(jù)的高效利用與精準學習,。
其中,,作為經(jīng)由多類視覺語言動作(VLA)及端到端模型充分驗證的跨本體標準化大規(guī)模數(shù)據(jù)集,RoboMIND覆蓋工業(yè),、家庭,、辦公等多場景任務(wù),具備高度的通用性和可擴展性,。未來,,隨著數(shù)據(jù)生態(tài)的持續(xù)完善,“慧思開物”將進一步突破技術(shù)邊界,,推動具身智能技術(shù)在更多高難度場景中的規(guī)?;涞嘏c應(yīng)用。