半月談記者 郭方達
“具身智能”被認為是人工智能競爭的重要領(lǐng)域。2025年的政府工作報告提出,建立未來產(chǎn)業(yè)投入增長機制,培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)。行業(yè)數(shù)據(jù)顯示,2024年全球人形機器人新品發(fā)布數(shù)量已超過106款,遠超過去20年的總和,與之相伴的“具身智能”概念成為全世界追捧的熱點。谷歌、特斯拉等一眾國際知名企業(yè)紛紛布局該賽道,波士頓動力、宇樹科技等新興企業(yè)的產(chǎn)品更是吸睛無數(shù)。
作為拓展人類能力邊界的“外骨骼”,具身智能的技術(shù)裂變究竟還有多遠?
人形,不止于人形
“許多人第一次對具身智能有直觀印象,就是看見春晚舞臺上轉(zhuǎn)手絹的機器人。”天津大學無人駕駛汽車交叉研究中心主任謝輝表示,人形機器人是該領(lǐng)域最具“顯示度”的產(chǎn)品,可通過類似人類的身體結(jié)構(gòu),執(zhí)行許多傳統(tǒng)任務。
事實上,任何能夠在物理空間中進行互動的機器人,都有望成為具身智能的載體,具身智能機器人的關(guān)鍵在于具身智能的底層技術(shù),而非機器人的物理形狀。“人形機器人是對于當前物理環(huán)境的友好解決方案之一,但不會是針對所有場景的最優(yōu)方案,比如組裝一輛汽車,人形機器人的效率就很難比機械臂高。”天津新松機器人自動化有限公司總經(jīng)理高松表示,在工廠等結(jié)構(gòu)化場景中,具身智能有很多外形不一的載體。
具身智能依托軟件算法和物理載體,能夠感知環(huán)境、做出決策并執(zhí)行具體的任務。清華大學人工智能學院教授沈陽說,具身智能作為一種軟硬件一體的特殊智能體,依賴的是多模態(tài)模型。“比如VLA大模型,V的視覺,L的語言,A的動作,形成一套感知決策行動的完整流程。”短期內(nèi),車輛很有可能成為具身智能最先投入大規(guī)模應用的領(lǐng)域。“通過傳感器進行視覺識別,大模型與用戶交互,最后落實在對汽車的機械操控上。”謝輝說。
從市場來看,全世界都對具身智能領(lǐng)域顯示出濃厚興趣。國際知名投資機構(gòu)高盛預測,2035年人形機器人全球市場規(guī)模將高達380億美元。我國北京、浙江、廣東等多省市已經(jīng)相繼出臺具身智能發(fā)展規(guī)劃,力圖打造領(lǐng)先的產(chǎn)業(yè)聚集區(qū)。工業(yè)和信息化部印發(fā)的《人形機器人創(chuàng)新發(fā)展指導意見》,提出到2027年產(chǎn)業(yè)綜合實力達到世界先進水平、成為重要的經(jīng)濟增長新引擎等發(fā)展目標。
2025年3月21日,北京,中關(guān)村國際創(chuàng)新中心,入口咨詢臺在布置的具身智能機器人
具身智能“成人禮”尚未到來
——通用平臺和標準化認證缺乏,多數(shù)企業(yè)陷入“重復造輪子”。國訊芯微(蘇州)科技有限公司首席技術(shù)官蔣琛表示,目前在具身智能領(lǐng)域,仍舊沒有統(tǒng)一的技術(shù)標準和通用開發(fā)平臺,這就使得多數(shù)企業(yè)都要從0到1獨立研發(fā),各地重復投入導致資源分散,影響產(chǎn)出效率。同時,硬件接口、通信協(xié)議、數(shù)據(jù)格式等缺乏統(tǒng)一規(guī)范,不同廠商的機器人本體構(gòu)型與軟件架構(gòu)互不兼容,制約規(guī)模化應用。
——應用場景開放度不足,缺乏快速孵化條件。“機器人最終還是要用起來。”天津朗譽機器人有限公司董事長任志勇表示,研發(fā)端的企業(yè)和應用行業(yè)尚未打通,許多實際工況都未能真正納入研發(fā)測試體系中,許多產(chǎn)品仍停留在“溫室花朵”的階段。高松認為,具身智能要真正走入生活,還需要在眾多非結(jié)構(gòu)化場景中積累數(shù)據(jù),與ChatGPT等依賴文本數(shù)據(jù)的大模型不同,具身智能需采集真實物理環(huán)境的動態(tài)交互數(shù)據(jù),其采集成本更為高昂。
——核心元器件自主化程度不足,復合型人才缺口擴大。北京大學智能學院副院長林宙辰坦言,在高端GPU、精密傳感器、減速機等領(lǐng)域,我國企業(yè)的自主化程度依舊有待提高,對本土創(chuàng)新型人才的需求也隨之增加。“又要懂編程,又要懂大模型,現(xiàn)在還要懂機械和自動化,這樣的人才太少太少。”謝輝表示,伴隨著多領(lǐng)域的交叉融合,行業(yè)的人才要求從雙棲走向三棲,未來的門檻還將進一步提高。
——法律道德風險仍是未解之題。謝輝舉例說,如果一臺被植入了惡意程序的智能車輛接入網(wǎng)絡(luò)中,可以生成并發(fā)送虛假的緊急消息,誤導周圍車輛的行駛路線、行車速度和前進方向等,從而制造交通擁堵與混亂,極端情況下甚至可以主動制造交通事故。對于這類智能機器可能造成損失的情況,責任歸屬邊界依舊模糊,開發(fā)者、運營者等主體責任幾何?這道“前置題”尚沒有答案。
產(chǎn)業(yè)競速先機何在
加強底層建設(shè),構(gòu)建龍頭引領(lǐng)共建的行業(yè)生態(tài)。蔣琛等人建議,加強具身智能領(lǐng)域的開放平臺建設(shè),在底層代碼、數(shù)據(jù)集等環(huán)節(jié)建立開源共享行業(yè)機制。主管部門宜組織龍頭企業(yè),鼓勵開發(fā)從硬件到軟件、從底層到應用層、從AI模型底座到3D數(shù)據(jù)集的通用開發(fā)套件。盡快制定國家級具身智能發(fā)展規(guī)劃,加快標準建設(shè),創(chuàng)建生態(tài)認證體系,推動技術(shù)加速迭代。
促進應用場景開放,提供高質(zhì)量的現(xiàn)實數(shù)據(jù)。任志勇等人認為,具身數(shù)據(jù)無法從互聯(lián)網(wǎng)海量內(nèi)容中直接獲取,而需通過真實的機器人操作來采集或高級仿真平臺生成,因此需要較高的采集成本和廣泛的應用場景支持。建議在柔性生產(chǎn)、醫(yī)療康養(yǎng)、公共安全、應急救援等領(lǐng)域開放政府、國企主導的應用場景,為廣大企業(yè)提供測試平臺。
強化高校、科研院所、企業(yè)的聯(lián)合科研能力,為技術(shù)創(chuàng)新提供支撐。謝輝認為,高校要打破學科專業(yè)壁壘,對現(xiàn)有學科專業(yè)體系進行調(diào)整升級,重視跨學科課程建設(shè)和人才培養(yǎng)項目,如推出“人工智能+X”雙學位項目等,打破傳統(tǒng)學科專業(yè)界限,培養(yǎng)一批適宜人工智能領(lǐng)域的復合型人才。
加速建設(shè)前置治理體系,完善法律等安全防線。業(yè)內(nèi)人士認為,構(gòu)建責任明晰的治理框架,是具身智能安全投用的重要保障。一方面應在隱私數(shù)據(jù)保護、責任歸屬等方面進行充分論證并出臺相關(guān)法律法規(guī),避免監(jiān)管真空;另一方面則應建立人工智能領(lǐng)域的預警及應急熔斷機制,盡可能將風險及影響降至最低。
編輯:尤立