今年的《政府工作報告》當中出現了很多的新名詞,其中,“具身智能”“智能機器人”這兩個較為相近的表述引發了諸多關注。一時間,大家都在問究竟什么是具身智能?什么是智能機器人?它們又與近年來爆火的人形機器人有什么區別?
雖然聽起來很前衛,但實際上具身智能并不是一個新概念。
1950年,人工智能之父、英國皇家學會院士艾倫·麥席森·圖靈就提出了智能與物理形態相結合的設想,然而,受限于技術條件,它在很長一段時間里并沒有取得實質性進展。直到近年來,隨著人工智能大模型技術的突破,具身智能才真正迎來了發展的契機。
那么,熱度暴漲的具身智能到底有多“能”?
具身智能到底是什么?
2024世界機器人大會上發布的《人形機器人十大趨勢展望》指出,具身智能是可以在高變化下做出迅猛、精準反應的高質量、高性能智能系統。它既不是單純的虛擬環境下的計算機仿真,也不是完全偏于物理空間的機電系統,與人形機器人系統緊密相關。
“具身智能應該是人工智能的一個分支,它主要是基于物理實體,能夠與物理世界進行感知和交互,以及有行動的一種智能系統。”國地共建具身智能機器人創新中心總經理熊友軍在中國電子學會組織召開的“貫徹落實全國兩會精神——推動具身智能和人形機器人創新發展座談會”上表示。簡言之,具身智能就是讓人工智能“擁有身體”。
熊友軍進一步解釋道,一方面,具身智能強調物理實體;另一方面,具身智能強調與物理世界能夠進行交互、感知,同時與物理世界發生一些行為。
“我覺得要構成一個完整的閉環,構成智能體跟物理世界有感知,有決策、思考和行動的閉環。”熊友軍認為,具身智能區別于離身智能和現在的普通智能。“現在的DeepSeek或者ChatGPT,這樣的智能就是離身智能,可能存在虛擬空間、數字空間、信息空間;而具身智能,一定要有物理的實體,F在的智能可能是‘動嘴皮子’,而具身智能真的是要實干的,是一個‘實干家’。”
對于智能機器人,熊友軍認為,其應該是具身智能的一種形式,它有物理的身體,能夠與物理世界構成感知、交互和思考行動的能力同時,智能機器人又區別于傳統的一些智能化的設備。“有些智能化設備沒有傳感器,完全靠程序驅動,環境變了,也不會根據環境的變化做出相應的響應,很少有思考和決策的過程,只是機械的執行,缺少跟物理世界交互、感知和思考的過程。像一般的智能化設備,可能還不屬于具身智能,而智能機器人應該是具身智能里面的一種形式。”熊友軍解釋道。
“人形機器人,除了長得像人,應該還有功能和思考行為,模擬人的一種機器人。在學術里面,我們覺得,它是具身智能的一種表現形式,也被稱為具身智能體的最佳載體。”熊友軍表示,具身智能有很多種表現形式。如輪式的,輪帶式的,復合型的機器人,機械臂類型的智能機器人也是具身智能的一種表現形式。因此,人形機器人只是智能機器人其中的一種而已。
針對具身智能、智能機器人與人形機器人三者之間的關系,全國政協常委、致公黨中央副主席、全國婦聯副主席、中國電子學會理事長徐曉蘭進一步指出,具身智能是未來產業的重要方向;智能機器人是具身智能的典型終端產品,涵蓋工業機器人、醫療機器人、服務機器人、農業機器人以及人形機器人等;人形機器人是智能機器人的高階形態,也是具身智能的最佳載體。人形機器人可廣泛應用于生產制造、倉儲物流、搶險救災、邊防安防、商業服務、家政醫療等場景,將有力帶動產業鏈上下游蓬勃發展,對推動科技創新與產業創新深度融合,培育瞪羚企業、獨角獸企業,搶占全球科技與產業發展制高點具有重要戰略意義。同時,人形機器人可在研發、生產、檢測、維修、保養等環節提供大量就業崗位,是拉動新消費、催生新產業、擴大新就業的強勁動能,是應對社會老齡化的重要抓手。
人工智能的最終形態嗎?
具身智能作為人工智能的一個分支,在其發展過程中,伴隨著“具身智能是人工智能最終形態”的一種說法。
對此,行業內看法不盡相同。
知名數字經濟學者、工信部信息通信經濟專家委員會委員盤和林在接受中國工業報記者采訪時表示,“結合智能體的具身智能可能是AI的終極形態,具身智能能過對環境進行感知,并基于感知獨立決策,給出解決方案然后執行。這樣的人工智能基本上模仿人類所有的動作,完成人類所有的工作。”
“具身智能強調智能行為與身體緊密關聯,身體是智能的載體,智能是身體的延伸,使得智能與身體高度統一,從而達到具有全面適應性、連續性、協作性等特點。這也是實現通用人工智能的重要路徑之一。”資深產業經濟觀察家梁振鵬在接受中國工業報記者采訪時也認為。
然而,在接受中國工業報記者采訪時,天使投資人、資深人工智能專家郭濤卻表達不同的看法。他認為,具身智能是實現通用人工智能的重要路徑之一,但它并非終極形態。AI的發展是一個不斷演進的過程,未來還可能出現新的技術和理念,具身智能只是在當前階段具有重要意義和發展潛力的一種形式。
科技商業博主、一篇網絡主編趙宏民在接受中國工業報記者采訪也不認同“具身智能是AI的終極形態”的說法。“因為人工智能還有許多其他的技術和概念也在不斷發展中,如量子計算、隱私計算等。”
行業內對具身智能與人工智能關系的不同看法,也映射出人們對人工智能正在不斷刷新認知。
近年來,似乎每過一段時間,“人工智能”的有關消息總能霸榜各類平臺的熱榜。郭濤認為,這是因為一方面,隨著科技的不斷發展和社會需求的變化,人們對人工智能的期望和要求不斷提高,促使研究者不斷探索新的方法和途徑;另一方面,不同時期對人工智能的研究重點和應用場景有所不同,一些新的概念和技術在特定歷史階段可能因條件限制而未得到充分發展,隨著技術的進步和環境的變化,這些概念又重新受到關注和應用。
盤和林則認為,“如具身智能中的一部分,已經從實驗室開始步入實踐應用場景,而具身智能一旦進入場景,他們學習人類的渠道就變多了,那么其發展速度會更快。人類社會也就真正進入了智能時代,而所有人都在期待或者擔憂這個智能時代的到來,所以,具身智能每一步向前如今都能引發大量關注。”
值得注意的是,盤和林表示,“大部分具身智能產品還在探索階段,我們不能保證說未來十年或者二十年會有大突破。當前,大多數具身智能的應用場景中都有替代品。比如,跨臺階是具身智能的一個功能,但如果是爬山,其實很多地方有索道,索道比具身智能運力更大也更經濟,同樣的,工業車間中,工業機器人也是具身智能的競爭對手。更多開放場景,由于具身智能成本過高,甚至不如雇人來得經濟。所以,具身智能最大的挑戰是商業化,而商業化最大的挑戰是成本。”
“開源”影響幾何?
3月19日,國家地方共建具身智能機器人創新中心預告,即將發布里程碑式的通用具身智能平臺——“格物”。值得關注,一周前,3月12日,北京人形機器人創新中心(國家地方共建具身智能機器人創新中心)才剛剛發布了全球首個“一腦多能”“一腦多機”的通用具身智能平臺“慧思開物”。記者在發布會現場了解到,這一平臺將為人形機器人配備“大腦”和“小腦”,能夠實現從任務理解到執行的全流程智能化,填補了具身智能領域在通用軟件系統方面的空白。
“自去年11月,我們啟動了開源計劃以來,在本體開源方面,很多的合作伙伴,基于天工硬件母平臺,在他們的應用場景里面做深度的垂直領域的二次開放,如優必選用天工平臺開發了‘天工行者’,用于科研和教育。”熊友軍介紹,另外,在數據集的開源方面,國家地方共建具身智能機器人創新中心發布了首個行業標準化的通用具身智能數據集,并首批開放了10萬條的數據。同時,在開源社區方面,通過開源協作的模式,吸引了幾千名開發者參與模型訓練的工作。
而更早些,1月21日,由國家地方共建人形機器人創新中心牽頭的全國首個異構人形機器人訓練場正式啟用。據國地共建人形機器人創新中心總經理許彬介紹,這個具身智能訓練場的核心目的是解決具身智能產業發展中的模型訓練的技術問題,進一步強化我國人形機器人研發和應用的基礎支撐,重點針對數據采集效率低、成本高、數據無法跨平臺復用以及缺乏統一的數據標準規范等挑戰。異構人形機器人訓練場將重點圍繞四個方向進行建設:一是構建可重構場景和訓練的基礎的具身智能模型;二是打造異構集群采訓推開源框架;三是搭建具身智能操作與任務調度系統;四是建設開源共享和共性機制,形成模型數據飛輪。
作為“國家隊”,在發展過程中,兩大創新中心均不約而同瞄準了“開源”。
在北京市社會科學院副研究員王鵬看來,大模型開源或打造開源開發平臺能重點解決一些技術問題。一是算法成熟度。開源大模型可以提供經過驗證的算法和模型,降低人形機器人研發中的算法開發難度和風險。二是數據獲取與處理。開源平臺可以共享數據資源和處理工具,幫助研發者更高效地獲取和處理數據,提高人形機器人的感知和認知能力。三是軟硬件解耦。開源開發平臺可以促進軟硬件的解耦,使得研發者可以更靈活地選擇和組合硬件和軟件組件,降低研發成本和提高研發效率。
“開源大模型可以應用于人形機器人的智能感知和交互系統,提高其環境感知、語音識別、自然語言處理等能力。開源平臺提供的算法和模型可以應用于人形機器人的決策和規劃系統,幫助其實現自主導航、路徑規劃、任務執行等功能。此外,開源大模型還可以支持人形機器人的持續學習和進化,使其能夠適應不斷變化的環境和任務需求。”王鵬對記者表示道。
“從目前人形機器人研發角度看,開源或打造開源開發平臺是解決技術問題的有效途徑之一。”梁振鵬則認為,開源平臺可以幫助開發者快速獲取最新的技術成果和工具,縮短研發周期,降低研發成本。同時,開源平臺也可以促進開發者之間的交流和合作,共同推動人形機器人技術的發展。通過開源平臺,開發者可以更容易地實現人形機器人的智能化和自主化,從而降低人形機器人研發的成本,并促進其商業化應用的發展。
郭濤表示,開源平臺可以提供更強大的語言理解和生成能力,幫助人形機器人更好地理解人類指令和進行自然語言交互;還可以為人形機器人的知識學習和推理提供支持,使其能夠更快地獲取和運用知識。
盤和林則認為,大模型開源開發平臺,在具身智能領域,其實是做一個生態。“你用具身智能搬運,我用具身智能生產,他用具身智能洗碗,中國制造業發達,相關機器人的硬件好找,但軟件開發,算法需要長期投入,而開源平臺降低了算法開拓成本。反過來,當你的生產,搬運,洗碗具身智能已經成功應用,那么,你為開源平臺做了共享,這些功能方案會整合回平臺當中。未來,我們可能收獲一個既會生產,也會搬運,還會洗碗的機器人。所以,好處在于,一方面節約具身智能部署成本,另一方面逐漸形成具身智能的生態。”
未來向何處發力?
“現在人形機器人這么火,有一個問題可能會給大家潑一盆冷水。”趙宏民在接受采訪時反問記者:“你猜,現在最先進的人形機器人,充滿電,能不間斷運行多長時間電池耗盡?”
“答案很可怕,根據不同產品不同運行強度,大概續航時長是30分鐘到2小時。從這個意義而言,除了一些臨時表演和一些緊急的救援任務。脫離了電線的那些人形機器人,應該還不具備大規模商業化的可能。”趙宏民表示。
具身智能除了商業化的問題外,熊友軍認為,具身智能領域還存在三類主要問題:
一是關于數據集,當前,各單位雖逐步開源數據集并建立收集平臺,但存在規模小、任務單一問題,導致機器人智能體訓練效率低、成本高。熊友軍建議,各創新中心打通數據壁壘,推動全國協作共享,構建規;柧氋Y源體系。
二是關于應用場景。我國具身智能產業起步較晚,熊友軍希望,工信部牽頭鼓勵企業試用并開放場景做測試。我們雖搭建了一些場景,但與真實場景有差距。具身智能在實驗室訓練后,還需在真實場景試練,目前,國家地方共建具身智能機器人創新中心在高壓、冷庫等危險場景做了測試,但與真實場景區別還比較大。
三是關于產業鏈。目前產業鏈還是沒有成體系,有一些上游產業鏈,核心關鍵的產業鏈,感覺有一些簡單的重復,造成資源浪費。而核心的產業鏈,做的人卻比較少。
“具身智能和人形機器人是將人工智能轉換為現實生產力的重要載體,是培育發展新質生產力的重要方向。”工信部科技司副司長杜廣達表示,下一步,工信部將深入貫徹落實黨中央、國務院決策部署,按照“一端抓供給,一端抓應用,整體壯生態”思路:一是繼續推動具身大模型、工具鏈等技術攻關突破。二是持續挖掘人形機器人高價值應用場景,促進供需對接。三是做強做優產業生態,加快推出一批關鍵急需標準,建設開源社區,打造整機、數據集等開源項目,提升安全可靠性測試能力和倫理治理水平,加強行業自律。
據麥肯錫預測,到2030年,全球具身智能市場規?赡苓_到數十萬億元。具身智能不僅蘊含著巨大經濟價值,更關乎國家競爭力。如今,具身智能被寫入《政府工作報告》,更是標志著它正式成為國家未來產業的重點發展方向。
可以預見,一個更加智能化的未來,正加速向我們走來。