毫秒級精准復刻人類動作——
人形機器人有了“通用小腦”
222
訂閱已訂閱已收藏
收藏點擊播報本文,約
酒店裡,機器人為你送外賣,隨叫隨到﹔馬路上,機器人和馬拉鬆運動員一起跑步,有模有樣﹔舞台上,機器人跟隨音樂一起跳舞,動作流暢……如今,機器人越來越多地走進大眾生活。但當前大部分機器人做動作都要靠程序員提前編好程序,如何能讓人形機器人真正實現“人在干啥,它就做啥”的功能?
近日,西湖大學王東林教授團隊發布了搭載全球首個通用動作預訓練大模型(GAE)身外化身系統的人形機器人泰坦o1——它能隨時、隨地、隨性模仿人類的各種動作,打破地域和距離的限制。
這套通用動作預訓練大模型可理解為團隊給機器人安裝了一個“通用小腦”——大腦管思維,小腦管動作。
人形機器人泰坦o1,是西湖大學人工智能和機器人領域的第一個優質成果轉化落地項目。
那麼,這個機器人,究竟有啥不一樣?
會動,但做不到“隨心而動”
人形機器人的外觀和人類相仿,能走路、拿東西……但你總覺得現有的人形機器人還是不像人類——動作生硬、依賴“套路”,一遇到沒練過的場景就出錯。
王東林是西湖大學機器智能實驗室負責人,一直在和人形機器人“過招”。“現在的機器人做動作,基本靠程序員提前編好程序,就像咱們背課文一樣,一字不差才能做好。”比如,“彎腰拿杯子”是一套程序,“抬手拿筆”是另一套。要是讓它做個沒編過的動作,比如“邊走路邊擦桌子”,它就會卡殼。這是傳統機器人最大的技術瓶頸:沒有通用的動作模型,無法舉一反三。王東林介紹。
更麻煩的是,絕大多數機器人的手腳“各管各的”——下半身走路和上半身操作的系統是分開的。人類走路時伸手接東西,不假思索﹔但機器人做起來,顧此失彼。
反應慢也是硬傷。機器人靠大模型先理解指令再生成動作,要花好幾秒鐘“琢磨”,跟不上真實節奏。地面有點斜坡、濕滑,它更容易踉蹌。
說白了,現在的機器人“會動”,但做不到“隨心而動”。
像照鏡子一樣,毫秒不差
人形機器人泰坦o1項目的辦公地,距離西湖大學雲谷校區不遠。一出電梯,記者看到一台銀黑相間、帶橙色裝飾的機器人在佔地近半層樓的試驗場地裡“鍛煉”——這就是泰坦o1。
不遠處,站著一位穿緊身黑色動捕服的工作人員。隻見他舒展雙臂,快速轉身,再蹲下身。旁邊的泰坦o1,就像照鏡子一樣,毫秒之間就復刻了所有動作:手臂角度、身體傾斜、膝蓋彎曲,甚至手指的細微顫動,都一模一樣。
工作人員故意踉蹌了一下,身體往左邊傾斜。泰坦o1瞬間跟上,左腿跨出一步穩住身體,右臂反向擺動,穩穩找回平衡,跟人類調整平衡的樣子如出一轍。
緊接著,工作人員做起廣播體操,擴胸、體轉、彎腰。泰坦o1全程同步,動作標准,連節拍都原樣復刻。“所有這些動作,並非事前編排好的程序,都是工作人員的隨性而為。任何人穿上動捕服隨意動作,機器人都能跟上,成為他的‘影子’。”王東林說。
泰坦o1的另一項強大功能是:它不僅能當“影子”,還能當千裡之外的“替身”。讓你無論走到天涯海角,只要有網絡,穿上動捕服,就能指揮機器人遠程辦事。你甚至可以一個人同時遙控幾十台機器人,讓它們做一樣的動作。
“最棒的是,這台機器人拿來就能用。你不需要懂技術、學編程,甚至不用提前訓練。穿上動捕服或打開電腦后台,你想讓它做什麼,它就做什麼。”王東林說。
“通用小腦”怎樣煉成
為什麼泰坦o1能做到這些?因為它有一顆其他人形機器人沒有的“通用小腦”:通用動作預訓練大模型。
在人體中,小腦負責協調運動、維持平衡。GAE就是人形機器人的“通用小腦”,能讓機器人在收到信號后瞬間做出最合適的動作。這套原創算法由西湖大學團隊完全自主研發,比國際上其他團隊的同類技術領先至少6個月。
“ChatGPT讓AI能理解並生成語言,Seedance能生成視頻畫面,而GAE讓機器人模仿和執行各種人類動作,是機器人領域第一個實現動作泛化的大模型。”王東林介紹。
有了這顆“小腦”,機器人能手腳協同配合,不再“各管各的”﹔也不用提前編好所有程序,遇到沒做過的動作都能輕鬆應對。而且,這顆“小腦”還很通用,具備“跨本體”能力——不同結構、不同尺寸的機器人,都能加載這套大模型。
記者了解到,王東林團隊此前已在四足機器人、人形機器人領域深耕多年,積累了豐富的運動控制技術。同時,他們還擁有全球領先、國內最大的高質量全身運動數據集——包含人類各種日常動作、復雜動作的詳細數據。正是這些數據,為泰坦o1的“通用小腦”提供了充足的“學習素材”,讓它能精准模仿人類動作,實現毫秒級同步。
團隊介紹,研發泰坦o1的初衷,是讓機器人代替人類去做那些危險的工作——比如消防救援、礦區作業、高空維修,既能提高效率,也能保護人類安全。
(記者 晉浩天)
分享讓更多人看到
- 評論
- 關注


































第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量