人民網
人民網>>教育

從扭秧歌到跳梅花樁

——新型學習框架讓人形機器人在復雜地形上“如履平地”

2025年02月25日08:30 | 來源:科技日報
小字號

原標題:從扭秧歌到跳梅花樁

繼在春晚“扭秧歌”后,來自宇樹科技的人形機器人G1再次進化。

近日,上海AI實驗室、上海交通大學、浙江大學、香港大學、香港中文大學聯合發布“BeamDojo強化學習框架”。根據官方解釋,其“用於實現人形機器人在稀疏立足點上的敏捷運動”。也就是說,有它加持,G1人形機器人在“難有立錐之地”的復雜地形上也能如履平地,連走平衡木、跳梅花樁都不在話下。

公開演示畫面中,G1能穩定穿過多個約20厘米寬、面積狹小、間距不一的踏腳石。不僅可以正向行走,G1還能倒著走,甚至在背負6千克重物、面臨外力干擾的情況下,依然能夠順利完成挑戰。

以往的機器人研究中,克服復雜地形問題一直是主要技術挑戰之一。通過引入新的學習框架,BeamDojo框架優化了機器人在動態環境中的運動控制,使G1即便在不規則的地形上,也能展現出不俗的平衡力和靈活性。

BeamDojo框架的創新之處就在於其獨特的兩階段強化學習訓練策略。第一階段讓機器人在平地進行訓練,通過輸入地形參數,讓算法在安全環境中預學習﹔第二階段切換至實際任務地形中,進行策略微調。針對人形機器人多邊形腳掌的特點,研究團隊還設計了基於採樣的落腳點獎勵機制,結合“雙評價器”架構,有效提升機器人的地形感知與適應能力。

值得注意的是,該框架還可以實現零樣本泛化。機器人的泛化能力是指機器人在面對新的、未見過的任務、環境或條件時,能夠應用其學到的知識和技能來成功完成任務的能力。這種能力對於機器人的實用性和靈活性至關重要,因為它使得機器人能夠在不斷變化的環境中有效工作。盡管G1在訓練過程中並未接觸過稀疏地形與平衡木,但基於這一框架,它能對各類稀疏落腳點地形做到零樣本泛化。

為了實現真實世界的部署,BeamDojo框架還搭載了基於激光雷達的高程地圖系統,結合模擬訓練中的域隨機化技術,使機器人能夠實時感知並適應復雜地形。

最終,在這一框架下,G1即便在未經訓練的稀疏地形上,也能以80%的成功率穩健行走。研究團隊表示,他們的目標是突破人形機器人在非傳統行走表面上的限制,新一代機器人有望在人機協作、救援等領域展現更為廣泛的應用可能性。

目前,宇樹科技已全面自研電機、減速器、控制器、激光雷達等機器人關鍵核心零部件和高性能感知及運動控制算法,並整合機器人全產業鏈。

宇樹科技CEO王興興日前表示,AI驅動下的機器人技術每天都在快速進步,大大加速了技術的發展。他預計,2025年AI人形機器人將達到一個新的量級。如果順利的話,到明年或后年,AI人形機器人可以在一些基礎服務業或工業應用中推廣開來,但家用機器人的推廣進度可能會稍微慢一點,因其對安全性、技術成熟度的要求更高。整體而言,隨著技術的不斷成熟與成本的逐步降低,人形機器人走進千家萬戶的腳步會越來越快。(記者 崔 爽)

(責編:郝孟佳、孫競)

分享讓更多人看到

推薦閱讀
返回頂部