我科研團隊在機器人空間智能領域取得新突破

2026-05-06 09:57:10: 來源：科技日報　作者：夏凡
分享到：

記者5日從浙江人形機器人創(chuàng)新中心獲悉，該中心聯(lián)合香港中文大學、浙江大學等團隊在機器人空間智能領域取得重要突破，提出名為RAM的三維空間理解與操作模型，為提升機器人在復雜長程任務中的操作可靠性提供了新的技術路徑。相關成果近日發(fā)表于國際學術期刊《科學·機器人》。

以視覺語言大模型為代表的人工智能（AI）技術，提升了機器人理解自然語言指令和分解復雜任務的能力。但從“聽懂指令”到“完成動作”之間，仍存在關鍵鴻溝：機器人需要在三維空間中理解物體的位置、朝向、尺度、可操作區(qū)域及相互關系，并將這些信息轉(zhuǎn)化為可執(zhí)行的運動約束?，F(xiàn)有大模型多依賴二維圖文數(shù)據(jù)訓練，缺乏直接的物理世界經(jīng)驗，在推理物體位姿和空間關系時易產(chǎn)生不符合物理規(guī)律的判斷。如何讓模型獲得可驗證、可遷移的三維空間知識，并將高層語義規(guī)劃與底層物理執(zhí)行連接起來，是具身智能和機器人操作領域的重要課題。

“針對這一挑戰(zhàn)，我們提出了RAM模型，其借鑒檢索增強生成的思想，為大模型配備可查詢的外部三維知識庫。機器人執(zhí)行任務時，模型可以按需檢索物體類別、幾何屬性、功能平面、抓取點等信息，從而彌補視覺語言模型自身三維空間理解不足的問題?！眻F隊成員、浙江人形機器人創(chuàng)新中心首席技術官許學成介紹。

研究團隊還專門構(gòu)建了面向機器人操作場景的空間理解問答評測集，結(jié)果顯示，在該評測集覆蓋的多類空間推理任務中，RAM模型的整體表現(xiàn)優(yōu)于多種代表性視覺語言大模型。除核心任務外，RAM展現(xiàn)出一定通用性與擴展性。

“人形機器人走向真實應用場景，不僅需要硬件本體、靈巧手和運動控制能力，也需要理解三維環(huán)境、判斷物理約束并規(guī)劃可執(zhí)行動作的算法能力?！痹S學成介紹，該研究讓機器人不僅能“聽懂人話”，還能“精準動手”，即通過給大模型配備一套結(jié)構(gòu)化的幾何知識庫，打通了從語義推理到精確操作的“最后一公里”。

據(jù)悉，浙江人形機器人創(chuàng)新中心由寧波市政府與浙江大學團隊聯(lián)合共建，成立于2023年12月。目前，該中心已形成軟硬件深度融合，覆蓋多行業(yè)、多場景的產(chǎn)品矩陣，正助力寧波打造以人形機器人為引領的全國具身智能創(chuàng)新高地。

編輯：韓夢晨

相關閱讀：

版權與免責聲明:
①凡本站注明稿件來源為：中國高新技術產(chǎn)業(yè)導報、中國高新網(wǎng)、中高新傳媒的所有文字、圖片和音視頻稿件，版權均屬本網(wǎng)所有，任何媒體、網(wǎng)站或個人未經(jīng)本網(wǎng)協(xié)議授權不得轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他方式復制發(fā)表。已經(jīng)本網(wǎng)授權使用作品的，被授權人應在授權范圍內(nèi)使用，并注明“來源：中國高新網(wǎng)、中高新傳媒或者中國高新技術產(chǎn)業(yè)導報”。違反上述聲明者，本網(wǎng)將追究其相關法律責任。
② 任何單位或個人認為本網(wǎng)站或本網(wǎng)站鏈接內(nèi)容可能涉嫌侵犯其合法權益，應該及時向本網(wǎng)站書面反饋，并提供身份證明，權屬證明及詳細侵權情況證明，本網(wǎng)站在收到上述文件后，將會盡快移除被控侵權的內(nèi)容或鏈接。
③如因作品內(nèi)容、版權和其他問題需要與本網(wǎng)聯(lián)系的，請在該事由發(fā)生之日起30日內(nèi)進行。電話：010-68667266 電子郵件：zhangj#stdaily.com　(請將“#”換為“@”)

听风微电影在线观看完整版|嫩草影院在线播放|不良教育电影未删减完整版|老司机亚洲精品,性生活免费网站,成人学院未删减版,一边吃奶一边添p好爽视频观看