微軟發佈 Rho-alpha 模型,機器人可通過語言指令執行復雜任務

新聞
HongKong
11
04:42 PM · Jan 23 ,2026

微軟研究院發佈了一款機器人領域的新型AI模型Rho-alpha,並表示將首先通過研究型早期訪問計劃向外部開放。

該模型是微軟首次基於 Phi 視覺-語言模型家族、專門面向機器人應用打造的系統。從技術定位來看,Rho-alpha 被微軟視為“物理 AI”戰略的一部分。與主要運行在數字空間中的大語言模型不同,這一方向強調智能體能夠直接與物理世界交互。

Rho-alpha 的核心能力在於,將自然語言指令直接轉化為機器人控制信號,使機器人能夠完成複雜的雙手協同操作任務,而無需依賴傳統工業機器人常見的固定腳本和預設流程。目前,微軟正在雙臂機器人平台和類人機器人上對該系統進行評估測試。

Rho-alpha模型可以突破機器人在高度可控環境中運行的侷限,且能夠將人類的自然語言指令直接轉化為機器人的控制信號,指揮機器人完成複雜的雙手協同操作,無需依賴固定的預設腳本。

此外,該模型具備顯著的適應性,可在運行中動態調整行為,並允許人類操作者通過直觀工具進行干預糾正,系統會將此反饋納入學習過程。為解決機器人訓練數據稀缺的問題,Rho-alpha採用了真實演示、仿真任務與大規模視覺問答數據相結合的混合訓練方式,大量合成數據通過Azure雲上的仿真流水線生成。

目前該模型正在雙臂機器人和類人機器人平台上進行測試評估。它不僅結合了視覺與語言理解,還引入了觸覺感知能力,使機器人能根據觸覺反饋實時調整動作,未來版本還將融入力感知等更多傳感模態。

user avatar
0 位用戶收藏了這個故事!
收藏

發佈 評論

Some HTML is okay.