微軟發佈 Rho-alpha 模型，機器人可通過語言指令執行復雜任務 - 新聞詳情 | YeLogs.com

微軟發佈 Rho-alpha 模型，機器人可通過語言指令執行復雜任務

新聞

HongKong

55

04:42 PM · Jan 23 ,2026

微軟研究院發佈了一款機器人領域的新型AI模型Rho-alpha，並表示將首先通過研究型早期訪問計劃向外部開放。

該模型是微軟首次基於 Phi 視覺-語言模型家族、專門面向機器人應用打造的系統。從技術定位來看，Rho-alpha 被微軟視為“物理 AI”戰略的一部分。與主要運行在數字空間中的大語言模型不同，這一方向強調智能體能夠直接與物理世界交互。

Rho-alpha 的核心能力在於，將自然語言指令直接轉化為機器人控制信號，使機器人能夠完成複雜的雙手協同操作任務，而無需依賴傳統工業機器人常見的固定腳本和預設流程。目前，微軟正在雙臂機器人平台和類人機器人上對該系統進行評估測試。

Rho-alpha模型可以突破機器人在高度可控環境中運行的侷限，且能夠將人類的自然語言指令直接轉化為機器人的控制信號，指揮機器人完成複雜的雙手協同操作，無需依賴固定的預設腳本。

此外，該模型具備顯著的適應性，可在運行中動態調整行為，並允許人類操作者通過直觀工具進行干預糾正，系統會將此反饋納入學習過程。為解決機器人訓練數據稀缺的問題，Rho-alpha採用了真實演示、仿真任務與大規模視覺問答數據相結合的混合訓練方式，大量合成數據通過Azure雲上的仿真流水線生成。

目前該模型正在雙臂機器人和類人機器人平台上進行測試評估。它不僅結合了視覺與語言理解，還引入了觸覺感知能力，使機器人能根據觸覺反饋實時調整動作，未來版本還將融入力感知等更多傳感模態。

0 位用戶收藏了這個故事！