美國人工智能初創公司 Arcee AI 宣佈推出全新開放權重模型系列 Trinity,包括已發佈的 Trinity Nano 與 Trinity Mini,以及計劃於 2026 年 1 月推出的 Trinity Large。
這一系列模型從數據、架構到訓練流程均由 Arcee 自主構建,官方稱“在美國進行端到端訓練,提供開放權重、強大的推理能力和開發者完全控制權”。
Trinity 系列採用多專家架構(afmoe),每層 128 個專家,每個 token 激活 8 個專家並額外包含共享專家。模型訓練基於 10T 級別數據,並加入 grouped-query attention、gated attention、長上下文支持等技術以提升穩定性與推理能力。
-
Trinity Nano:約 6B 參數 MoE(1B active),面向移動、嵌入式、隱私敏感等本地部署場景。
-
Trinity Mini:26B 參數 MoE(3B active),面向雲或本地機房,適用於多步推理、工具調用、長文本處理等任務。
兩款模型均採用 Apache 2.0 許可,權重已可下載或通過 API 使用。
https://huggingface.co/collections/arcee-ai/trinity
Arcee 表示,當前許多開源模型依賴他人基礎模型微調,導致能力天花板明顯、數據來源不透明、難滿足企業合規需求。Trinity 轉向完全自主的預訓練路線,目標是構建可長期迭代、可在企業內部持續學習的模型體系。
Arcee AI 同時確認正在訓練 Trinity Large(約 420B 參數、13B active),使用 2048 片 B300 GPU,數據規模擴展至 20T tokens。官方計劃在 2026 年 1 月正式發佈,並提供完整技術報告。