引言
Post-Training(即模型後訓練)作為大模型落地的重要一環,能顯著優化模型性能,適配特定領域需求。相比於 Pre-Training(即模型預訓練),Post-Training 階段對計算資源和數據資源需求更小,更易迭代,因此備受推崇。
近期,我們將體系化地分享基於阿里雲人工智能平台 PAI 在強化學習、模型蒸餾、數據預處理、SFT等方向的技術實踐,旨在清晰地展現 PAI 在 Post
1. 前言
1.1 Ray
Ray是一個開源的分佈式計算框架,集成了多個AI庫,擁有豐富的生態系統,包括Ray Tune(超參數調優)、Ray RLlib(強化學習)、Ray Serve(模型部署)、RaySGD 的分佈式運行環境,提供了全面的AI解決方案,使得AI並行訓練更容易和高效。 OpenAI 聲明使用了 Ray 作為ChatGPT 大模型訓練的底層平台,參考 How Does Ray
1. 前言
1.1 Ray
Ray是一個開源的分佈式計算框架,集成了多個AI庫,擁有豐富的生態系統,包括Ray Tune(超參數調優)、Ray RLlib(強化學習)、Ray Serve(模型部署)、RaySGD 的分佈式運行環境,提供了全面的AI解決方案,使得AI並行訓練更容易和高效。 OpenAI 聲明使用了 Ray 作為ChatGPT 大模型訓練的底層平台,參考 How Does Ray
隨着 AI 技術的飛速發展,搜索已不僅是“查找信息”,更是“創造價值”的核心引擎。阿里雲 AI 搜索開放平台與 Qwen3 模型的深度融合,為企業和開發者提供了從基礎能力到複雜場景的全棧解決方案,讓智能搜索的落地門檻更低、效率更高、體驗更佳。
一、AI 搜索開放平台介紹
阿里雲 AI 搜索開放平台面向企業及開發者提供豐富的 AI 搜索組件化服務,用户可靈活調用多模態數據解析、大語言模型、效果測評等