博客 / 列表

DeepSeaAI - 基於 NVIDIA Run:ai 的 GPU 調度解決方案

基於 NVIDIA Run:ai 的 GPU 調度解決方案,是一個企業級的AI算力管理與編排平台。它通過智能調度和策略管理,旨在解決GPU資源利用率低和分佈式AI工作負載管理複雜這兩大核心挑戰。 下面的表格彙總了其核心調度與策略功能,可以幫助你快速瞭解全貌: 調度策略 核心功能 解決的問題

細粒度 , 神經網絡 , 人工智能 , 解決方案 , 混合雲

DeepSeaAI - 醫療行業大模型微調

醫療行業大模型微調 一、整體解決方案框架 1.1 分層解決方案體系 ┌─────────────────────────────────────────┐ │ 應用層(場景解決方案) │ ├─────────────────────────────────────────┤ │ 智能診療 │ 病歷質控 │ 科研輔助 │ ├

數據 , 神經網絡 , 人工智能 , 解決方案 , Python

DeepSeaAI - RAG(檢索增強生成)分類與開發框架

RAG(檢索增強生成)分類與開發框架 概述 RAG(Retrieval-Augmented Generation)是一種結合檢索機制與大型語言模型的技術範式,通過從外部知識源檢索相關信息來增強生成模型的準確性和可靠性。 一、RAG 分類體系 1. 按架構分類 類型 特點 適用場景

數據集 , 分塊 , pytorch , 人工智能 , 開發框架

DeepSeaAI - 智能體開發框架選型與技術架構深度分析

智能體開發框架選型與技術架構深度分析 一、智能體開發框架技術架構深度剖析 1.1 LangChain 框架技術架構 LangChain 作為 AI 應用開發的核心框架,其技術架構在 2024-2025 年經歷了重大演進。當前的 LangChain 3.0 版本實現了歷史性的架構重構,將框架解構為三個核心層級:開發層、工程化層和部署層(1)。 在模塊化架構設計方面,Lang

任務分配 , 技術架構 , pytorch , 架構設計 , 人工智能

DeepSeaAI - 智能體開發框架選型決策樹V2

四大框架的技術架構和典型應用案例,通過結構化拆解讓選型邏輯更貼合實際開發場景,同時優化決策樹的實用性和參考價值。 智能體開發框架選型決策樹 各框架核心信息補充説明 LlamaIndex 架構亮點:核心優勢在索引優化,提供Llama Parse組件支持複雜文檔解析,Workflows引擎可編排多步驟異步流程,索引層支持增量更新和量化壓縮,兼顧精

應用層 , 技術架構 , pytorch , 人工智能 , 結構化

DeepSeaAI - 智能體(Agent)的分類與開發框架V2

智能體(Agent)的分類與開發框架 一、智能體(Agent)的實現類型 根據能力與形態,Agent主要分為4類: 1. 通用型Agent 具備跨任務、自主決策能力,能拆解複雜目標並調用工具完成(如AutoGPT、BabyAGI),核心是目標驅動+自主迭代。 2. 知識型Agent 專注於知識檢索與利用(結合RAG技術),擅長處理專業文檔、領域知識類任務(如基於L

API , pytorch , 加載 , 人工智能 , 示例代碼

DeepSeaAI - AI與微服務系統架構解決方案V1

AI與微服務系統架構 一、方案概述 1.1 核心思想 本方案採用雲原生微服務架構作為基礎,將AI能力原子化、服務化,構建一個高內聚、低耦合、可獨立演進的智能分佈式系統。通過解耦業務邏輯與AI能力,實現技術團隊的敏捷協作、系統的彈性伸縮和能力的持續演進。 1.2 設計原則 服務自治:每個微服務(含AI服務)獨立開發、部署、擴展 能力複用:AI服務作為基礎能

Pod , 神經網絡 , API , 人工智能 , 基礎設施

DeepSeaAI - 金融行業大模型微調

針對銀行和金融行業專有詞彙標準化系統 注意:在醫療領域,由於涉及隱私,我們需要確保使用公開數據或合成數據。 一、大模型微調方案選擇 推薦方案:混合策略微調 1. 監督微調(SFT) + 檢索增強(RAG)結合 - SFT微調:增強基礎理解能力 - RAG檢索:確保標準化準確性 2. 多階段微調流程: ├── 第一階段:領域預訓練 ├── 第二階段:任

數據 , 神經網絡 , 相似度 , 人工智能 , Python

DeepSeaAI - 企業級RAG高性能技術架構解決方案V2

企業級RAG架構方案 一、總體架構設計原則 1.1 架構目標 99.99%可用性:年度不可用時間 53分鐘 P95延遲 1秒:複雜查詢不超過2秒 線性擴展:支持從百萬到百億級文檔 成本可控:每千次查詢成本 $0.5 安全合規:數據隔離、審計跟蹤、GDPR合規 二、系統架構圖 2.1 整體架構分層圖 graph TB

神經網絡 , 緩存 , 人工智能 , 服務集羣 , ci

DeepSeaAI - AI應用平台架構設計:構建的企業級AI應用開發與部署平台

高性能高可用AI應用平台架構設計 一、項目概述 1.1 定位與目標 基於AI應用平台核心理念構建的企業級AI應用開發與部署平台,為組織提供: 可視化AI應用編排:拖拽式構建複雜AI工作流 多模型統一管理:統一接口管理20+主流大語言模型 智能知識庫系統:RAG增強的智能問答與文檔處理 高性能高可用架構:滿足企業級SLA(99.95%+)要求

redis , 神經網絡 , G1 , 緩存 , 人工智能

DeepSeaAI - ChatGLM3微調實戰:基於LLaMA-Factory微調改造企業級知識庫

概述 本文介紹如何使用LLaMA-Factory框架對ChatGLM3模型進行微調,以適應企業級知識庫的問答和交互需求。通過微調,可以使模型更好地理解和迴應特定領域的專業知識。 1. 背景與挑戰 企業知識庫需求:企業通常擁有大量內部文檔、FAQ、產品手冊等,需要智能系統快速準確回答相關問題。 通用模型的侷限性:預訓練模型缺乏特定領域知識,可能產

數據 , 神經網絡 , API , 人工智能 , Json

DeepSeaAI - 項目實戰:LLaMaFactory和Qwen2-VL-2B微調大模型實戰

簡介 本文介紹了一個基於多模態大模型的醫療圖像診斷項目。項目旨在通過訓練一個醫療領域的多模態大模型,提高醫生處理醫學圖像的效率,輔助診斷和治療。作者以家中老人的腦部CT為例,展示瞭如何利用MedTrinity-25M數據集訓練模型,經過數據準備、環境搭建、模型訓練及微調、最終驗證等步驟,成功使模型能夠識別CT圖像並給出具體的診斷意見,與專業醫生的診斷結果高度吻合。 前

數據集 , 數據 , 神經網絡 , 人工智能 , 模態

DeepSeaAI - EchoMimic:阿里巴巴開源的AI數字人視頻生成系統

概述 EchoMimic 是阿里巴巴螞蟻集團推出的開源AI數字人視頻生成模型。該項目通過先進的深度學習技術,將靜態圖像轉化為具有動態語音和表情的數字人像,實現"讓照片開口説話"的革命性能力。 核心價值主張 開源開放:完整的源代碼和預訓練模型免費提供 多模態驅動:支持音頻、視覺或二者結合的驅動方式 高保真生成:保持原始人物身份特徵的同時生

神經網絡 , 人工智能 , 特徵提取 , Git , Json

DeepSeaAI - 大型語言模型(LLM)微調視圖V2

大型語言模型(LLM)微調視圖 摘要 本指南全面介紹大型語言模型微調的核心技術體系,涵蓋SFT、RLHF、對齊、RAG及各類微調方法,提供從理論到實踐的全流程指導。 目錄 概述:大模型微調技術演進全景 詳細技術組件説明 核心技術詳解 參數高效微調技術對比 微調策略選擇指南 評估與監控體系 最

數據 , 神經網絡 , 性能評估 , 人工智能 , 核心技術