tag 深度學習

標籤
貢獻317
309
05:25 PM · Oct 25 ,2025

@深度學習 / 博客 RSS 訂閱

deephub - 融合AMD與NVIDIA GPU集羣的MLOps:異構計算環境中的分佈式訓練架構實踐

在深度學習的背景下,NVIDIA的CUDA與AMD的ROCm框架缺乏有效的互操作性,導致基礎設施資源利用率顯著降低。隨着模型規模不斷擴大而預算約束日益嚴格,2-3年更換一次GPU的傳統方式已不具可持續性。但是Pytorch的最近幾次的更新可以有效利用異構計算集羣,實現對所有可用GPU資源的充分調度,不受制於供應商限制。 本文將深入探討如何混合AMD/NVIDIA GPU集羣以支持PyTor

神經網絡 , pytorch , 人工智能 , 分佈式系統 , 深度學習

收藏 評論

deephub - PINN訓練新思路:把初始條件和邊界約束嵌入網絡架構,解決多目標優化難題

PINNs出了名的難訓練。主要原因之一就是這個多目標優化問題。優化器很容易找到投機取巧的路徑——比如拼命降低微分方程殘差,但完全不管初始條件和邊界約束。只要給初始條件和邊界損失配的權重夠低,它們增加的那點損失完全能被殘差損失的大幅下降抵消掉。調整權重也許能暫時緩解這個問題,但誰也不能保證最優權重在整個訓練過程中一直有效。 標準的PINN用複合損失函數,把三項加權求和: 初始條件損失 邊界損失

神經網絡 , pytorch , 人工智能 , 深度學習

收藏 評論

JUGG11 - 硬核解析:AI 原生知識庫系統如何擊穿企業知識管理技術瓶頸

在企業知識管理領域,傳統工具的技術短板早已成為數字化轉型的攔路虎:關鍵詞檢索的 “信息噪聲冗餘”、知識沉澱的 “被動低效困境”、跨系統集成的 “接口壁壘難題”,這些痛點本質上都是架構設計與技術選型的底層缺陷。而一款以 AI 大模型為核心驅動的開源知識庫系統,憑藉直擊核心的技術架構與工程化實現,將知識管理的效率與靈活性提升至新維度。本文將從底層技術架構、核心模塊實現、企業級適配能力

性能優化 , 數據 , 知識管理 , 人工智能 , 深度學習

收藏 評論

HyperAI超神經 - 2026年將成中美AI競賽拐點?美國監管邏輯轉向背後,各巨頭算力豪賭未止

如果要用關鍵詞概括 2025 年,那麼這一年無可爭議地屬於人工智能:當 AI 發展不再止步於技術圈內部的競賽,而深度滲入內容生產、情感互動和公共討論,那麼它已經成為了塑造世界的真實力量。 人們對 AI 的評價也從未如此分裂。劍橋詞典發佈了 2025 年度詞「Parasocial(準社會關係)」,指出了人們與虛擬對象——包括 AI 聊天機器人——之間愈發普遍的單向情感連接。 「隨着與

插入圖片 , 人工智能 , 基礎設施 , 深度學習

收藏 評論

短短同學 - 對象住哪裏?——深入剖析JVM內存結構與對象分配機制

對象住哪裏?—— 深入剖析 JVM 內存結構與對象分配機制 在 Java 程序運行時,我們創建的每一個對象(如new User())都需要佔用 JVM 內存,但這些對象究竟 “居住” 在哪個內存區域?為何有的對象很快被回收,有的卻能長期存活?要解答這些問題,必須先理清 JVM 的內存結構劃分,再深入對象從創建到銷燬的全生命週期分配邏輯 —— 這不僅是面試高頻考點,更是理解

User , jvm , 人工智能 , 深度學習 , 常量池

收藏 評論

farfarcheng - 邁入大模型時代的深度學習:使用 Flash Attention 技術讓 Transformer 起飛

Transformer 是 ChatGPT 等大語言模型的核心技術之一,而注意力機制是其的關鍵部分。但是,標準的注意力實現具有二次時間和內存複雜度,使其在長序列任務上變慢並消耗大量顯存。這限制了 Transformer 能夠建模的上下文長度,同時使得大尺度模型的訓練和推理時間延長。 FlashAttention: Fast and Memory-Efficient Exact Attention

機器學習 , Flash , 人工智能 , transformer , 深度學習

收藏 評論

憂鬱的吐司 - 數字人帶貨狂攬 23 億!數字人主播成電商新寵,直播帶貨迎來全新時代?

2025 年雙十一,數字人帶貨交出了震撼行業的成績單:京東平台數字人直播總成交額突破 23 億元,1.7 萬商家通過虛擬主播實現 24 小時不間斷開播,帶動平台整體轉化率提升 30%。(青否數字人源頭v:zhibo175) !從凌晨三點仍在滔滔不絕的國貨彩妝虛擬主播,到創下 5500 萬單場 GMV 的羅永浩 AI 分身,數字人正從直播帶貨的 “補充角色” 躍升為 “核心生產力”,引發行業對 “無

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

jkfox - 權重向量是特徵向量嗎 特徵向量與權重的關係

前言 動筆寫這個支持向量機(support vector machine)是費了不少勁和困難的,原因很簡單,一者這個東西本身就並不好懂,要深入學習和研究下去需花費不少時間和精力,二者這個東西也不好講清楚,儘管網上已經有朋友寫得不錯了(見文末參考鏈接),但在描述數學公式的時候還是顯得不夠。得益於同學白石的數學證明,我還是想嘗試寫一下,希望本文在兼

權重向量是特徵向量嗎 , 支持向量機 , 數據 , 人工智能 , 深度學習 , 約束條件

收藏 評論

Lab4AI - NeurIPS 2025Mamba引爆3D重建!MVSMamba:效率與精度雙雙超越Transformer

論文標題:MVSMamba: Multi-View Stereo with State Space Model 作者團隊:北京科技大學 發佈時間:2025年11月4日 👉一鍵直達論文 👉Lab4AI大模型實驗室論文閲讀 ✅Lab4AI平台提供AI導讀和AI翻譯等工具,輔助論文閲讀。 ⭐研究背景 基於學習的多視圖立體視覺方法嚴重依賴魯棒的特徵匹配。傳統CNN方法因感受野有限,難以捕捉全局特徵

llm , 算法 , chatgpt , 人工智能 , 深度學習

收藏 評論

JavaEdge - 下一代搜索:AI 與 OpenSearch 的融合 —— 基於 MCP 的智能搜索

本文已收錄在Github,關注我,緊跟本系列專欄文章,咱們下篇再續! 🚀 魔都架構師 | 全網30W技術追隨者 🔧 大廠分佈式系統/數據中台實戰專家 🏆 主導交易系統百萬級流量調優 車聯網平台架構 🧠 AIGC應用開發先行者 | 區塊鏈落地實踐者 🌍 以技術驅動創新,我們的征途是改變世界! 👉 實戰乾貨:編程嚴

服務器 , yyds乾貨盤點 , 數據 , 搜索 , 人工智能 , 深度學習

收藏 評論

一點人工一點智能 - 書籍-《機器學習數學基礎》

書籍:Mathematics for Machine Learning 作者:Marc Peter Deisenroth,A. Aldo Faisal,Cheng Soon Ong 出版:Cambridge University Press​ 編輯:陳萍萍的公主@一點人工一點智能 下載:書籍下載-《機器學習數學基礎》 01 書籍介紹 理解機器學習所需的基本數學工具包

機器學習 , 數學 , 深度學習

收藏 評論

沉着的牙膏 - 從包過濾到深度檢測:防火牆的演進之路

一、防火牆的概念防火牆(Firewall)是一種部署在內部網絡與外部網絡之間的安全防護系統,由 Check Point 創始人 Gil Shwed 於 1993 年正式提出並專利化(US5606668(A))。其核心機制是通過預設的規則對數據流進行允許或阻斷,實現訪問控制。防火牆主要在網絡通信中過濾承載內容的數據包,從而隔離內部網絡與公共網絡,確保未經授權的數據與用户無法進入企業環境,同時保障合法

深度學習

收藏 評論

星星上的柳樹 - 芯片騰飛

“芯片行業,不只是在“還好”,而是在加速。” 當話題在“科技放緩”與“AI 大熱”之間搖擺時,真實數據卻講出了不同的故事:在 2025 年第二季度,全球半導體市場規模逼近 1800 億美元,上季度環比增長 7.8%,同比更是飆升 19.6%。這已經是連續六個季度年增率超過 18%。 換句話説:芯片行業不僅沒有降温,反而在以新的方式燃燒。 ✤ 1 ✤市場規模與增長態勢 從來

資訊 , 教程 , 知識 , 人工智能 , 深度學習

收藏 評論

疆鴻智能研發中心 - 破局!EtherNet/IP直連DeviceNet,我們讓光伏電站數據“毫秒必達”

破局!EtherNet/IP直連DeviceNet,我們讓光伏電站數據“毫秒必達” 1 項目背景 隨着光伏電站規模的擴大和智能化需求的提升,電站內部設備通訊網絡的整合成為關鍵挑戰。某100MW光伏電站項目中,控制系統採用羅克韋爾Controllogix系列PLC,基於EtherNet/IP協議實現主站通訊。然而,電站現場分佈着大量智能匯流箱、跟蹤支架控制器和環境監測儀

協議轉換網關 , 工業通訊 , ETHERNET IP , 人工智能 , DEVICENET , 深度學習 , 工業自動化

收藏 評論

OpenBayes - OpenBayes 教程上新丨CSM 駕到,統統閃開!更鮮活的語音生成,從此告別延遲呆板機械味

與 AI 語音助手聊天時,總感覺哪裏怪怪的。它們對問題應答自如,可就是少了點「人味」。語調呆板、停頓突兀,時不時還在莫名其妙的地方卡頓,這種似人非人的違和感,其實就是「恐怖谷效應」在作祟。當 AI 語音與人類語音相似度頗高卻又未達到完美一致時,用户便會感到不適。 近期,由 Sesame 團隊推出的語音生成模型 CSM (Conversational Speech Model) 在眾多語音模型中脱穎

機器學習 , tensorflow , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

1艾一刀 - 資本瘋搶無人物流玩家,行深智能的核心底氣是什麼?

文 | 智能相對論 作者 | 孫曉巍 2025年無人物流配送風起雲涌。頭部玩家接連在資本市場有大動作:新石器年內完成第二筆6億美元的融資,九識智能完成1億美元B4輪融資,白犀牛完成B+輪融資,順豐這樣的物流巨頭甚至連投了三次。 毫無疑問,無人物流配送已經成了自動駕駛垂直領域的真正熱門。數據顯示,今年L4級無人物流配送賽道累計融資已超過40億元人民幣。 當乘

數據 , 自動駕駛 , 人工智能 , 深度學習 , 迭代

收藏 評論

青否Ai - 青否AI員工提升客户體驗:讓服務更智能、更人性化!

在現代企業中,客户體驗已經成為競爭力的重要指標。客户期待快速、精準、個性化的服務,而人工服務往往受限於效率和精力。AI員工的出現,讓企業服務煥然一新,它不僅能高效執行任務,更能讓服務變得智能而人性化。 AI員工能夠實時理解客户需求,從諮詢到解決問題,完成整個業務流程的閉環交付。比如,當客户提出修改訂單或查詢服務狀態時,AI員工會快速識別信息、調用系統執行操作,並及時反饋結果。 整個過程中,客户不再

機器學習 , 算法 , 人工智能 , 深度學習

收藏 評論

mob649e81567471 - ollama如何使用顯卡

在當前的AI開發生態中,如何利用顯卡來提升模型的訓練與推理性能成為了每個開發者的重要課題。最近,我在使用Ollama時碰到了一些關於顯卡的使用問題,現將此過程的解決方案記錄下來,以便未來參考。 問題背景 隨着深度學習與自然語言處理的不斷髮展,顯卡成為了訓練大型語言模型的重要計算資源。Ollama是一個支持多種架構的框架,然而在我第一次嘗試利用顯卡時,出現了一些異常現象。

aigc , 深度學習 , memory , CUDA

收藏 評論

mob64ca1415f0ab - 模型的跨界:我拿Transformer去做目標檢測,結果發現效果不錯

一、Transformer目標檢測基礎概念與核心原理 什麼是Transformer目標檢測? Transformer目標檢測是以DETR(DEtection TRansformer)為代表的新型檢測範式,其核心思想是將目標檢測任務轉化為直接集合預測問題。與傳統基於卷積神經網絡(CNN)的方法不同,Transformer檢測器摒棄了錨框、非極大

編碼器 , 後端開發 , transformer , 深度學習 , 目標檢測 , Python

收藏 評論

Lab4AI - 【每日Arxiv熱文】ICLR2026 !SAM3重磅來襲:能“聽懂人話”的分割模型,性能狂飆2倍!

1.論文概述 論文標題:SAM3: Segment Anything with Concepts 作者團隊:Anonymous authors 發佈時間:ICLR2026 論文鏈接:https://openreview.net/pdf?id=r35clVtGzw 👉Lab4AI 大模型實驗室鏈接: https://www.lab4ai.cn/paper/detail/reprodu

機器學習 , 圖像識別 , 知識 , 人工智能 , 深度學習

收藏 評論

deephub - PyTorch中的多進程並行處理

PyTorch是一個流行的深度學習框架,一般情況下使用單個GPU進行計算時是十分方便的。但是當涉及到處理大規模數據和並行處理時,需要利用多個GPU。這時PyTorch就顯得不那麼方便,所以這篇文章我們將介紹如何利用torch.multiprocessing模塊,在PyTorch中實現高效的多進程處理。 多進程是一種允許多個進程併發運行的方法,利用多個CPU內核和GPU進行並行計算。這可以大大提高

pytorch , 人工智能 , 深度學習 , 多進程

收藏 評論

華明視訊科技 - 岸橋自動理貨系統:AI視覺技術重塑港口智能作業新標準

在現代化港口運營中,效率、安全與準確性是理貨業務的核心挑戰。岸橋自動理貨系統應運而生,通過融合人工智能、邊緣計算與高清視覺技術,實現對集裝箱信息的實時感知、識別與處理,推動港口作業進入全面智能化時代。 系統核心架構與技術優勢 本系統以高性能高清攝像機和嵌入式AI工控機為核心硬件,依託邊緣計算架構,將算法部署在作業最前端。系統通過在岸橋上直接進行視覺採集與實時分析,有效避免了傳統視頻傳輸

數據挖掘 , 圖像識別 , 神經網絡 , 人工智能 , 深度學習

收藏 評論

技術領航舵手 - pytorch 張量如何深拷貝 pytorch batchsize

零、Tricks集宜 0.1 知識搬運 (1)PyTorch提速 預處理提速 IO提速 訓練策略 代碼層面 模型設計 推理加速 時間分析 項目推薦 擴展閲讀 (2)PyTorch節省顯存 儘

機器學習 , pytorch 張量如何深拷貝 , pytorch , 人工智能 , 深度學習 , 2d

收藏 評論

編程夢想家 - 實時實例分割最新

本文主要解決視頻目標分割領域的一個基本問題:如何使分割模型能夠有效地適應特定視頻以及在線目標的外觀變化。 解決辦法:提出一個圖存儲網絡來對分割模型進行“學習更新”。 大概流程分為兩步:首先構建一個由全連接圖構成的情景存儲網絡,將幀存儲為節點,並通過邊捕獲跨幀的相關性。然後,可學習的控制器被嵌入以簡化內存的讀寫。 相比於以往模型的優勢:結構化的外部

機器學習 , 實時實例分割最新 , 神經網絡 , 人工智能 , 深度學習 , 計算機視覺

收藏 評論