tag 神經網絡

標籤
貢獻47
107
07:19 PM · Oct 26 ,2025

@神經網絡 / 博客 RSS 訂閱

deephub - VideoMind:Chain-of-LoRA突破時間盲區讓AI真正看懂長視頻

視頻作為一種富含信息且密集的媒介,已廣泛應用於娛樂、社交媒體、安全監控和自動駕駛等領域。人類能夠輕鬆理解視頻內容,例如理解因果關係、定位特定時刻以及關聯動作。 但是人工智能,尤其是大型語言模型(LLM)及其多模態(MLLM)變體,在視頻理解方面仍然面臨挑戰,尤其是在處理長視頻時。儘管像 GPT-4V 或 Claude 這樣的模型可以詳細描述圖像或短片,但在需要根據長序列中特定時間間隔推斷事件

llm , 神經網絡 , 人工智能 , 視頻處理

收藏 評論

deephub - 斯坦福ACE框架:讓AI自己學會寫prompt,性能提升17%成本降87%

斯坦福和SambaNova AI最近聯合發了一篇論文,Agentic Context Engineering (ACE)。核心思路:不碰模型參數,專注優化輸入的上下文。讓模型自己生成prompt,反思效果,再迭代改進。 可以把這個過程想象成模型在維護一本"工作手冊",失敗的嘗試記錄成避坑指南,成功的案例沉澱為可複用的規則。 數據表現 論文給出的數字: AppWorld任務準確率比GPT-4驅動的a

llm , 神經網絡 , 人工智能 , 深度學習

收藏 評論

編程夢想編織者 - 神經網絡至少要多少數據 神經網絡有

目錄 迷人的神經網絡——機器學習筆記1 第1章 神經元模型及網絡結構 1.1 神經元模型 1.1.1 單輸入神經元 1.1.2 激活函數 1.1.3 多輸入神經元 1.2 網絡結構 1.2.1 單層神經網絡 1.2.2 多層神經網絡

神經網絡 , 激活函數 , 權值矩陣 , 神經網絡至少要多少數據 , 感知機 , 人工智能

收藏 評論

華明視訊科技 - 國內口碑較好的海關智能閘口系統品牌推薦,幫你做出明智的決策!

當海關物流效率直接影響企業競爭力,智能閘口系統的選擇便成了關鍵決策。面對市場上眾多的品牌和解決方案,如何找到真正可靠、高效的智能閘口系統?今天我們從行業實踐出發,為您梳理國內口碑較好的幾類選擇,助您做出明智決策。 穩定可靠型:老牌勁旅值得信賴 國內一批深耕海關智能化領域多年的企業,憑藉紮實的技術積累和豐富的項目經驗,在多個重要口岸實施了穩定運行的智能閘口系統。這些系統通常具備完善的硬件

圖像識別 , 神經網絡 , 自然語言處理 , 人工智能 , 深度學習

收藏 評論

deephub - JAX核心設計解析:函數式編程讓代碼更可控

很多人剛接觸JAX都會有點懵——參數為啥要單獨傳?隨機數還要自己管key?這跟PyTorch的畫風完全不一樣啊。 其實根本原因就一個:JAX是函數式編程而不是面向對象那套,想明白這點很多設計就都説得通了。 先説個核心區別 PyTorch裏,模型是個對象,權重藏在裏面,訓練的時候自己更新自己。這是典型的面向對象思路,狀態封裝在對象內部。 JAX的思路完全反過來。模型定義是模型定義,參數是參數,兩邊分

llm , jax , 神經網絡 , 人工智能 , 深度學習

收藏 評論

緊張的麪包 - 使用SOM進行圖像顏色量化

使用SOM進行圖像顏色量化 前言 自組織映射(Self-Organizing Map, SOM)是一種人工神經網絡,能夠將高維數據映射到低維空間,同時保持數據的拓撲結構。在圖像處理領域,SOM常被用於顏色量化,即減少圖像中的顏色數量,同時儘量保持圖像的視覺效果。 本文將介紹如何使用MiniSom庫實現基於SOM的圖像顏色量化,將一幅圖像的顏色從數百萬種減少到9種代表色,同時保持圖像的主要視覺特徵。

神經網絡

收藏 評論

DeepSeaAI - 項目實戰:LLaMaFactory和Qwen2-VL-2B微調大模型實戰

簡介 本文介紹了一個基於多模態大模型的醫療圖像診斷項目。項目旨在通過訓練一個醫療領域的多模態大模型,提高醫生處理醫學圖像的效率,輔助診斷和治療。作者以家中老人的腦部CT為例,展示瞭如何利用MedTrinity-25M數據集訓練模型,經過數據準備、環境搭建、模型訓練及微調、最終驗證等步驟,成功使模型能夠識別CT圖像並給出具體的診斷意見,與專業醫生的診斷結果高度吻合。 前

數據集 , 數據 , 神經網絡 , 人工智能 , 模態

收藏 評論

DeepSeaAI - 大型語言模型(LLM)微調視圖V2

大型語言模型(LLM)微調視圖 摘要 本指南全面介紹大型語言模型微調的核心技術體系,涵蓋SFT、RLHF、對齊、RAG及各類微調方法,提供從理論到實踐的全流程指導。 目錄 概述:大模型微調技術演進全景 詳細技術組件説明 核心技術詳解 參數高效微調技術對比 微調策略選擇指南 評估與監控體系 最

數據 , 神經網絡 , 性能評估 , 人工智能 , 核心技術

收藏 評論

全棧技術開發者 - 為什麼樹模型在結構化數據上如此有效?為什麼樹模型在結構化數據上比神經網絡更有效?隨機森林的隨機性是如何降低模型方差的?

在機器學習中,人們常常驚歎於深度神經網絡在圖像、語音和自然文本領域的突破性表現。然而,當問題回到表格化的結構化數據時,一種看似“樸素”的模型類型——樹模型(Tree-based Model)——卻長期佔據主導位置。從工業設備故障診斷到電子商務推薦系統,樹模型的表現常常超過複雜的深度學習架構。為什麼這種層級劃分的模型能夠在結構化數據上展現出如此強大的效能?這不僅是一個關於模型選擇的

機器學習 , yyds乾貨盤點 , 數據 , 神經網絡 , 人工智能 , 結構化

收藏 評論

小宋 - 多樣本反向傳播矩陣推導及其MLP的代碼實現

一.多樣本反向傳播矩陣推導 二.MLP代碼實現 # @time : 2025/1/8 10:53 # @author : specier import numpy as np import pandas as pd import datetime import pickle class MultipleLayerPerception: def __in

pickle , 神經網絡 , numpy , pandas , 深度學習

收藏 評論

DeepSeaAI - 企業級RAG高性能技術架構解決方案V2

企業級RAG架構方案 一、總體架構設計原則 1.1 架構目標 99.99%可用性:年度不可用時間 53分鐘 P95延遲 1秒:複雜查詢不超過2秒 線性擴展:支持從百萬到百億級文檔 成本可控:每千次查詢成本 $0.5 安全合規:數據隔離、審計跟蹤、GDPR合規 二、系統架構圖 2.1 整體架構分層圖 graph TB

神經網絡 , 緩存 , 人工智能 , 服務集羣 , ci

收藏 評論

colddawn - 神經網絡自適應控制仿真matlab 自適應 神經網絡

Adaptively Connected Neural Networks Paper link: Adaptively Connected Neural Networksarxiv.org Code link: wanggrun/Adaptively-Connected-Neural

神經網絡自適應控制仿真matlab , 自適應 , 卷積 , 數據 , 神經網絡 , 人工智能

收藏 評論

mob649e81673fa5 - AIGC 神經網絡的可視化

AIGC 神經網絡的可視化是一項涉及到深度學習算法和圖形化表示技術的複雜任務,其目的是通過可視化手段幫助開發者和研究人員理解神經網絡的結構和性能。本文將圍繞這一主題,詳細探討可視化技術的適用場景、核心維度、特性拆解、實戰對比、深度原理及選型指南,力求給讀者以全方位的理解。 背景定位 在近年來,人工智能的飛速發展推動了 AIGC(人工智能生成內容)相關技術的廣泛應用。尤其是在圖像生

神經網絡 , aigc , 開發者 , 可視化工具

收藏 評論

JAVA小俠影 - pytorch和springboot

作為一名AI工程師,掌握一門深度學習框架是必備的生存技能之一。 自 TensorFlow 從 Google 中脱穎而出以來,它在研究和商業領域成為最受歡迎的開源深度學習框架,緊接着 從 Facebook 誕生的 PyTorch 由於社區推動的易用性改進和越來越廣泛的用例部署,而迅速趕上TensorFlow。 兩個框架在當年一度備受爭議

pytorch和springboot , 神經網絡 , 算法 , pytorch , 人工智能 , JAVA

收藏 評論

DeepSeaAI - 基於 NVIDIA Run:ai 的 GPU 調度解決方案

基於 NVIDIA Run:ai 的 GPU 調度解決方案,是一個企業級的AI算力管理與編排平台。它通過智能調度和策略管理,旨在解決GPU資源利用率低和分佈式AI工作負載管理複雜這兩大核心挑戰。 下面的表格彙總了其核心調度與策略功能,可以幫助你快速瞭解全貌: 調度策略 核心功能 解決的問題

細粒度 , 神經網絡 , 人工智能 , 解決方案 , 混合雲

收藏 評論

漫步雲端的豬 - 阿里內部架構解密:網絡+分佈式+RPC+消息中間件+微服務 - 小遷來了的個人空間 -

本文詳細解析阿里Qwen3大模型的架構與實現。首先介紹Qwen3在代碼、數學等領域的出色性能,然後深入解析其模型結構,包括輸入處理、Transformer塊、GQA注意力機制、前饋網絡和RMSNorm歸一化等。文章提供了完整的PyTorch代碼實現,從Qwen3Model到各個組件,幫助讀者理解大模型的工作原理和實現細節。 引言 2025年4月29號,阿里千問

神經網絡 , 開發語言 , 自然語言處理 , JAVA , Css , 前端開發 , HTML , Python

收藏 評論

doscommand - 李宏毅深度學習教程 pdf

本文是2016 台灣資料科學年會前導課程“一天搞懂深度學習”的全部講義PPT(共268頁),由台灣大學電機工程學助理教授李宏毅主講。作者在文中分四個部分對神經網絡的原理、目前存在形態以及未來的發展進行了介紹。深度學習的每一個核心概念在文中都有相關案例進行呈現,通俗易懂。一天的時間搞懂深度學習?其實並不是沒有可能。 深度學習 ( De

機器學習 , 神經網絡 , 人工智能 , 李宏毅深度學習教程 pdf , 深度學習

收藏 評論

芯動大師 - 對深度學習概念的基礎理解與認識

一、神經網絡的組成 人工神經網絡(Artificial Neural Networks,簡寫為ANNs)是一種模仿動物神經網絡行為特徵,進行分佈式並行信息處理的算法數學模型。 這種網絡依靠系統的複雜程度,通過調整內部大量節點之間相互連接的關係,從而達到處理信息的目的,並具有自學習和自適應的能力。神經網絡類型眾多,其中最為重要的是多層感知機。為了詳細地描述神經網絡,我們

機器學習 , yyds乾貨盤點 , 神經網絡 , 人工智能 , 深度學習 , 數據結構與算法

收藏 評論

一點人工一點智能 - 書籍-《使用TensorFlow和Keras的神經網絡》

書籍:Neural Networks with TensorFlow and Keras: Training, Generative Models, and Reinforcement Learning 作者:Philip Hua 出版:Apress​ 編輯:陳萍萍的公主@一點人工一點智能 下載:書籍下載-《使用TensorFlow和Keras的神經網絡》 01 書

機器學習 , tensorflow , 神經網絡 , 深度學習

收藏 評論

網絡安全守護先鋒 - 神經網絡原理的可視化 - AI女神的個人空間 -

痛點突破 傳統繪圖工具難以表達深度學習模型的層次結構和數據流動,研究者們常常陷入「知道架構卻畫不出來」的困境。我們發現在神經網絡可視化過程中,存在架構表達不清晰、層級關係混亂、參數傳遞路徑模糊等核心痛點。 視覺化解決方案 我們開發了基於智能架構生成器的可視化解決方案,通過模塊化組件和AI架構設計思維,實現了神經網絡結構的直觀呈現。這套工具能夠將複雜的數學概念轉化

network , 神經網絡 , 深度學習 , Css , 前端開發 , HTML

收藏 評論

deephub - 如何應對缺失值帶來的分佈變化?探索填充缺失值的最佳插補算法

本文將探討了缺失值插補的不同方法,並比較了它們在復原數據真實分佈方面的效果,處理插補是一個不確定性的問題,尤其是在樣本量較小或數據複雜性高時的挑戰,應選擇能夠適應數據分佈變化並準確插補缺失值的方法。 我們假設存在一個潛在的分佈P,從中得出觀察值X。此外,還繪製了一個與X相同維數的0/1向量,我們稱這個向量為M,實際觀測到的數據向量X被M掩碼為X。我們觀測到聯合向量(X,M)的n個獨立同分布(i.i

機器學習 , 神經網絡 , r , 人工智能

收藏 評論

中昊芯英 - DeepSeek-V3.2的DSA稀疏注意力技術:在TPU平台上的效能革命與適配實踐

9 月 29 日,DeepSeek 最新發布的DeepSeek-V3.2-Exp模型引入了自主研發的DeepSeek Sparse Attention(DSA)稀疏注意力機制,在幾乎不影響模型性能的前提下,實現了長文本訓練和推理效率的大幅提升。本文旨在深入解析 DSA 的技術原理,並重點探討中昊芯英「剎那®」TPU 平台如何憑藉其片上緩存與高度並行矩陣計算單元,在 Lightning Indexe

機器學習 , tensorflow , 神經網絡 , 自然語言處理 , 人工智能

收藏 評論