博客 / 列表

Lab4AI - NeurlPS 2024! 擴散模型用於世界建模:視覺細節在Atari環境中至關重要| 計算機視覺 | 強化學習

01 論文概述 論文名稱:Diffusion for World Modeling: Visual Details Matter in Atari ——擴散模型用於世界建模:視覺細節在 Atari 環境中至關重要 👉一鍵直達論文 [👉Lab4AI大模型實驗室論文]( https://www.lab4ai.cn/paper/detail?utm_source=lab4ai_jssq_sf

機器學習 , 神經網絡 , 算法 , 人工智能 , 深度學習

Lab4AI - AAAI2025!北理工團隊提出FBRT-YOLO:面向實時航拍圖像更快更好的目標檢測 |計算機視覺|目標檢測

01 論文概述 論文名稱:FBRT-YOLO: Faster and Better for Real-Time Aerial Image Detection —— 更快更好:面向實時航拍圖像的目標檢測 👉一鍵直達論文 👉Lab4AI大模型實驗室論文 🌟 簡介 航拍圖像目標檢測在城市監控、災害響應和農業管理等領域至關重要。然而,這一任務面臨着獨特的挑戰:物體尺寸變化劇烈、小目標密集、背景複

機器學習 , 圖像識別 , 知識 , 人工智能 , 深度學習

Lab4AI - CBT-LLM 心理大模型微調,用 LLaMA Factory 微調框架就夠啦!| 附一鍵復現指南

01 | 引入 在人工智能快速發展的今天,通用大語言模型雖然具備強大的語言理解和生成能力,但在專業領域服務時往往顯得力不從心。以心理健康支持為例,普通預訓練模型無法理解"共情"深層含義,難以給出符合認知行為療法(CBT)原則的專業建議,導致回答要麼過於機械,要麼缺乏針對性。 僅靠通用模型無法實現"懂情感、會共情"的高質量心理支持,必須通過高質量數據集微調才能實現專業場景的精準適配,將通用語言能力

llm , 人工智能

Lab4AI - 【每日Arxiv熱文】北大新框架 Edit-R1 炸場!破解圖像編輯 3 大難題,雙榜刷 SOTA

【01 論文概述】 論文標題: Uniworld-V2:ReinforceImageEditingwithDiffusionNegative-awareFinetuningandMLLMImplicitFeedback 作者團隊:北京大學 發佈時間:2025 年 10 月 21 日 論文鏈接:uhttps://arxiv.org/pdf/2510.16888/u Lab4AI 大模型實

機器學習 , 圖像識別 , 人工智能 , 深度學習

Lab4AI - 【項目復現上新】Karpathy開源GitHub高分項目NanoChat!僅用100美元+8000行代碼手搓ChatGPT

The best ChatGPT that $100 can buy. 10 月 13 日,AI 領域大神 AndrejKarpathy 發佈了自己的最新開源項目。截至當前,​GitHub 項目上已經達到 29.1KStar​。 nanochat 是什麼 nanochat 是 AI 領域專家 AndrejKarpathy 發佈的開源項目,該項目包含從數據準備、預訓練、中期訓練、監督微調(S

機器學習 , 圖像識別 , 自然語言處理 , 知識 , 深度學習

Lab4AI - 【Github熱門項目】DeepSeek-OCR項目上線即突破7k+星!突破10倍無損壓縮,重新定義文本-視覺信息處理

當“8000 行代碼手搓 ChatGPT”的熱度還未褪去,大模型領域又迎來新驚喜——DeepSeek 團隊於 10 月 20 日開源的DeepSeek-OCR,以“上下文光學壓縮”為核心突破,重新定義了 OCR(光學字符識別)的效率邊界。這款僅 30 億參數量的模型,不僅能以 100 個視覺 token 超越傳統模型 256 個 token 的性能,更在單張 A100-40G 顯卡上實現每日 20

機器學習 , 圖像識別 , 自然語言處理 , 人工智能 , 深度學習

Lab4AI - 10.7萬條軌跡+4大機器人構型!RoboMIND開源數據集破解機器人通用操作難題

01 | 引入 開發魯棒且通用的操作策略是機器人領域的關鍵目標。為實現有效的泛化能力,構建包含大量演示軌跡和在複雜真實環境中完成多樣化任務的綜合數據集至關重要。儘管現有研究已致力於整合各類機器人數據集,但仍缺乏統一的數據收集標準,且在多樣化任務、場景和機器人類型方面的高質量數據不足。因此,構建一個大規模、標準化的多構型機器人操作數據集具有重要意義。然而,現有數據集往往存在以下侷限: l 規模有限

機器學習 , 圖像識別 , 神經網絡 , 人工智能 , 深度學習

Lab4AI - 【每日Arxiv熱文】ICLR2026 !SAM3重磅來襲:能“聽懂人話”的分割模型,性能狂飆2倍!

1.論文概述 論文標題:SAM3: Segment Anything with Concepts 作者團隊:Anonymous authors 發佈時間:ICLR2026 論文鏈接:https://openreview.net/pdf?id=r35clVtGzw 👉Lab4AI 大模型實驗室鏈接: https://www.lab4ai.cn/paper/detail/reprodu

機器學習 , 圖像識別 , 知識 , 人工智能 , 深度學習

Lab4AI - 【論文復現上新】NeurIPS 2023! 經典論文! DPO:你的語言模型,其實就是個獎勵模型 | 強化學習 | 微調策略

01 論文概述 論文名稱: Direct Preference Optimization: Your Language Model is Secretly a Reward Model —— DPO:你的語言模型,其實就是個獎勵模型 論文鏈接:https://arxiv.org/pdf/2305.18290 👉Lab4AI 鏈接: https://www.lab4ai.cn/paper/det

機器學習 , 神經網絡 , 教程 , 人工智能 , 深度學習

Lab4AI - 7M參數,幹翻巨無霸LLM!這款超小遞歸模型(TRM),在ARC-AGI上證明了“少即是多”

01 論文概述 論文標題:Less is More: Recursive Reasoning with Tiny Networks 作者團隊:三星AI實驗室(Samsung SAIL Montréal) 發佈時間:2025年9月6日 論文鏈接:https://arxiv.org/pdf/2510.04871 👉您可以跳轉到 Lab4AI 平台上去閲讀論文原文。 Lab4AI

機器學習 , 神經網絡 , 自然語言處理 , 人工智能 , 深度學習