收藏 / 列表

MIAOYUN - MIAOYUN | 每週AI新鮮事兒(10.17-10.24)

本週AI領域動態頻出,百度、阿里、DeepSeek推出高效OCR與視覺語言模型,提升文檔解析與多模態能力;騰訊、字節跳動分別開源世界模型與3D生成模型,推動3D內容生成;Anthropic、OpenAI、Google升級AI工具,聚焦生命科學、瀏覽器集成與開發體驗;華為鴻蒙6、宇樹機器人H2及多項評測基準發佈,推動AI向終端與實體場景加速落地,一起來回顧本週發生的AI新鮮事兒吧! AI 大模型 百

機器學習 , 機器人 , 自然語言處理 , 人工智能 , 深度學習

容智信息 - 智能體最佳實踐的方法論(五):擴展規劃

當您的企業在某個業務場景中,藉由智能體實現了效率的跨越式提升——比如財務自動化讓人力成本直降30%,智能客服讓客户滿意度飆升25%……您是否會思考:如何讓這“單點的光芒”照亮全業務版圖?如何讓智能體從“部門級工具”進化為“企業級智能基建”?這正是智能體擴展規劃的核心價值——它是企業智能轉型從“試水”到“深耕”的關鍵橋樑,是讓智能體價值從“短期紅利”升級為“長期生態優勢”的操盤密碼。接下來,

資訊 , 機器人 , 自然語言處理 , 人工智能

老IT人 - DGX Spark 雙機互連實測 Qwen3-235B 模型

前段時間我們使用單台 DGX Spark 測試了gpt-oss-120b模型性能。今天,我們通過一根 200 Gbps 帶寬的 QSFP 線纜連接兩台 DGX Spark,並測試了一個參數更大的模型:Qwen3-235B,看看性能如何。 整體測試下來,單用户生成速度為10 tokens/s,但預填充速度還不錯,單用户可達1000 tps,詳細測試數據如下: 生成速度 知識庫應用(輸入4K) 知

機器學習 , 教程 , 知識 , 人工智能 , 深度學習

farfarcheng - 邁入大模型時代的深度學習:使用 Flash Attention 技術讓 Transformer 起飛

Transformer 是 ChatGPT 等大語言模型的核心技術之一,而注意力機制是其的關鍵部分。但是,標準的注意力實現具有二次時間和內存複雜度,使其在長序列任務上變慢並消耗大量顯存。這限制了 Transformer 能夠建模的上下文長度,同時使得大尺度模型的訓練和推理時間延長。 FlashAttention: Fast and Memory-Efficient Exact Attention

機器學習 , Flash , 人工智能 , transformer , 深度學習

瀾極美顏SDK - 2025 年直播美顏 SDK 技術:AI 驅動下的磨皮算法功能革新

在直播行業 “顏值經濟” 的競爭中,磨皮作為美顏功能的核心基礎,始終面臨 “自然度” 與 “實時性” 的平衡難題。早期算法依賴簡單模糊處理,常導致 “假面感”“細節丟失” 等問題;2023 年的 AI 磨皮雖實現初步優化,但在複雜光線、動態場景下仍顯不足。進入 2025 年,隨着深度學習與計算機視覺技術的深度融合,直播美顏 SDK 中的磨皮算法迎來質的飛躍 ——AI 不再

自適應 , 終端設備 , 人工智能 , 深度學習 , 模態

巨浪888 - 用AI讓藏品説話項目開發筆記

你去過博物館嗎?站在玻璃展櫃前,看着千年前的陶俑、青銅器,除了旁邊的簡介牌,你對它的前世今生一無所知。文物不會説話,但我們能用AI讓它“活”一次。全國有近6千家博物館,但九成以上缺乏沉浸式導覽能力。AR導覽設備租金昂貴,NFT數字藏品門檻高、手續費勸退。於是我想做一個APP產品,不用額外硬件,不用耗流量,手機 Web/APP 拍張文物照,或喊一句 “這是哪裏”,30 秒就能生成

AIGC二三事 , 3d , 人工智能 , 深度學習 , 4D , Web

OpenBayes - OpenBayes 教程上新丨Qwen-Image 刷新圖像編輯 SOTA,實現精準中文渲染

近期,阿里通義千問團隊開源首個圖像生成基礎模型 Qwen-Image, 參數量達 20B,採用全新 MMDiT 架構,刷新了圖像生成模型 SOTA。 Qwen-Image 專注於提升 AI 在兩大核心場景的能力:複雜的文本渲染與精準的圖像編輯。 無論是海報上的標語、PPT 裏的長段落文字,還是古籍中的詩詞意境,Qwen-Image 都能憑藉卓越的中英文渲染能力精準呈現,字形、排版、語義俱佳。在多

阿里巴巴 , 通義千問 , 開源 , 生成圖片 , 圖像

KlipC小助手 - 數據缺失與美聯儲官員“潑冷水”,12月降息預期驟降!

KlipC報道:當地時間11月13日,美股市場再度遭遇重挫。截至收盤,道指跌幅為1.65%,納指下挫2.29%,標普跌1.66%,大型科技股普遍走低,拋售情緒持續升温。 科技股估值過高的擔憂情緒進一步發酵,引發科技股大幅拋售。有經濟學家指出,市場正在對AI板塊進行“健康但痛苦”的修正,同時出現從超配科技向標配防禦資產的板塊輪動跡象。 此外,華爾街分析師表示,“市場關注點正從政府停擺結束迅

數據 , 人工智能 , 深度學習 , 估值

郭傳志的博客 - 多模態智能體

項目介紹 需求數據拆解 數據收集智能體 研究員智能體 本文包含:-->

多模態智能體 , 人工智能 , 深度學習

沉着的牙膏 - 智能識別與持續合規:構建運行平穩的API風險監測體系

(提示:在數字化浪潮下,API風險監測系統正成為企業實現穩定運營與合規治理的關鍵基石。) 概要:隨着數字經濟的持續發展,數據已經成為企業最重要的生產要素之一,而API(應用程序接口)作為數據流通的“高速通道”,支撐着業務系統間的交互與協同。從銀行轉賬、在線購物到智慧政務,幾乎所有數字化服務都離不開API的參與。與此同時,接口暴露面急劇擴大,安全威脅也隨之增加。API漏洞被利用導致的數據泄露、

深度學習

Lab4AI - 7M參數,幹翻巨無霸LLM!這款超小遞歸模型(TRM),在ARC-AGI上證明了“少即是多”

01 論文概述 論文標題:Less is More: Recursive Reasoning with Tiny Networks 作者團隊:三星AI實驗室(Samsung SAIL Montréal) 發佈時間:2025年9月6日 論文鏈接:https://arxiv.org/pdf/2510.04871 👉您可以跳轉到 Lab4AI 平台上去閲讀論文原文。 Lab4AI

機器學習 , 神經網絡 , 自然語言處理 , 人工智能 , 深度學習

Fabarta - AI賦能生物醫藥,楓清科技連續中標頭部醫藥公司產業智能升級項目

在全球醫藥科技加速迭代、產業競爭日趨激烈的背景下,國家以政策為引領、以人工智能技術為核心驅動力、以全產業鏈協同為關鍵路徑,完善“AI +醫藥”系統性發展佈局。其中,《醫藥工業數智化轉型實施方案(2025—2030年)》進一步明確全鏈條轉型路徑,將AI技術定位為突破產業瓶頸、提升醫藥工業核心競爭力的核心抓手,為行業智能化升級提供清晰方向。 楓清科技緊扣“AI賦能醫藥產業全鏈條”核心目標,圍繞

人工智能

思考的袋鼠 - 構建數據庫安全新範式:以規範為基石,實現精確與實時動態防護

概要: (提示:當防護邊界逐漸模糊,數據自身的“行為軌跡”成為新的安全焦點。) 在數字經濟的核心結構中,數據庫不再僅是支撐業務的技術組件,而是企業數字資產的“原礦”。金融機構的交易流水、互聯網平台的用户畫像、醫療系統的病歷檔案——所有這些關乎隱私、業務與監管的數據,都以數據庫為載體在組織內流轉與沉澱。但隨着數據量與訪問頻率呈指數級增長,傳統以“靜態防護”為核心的數據庫

數據 , 數據庫 , 數據庫安全 , 人工智能 , 深度學習

架構師李哲 - 大模型微調「數據集構建」保姆級教程(超全)

經驗之談:實踐表明,近80%的大模型微調失敗案例,根源都可追溯至數據集問題。 2024年堪稱“行業大模型元年”,金融、醫療、教育等各行各業都在積極佈局專屬AI助手。然而,許多企業在投入重金進行模型微調後,卻常常面臨“模型表現不及預期”的困境。 實踐中常見的三大困境: ● 災難性遺忘:模型在學習了新的專業知識後,原有的通用對話與理解能力顯著衰退。 ● 泛化能

數據 , AI , 大模型微調 , aigc , 人工智能 , 深度學習

全棧技術開發者 - 怎麼提高自己的系統設計和架構理論水平?如何理解並控制複雜性?如何推演複雜性影響?如何在多節點、多狀態、多併發條件下保持系統穩定?

軟件系統在現代社會中的規模和複雜度正在以前所未有的速度增長。隨着系統功能的擴展、分佈式組件的增加以及併發操作的普及,傳統依靠經驗和模塊化思維進行設計的方法逐漸顯得力不從心。當系統的行為不再能夠通過單一模塊或局部邏輯進行解釋時,架構理論的重要性便凸顯出來。架構不僅僅是組件的排列與接口的定義,它更是一種對系統整體行為進行預測、推演和約束的認知模型。 在系統設計中,設計者面對的不

系統設計 , 耦合度 , yyds乾貨盤點 , 架構 , 依賴關係 , 後端開發

JavaEdge - 你的JAR包放對了嗎?​​後端開發必知的Linux目錄規範

本文已收錄在Github,關注我,緊跟本系列專欄文章,咱們下篇再續! 🚀 魔都架構師 | 全網30W技術追隨者 🔧 大廠分佈式系統/數據中台實戰專家 🏆 主導交易系統百萬級流量調優 車聯網平台架構 🧠 AIGC應用開發先行者 | 區塊鏈落地實踐者 🌍 以技術驅動創新,我們的征途是改變世界! 👉 實戰乾貨:編程嚴

yyds乾貨盤點 , 文件系統 , jar , 應用程序 , 人工智能 , 深度學習

fangpin - 從 1.56% 到 62.9%:SFT 推理微調優化實戰

讀完這篇文章,你將用監督微調(SFT)把一個 1.5B 規模的數學模型在 GSM8K 上的零樣本推理正確率從 1.56% → 62.9%,同時把輸出格式遵循率從 18.9% → 100%。我們將完整走通數據集下載、Prompt 架構、訓練配置和評估方法,所有代碼均來自本倉庫 alignment 文件夾,保證可復現與透明。 本文將深入剖析 llm-from-scratch

lua , 人工智能 , 深度學習 , Json , Python

HyperAI超神經 - 在線教程丨目標檢測邁入「全局感知」時代:清華大學等發佈 YOLOv13,實現速度、精度雙突破

在自動駕駛、工業質檢、安防監控等需要「毫秒級反應」的應用場景中,實時目標檢測始終是一條極具挑戰的技術賽道。過去十年裏,YOLO 系列憑藉輕量高效的架構成為該領域的主流方案,從最初的 YOLO 到近年的 YOLOv11、YOLOv12,模型不斷在速度與精度之間尋找新的平衡點。 不過,即便進化多次,YOLO 系列的底層機制依舊面臨共同瓶頸: 要麼像卷積那樣只能在固定感受野內做局部聚合,要

卷積神經網絡 , 人工智能 , 計算機視覺 , 實時目標檢測

註銷 - 微信小程序開發系列 (三) :微信小程序如何響應用户點擊事件和微信平台 API 的使用方法介紹

筆者由於工作需要,曾經參加過一個微信小程序同 SAP 系統集成的項目,因此從零開始學習了微信小程序的開發知識。這裏通過系列文章把自己所學分享出來,希望對相關學習者有所幫助。 本教程前面兩篇文章: 微信小程序開發系列 (一) :開發環境搭建和微信小程序的視圖設計與開發 微信小程序開發系列 (二) :微信小程序的單步調試和控制器實現步驟概述 通過本教程前面兩篇文章的介紹,大家對微信小程序的視圖

微信 , 微信小程序 , 微信開發 , 微信公眾平台 , Javascript

水冗水孚 - 使用nodejs的express框架實現大文件上傳的功能,附完整前後端github代碼

問題描述 兩年前,筆者寫過一篇文章 《面試官桀桀一笑:你沒做過大文件上傳功能?那你回去等通知吧!》 當時,後端是用java語言寫的 本篇文章,就是講解一下,後端的nodejs如何實現大文件上傳 後端使用node的express框架寫 完整代碼在github上:https://github.com/shuirongshuifu/bigfile 在看本篇文章之前,建議看一下之前的筆者的大

express , node.js , Javascript