收藏 / 列表

fangpin - 深入解析:使用 Triton 實現 Flash Attention2 - 讓大模型訓練飛起來

引言 你是否曾經在訓練大型語言模型時,眼睜睜地看着 GPU 內存不斷飆升,最終因為 OOM(Out of Memory)錯誤而前功盡棄?或者在處理長序列時,發現注意力機制的計算時間呈平方級增長,讓人望而卻步? 如果你有過這樣的經歷,那麼今天這篇文章將為你帶來一個革命性的解決方案:Flash Attention2。更令人興奮的是,我們將通過 Triton 這個強大的 GPU 編程框

歸一化 , 人工智能 , 深度學習 , ide , Python

colddawn - DB where 字段 is null 會走索引嘛

1.對查詢進行優化,要儘量避免全表掃描,首先應考慮在 where 及 order by 涉及的列上建立索引。 2.應儘量避免在 where 子句中對字段進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如: select id from t where num is null 最好不要給數據庫留NULL,儘可能的使用NO

字段 , 大數據 , 存儲過程 , 數據倉庫 , bc

IvorySQL - 災難恢復工具內核細節探究與分享

本文整理自 IvorySQL 2025 生態大會暨 PostgreSQL 高峯論壇的演講分享,演講嘉賓:張晨,公眾號《ZhangChen-PDU》主理人。 前言 在數據庫運維中,災難恢復始終是保障業務連續性和系統可靠性的核心環節。隨着數據庫規模和複雜性的增加,傳統工具在極端場景下的侷限性愈發明顯,因此需要更專業、高效的解決方案來應對數據損壞或不可啓動的情況。 PDU 的快速介紹 在數據庫運維場景中

數據庫 , postgresql , 開源

HuiZhu - 寫週報還在手動湊字數?試試這個結構化提示詞模板

週報:開發者的代碼之外的另一場戰鬥 週五下午 5 點,代碼提交完了,測試也跑通了,本想着可以準點下班。突然想起來:週報還沒寫。 打開文檔,腦子裏的想法是這樣的: const weeklyReport = { tasks: ['修bug', '寫代碼', '開會', '對接需求'], hours: 40, result: '???' } 問題就在這個 result 上。工作做了一堆,但該

generative-ai , 教程 , chatgpt , 人工智能 , prompt

PoloAPI - Kimi K2 日調用量超100億 token,API 價格低於 Claude 系列模型

一、Kimi K2模型基本信息 Kimi K2是由北京月之暗面科技有限公司(Moonshot AI)於2025年7月11日發佈的開源大語言模型,具有以下核心特點: ‌架構創新‌:採用MoE(混合專家)架構,總參數規模達1萬億(1T),激活參數為320億(32B),包含384個專家模塊,每個token選擇8個專家進行計算 ‌性能表現‌:在SWE Bench Verified、Tau2、AceB

編程 , llm , 算法 , 人工智能 , 後端

一點人工一點智能 - 書籍-《正則表達式謎題與AI編碼助手》

書籍:Regular Expression Puzzles and AI Coding Assistants: 24 puzzles solved by the author, with and without assistance from Copilot, ChatGPT and more 作者:David Mertz 出版:Manning​ 編輯:陳萍萍的公主@一點

機器學習 , 人工智能 , 深度學習 , 正則表達式

Aloudata大應科技 - 如何找到心儀的 ChatBI 智能體?Aloudata Agent 推薦給你

在數智化轉型浪潮中,ChatBI 智能體憑藉自然語言交互能力,成為企業打破數據分析壁壘、實現數據民主化的關鍵工具。面對市場上眾多選擇,Aloudata Agent 以“NoETL 明細語義層+多 Agent 協同架構”脱穎而出,通過 NL2MQL2SQL(MQL:MetricQueryLanguage)技術路徑精準對齊業務語義與數據語言,解決了 NL2SQL 和 NL2DSL2SQL 傳統方案中存

chat , agent , etl , 人工智能 , 數據分析

未聞花名AI - 構建AI智能體:十四、從“計算”到“洞察”:AI大模型如何讓時間序列數據“開口説話”

一、我需要學習“時間序列”嗎 今天主題是“時間序列模型”,在開始之前我們先討論一下學習大模型需要了解時間序列嗎,首先要看我們的目標,學習大模型也必須也要有自己的目標。 應用型工程師: 如果想成為一名應用大模型的專業工程師,比如構建一個智能聊天客服機器人、開發一個文檔總結工具、創建一個代碼生成助手,那麼,不需要深入研究時間序列模型,此時你的核心技能應該是:

擬合 , yyds乾貨盤點 , 數據 , NLP , 人工智能 , 時間序列