tag 緩存

標籤
貢獻172
154
07:51 PM · Nov 03 ,2025

@緩存 / 博客 RSS 訂閱

短短同學 - 大模型的秘密:從三元一次方程組到KV Cache

大模型的秘密:從三元一次方程組到 KV Cache 當我們驚歎於大模型生成流暢文本、解答覆雜問題的能力時,其底層核心並非不可捉摸的 “黑魔法”,而是從基礎數學逐步構建的精密系統。從初中數學的三元一次方程組,到 Transformer 架構中的 KV Cache 優化,這條技術脈絡清晰展現了 “簡單原理→複雜擴展→效率突破” 的進化路徑。本文將拆解這一過程,揭開大模型高效運行

方程組 , 線性變換 , 緩存 , 人工智能 , 深度學習

收藏 評論

軟件求生 - 面試官最愛問:生產環境 Redis 怎麼部署?這套標準答案直接封神

大家好,我是你們的老朋友,小米,一個31歲還在禿頭邊緣瘋狂掙扎的 Java 打工人。 前幾天,我帶了一個剛準備社招跳槽的學弟,陪他去面試。他回來以後,一臉生無可戀地問我一句話: 師哥,面試官問我:“你們生產環境的 Redis 是怎麼部署的?” 我當時腦子直接宕機,只憋出一句:“我們用的是…阿里雲的…Redis。” 然後就沒然後了……

redis , yyds乾貨盤點 , 數據 , 緩存 , 數據庫

收藏 評論

京東雲開發者 - Redis緩存高可用集羣

作者:京東零售 王雷 1、Redis集羣方案比較 • 哨兵模式 在redis3.0以前的版本要實現集羣一般是藉助哨兵sentinel工具來監控master節點的狀態,如果master節點異常,則會做主從切換,將某一台slave作為master,哨兵的配置略微複雜,並且性能和高可用性等各方面表現一般。 特別是在主從切換的瞬間存在訪問瞬斷的情況,而且哨兵模式只有一個主節點對外提供服務,沒法支持很

redis , 緩存 , redis集羣 , 集羣

收藏 評論

IT智行領袖 - redis多賬號密碼

1、Redis緩存穿透,緩存擊穿,緩存雪崩原因+解決方案 緩存穿透:key對應的數據在數據源並不存在,每次針對此key的請求從緩存獲取不到,請求都會到數據源,從而可能壓垮數據源。比如用一個不存在的用户id獲取用户信息,不論緩存還是數據庫都沒有,若黑客利用此漏洞進行攻擊可能壓垮數據庫; 緩存擊穿:key對應的數據存在,

redis , redis多賬號密碼 , 客户端 , 緩存 , 數據庫

收藏 評論

LeanCloud - 內存屏障及其在-JVM 內的應用(上)

作者:LeanCloud 後端高級工程師 郭瑞 內容分享視頻版本: 內存屏障及其在-JVM-內的應用 MESI MESI 的詞條在這裏:MESI protocol - Wikipedia,它是一種緩存一致性維護協議。MESI 表示 Cache Line 的四種狀態,modified, exclusive, shared, invalid。 modified:CPU 擁有該 Cache Line

jvm , 緩存 , 內存屏障 , leancloud , cpu

收藏 評論

碼海探險家 - iptables snat 透傳源ip

ARP協議:IP地址是主機在網絡層中的地址。數據鏈路層是不能夠識別IP地址的,但網卡、交換機等都工作在數據鏈路層,所以如果想要將網絡層中的數據包交給目的主機,必須要在數據鏈路層封裝為有MAC地址的幀後才能發送。但是32bit的IP地址和48bit的MAC地址之間沒有簡單的映射關係。ARP協議就是將某個IP地址解析為對應的MAC地址的協議。 每個主機都設有一個ARP高速緩存,

雲計算 , ip , 地址映射 , 緩存 , iptables snat 透傳源ip , 雲原生

收藏 評論

數據分析大師 - CUDA學習筆記(一)

__ldg 功能:從 global memory 通過只讀緩存(read-only cache)加載數據。 template typename T __device__ __forceinline__ T __ldg(const T* ptr); 注意這並不是函數原型,但是你可以這麼理解,T並不是所有類型都能適配的。

API , 緩存 , 後端開發 , memory , 筆記 , CUDA , Python

收藏 評論

技術員阿偉 - 《LLM零開銷抽象與插件化擴展指南》

許多高層語言構建的LLM方案,雖能通過靈活封裝適配複雜架構,卻因抽象層的運行時開銷、硬件調用的中間損耗,導致實際推理效率大打折扣,尤其在高併發、資源受限場景下,這種損耗會被無限放大。而C++的核心價值,正體現在其“零開銷抽象”與“硬件級可控”的雙重特性上:它既能夠以接近彙編的底層效率直接操作CPU、內存、緩存等硬件資源,又能通過泛型編程、強類型系統構建靈活的抽象層,無需額外 ru

封裝 , yyds乾貨盤點 , 數據 , 緩存 , c++ , 後端開發 , c

收藏 評論

qq68d2318712d49 - 詳細介紹一下MyBatis的緩存機制

MyBatis 緩存機制詳解(一級緩存+二級緩存+自定義緩存) MyBatis 的緩存機制是其核心性能優化手段之一,目的是減少數據庫查詢次數,降低IO開銷,提升查詢效率。其設計遵循“分層緩存”理念,分為 一級緩存(SqlSession 級別) 和 二級緩存(Mapper 級別),同時支持集成第三方緩存(如 Redis)實現分佈式場景下的緩存共享。 一、緩存核心設計理念

二級緩存 , 緩存 , 後端開發 , SQL , Python

收藏 評論

軟件求生 - 別再死記八種策略了!Redis 淘汰機制其實超簡單!

有時候,技術面試就像一場心理戰。你以為面試官在聊 Redis 緩存?其實他在考你對“內存管理”的理解。今天,我就帶你用一個小故事,輕鬆搞懂 Redis 的內存淘汰策略,讓你在面試中胸有成竹、侃侃而談! 那場面試,讓我對“Redis 淘汰策略”徹底改觀 上個月,我去參加一家金融科技公司的社招面試。面試官是個看起來不苟言笑的大哥,問的第一個問題就挺硬核:

redis , yyds乾貨盤點 , 數據 , 緩存 , 數據庫

收藏 評論

gulaotou - 前端性能優化(一):準備工作 - 個人文章

Sandbox是一個開源的雲代碼編輯環境,提供AI驅動的智能代碼補全和實時協作功能。本文將深入探討Sandbox項目的性能優化策略,包括前端緩存機制、後端併發處理和資源管理技術,幫助開發者構建更高效的應用。 🚀 前端緩存優化策略 防抖函數實現智能緩存 在 frontend/lib/utils.ts 文件中,Sandbox實現了

文件操作 , 緩存 , 代碼補全 , Css , 前端開發 , HTML

收藏 評論

mob64ca13f937ae - spring boot框架學習11-spring boot整合redis - 凱哥java的個人頁面 -

簡言 在後端開發中,API接口是服務間通信的核心載體,而數據存儲與緩存策略則直接決定了接口的性能與穩定性。Spring框架憑藉其強大的生態成為API開發的首選,MySQL作為關係型數據庫提供了可靠的數據持久化支持。當系統併發量提升時,單一數據庫架構易出現性能瓶頸,此時引入Redis(分佈式緩存)與Caffeine(本地緩存)構建多級緩存體系,成為優化性能的關鍵方案。本文將從

redis , spring , 多級緩存 , 緩存 , JAVA , Css , 前端開發 , HTML

收藏 評論

liutao988 - ios 14 nskeyedarchiver無法正常存儲數據

Jetsam管理的一種crash機制,通過Signal無法捕捉到Jetsam,iOS不支持交換空間,無RAM和DISK之間的映射,這是因為移動端大多數設備均為閃存。 Jetsam crash日誌 {"bug_type":"298","timestamp":"2020-10-19 11:27:59.22 +0800","os_version":"i

移動開發 , 緩存 , XS , ios

收藏 評論

bingfeng - Haproxy+Nginx負載均衡實戰

在高併發互聯網系統中,負載均衡是保證服務高可用、均衡請求壓力和提高吞吐量的核心組件。Nginx和HAProxy作為主流負載均衡器,通過合理的調度策略、緩存優化、連接管理和監控配置,可以在高併發場景下保證系統穩定。本文從架構設計、負載均衡策略、高併發優化、緩存與加速、監控與告警、工程化部署及性能調優等方面分享實踐經驗。 一、負載均衡架構設計

emacs , 高併發 , 負載均衡 , 緩存 , 前端開發 , Javascript

收藏 評論

建木 - 「建木v2.7.0」緩存功能上線

新增功能 大家心心念念心心念唸的緩存功能終於上線了! 有了緩存之後能夠避免重複下載依賴,讓節點執行速度變快,下面以maven節點為例,給大家演示一下如何添加緩存 兩種方式都是兩步走:1、定義緩存 2、在節點中引用緩存並填寫緩存目錄 友情提示:緩存目錄很重要,寫不對你可能會發現一切白乾... 圖形化編排 DSL DSL具體使用方式可以參考文檔 第一次執行流程需要下載緩存,第二次節點執行速度就會

ci-cd , 持續集成 , maven , 緩存

收藏 評論

mob64ca13f96cda - 詳解JS模塊導入導出_javascript技巧

深入理解HarmonyOS ArkTS模塊導入導出規範 引言 隨着HarmonyOS的快速發展,ArkTS作為其官方應用開發語言,基於TypeScript並擴展了聲明式UI和狀態管理等特性,已成為構建分佈式應用的核心工具。在大型應用開發中,模塊化是確保代碼可維護性、可複用性和性能的關鍵。模塊導入導出規範不僅是語法層面的約定,更涉及工程架構、依

華為 , 導入導出 , 緩存 , 後端開發 , harmonyos , Python , ui

收藏 評論

墨香四溢 - Java如何搭建腳手架(自動生成通用代碼),創建自定義的archetype(項目模板)

目錄 封裝常用組件 Redis服務類 分佈式鎖服務類 二級緩存服務類 RabbitMQ服務類 JWT工具包 封裝常用組件 Redis服務類 核心設計 將 Redis 封裝到 fw-common 工程下的 fw-common-redis 模塊,提供可插拔使用模式 封裝 Redis 常用操作,提供對應方法

redis , 微服務 , 開發語言 , 緩存 , JAVA , Css , 前端開發 , HTML

收藏 評論

數據小探 - 大數據presto 併發性能

大數據和高併發的解決方案總結: 軟件剛開始的時候是為了實現功能,隨着信息量和用户的增多,大數據和高併發成了軟件設計必須考慮的問題,那麼大數據和高併發本質是什麼呢? 本質很簡單,一個是慢,一個是等。兩者是相互關聯的,因為慢,所以要等,因為等,所以慢,解決了慢,也就解決了等,解決了等,也就解決了慢。 關鍵是如何解決慢和等,核心一個是短,一個

服務器 , 雲計算 , 大數據presto 併發性能 , 緩存 , 數據庫 , 雲原生

收藏 評論

mb68e64068cf586 - uniapp開發鴻蒙:網絡請求與數據交互實戰

uniapp開發鴻蒙:網絡請求與數據交互實戰 引入:構建健壯的網絡層 在前幾篇文章中,我們學習了uniapp鴻蒙開發的環境配置、頁面佈局、狀態管理等核心知識。今天,我們將深入探討網絡請求與數據交互的完整方案,這是應用與後端服務通信的橋樑,也是保證應用穩定性和用户體驗的關鍵環節。 uniapp提供了uni.request作為網絡請求的基礎API,但直接使用會遇到代

封裝 , 移動開發 , 緩存 , 錯誤處理 , html5

收藏 評論

雲端夢想實現家 - SDWebImage小記

SDWebImage作為iOS開發中最流行的圖片加載庫之一,為開發者提供了強大的異步圖片下載和緩存功能。然而在實際使用過程中,開發者經常會遇到各種SDWebImage錯誤和調試問題。本文將為你詳細解析SDWebImage的常見錯誤類型、調試技巧和解決方案,幫助你快速定位並解決圖片加載問題。 🔍 SDWebImage錯誤類型全解析 SDWebImage定義了完

緩存 , 圖片加載 , Css , 解決方案 , 前端開發 , HTML

收藏 評論

Jimaks - PostgreSQL緩存機制與優化

PostgreSQL作為世界上最先進的開源關係型數據庫之一,擁有強大的緩存機制來提升查詢性能。理解並正確利用這些緩存機制,對於數據庫性能優化至關重要。 PostgreSQL緩存架構概述 PostgreSQL採用了多層次的緩存體系,主要包括共享緩衝區(Shared Buffers)、操作系統緩存和查詢計劃緩存。每一層都有其特定的作用和優化策略。 共享緩衝區(Shared Buf

數據 , MySQL , 緩存 , 數據庫 , postgresql

收藏 評論

數據庫知識分享者小北 - Hybrid Model Support:阿里雲 Tair 聯合 SGLang對 Mamba-Transformer 等混合架構模型的支持方案

導讀 接着上一節內容對KV Cache存儲方案的深入解讀,本文介紹了阿里雲 Tair KVCache 團隊與SGLang 社區在推理框架上的提效——支持混合架構模型的工程化實踐。 在大模型長文本與智能體化趨勢下,Transformer 面臨顯存與計算瓶頸,而高效的 Mamba 模型語義召回受限。混合架構通過結合兩者優勢應運而生,卻帶來系統級挑戰:Tran

tair , nosql , 狀態空間 , 阿里雲 , 緩存 , 數據庫 , 複用

收藏 評論

註銷 - SAP Hybris platform和Netweaver的緩存(Cache)設計機制

Hybris Cache (1 )The Hybris Cache is a part of the Hybris persistence layer. (2) It improves the performance of a single server node by reducing the amount of database queries. (3) It transparen

saprfc , cache-control , 緩存 , sap , abap

收藏 評論

數據俠客行 - 源碼 狀態機_LLVM學習筆記(1)--初探源碼_weixin

【Agent】MemOS 源碼筆記---(1)--基本概念 目錄 【Agent】MemOS 源碼筆記---(1)--基本概念 0x00 概要 0x01 背景 1.1 為什麼需要MemOS 1.2 MemOS 相關信息 1.3 MemOS能做些什麼 0x02 原理

初始化 , 加載 , 緩存 , Css , 前端開發 , HTML

收藏 評論