博客 RSS 訂閱

大模型玩家七七 - 大模型成本刺客退散!1/3算力跑出同等效果的秘訣

大模型成本刺客退散!1/3算力跑出同等效果的秘訣 破解算力成本難題,1/3 算力實現同等效果 大家好,我是七七!前陣子幫一個創業團隊做大模型落地諮詢,他們吐槽最狠的就是算力成本——微調一個7B模型,用雲GPU跑一次要花800塊,推理時高併發場景每月算力賬單超2萬,本來小團隊預算就緊,硬生生被算力拖慢了項目進度。 其實這是很多人和企業的共同痛點:做大模型微調與推理,要麼盲目堆硬件、拉滿參數,導致算

AI

收藏 評論

zdyz - 《ESP32-S3使用指南—IDF版 V1.6》第六十三章 運動偵測實驗

第六十三章 運動偵測實驗 1)實驗平台:正點原子DNESP32S3開發板 2)章節摘自【正點原子】ESP32-S3使用指南—IDF版 V1.6 3)購買鏈接:https://detail.tmall.com/item.htm?id=768499342659 4)全套實驗源碼+手冊+視頻下載地址:http://www.openedv.com/docs/boards/esp32/ATK-DNESP32

操作系統

收藏 評論

ApacheIoTDB - 技術創新 + 國產化標杆!天謀科技榮獲金猿大數據產業兩項大獎

昨日,第八屆金猿大數據產業發展論壇 —— 暨 AI Infra Data Agent 趨勢論壇於上海隆重召開,本屆金猿季評選的八大類重磅榜單亦同步揭曉。天謀科技憑藉在國產化領域的深耕與突破,榮登“2025 中國大數據產業年度國產化優秀代表廠商榜”;憑藉核心技術創新與國產化實踐成果,天謀科技與清華大學聯合研發的發明專利《一種基於數據文件的分佈式多副本高性能高可用方案》亦成功入選 “2025 中國大

數據庫

收藏 評論

gavin_l - 我們為什麼需要另一個“桌面助手”?

一、起點:從手動查找到一鍵問答 開發初期,我只是想解決自己的一個高頻痛點: 在寫代碼、看PDF、甚至答題時,經常需要複製一段文本 → 打開瀏覽器 → 打開AI對話頁 → 粘貼 → 等待回覆 → 再切回原窗口。 這個過程重複、低效,且打斷心流。 於是,第一個版本誕生了: 一個簡單的窗口程序,內置大模型調用,支持本地文檔加載。 它解決了基礎問答問題,但依然需要“主動打開軟件、切

AI

收藏 評論

iVictor - Redis 調優:必須關注的幾個參數

背景 在一台未經過任何調優的 Linux 服務器上部署 Redis,在 Redis 啓動過程中,可能會碰到以下警告信息。 1363410:M 15 Jan 2026 13:07:34.879# WARNING: The TCP backlog setting of 512 cannot be enforced because /proc/sys/net/

數據庫

收藏 評論

codechen8848 - 25K+ Star!一個開源的通用 SQL 客户端工具!

大家好,我是 Java陳序員。 對於每一位後端開發者、數據分析師、DBA 而言,日常工作中繞不開的就是與各類數據庫打交道,擁有一款功能強大的數據庫管理工具,可以大大地提高工作效率。 今天,給大家推薦一款開源的 SQL 客户端工具,幫助你更好的管理數據庫! 關注微信公眾號:【Java陳序員】,獲取開源項目分享、AI副業分享、超200本經典計算機電子書籍等。 項目介紹 Chat2DB —— 一個

後端

收藏 評論

躺柒 - 讀人本智能產品設計6原則06互動(上)

1.互動 1.1.親密無間且直覺化的交互體驗從此成為衡量人機互動的黃金準則 1.2.對於產品發明者來説,理解人與產品之間只能通過預先編程好的零散規則進行交流互動,這很重要 1.3.作為消費者和設計師,我們成長的環境都讓人理所當然地認為產品就是功能的集合 1.4.在設計產品的過程中最好是放棄這種想法,才能更全面地看待消費者、產品和周圍環境之間的溝通交流,以及由此形成的整體關係,並在此基礎上建立與之

AI

收藏 評論

sevencoding - InheritableThreadLocal,從入門到放棄

InheritableThreadLocal相比ThreadLocal多一個能力:在創建子線程Thread時,子線程Thread會自動繼承父線程的InheritableThreadLocal信息到子線程中,進而實現在在子線程獲取父線程的InheritableThreadLocal值的目的。 關於ThreadLocal詳細內容,可以看這篇文章:史上最全ThreadLocal 詳解 和 ThreadL

後端

收藏 評論

獨元殤 - 初學者掌握 claude code 的一些進階知識

目錄 1.發展史 2.斜槓命令 commands 3.skill 技能包 4.鈎子 HOOK 5. MCP 服務器 6.插件 plugins 7.子代理 SubAgents 8.項目記憶文件 CLAUDE.md 9.Plan模式 暫時的結語 很少有人真的喜歡天天學新東西,我一個 java 技術棧的朋友,説我們怎麼天天能學那麼多東西(針對於全

AI

收藏 評論

Coding茶水間 - 基於深度學習的PCB板元器件檢測系統演示與介紹(YOLOv12/v11/v8/v5模型+Pyqt5界面+訓練代碼+數據集)

視頻演示 基於深度學習的PCB板元器件檢測系統 1. 前言​ 大家好,歡迎來到 Coding 茶水間! 當前,在電子製造與 PCB 檢測領域,傳統人工目檢效率低、易漏檢,而現有自動化方案往往識別種類有限、適應性弱,難以滿足高精度、多目標的實時檢測需求。為此,今天我們帶來《基於 YOLO 算法的 PCB 板元器件檢測系統》,該系統支持對 22 種元器件(如電池、電容、電阻、晶體管等)進行高效識別,具

AI

收藏 評論

菩提樹下的楊過 - Agent設計模式學習(基於langchain4j實現)(7) - 監督者模式

書接上回,這次學習一種更高級的模式:監督者模式。職場上的牛馬們,大家回想一下,每次部門的OKR,是怎樣層層拆解最終落地的?是不是得有一個大佬(即:監督者),根據OKR先做拆解計劃(plan),然後把活兒派給各組去落地(action),中間還會時不時的review? 這個就叫做監督者模式。 仍然還是這個招聘的示例,我們定義1個監督者Agent 1 public interface HiringS

AI

收藏 評論

大模型玩家七七 - 微調 + RAG 組合方案:1+1>2 的大模型應用技巧

微調 + RAG 組合方案:1+1>2 的大模型應用技巧 微調 + RAG 互補發力,解鎖大模型 1+1>2 效果 大家好,我是七七!上個月幫一家連鎖藥店做智能客服項目,一開始踩了個大坑:只用微調,模型對最新的醫保政策一問三不知;只用RAG,模型又看不懂專業的醫學術語,回答總是驢唇不對馬嘴。後來我把微調與RAG結合起來,先用行業數據微調模型讓它“懂醫學”,再用RAG掛載實時醫保知識庫讓它“知政策

後端

收藏 評論

躺柒 - 讀人本智能產品設計6原則05表達(下)

1.物體的表達方式 1.1.隨着產品變得更具有互動性和內容驅動性,例如亞馬遜的Alexa或蘋果的Siri,語音交互成為多模態系統的必要組成部分 1.2.語音要素必須與燈光、非語音提示、動作等實體表達形式有機融合,構成統一的產品語義體系 2.燈光 2.1.一種可以改變產品整體外觀的動態材料 2.2.利用環境光線的微妙變化來表達時區的變化,這是通過編程的方式在進行着有意識或無意識的交流 2.3.開車

AI

收藏 評論

大模型玩家七七 - 大模型從“瞎聊”到“幹活”:指令微調核心邏輯全拆解

大模型從“瞎聊”到“幹活”:指令微調核心邏輯全拆解 指令微調破局,讓大模型從 “瞎聊” 變 “能幹” 大家好,我是七七!剛入門大模型時,我總被一個問題困擾:明明Llama 2、Qwen這些模型能聊天説地,可一讓它幹具體活就掉鏈子——讓它寫電商文案,通篇空話套話;讓它整理會議紀要,邏輯混亂漏重點;讓它做客服話術,答非所問不專業。 後來才明白,預訓練大模型就像“剛識字的小孩”,只會基礎的語言表達,卻

AI

收藏 評論

林恆 - 用户 Token 到底該存哪?

🧑‍💻 寫在開頭 點贊 + 收藏 === 學會🤣🤣🤣 面試官問:"用户 token 應該存在哪?" 很多人脱口而出:localStorage。 這個回答不能説錯,但遠稱不上好答案。 一個好答案,至少要説清三件事: 有哪些常見存儲方式,它們的優缺點是什麼 為什麼大部分團隊會從 localStorage 遷移到 HttpOnly Cookie 實

前端

收藏 評論

菩提樹下的楊過 - Agent設計模式學習(基於langchain4j實現)(6) - 組合複雜工作流

前面已經學習了 順序、循環、條件分支、並行 這4種基本的工作流編排方式,利用這些可以組合出各種複雜的邏輯。下面將前面招聘的整個流程串起來,做一個相對比較完整的工作流: 宏觀上,1-2-3是面向候選人的,4-5-6是面向公司招聘團隊的。 一、定義Agent 1.1CandidateWorkflow 1 public interface CandidateWorkflow { 2 @Ag

AI

收藏 評論

大模型玩家七七 - 企業大模型微調別亂花錢!從ROI看值不值(附測算工具)

企業大模型微調別亂花錢!從ROI看值不值(附測算工具) 企業微調避坑:以 ROI 為核心把控成本 大家好,我是七七!上個月幫朋友的電商公司做技術諮詢,他們老闆一拍腦袋要花20萬買GPU服務器,給大模型做微調,説“別人都調,我們也得跟上”。我幫他們算完賬發現:他們的客服對話任務用現成的Qwen 7B加提示詞就能達標,微調後轉化率提升不到2%,投入產出比直接倒掛,最後硬生生把項目攔了下來。 其實這是

AI

收藏 評論

wang_yb - 打破堆積困局:優化堆積條形圖的對比效果

在數據可視化中,堆積條形圖 擅長展示 “整體與構成” 的關係,但當每個柱子內的分段超過4個時,讀者很難同時追蹤各段的長度、位置與顏色映射, 誤讀概率顯著上升。 更糟的是,若不同類別的總量差異很大,堆積結構會放大視覺錯覺,導致“看起來差不多”的結論失真。 今天,本文將嘗試探索一下改進堆積條形圖的呈現方式,讓複雜數據對比變得一目瞭然。 如果大家有更好的方式,也歡迎指教,交流。完整的代碼會在文末提供共享

後端

收藏 評論

PetterLiu - 軟件工程Agent在工程依賴版本升級探索

背景與動機 現代軟件項目廣泛依賴開源庫以避免重複開發,但庫版本更新常引入破壞性變更,導致代碼兼容性問題。手動適配這些更新需消耗大量開發者時間,且大型代碼庫中開發者易忽視更新警告或鎖定舊版本,長期阻礙功能迭代、性能優化與安全修復。現有自動化方案未被廣泛採用,而 LLM 在代碼生成、程序修復等領域已展現潛力,因此本文提出一種基於 LLM Agents 的框架,用於自動化完成依賴升級並保障代碼兼容性

AI

收藏 評論

大模型玩家七七 - 5 分鐘搞懂開源大模型選型核心維度,16G顯卡也能選對

5 分鐘搞懂開源大模型選型核心維度,16G顯卡也能選對 快速拿捏開源大模型選型,關鍵維度一文説清 大家好,我是七七!剛入門大模型的時候,我踩過最蠢的坑就是“盲目跟風選模型”——當時看到朋友圈都在曬Llama 2 70B,腦子一熱就下載了,結果16G顯卡直接OOM(顯存溢出),折騰了整整一天,最後發現自己只是想做個簡單的中文情感分析,根本用不上70B模型。 後來跟身邊的技術大佬聊才明白:開源大模型

AI

收藏 評論

aqi00 - FFmpeg開發筆記(一百)國產的Android開源視頻壓縮工具VideoSlimmer

在Android平台上,國產的開源視頻剪輯框架也有很多了,參見之前的文章《國產的視頻裁剪框架AndroidVideoTrimmer》、《國產的Android開源視頻編輯器EpMedia》、《國產的開源視頻美顏工具VideoEditorForAndroid》、《國產的開源視頻剪輯工具AndroidVideoEditor》等等。那麼在Android系統上還有一款國產的開源視頻壓縮工具VideoSlim

移動端開發

收藏 評論

SomeBottle - 【小記】解決校園網中單播互通的不同子網間的 LocalSend 發現問題

各位好久不見~下半年又是忙論文又是忙項目的,實在是沒什麼時間更新筆記了。趁着今天有點空閒,咱來寫寫最近抽空解決的一個小網絡問題叭(゜ー゜)。 0. 問題背景 咱實驗室有一台連接着打印機的計算機,我們在這台機器上掛了一個專門註冊的 QQ 賬號,需要打印文件時把文件發送到這個 QQ 賬號上,在打印機計算機上下載下來就行了。 但是吧,像是比較機密文件的話,如果這樣過一道別人的服務器感覺不太好,正好咱當時

後端

收藏 評論

獨元殤 - 新手在國內,如何 10 分鐘快速用上 Claude Code !

目錄 1.首先是安裝! 2.配置代理 3.上聚合站搞 API 4.配置環境,自定義模型 API 5.選擇其他模型 6.終於看到主界面了 7.完成 首先,這個話題針對的大概率是 claude opus 4.5 模型 很難在國內被使用。這個很好解決,我肯定不會肉身在國內,冒險去花個幾百塊砸去 Anthropic

AI

收藏 評論

TwilightLemon - WPF 使用 HLSL + Clip 實現高亮歌詞光照效果

最近在搓一個Lyricify Lite類似物,原本使用漸變畫刷實現歌詞高亮,但是發現視覺效果與Apple Music相去甚遠:單純使用白色漸變畫刷缺乏“高亮”的光照感覺,而Apple Music的歌詞高亮則更像是有光線投射在歌詞上,形成一種柔和的發光效果。 受到呂毅大佬的文章使用 WPF 做一個可以逼真地照亮你桌面的高性能陽光 - walterlv啓發,遂嘗試使用HLSL編寫一個簡單的文本高亮着色

.net , 後端

收藏 評論