tag generative-ai

標籤
貢獻15
74
07:36 AM · Oct 30 ,2025

@generative-ai / 博客 RSS 訂閱

六邊形架構 - 別再選錯!5分鐘掌握AI Agent框架選型的方法

文 / 勇哥 原創文章,轉載請聯繫授權 在前一篇文章中,我們探討了《大模型應用開發技術路線(下):智能代理與多模態應用指南》。今天,讓我們深入剖析AI Agent開發框架——這個被稱為AI應用開發的"樂高積木"的標準化工具集。 作為長期從事技術應用開發的"老司機",我見證了太多團隊因為選擇錯了開發框架,導致項目週期延長、開發效率低下、系統穩定性差的痛點。在AI時代,如何選擇一個合適的A

generative-ai , 觀點 , llm , 知識 , 人工智能

收藏 評論

HuiZhu - 拒絕"自嗨式"產品設計:用AI生成專業調研問卷,專治各種"偽需求"

"我覺得用户會喜歡"——這是產品經理最昂貴的錯覺 你是否經歷過這樣的場景: 團隊熬了兩個通宵上線的新功能,滿心歡喜地盯着後台數據,結果點擊率寥寥無幾。 覆盤會上,大家面面相覷:“上線前我們不是問過幾個用户嗎?他們都説挺需要的啊。” 問題恰恰就出在這個“問”字上。 大多數非專業出身的產品經理或創業者,在做用户調研時容易陷入“誘導性提問”的陷阱: ❌ “如果我們上線這個功能,你會用嗎?”(用

generative-ai , chatgpt , 人工智能 , prompt , 用户體驗

收藏 評論

da_miao_zi - 氛圍編程Vibe Coding的梗圖

今年 2 月初,OpenAI 聯合創始人、前特斯拉 AI 負責人 Andrej Karpathy 於社交平台上提出了氛圍編程 Vibe Coding 這一概念。僅僅過了一個多月,這一術語就迅速席捲了開發者社區。 最近,Karpathy 又在社交媒體上分享了他的最新嘗試:“剛用‘氛圍編程’搞定了一個完整的 iOS 應用!雖然之前完全沒碰過 Swift,但也就 1 個多小時吧,這個 app 就已經能在

code , generative-ai , llm , 人工智能

收藏 評論

DM今天肝到幾點 - 我用24小時把一個瀕臨超時的任務救活【告急項目救命經驗】

寫在前面 當你正在深夜對着 IDE 狂敲代碼、看着日誌裏紅得發紫的 ERROR,卻忽然發現——速度、穩定性、成本,樣樣掣肘——別急,十分鐘後你可能會加入那個「不用為 API 報錯掉頭髮」的羣體。下面這篇實戰體驗,帶你看看我如何用 勝算雲 Router 把一個瀕臨超時的 AI 服務救活,並把本月賬單砍掉 80 %。 一、凌晨 1:42 —— 項目告急 那天凌晨,測試同事一連甩來三條 e

generative-ai , cursor , chatgpt , visual-studio , claude

收藏 評論

deephub - 構建有記憶的 AI Agent:SQLite 存儲 + 向量檢索完整方案示例

現在的 Agent 系統有個很明顯的問題 —— 會話一結束,什麼都忘了。 這不是個技術缺陷,但是卻限制了整個系統的能力邊界。Agent 可以做推理、規劃、執行復雜任務,但就是記不住之前發生過什麼。每次對話都像是第一次見面,這種狀態下很難説它真正"理解"了什麼。 記憶能力是把 LLM 從簡單的問答工具變成真正協作夥伴的關鍵。一個只能"回答當前問題",另一個能"基於歷史經驗做決策",這就是增加了記憶能

generative-ai , llm , 教程 , 人工智能

收藏 評論

HuiZhu - 30分鐘搞定媒體級新聞稿!我開源了這個"公關寫手"AI指令

哈嘍,各位思否的開發大佬們! 作為技術人,我們最擅長的是寫代碼、解決問題,但一提到"新聞稿",很多人就懵了。 "我們產品功能很強,為什麼媒體不報道?" "技術這麼牛,為什麼投資人聽不懂?" "明明很用心,為什麼傳播效果這麼差?" 這些問題,本質上都是內容表達能力的問題。 最近我整理了一套"新聞稿撰寫AI指令",把專業公關寫手的思維模式,用我們程序員最熟悉的"工程化思維"重新包裝了一下。

generative-ai , 教程 , chatgpt , 人工智能 , prompt

收藏 評論

HuiZhu - 技術人做活動策劃?這個AI指令幫你搞定專業方案

作為開發者或技術leader,你有沒有遇到過這種情況:老闆突然讓你負責技術沙龍、產品發佈會或者團隊建設活動,你對着PPT發呆半天,不知道從哪兒開始? 我之前也遇到過。明明寫代碼很溜,一到策劃活動就抓瞎——預算怎麼算?流程怎麼設計?風險怎麼控制?感覺每個環節都是坑。 技術人策劃活動的三大痛點 跟幾個做過活動的技術朋友聊過,大家的困擾出奇一致: 1. 不知道完整流程包含什麼 策劃案要寫哪些部分?

generative-ai , chatgpt , 人工智能 , 活動 , prompt

收藏 評論

deephub - 解決GRPO優勢歸因錯誤,Chunk-GRPO讓文生圖模型更懂"節奏"

文本到圖像(T2I)生成模型的發展速度超出很多人的預期。從SDXL到Midjourney,再到最近的FLUX.1,這些模型在短時間內就實現了從模糊抽象到逼真細膩的跨越。但問題也隨之而來——如何讓模型生成的不僅僅是"一張圖",而是"正確的那張圖"?這涉及到如何讓AI理解人類在審美、風格和構圖上的真實偏好。 強化學習(RL)成為解決這個問題的關鍵技術。通過將人類偏好分數作為獎勵信號,可以對這些大模型進

generative-ai , llm , 強化學習 , 知識 , 人工智能

收藏 評論

六邊形架構 - 大模型應用開發技術路線(下):智能代理與多模態應用開發指南

文 / 勇哥 原創文章,轉載請聯繫授權 關注公眾號「六邊形架構」,及時瞭解更多的技術分享和項目經驗 在前兩篇文章中,我們探討了《大模型應用開發技術路線(上):從概念到RAG實戰指南》和《大模型應用開發技術路線(中):大模型微調與定製實戰指南》。今天,讓我們繼續探索大模型應用開發的前沿技術路線——智能代理(Agent)開發和多模態應用開發。 作為一名在AI領域"衝浪"多年的技術老兵

generative-ai , llm , 人工智能 , 深度學習 , llama

收藏 評論

HuiZhu - 面對那坨5000行的"祖傳代碼",你是否也曾想過離職?

當你顫抖着雙手點開那個名為 OrderManager.java 的文件,滾動條彷彿深不見底的黑洞——5328行代碼,260個if-else嵌套,沒有任何註釋,上一次修改記錄是三年前離職的"大神"。 老闆讓你"加個小功能",你卻感覺像是在拆彈:剪斷紅線,可能是新增功能成功;剪斷藍線,整個生產環境可能瞬間崩塌。 這就是每個程序員的夢魘——"防禦性編程"變成了"不敢動編程"。 我們常説"代碼是寫給人看的

generative-ai , 設計模式 , 軟件架構 , 代碼重構 , prompt

收藏 評論

HuiZhu - 寫週報還在手動湊字數?試試這個結構化提示詞模板

週報:開發者的代碼之外的另一場戰鬥 週五下午 5 點,代碼提交完了,測試也跑通了,本想着可以準點下班。突然想起來:週報還沒寫。 打開文檔,腦子裏的想法是這樣的: const weeklyReport = { tasks: ['修bug', '寫代碼', '開會', '對接需求'], hours: 40, result: '???' } 問題就在這個 result 上。工作做了一堆,但該

generative-ai , 教程 , chatgpt , 人工智能 , prompt

收藏 評論

六邊形架構 - Java程序員該如何快速上手LLM應用開發呢?

文 / 勇哥 原創文章,轉載請聯繫授權 作為一名在Java領域摸爬滾打快20年的"老碼農",我經常聽到身邊的Java開發者發出這樣的感嘆:"大模型時代來了,我們Java開發者該何去何從?"、"Python在AI領域這麼火,我們要不要轉語言?" 今天,我想告訴大家的是:完全沒必要!作為Java開發者,你完全可以利用自己已有的技能棧,快速上手LLM應用開發。 在過去的一年裏,我嘗試了把多種

generative-ai , llm , 知識 , 人工智能 , 深度學習

收藏 評論

六邊形架構 - Spring AI,一個讓Spring應用輕鬆擁抱AI的統一框架

文 / 勇哥 原創文章,轉載請聯繫授權 在前一篇文章中,我們探討了《Java程序員該如何快速上手LLM應用開發呢?》。今天,讓我們聚焦Spring AI——這個被稱為"Spring開發者的AI賦能工具包"的框架,它為Java開發者打開了一扇通往AI世界的便捷之門。 作為一名在Java領域摸爬滾打快20年的"老碼農",我見過太多團隊在集成AI能力時遇到的痛點:開發語言不一致、重複造輪子、

generative-ai , llm , 人工智能 , springboot , JAVA

收藏 評論

deephub - 基於 LangGraph 的對話式 RAG 系統實現:多輪檢索與自適應查詢優化

RAG(Retrieval-Augmented Generation)在語言模型應用中已經相當成熟,但傳統實現往往只是簡單的"檢索-生成"流程。實際對話場景要複雜得多——用户的問題可能含糊不清,或者會頻繁追問,還經常提些不相關的內容。 這篇文章會展示怎麼用 LangGraph 構建一個具備實用價值的 RAG 系統,包括能夠處理後續追問、過濾無關請求、評估檢索結果的質量,同時保持完整的對話記憶。 傳

generative-ai , llm , 人工智能 , 深度學習 , langchain4j

收藏 評論

HuiZhu - 每週8小時耗在會議上,但73%的會議紀要根本沒人看

數據顯示,職場人平均每週花費8小時在各類會議上,但調研發現:73%的會議紀要在發出後根本沒人仔細讀,92%的行動項沒有被有效追蹤。 更尷尬的是,38%的職場人承認自己"從不寫會議紀要",原因不是懶,而是不知道該怎麼記錄才有用。 這就是會議紀要的真實現狀:會開了,時間花了,但價值沒沉澱下來。 會議紀要為什麼淪為"形式主義"? 真正的問題不是寫不寫,而是寫了沒人用。我見過太多這樣的紀要: 會議紀要 -

generative-ai , 教程 , chatgpt , 人工智能 , prompt

收藏 評論

HuiZhu - // TODO: 寫一封讓老闆秒回的郵件?試試這個AI提示詞模板

// 程序員寫郵件的日常 try { const email = writeEmail(); // 期望: 專業得體,重點突出 // 實際: 寫了刪,刪了寫,最後發出去像流水賬 } catch (error) { console.log("郵件焦慮綜合徵又犯了"); } 數據顯示,87%的程序員寫商務郵件需要30分鐘以上,其中63%的人會反覆修改超過3次。不是不會寫

generative-ai , 教程 , chatgpt , 人工智能 , prompt

收藏 評論

deephub - HaluMem:揭示當前AI記憶系統的系統性缺陷,系統失效率超50%

用過聊天機器人的人都遇到過這種情況:你剛説喜歡科幻小説,幾輪對話後它給你推薦言情小説。你告訴聊天機器人升職了,但是過會兒又他又問你職業。這種情況不只是健忘而是根本性的bug——AI不僅會丟上下文,還會憑空編造、記錯、甚至生成自相矛盾的內容。 這就是記憶幻覺(memory hallucination)。相比那些編造世界知識的"生成幻覺",記憶幻覺是更上游的問題。一旦AI的記憶庫被污染,後續所有的推理

generative-ai , llm , 知識 , 人工智能

收藏 評論

deephub - RAG系統的隨機失敗問題排查:LLM的非確定性與表格處理的工程實踐

RAG教程裏説的流程是:分塊、嵌入、向量搜索、生成答案。看起來非常簡單,按這個思路搭了一套系統,測試沒問題就上線了。但是結果出了怪事,經常會隨機的失敗。 輸入一樣,但是輸出卻不一樣,而且這不是偶發,是還有一定的規律,這是怎麼回事呢? 本文將介紹RAG在真實場景下為什麼會崩,底層到底有什麼坑,以及最後需要如何修改。 🚨 現象:測試結果飄忽不定 一套端到端的PDF處理管道,專門針對表格密集型文檔。比

generative-ai , llm , 人工智能 , 檢索系統

收藏 評論

龍智DevSecOps - Perforce《2025遊戲技術現狀報告》Part 2:生成式AI在汽車和製造、媒體和娛樂等行業的應用趨勢

Perforce《2025遊戲技術現狀報告》現已正式發佈,由JetBrains提供洞察支持。該報告基於對全球521位來自遊戲、媒體與娛樂、汽車與製造業等行業領袖及創作者的深入調研,全面揭示了遊戲引擎與生成式AI如何作為核心驅動力,從“實驗探索”邁向“業務必需”,並正在重新定義各行業的創新邊界。 龍智作為Perforce中國授權合作伙伴,將此重磅報告完整翻譯為中文,並將以系列文章的形式陸續發佈,旨在

generative-ai , 遊戲開發 , 人工智能

收藏 評論

GPUStack - GPUStack v2:推理加速釋放算力潛能,開源重塑大模型推理下半場

2025 年是大模型推理技術發展的關鍵之年。自年初 DeepSeek R1 發佈引發全民關注以來,推理框架加速需求暴漲,推理優化的戰場驟然升温。以 vLLM、SGLang、MindIE 為代表的高性能推理引擎,以及 FlashInfer、FlashAttention、ATB 等底層加速庫不斷突破性能瓶頸,相比年初,部分前沿框架的推理性能提升已達 3 到 4 倍以上。 隨着 Agent 應用的爆發和

generative-ai , llm , 容器 , 人工智能 , 深度學習

收藏 評論

百度智能雲一見 - 百度一見全新升級!多人協作SOP分析Agent守護乾飯人不Emo

11月13日,2025百度世界大會在北京舉辦。百度集團執行副總裁、百度智能雲事業羣總裁沈抖在會上重磅發佈“一見多人協作SOP分析Agent”!基於一見多模態大模型的時空定位能力,不僅能夠理解視頻中複雜的時間與空間關係,精準識別每一道菜品的完整工序,還能識別多人協同操作過程中的錯誤環節並及時提醒,有效應對門店多員工並行操作時易出錯的問題,真正實現從“看懂畫面”到“理解過程”的跨越。 你是否也經歷過這

generative-ai , 人工智能 , 百度

收藏 評論

Robin - 2023 re:Invent 用 Amazon Q 打造你的知識庫

前言 隨着 ChatGPT 的問世,我們迎來了許多創新和變革的機會。一年一度的亞馬遜雲科技大會 re:Invent 也帶來了許多前言的技術,其中 AWS CEO Adam Selipsky 在 2023 re:Invent 大會中介紹 Amazon Q 讓我印象深刻,這預示着生成式 AI 的又一里程碑。 在本文中,我們將探討 Amazon Q 是什麼以及它能為我們做些什麼。我們還將詳細介紹如何使用

亞馬遜雲科技 , generative-ai , 2023reinvent , challenge

收藏 評論

老IT人 - 超全測試:32GB專業顯卡 vs 最強消費級顯卡

​近期 ComfyUI 社區小夥伴們用RTX 5000 Ada專業顯卡測試了Flux.1[dev]模型,並與最強消費級顯卡對比大場景實際應用中的性能表現。 測試項目: Flux.1文生圖 Flux.1-dev FP8訓練 Flux.1生成不同分辨率圖片 Flux.1生成人物大模型+Lora+高清分辨率修復 Flux.1測試ControlNet 使用 Tile 高清修復 文生圖 設置尺

generative-ai , 顯卡 , flux , 人工智能

收藏 評論

HuiZhu - 別再給數據庫堆硬件了,你的SQL可能只是在"磨洋工"

有些開發者信奉一種"暴力美學":查詢慢?加索引!還慢?加內存!再慢?換固態! 這種"氪金變強"的思維,往往掩蓋了真正的技術貧瘠。 在雲原生時代,每一次低效的全表掃描,每一毫秒的CPU空轉,燃燒的不僅是服務器資源,更是實實在在的美元賬單。很多時候,你引以為傲的"複雜業務邏輯",在數據庫看來,不過是一堆甚至連執行計劃都無法命中的垃圾代碼。 今天,我們要打破"性能優化=玄學"的刻板印象。不需要你背誦幾百

generative-ai , 數據庫 , chatgpt , SQL , prompt

收藏 評論