博客 / 列表

風雨中的小七 - 解密Prompt系列67. 智能體的經濟學:從架構選型到工具預算

導讀:2025年是智能體爆發的一年。然而,隨着模型能力的提升,工業界開始反思:盲目增加智能體、盲目增加工具調用次數真的能“大力出奇跡”嗎?本文串聯了兩篇Google論文,從宏觀的架構選擇到微觀的工具預算感知,探討如何科學地構建高效的Agent系統。 Part 1. 宏觀選型:多智能體的科學定律 Towards a Science of Scaling Agent Systems 最

AI

風雨中的小七 - 解密Prompt系列66. 視覺Token爆炸→DeepSeek-OCR光學壓縮

藉着 DeepSeek-OCR這篇論文,本章我們來回顧下多模態大模型(VLM)的核心技術演進。 很多人認為:圖像Token的信息密度和效率遠不如文本。但 DeepSeek-OCR的核心價值,就是用實踐證明了這是一個偽命題。它通過一套巧妙的串行視覺壓縮架構,實現1個視覺Token近乎無損地承載10個文本Token的驚人效率。 下面我們沿着 \(O(N^2)\) 危機 \(\rightarrow\)

AI

風雨中的小七 - 解密Prompt系列65. 三巨頭關於大模型內景的硬核論文

這一章我們不談應用,而是通過三巨頭 Google、OpenAI、Anthropic 三篇充滿腦洞的論文,深入探討模型內部狀態的可訪問性與可操控性。我們將從三個維度展開: 模型是否有自我認知? 如何引導這種認知? 如何從數學和電路層面解釋這種認知? Google:In-Context Learning 本質上是隱式梯度更新 📄 Google:# Learning without

AI

風雨中的小七 - 解密Prompt系列64. Anthropic Skils的延伸思考

💡 文章摘要 Anthropic SKILLS 看着只是一堆提示詞和腳本,但其精妙在於“大道至簡”。本文將深入解構 SKILLS 的三層分層加載架構,探討它如何解決傳統 Agent 上下文膨脹、領域任務成功率低的核心痛點。我們將通過一個完整流程展示 SKILLS 如何工作,並延伸思考它對現有 MCP、工作流和多智能體範式帶來的衝擊與重構可能。同時,我們也會探討 SKILLS 在工程實踐中面臨的挑

AI

風雨中的小七 - 解密prompt系列58. MCP - 工具演變 & MCP基礎

作為結構化推理的堅定支持者,我一度對MCP感到困惑:Agent和工具調用的概念早已普及,為何還需要MCP這樣的額外設計呢?本文就來深入探討MCP,看看它究竟解決了什麼問題。 我們將分幾章解析MCP:本章理清基礎概念和邏輯,後面我們直接以一個Agent為例演示全MCP接入的實現方案。 工具調用方式的演進 大模型調用工具的概念從ChatGPT亮相後就被提出,其表達形式經歷了三個階段演變: 1.

AI , mcp

風雨中的小七 - 解密prompt系列63. Agent訓練方案:RStar2 & Early Experience etc

當大模型成為Agent,我們該如何教會它“行動”?純粹的模仿學習(SFT)天花板明顯,而強化學習(RL)又面臨獎勵稀疏、環境複雜、探索成本高的挑戰。本文將帶你深入四種前沿的Agent訓練方案:ReTool, RAGEN, RStar2, 和 Early Experience,看它們如何巧妙地設計環境、利用反饋,讓Agent不僅“能幹”,而且“聰明”。 我們將看到一條演進路線:從優化單一動作(ReT

AI