收藏 / 列表

風雨中的小七 - 解密prompt系列63. Agent訓練方案:RStar2 & Early Experience etc

當大模型成為Agent,我們該如何教會它“行動”?純粹的模仿學習(SFT)天花板明顯,而強化學習(RL)又面臨獎勵稀疏、環境複雜、探索成本高的挑戰。本文將帶你深入四種前沿的Agent訓練方案:ReTool, RAGEN, RStar2, 和 Early Experience,看它們如何巧妙地設計環境、利用反饋,讓Agent不僅“能幹”,而且“聰明”。 我們將看到一條演進路線:從優化單一動作(ReT

AI

Paul Boag - AI In UX: Achieve More With Less

I have made a lot of mistakes with AI over the past couple of years. I have wasted hours trying to get it to do things it simply cannot do. I have fed it terrible prompts and received terrible outpu

workflow , ux , AI

雲棧開源日記 - Zig 完成編譯器自舉,內存佔用降 70%

Zig 完成編譯器自舉,內存佔用降 70%。通過數據導向設計、編譯期計算和零開銷 C 互操作,為後端高性能場景提供 C/C++ 的現代化替代方案。適合微服務網關、數據庫驅動等延遲敏感場景,支持漸進式遷移。 一個編譯器如何給自己"動手術"? 去年 12 月,Zig 項目完成了一件聽起來有點"遞歸"的事:用 C++ 寫的編譯器,編譯出用 Zig 重寫的新版本,然後徹底拋棄了 C++ 代碼庫。這個

後端

Lyndon Cerejo - From Prompt To Partner: Designing Your Custom AI Assistant

In “A Week In The Life Of An AI-Augmented Designer”, Kate stumbled her way through an AI-augmented sprint (coffee was chugged, mistakes were made). In “Prompting Is A Design Act”, we introduced WIRE

workflow , ux , AI , Design

努力的小雨 - 點我!1分錢獲取你的專屬表白網頁,浪漫由大模型代運營

轉眼之間,MCP 技術已在人工智能領域炙手可熱,持續走紅超過半年,堪稱當下最受關注的“新晉頂流”技術。從最初的地圖類應用,到後來層出不窮的新聞類、工具類 MCP 智能體,各類場景的探索不斷拓寬,相關產品可謂比比皆是。不過,令人欣喜的是,近期終於成功推出了與支付相關的 MCP 工具,標誌着無論是個人開發者還是企業機構,都能夠更加高效地實現商業化落地與盈利模式的構建。最近也注意到又有一家新的智能體平台

AI , mcp