收藏 / 列表

風雨中的小七 - 解密prompt系列63. Agent訓練方案:RStar2 & Early Experience etc

當大模型成為Agent,我們該如何教會它“行動”?純粹的模仿學習(SFT)天花板明顯,而強化學習(RL)又面臨獎勵稀疏、環境複雜、探索成本高的挑戰。本文將帶你深入四種前沿的Agent訓練方案:ReTool, RAGEN, RStar2, 和 Early Experience,看它們如何巧妙地設計環境、利用反饋,讓Agent不僅“能幹”,而且“聰明”。 我們將看到一條演進路線:從優化單一動作(ReT

AI

Paul Boag - The Big Difference Between Digital Product And Web Design

In the early days of the web, I remember how annoying it was when print designers would claim they could design websites, too. They assumed that just because they could design for one medium, they c

Web Design , User Experience , Design

雲棧開源日記 - 終端裏的 AI 編程助手:OpenCode 使用指南

寫代碼時遇到過這種情況嗎? 想問 AI 一個問題,得切到瀏覽器;讓 AI 改代碼,又要來回複製粘貼。編輯器、終端、瀏覽器反覆切換,思路早斷了。 OpenCode 解決的就是這個問題——直接在終端使用 AI 助手。 OpenCode 是什麼 OpenCode 是一個開源 AI 編碼工具,專為終端環境設計。裝好後在命令行裏直接和 AI 對話,讓它幫你寫代碼、找 Bug、做重構。 主要特點: 原

opensource

Lyndon Cerejo - Prompting Is A Design Act: How To Brief, Guide And Iterate With AI

In “A Week In The Life Of An AI-Augmented Designer”, we followed Kate’s weeklong journey of her first AI-augmented design sprint. She had three realizations through the process: AI isn’t a co-pi

workflow , ux , AI

努力的小雨 - 點我!1分錢獲取你的專屬表白網頁,浪漫由大模型代運營

轉眼之間,MCP 技術已在人工智能領域炙手可熱,持續走紅超過半年,堪稱當下最受關注的“新晉頂流”技術。從最初的地圖類應用,到後來層出不窮的新聞類、工具類 MCP 智能體,各類場景的探索不斷拓寬,相關產品可謂比比皆是。不過,令人欣喜的是,近期終於成功推出了與支付相關的 MCP 工具,標誌着無論是個人開發者還是企業機構,都能夠更加高效地實現商業化落地與盈利模式的構建。最近也注意到又有一家新的智能體平台

AI , mcp