收藏 / 列表

風雨中的小七 - 解密prompt系列63. Agent訓練方案:RStar2 & Early Experience etc

當大模型成為Agent,我們該如何教會它“行動”?純粹的模仿學習(SFT)天花板明顯,而強化學習(RL)又面臨獎勵稀疏、環境複雜、探索成本高的挑戰。本文將帶你深入四種前沿的Agent訓練方案:ReTool, RAGEN, RStar2, 和 Early Experience,看它們如何巧妙地設計環境、利用反饋,讓Agent不僅“能幹”,而且“聰明”。 我們將看到一條演進路線:從優化單一動作(ReT

AI

Paul Boag - Turning User Research Into Real Organizational Change

This article has been kindly supported by our dear friends at Lyssna who help teams listen to and understand their audience. Thank you! We’ve all been there: you pour your heart and soul in

User Research , ux , Design

雲棧開源日記 - Strix:用AI做滲透測試,把安全漏洞扼殺在開發階段

你的應用真的安全嗎?傳統安全掃描工具給你一堆"可能存在的漏洞",但哪些是真的? Strix是一個開源的AI安全測試工具,它不只是掃描代碼找問題,而是像真正的黑客一樣——運行你的程序、嘗試攻擊、驗證漏洞是否真實存在。這個項目最近在GitHub上獲得了3.1k星標,核心亮點是把原本需要幾周的人工滲透測試壓縮到幾小時完成。 解決什麼問題 做過安全測試的人都知道這些痛點: 找安全公司做滲透測試,一次

企業信息化

Lyndon Cerejo - A Week In The Life Of An AI-Augmented Designer

Artificial Intelligence isn’t new, but in November 2022, something changed. The launch of ChatGPT brought AI out of the background and into everyday life. Suddenly, interacting with a machine didn’t

workflow , ux , AI

努力的小雨 - 我一個寫Java的,怎麼就開始玩K8s和Jenkins了?!

前幾天接到一個新任務,要求把以前部署在私有服務器上的項目,全都搬到雲端去部署。之前的發佈流程其實挺簡單的,都是在本地打包好,然後通過文件傳輸把打好的jar包或者前端編譯好的文件夾,直接替換到服務器上。挺傳統也挺直接的。 但這次不一樣了,老闆希望上線流程能更自動化,得用Jenkins實現一鍵部署,減少人工操作,省時省力。説實話,對於我這開發來説,哪幹過這活啊。都是已經做好的流水線直接用就行了,奈何人

kubernetes