動態

@gogoSandy

解密prompt系列63. Agent訓練方案:RStar2 & Early Experience etc

當大模型成為Agent,我們該如何教會它“行動”?純粹的模仿學習(SFT)天花板明顯,而強化學習(RL)又面臨獎勵稀疏、環境複雜、探索成本高的挑戰。本文將帶你深入四種前沿的Agent訓練方案:ReTool, RAGEN, RStar2, 和 Early Experience,看它們如何巧妙地設計環境、利用反饋,讓Agent不僅“能幹”,而且“聰明”。 我們將看到一條演進路線:從優化單一動作(ReT

gogoSandy 頭像

@gogoSandy

昵稱 風雨中的小七

@Goblinscholar

吳恩達深度學習課程二: 改善深層神經網絡 第一週:深度學習的實踐(六)梯度現象和梯度檢驗

此分類用於記錄吳恩達深度學習課程的學習筆記。 課程相關信息鏈接如下: 原課程視頻鏈接:[雙語字幕]吳恩達深度學習deeplearning.ai github課程資料,含課件與筆記:吳恩達深度學習教學資料 課程配套練習(中英)與答案:吳恩達深度學習課後習題與答案 本篇為第二課第一週的內容,1.10到1.14的內容,也是本週理論部分的最後一篇。 本週為第二課的第一週內容,就像課題名稱

Goblinscholar 頭像

@Goblinscholar

昵稱 哥布林學者

@yunpan-plus

DeepCode:把論文和想法變成代碼的 AI 工具

看論文時,你是不是也遇到過這種情況? 明明算法思路看懂了,但要自己從零實現,光是搭環境、調參數就要折騰大半天。或者腦子裏突然冒出個網站創意,想快速驗證一下可行性,卻被前後端開發的工作量勸退了。 最近發現香港大學開源的 DeepCode 項目,專門解決這類問題——用 AI 自動把想法轉成能跑的代碼。 這個工具能做什麼 DeepCode 是一個基於大語言模型的編碼工具,主要功能是把"人的想法"自動轉

yunpan-plus 頭像

@yunpan-plus

昵稱 雲棧開源日記

@lying7

讀浪潮將至06技術浪潮特徵

1.技術浪潮 1.1.俄烏衝突仍是一個里程碑式的事件,因為它凸顯了訓練相對不足的戰鬥力量如何利用消費市場上相對廉價的技術來進行快速組建和武裝 1.2.當技術能夠帶來如此顯著的成本和戰術優勢時,它的擴散與廣泛採用無疑將成為必然趨勢 2.固有特徵 2.1.技術的高度非對稱性影響 2.1.1.新技術會使得那些看似強大的勢力暴露出以前難以想象到的弱點和破綻 2.2.技術發展迅猛,呈現出一種超級進化

lying7 頭像

@lying7

昵稱 躺柒

@ludangxin

2. AI 輸出內容導出Word!docx4j+poi-tl 實現Markdown轉Word全流程

1.簡介 我們在上一章介紹瞭如果想實現將markdown內容轉換為word的話, 如果想要轉換後的word內容排版好看的話, 就需要將其轉換過程分為兩步 markdown→html html→ooxml(Office Open XML) word內容,word元信息本身就是個xml) 上一章節我們使用flexmark將markdown內容轉換為html內容, 完成了第一步, 本章節我們將介

ludangxin 頭像

@ludangxin

昵稱 張鐵牛

@daibitx

Microsoft Agent Framework 接入DeepSeek的優雅姿勢

一、前言 ​ Microsoft Agent Framework 框架發佈也有一陣子了,在觀望(摸魚)過後,也是果斷(在老闆的威脅下)將幾個AI應用微服務完成了從Semantic Kernel 框架到Microsoft Agent Framework 框架中的遷移工作。 所以這篇文章,我想記錄一下在開發過程中的我總結的一下工程化用法。 二、Agent Framework是什麼 簡單來講,Micro

daibitx 頭像

@daibitx

昵稱 daibitx

@lying7

讀浪潮將至07驅動力

1.驅動力 1.1.技術持續進步的主要推動力來自那些原始的、與人性緊密相關的因素 1.1.1.不論是為了滿足好奇心、應對危機,還是追求財富、逃避恐懼,技術發展的核心始終在於服務人性的需求 1.1.2.只要人們有足夠的動力去研發和應用技術,技術便會應運而生,並得到推廣應用 1.2.迄今為止,沒有任何技術浪潮被真正遏制住 1.3.事實上,技術領域的較量一直以來都是地緣政治

lying7 頭像

@lying7

昵稱 躺柒

@Goblinscholar

吳恩達深度學習課程二: 改善深層神經網絡 第一週:深度學習的實踐 課後作業和代碼實踐

此分類用於記錄吳恩達深度學習課程的學習筆記。 課程相關信息鏈接如下: 原課程視頻鏈接:[雙語字幕]吳恩達深度學習deeplearning.ai github課程資料,含課件與筆記:吳恩達深度學習教學資料 課程配套練習(中英)與答案:吳恩達深度學習課後習題與答案 本篇為第二課第一週的課程習題和代碼實踐部分筆記。 1. 理論習題 【中英】【吳恩達課後測驗】Course 2 - 改善深

Goblinscholar 頭像

@Goblinscholar

昵稱 哥布林學者

@ai-hpc-trivia

使用vLLM實測3090和4090的大模型推理性能

之前使用Ollama基於順序調用的場景比較了3090和4090的顯卡性能: Ollama大模型推理場景下3090和4090性能實測 同時,又基於3090顯卡比較了Ollama和vLLM在順序調用和多併發推理場景下的性能差異: Ollama和vLLM大模型推理性能對比實測 這裏再使用vLLM測試下大模型併發推理場景下3090和4090兩張顯卡的性能表現,看下4090是否在高併發場景下具備

ai-hpc-trivia 頭像

@ai-hpc-trivia

昵稱 AI算力小知識

@geeklab

React Props指南:從基礎到高階應用的最佳實踐解析

在 React 中,Props(屬性)是組件間通信和數據傳遞的核心機制。通過合理使用 Props,開發者可以構建動態、可複用且易於維護的組件體系。本文將深入探討 Props 的核心概念、使用方法及最佳實踐,幫助開發者全面掌握這一重要特性。 一、Props 的核心概念與作用 定義與特性 Props 是 "Properties" 的縮寫,代表傳遞給組件的只讀數據塊,其核心特性包括:

geeklab 頭像

@geeklab

昵稱 科韻小棧

@huangmingji

跨平台桌面應用開發:解鎖 Electron 與 shadcn/ui 的潛力

本文部分內容使用豆包AI進行撰寫和潤色 在當今數字化轉型加速推進的時代,桌面應用程序作為各行各業的關鍵支撐,持續發揮着不可替代的作用。從醫療領域專業精準的影像診斷軟件,助力醫生快速洞察病情、制定治療方案;到建築設計行業複雜且功能強大的建模工具,將設計師腦海中的藍圖完美轉化為虛擬模型;再到電商運營不可或缺的店鋪管理軟件,高效處理訂單、庫存等海量數據,桌面應用憑藉其對本地資源的深度掌控、卓越的性

huangmingji 頭像

@huangmingji

昵稱 黃明基

@refanbanzhang

給線條類型的svg圖標加上繪製的動畫效果

效果展示 步驟分解 1 確認svg文件有路徑數據 2 獲取path的長度 3 定義繪製線條的長度 4 定義關鍵幀動畫 5 應用關鍵幀動畫 實操 1 確認svg文件有路徑數據 path標籤裏面的d屬性,就是路徑數據 template svg fill="none" xmlns="http://www.w3.org/2000/svg" width="260" hei

refanbanzhang 頭像

@refanbanzhang

昵稱 熱飯班長

@yayujs

Svelte 最新中文文檔教程(22)—— Svelte 5 遷移指南

前言 Svelte,一個語法簡潔、入門容易,面向未來的前端框架。 從 Svelte 誕生之初,就備受開發者的喜愛,根據統計,從 2019 年到 2024 年,連續 6 年一直是開發者最感興趣的前端框架 No.1: Svelte 以其獨特的編譯時優化機制著稱,具有輕量級、高性能、易上手等特性,非常適合構建輕量級 Web 項目。 為了幫助大家學習 Svelte,我同時搭建了 Svelte 最新的中文

yayujs 頭像

@yayujs

昵稱 yayujs

@abc-x

Visual Studio Code(VS Code)常用插件彙總

vscode是微軟開發的代碼編輯器,因其輕量、跨平台、多語言支持性而廣受歡迎。vscode本身的定位只是一個代碼編輯器(editor),卻能實現傳統ide(集成開發環境,integrated development environment )一樣實現一站式開發,支持多語言的代碼提示、編譯、調試等重要功能。正是因為有強大的插件系統和豐富的插件社區,vscode才能提供如此優秀的代碼編寫體驗。本文將為

abc-x 頭像

@abc-x

昵稱 消逝的風i

@lovecola

【筆記】React 國際化

React 國際化 前言 僅管市面上存在多款流行的國際化解決方案,但是筆者個人精力有限在此只記錄工作學習中遇到的解決方案(持續更新) react-i18next 方案 1. 安裝 pnpm install react-i18next i18next --save 2. 創建文件 在 src 目錄下新建 locales ,並創建 en-US.json 、zh-CN.json 和 resources

lovecola 頭像

@lovecola

昵稱 世界盡頭守望的勇者

@yayujs

SvelteKit 最新中文文檔教程(6)—— 狀態管理

前言 Svelte,一個語法簡潔、入門容易,面向未來的前端框架。 從 Svelte 誕生之初,就備受開發者的喜愛,根據統計,從 2019 年到 2024 年,連續 6 年一直是開發者最感興趣的前端框架 No.1: Svelte 以其獨特的編譯時優化機制著稱,具有輕量級、高性能、易上手等特性,非常適合構建輕量級 Web 項目。 為了幫助大家學習 Svelte,我同時搭建了 Svelte 最新的中文

yayujs 頭像

@yayujs

昵稱 yayujs

@yayujs

SvelteKit 最新中文文檔教程(7)—— 構建和部署

前言 Svelte,一個語法簡潔、入門容易,面向未來的前端框架。 從 Svelte 誕生之初,就備受開發者的喜愛,根據統計,從 2019 年到 2024 年,連續 6 年一直是開發者最感興趣的前端框架 No.1: Svelte 以其獨特的編譯時優化機制著稱,具有輕量級、高性能、易上手等特性,非常適合構建輕量級 Web 項目。 為了幫助大家學習 Svelte,我同時搭建了 Svelte 最新的中文

yayujs 頭像

@yayujs

昵稱 yayujs

@aser1989

前端藝術實踐:用Storybook構建交互式組件文檔

對於前端來説,組件話已經從熱門話題變成了基礎能力,自定義組件或自建組件庫已是再常見不過的事了。在實際工作中組件庫的文檔直接決定開發體驗和效率,文檔建設的重要性不言而喻。今天要推薦的工具叫Storybook,為此我特地通過用99元買的服務器搭了一套CI/CD系統部署了一套Demo,歡迎點擊體驗:Demo (首次加載速度尤為感人,請耐心等待。僅用於效果演示,希望大家別被這潦草的Demo迷惑)。組件庫的

aser1989 頭像

@aser1989

昵稱 ASER_1989

@codechen8848

開源免費!一個在線的數據庫實體關係繪圖工具!

大家好,我是 Java陳序員。 之前,給大家介紹過一款基於實體連接圖的數據庫設計工具。 可視化!一款基於實體連接圖的數據庫設計工具! 今天,給大家介紹一個同款的在線數據庫實體關係繪圖工具。 關注微信公眾號:【Java陳序員】,獲取開源項目分享、AI副業分享、超200本經典計算機電子書籍等。 項目介紹 drawDB —— 一個開源免費的在線數據庫圖表編輯器,通過鼠標拖拽可視化設計數據庫,並支持

codechen8848 頭像

@codechen8848

昵稱 codechen8848

@codechen8848

一體化白板!一款開源的白板工具!

在日常工作中,我們常常需要使用到白板工具,用於作圖,生成思維導圖、流程圖等來輔助工作。 今天,給大家介紹一款開源的白板工具,支持多種類型圖! 關注微信公眾號:【Java陳序員】,獲取開源項目分享、AI副業分享、超200本經典計算機電子書籍等。 項目介紹 drawnix —— 一款開源的、基於 React 實現的白板工具(SaaS),實現一體化白板功能,包含自由畫、思維導圖、流程圖等。 功能

codechen8848 頭像

@codechen8848

昵稱 codechen8848

@codechen8848

絕了!一款簡潔優雅的高性能個人博客系統!

大家好,我是 Java陳序員。 作為一名程序員,你是否會想搭建個人技術博客,卻被各種技術配置搞得頭大?用靜態博客系統要手動部署,用動態系統又擔心速度太慢,找圖牀、配評論、做統計還要東拼西湊各種工具? 今天,給大家介紹一款簡潔優雅的高性能個人博客系統,開箱即用! 關注微信公眾號:【Java陳序員】,獲取開源項目分享、AI副業分享、超200本經典計算機電子書籍等。 項目介紹 VanBlog ——

codechen8848 頭像

@codechen8848

昵稱 codechen8848

@software-Development

DHTMLX重磅發佈React Scheduler組件,強勢賦能日程管理開發!

React開發者們的呼聲,DHTMLX團隊聽到了!繼DHTMLX React Gantt圖表廣受歡迎後,DHTMLX再次帶來全新力作 ——DHTMLX React Scheduler正式發佈! 該組件將成熟穩定的JavaScript Scheduler功能完美移植到React生態,為現代Web開發提供強大的日程排程能力,極大地提升項目開發效率與界面體驗。本文將帶您快速瞭解其核心能力與典型用法,助力

software-Development 頭像

@software-Development

昵稱 IT開發者筆記

@dtux

釦子 Coze 產品體驗功能

我們是袋鼠雲數棧 UED 團隊,致力於打造優秀的一站式數據中台產品。我們始終保持工匠精神,探索前端道路,為社區積累並傳播經驗價值。 本文作者:長路 認識釦子 相關鏈接 官方文檔:什麼是釦子 https://www.coze.cn/open/docs/guides/welcome 學習資源:https://www.coze.cn/open/docs/guides/learning_res

dtux 頭像

@dtux

昵稱 袋鼠雲數棧前端