NVIDIA 最近推出了一種新方法 —— ToolOrchestra,旨在提升 AI 系統選擇合適模型和工具的能力,避免傳統的單一大型模型依賴。該方法通過訓練一個名為 Orchestrator-8B 的小型語言模型,作為多工具使用代理的 “大腦”,實現更高效的任務處理。 目前大多數 AI 代理使用單一大型模型,例如 GPT-5,根據提示選擇工具並完成任務。然而,研究發現,這種方法容易導致模型在決
新聞 RSS 訂閱
美團 LongCat 團隊發佈數學推理評測基準:AMO-Bench
大模型的"推理能力"能讓機器具備與人類相似的認知和行為能力,能像人一樣理解、思考、學習並解決複雜問題。而在眾多推理能力評測場景中,數學推理任務是當前衡量和追蹤模型推理能力進展的 "黃金標尺"。與此同時,主流數學推理評測體系正面臨關鍵瓶頸:部分頂尖模型在常用的數學推理評測任務中,如 AIME24/25 的正確率已突破 90%,評測區分度大幅下降,難以再有效牽引模型向更高階推理能力進化;此外,現有基準
阿里通義發佈 Qwen3-VL 技術報告
阿里通義 Qwen 團隊在 arXiv 平台發佈了 Qwen3-VL 視覺語言模型的詳細技術報告,全面披露了其從架構設計到評估方法的完整技術細節。 該報告全面涵蓋了從預訓練到後訓練、從架構設計到基礎設施、從數據處理到評估方法的整個技術鏈路,旨在為視覺語言模型領域的研究者與開發者提供一份完整的技術參考。 https://arxiv.org/pdf/2511.21631 Qwen 團隊負責人林俊暘表
Linux 6.19 內核支持使用 Rust 編寫 I2C 驅動
Linux 內核在持續推進 Rust 支持。根據最新合併的補丁,Linux 6.19 將加入用於編寫 I2C 驅動的 Rust 基礎設施,這是繼 LED 等子系統之後,Rust 語言在驅動層的又一擴展。 最近幾周,內核的 driver-core-next 分支已經合併了一系列補丁,這些補丁引入了“Rust I2C 綁定 (bindings)”以及示例驅動 (sample drivers) ——
皮查伊:美國 AI 監管混亂 恐在全球競爭中落後
谷歌首席執行官桑達爾·皮查伊呼籲美國製定國家層面的人工智能(AI)監管法規,稱美國必須在AI監管方面“把握好平衡”,否則就有可能在AI競賽中落後於人。 皮查伊在接受採訪時指出,目前全美各州議會正在審議的AI相關法案超過1000項,這可能會導致法規混亂,使美國公司在全球競爭中處於不利地位。他認為,美國必須在鼓勵創新和建立監管框架之間找到平衡,這一點“在國家層面進行會更好”。 皮查伊還表示,政府和科技
Homebrew 5.0.0 發佈
Homebrew 5.0.0 版本已於日前發佈。與 4.6.0 版本相比,最重要的變化是默認啓用併發下載、正式支持 Linux ARM64/AArch64、制定了棄用 macOS Intel 的時間表以及移除 macOS Gatekeeper bypass 行為。 自 4.6.0 版本以來的主要變更和棄用: HOMEBREW_DOWNLOAD_CONCURRENCY=auto默認啓用。這將默認
AI 模型高壓測試:Gemini 2.5 Pro 失敗率從18.6% 飆升至 79%
最新研究對 Google、Meta、OpenAI 等 12 款主流模型進行5874個高壓場景測試,結果顯示:Gemini2.5Pro 失敗率從 18.6% 飆升至79%,GPT-4o 亦接近“腰斬”。 實驗腳本很簡單:把截止日期砍半、財務懲罰翻倍、計算資源縮減,再補一句“拖延將造成嚴重後果”。瞬間,模型紛紛“兵荒馬亂”—— 生物安全任務裏,Gemini2.5Pro 直接跳過毒株無害驗證步驟;
微軟為 Windows 11 記事本添加“流式響應”效果
微軟正在為 Windows 11 的記事本(Notepad)加入一系列新特性,讓這款傳統的輕量級文本工具變得更加“AI 化”。 最新版本中,記事本新增了 Copilot 的文本生成功能,並支持 Streaming Results(實時流式輸出) —— 當 AI 生成內容時,用户可以看到文本逐字出現,類似 ChatGPT 網頁端的呈現方式。 除了 AI,記事本還開始支持 表格(Tables)。用
Git Extensions v6.0.5 發佈,獨立的 Git 倉庫 UI 管理工具
Git Extensions 是一個用於管理 git 存儲庫的獨立 UI 工具。Git Extensions v6.0.5 現已發佈,更新亮點如下: 必需:.NET 9.0 Desktop Runtimev9.0.11 x64或更高版本 9.x 推薦版本:Git 2.51.0 或更高版本 兩項修復 已更新的翻譯(日語、韓語 100%;泰語、中文、法語、土耳其語、俄語 95%;其他語言低
英特爾擴充 Linux 內核團隊:再招兩名資深工程師
英特爾正在擴充其 Linux 上游工程師團隊,該公司近日公開招聘兩名“經驗豐富的 Linux 內核軟件工程師”,由 Intel 上游 Linux 內核工程總監 Kristen Accardi 發起。 兩個職位分別面向不同的技術方向:其中一個專注 Intel 平台在 Linux 上的系統軟件與驅動優化,另一個聚焦操作系統內核層的硬件支持與性能調優。對應薪酬區間約為 14.6 萬至 27.7 萬美元/
Kimi 推出基於 Google Nano Banana Pro 的 AI 幻燈片生成器
Kimi近日推出了一款基於Google Nano Banana Pro模型的全新幻燈片生成器,旨在徹底改變用户創建演示文稿的方式。為慶祝髮布,Kimi正提供48小時限時免費試用,用户無需付費即可體驗其核心功能。 本次試用期的焦點是突破性的功能——“Agentic Slides”。該功能由智能體(Agentic)驅動,能夠自動將PDF、圖片和各類文檔快速轉換為完整的演示文稿。用户可以在瀏覽器內直接
黃仁勳:要求員工儘可能利用 AI 工具完成各項任務
英偉達 CEO 黃仁勳在一次全體員工會議上,強調了 AI 在日常工作流程中的重要性,並要求員工儘可能利用 AI 工具完成各項任務。 會議上,黃仁勳在宣佈創紀錄的570億美元季度營收後,直言要將 AI 應用拓展到每一個可自動化的任務。他指出:“我希望所有能夠通過 AI 完成的任務都能實現自動化。” 此外,黃仁勳還對部分管理者不鼓勵員工依賴 AI 的現象表達了不滿。他詢問:“你們瘋了嗎?” 並強調,
階躍星辰發佈完全開源 GUI 智能體“GELab-Zero”:包含模型和基礎設施、可本地部署
階躍星辰宣佈推出首個完全開源 GUI 智能體,由兩個主要部分組成: 即插即用的完整推理工程基礎設施 可本地運行的4B GUI Agent 模型 GELab-Zero提供了類似開源 GUI Agent MCP 的一鍵啓動體驗,支持完全本地化部署,並將整個推理鏈路置於您的完全控制之下。具體能力包括: 輕量級本地推理:支持 4B 規模模型在消費級硬件上運行,兼顧低延遲與隱私。 一鍵任務啓
深入理解分佈式共識算法 Raft
“不可靠的網絡”、“不穩定的時鐘”和“節點的故障”都是在分佈式系統中常見的問題,在文章開始前,我們先來看一下:如果在分佈式系統中網絡不可靠會發生什麼樣的問題。 有以下 3 個服務構成的分佈式集羣,並在 server_1 中發生寫請求變更 A = 1,“正常情況下” server_1 將 A 值同步給 server_2 和 server_3,保證集羣的數據一致性: 但是如果在
微軟警告 IT 管理員不要在 Windows 上使用不受支持的 .NET 運行時
微軟近日面向 IT 管理員發佈提醒,強烈反對在 Windows 環境中繼續使用已停止支持的 .NET 運行時版本,認為這類組件可能帶來安全風險、穩定性問題以及合規隱患。 微軟同時將這一警告與此前逐步淘汰傳統組件(如將在 Windows Server 2025 中最後支持的 WINS 服務)放在同一背景下,強調清理“遺留技術”的必要性。 傳統 .NET Framework 曾是 Windows 的核
Linux 6.18 內核正式發佈,或成今年 LTS 版本
Linux 6.18 已正式推送至 kernel.org,作為今年壓軸的主線版本,它極有可能成為 2025 年的長期支持(LTS)內核。該版本在硬件支持、文件系統、驅動與底層機制等方面都有重要更新。 這次更新中,Apple Silicon 的適配進一步推進,M2 Pro / Max / Ultra 等平台的設備樹被上游合入。Intel 新平台(如 Wildcat Lake)也同步獲得支持。GPU
“deepseek”當選網易有道詞典 2025 年度詞彙
網易有道詞典發佈2025年度詞彙,deepseek 以 8672940 次年度搜索量成功當選。 據有道詞典負責人介紹,“deepseek”在詞典內部的搜索曲線呈現明顯的爆發式特徵,從年初因“低成本”突破算力封鎖起,幾乎每個重要進展都會帶動搜索量上漲。 “搜索數據顯示,‘deepseek’的關注者分佈在不同年齡與職業羣體,大學生羣體的參與尤為突出。”該負責人表示,“全年超過867萬次的搜索量,反映
上海 AI 實驗室發佈新一代裸眼 3D 顯示系統:書生·瞳真EyeReal
長期以來,在顯示技術領域存在着一個公認的物理瓶頸:裸眼3D顯示的大尺寸與超寬連續視角難以兼得。近日,上海AI實驗室聯合復旦大學等機構成功研發了新一代裸眼3D顯示系統書生·瞳真EyeReal,成功攻克這一難題。 通過AI深度學習算法進行實時計算,EyeReal將有限的顯示資源精確地傳遞至觀看者的雙眼,從而實現裸眼3D,並大幅提升觀看體驗。該技術完全兼容消費級液晶面板,無需複雜的光學元件或特製硬件,首
羅永浩官宣月底開“科技春晚”,將發佈細紅線科技 AI 軟件
12月1日,羅永浩在微博發表長文,預告“羅永浩的十字路口”之年度科技創新分享大會(2025)將於今年12月30日19時在上海召開,兩週後放票。按“科技春晚”的優良傳統,門票收入會全部用於公益。 在長文中,羅永浩解答了一些相關問題。他表示,給大家集中介紹一批令人印象深刻,但還沒徹底走進大眾視野的中國創新型科技產品。他還強調,科技創新分享大會不是“帶貨直播”,大會上將發佈細紅線科技內部開發的 AI
NixOS 25.11 “Xantusia” 正式發佈
NixOS 25.11 “Xantusia” 現已發佈。此版本將獲得為期七個月的錯誤修復和安全更新(直至 2026 年 6 月 30 日)。舊版本 25.05“Warbler”現已正式棄用,將於 2025 年 12 月 31 日之後停止維護並停止接收安全更新。 本次發佈的 Nixpkgs 版本: 新增 7002 個軟件包 已更新 25252 個現有軟件包 為了保持軟件包集的可維護性和安全性
Framework Computer 簽約贊助 LVFS/Fwupd 開發
Linux Vendor Firmware Service (LVFS) 已為超過 1.35 億 Linux 用户提供系統和設備固件更新下載,其也在一直致力於吸引更多硬件廠商貢獻工程資源或直接繳納年度會費作為贊助商。 一直以來,Red Hat 通過聘用首席開發人員 Richard Hughes 為 LVFS/Fwupd 的成功做出了最大貢獻,Linux 基金會自該項目納入其管理以來也一直為其提供支
歐盟達成全球首個全面 AI 法案協議
歐盟立法者近日在布魯塞爾達成了一項歷史性協議,推出全球首個全面的人工智能法案。這一開創性立法旨在根據人工智能系統的潛在風險和影響程度進行規範,為27個成員國建立一個統一的監管體系。該法案不僅促進創新,還旨在保護基本人權。 新法案將人工智能系統分為四類風險等級,從不可接受風險到最低風險。根據路透社的報道,被認定為 “不可接受風險” 的 AI 應用將被全面禁止。這包括政府的操控性社會評分系統,以及在公
微軟推進 Windows AI 代理計劃,風險與創新並存
微軟近期在官方文檔中透露,儘管 Windows 11 上的新一代 AI 代理存在潛在風險,但依然將其視為未來操作系統的重要組成部分。 這些 AI 代理被設計為能夠模擬人類的操作,包括點擊界面、操作應用和文件,以幫助用户完成多步任務。然而,微軟也警告用户,這些代理可能會出現 “幻覺” 現象,或者受到惡意提示的欺騙,甚至可能成為黑客攻擊的新入口。 自 2025 年 10 月起,微軟計劃將每一台 Wi
ChatGPT Android 測試版出現廣告功能代碼
據X用户Tibor表示,在最新ChatGPT安卓1.2025.329測試版中,開發者發現新增“ads feature”“search ad”“bazaar content”等字符串,暗示廣告功能已進入開發階段。 據內部人士透露,OpenAI正評估基於用户記憶或交互信息展示廣告的可行性。OpenAI應用首席執行官Fidji Simo近期在全員會議中表示,公司正在探索廣告如何為用户帶來價值。Sam