字節跳動 Seed 團隊推出新一代形式化數學推理專用模型 Seed Prover 1.5,通過大規模的 Agentic RL 訓練,其推理能力和推理效率取得顯著進步。相比上一代模型,Seed Prover 1.5 在 16.5 小時內,針對 IMO 2025 的前 5 道題目生成了完整可編譯驗證的 Lean 證明代碼,換算成績為 35/42,達到此前 IMO 評分標準的金牌分數線。 更系統的評估中
新聞 RSS 訂閱
LibreOffice 26.2 不再使用 “Community Edition(社區版)” 品牌名
在即將發佈的 LibreOffice 26.2 中,官方決定不再使用“Community Edition”名稱來稱呼標準版本。 之前 LibreOffice 曾試圖用 “Personal Edition(個人版)” 命名,但因用户混淆而被否定,後來改為“Community Edition”。“Community Edition” 本意是和商業/企業版本做區分,但這個命名同樣造成理解問題,因此董事
OpenAI 啓用 AI 模擬黑客攻擊
OpenAI 開發了一套“自動化攻擊者”系統,通過模擬真實黑客的攻擊手段,對 ChatGPT Atlas 進行全天候的壓力測試。 這套系統的核心在於對抗提示注入(Prompt Injection)攻擊。在這種攻擊中,惡意第三方會悄悄向 AI 代理髮送指令,誘導其執行違背用户意願的操作,例如在用户不知情的情況下轉發敏感郵件或刪除雲端文件。 OpenAI 的“自動化攻擊者”利用了先進的強化學習技術,
面壁智能完成數億元融資
面壁智能宣佈,已於近期完成數億元融資。本次融資由京國瑞、國科投資、中金保時捷基金、米聚資本與和基投資共同參與,募集資金將主要用於加大端側高效大模型的研發投入,加速端側AI的商業化進程。 公告稱,面壁智能順利完成本輪融資,得益於端側智能市場空間進一步打開,更有賴於投資方對面壁的技術實力、市場地位及行業前景的充分認可。作為國內在端側智能領域佈局最早的大模型廠商,面壁構建起完善的理論體系與模型產品譜系
2025 知乎 AI 產品榜年度榜單公佈
知乎正式發佈“年度 AI 產品榜單”。 “基於大家貢獻的深度內容、真實互動與熱度反饋,經過系統化的加權計算與多輪篩選,這份融合了廣大用户心聲與專業視角的 2025 年度 AI 產品榜單終於出爐。它既是一份來自社區的集體實測報告,也希望能為你接下來的選擇,提供一份可靠的參考。” 在“知友年度愛用”榜單中,字節跳動旗下的豆包榮登榜首,其次分別是 DeepSeek、Gemini與通義千問。 知乎自
Jan 團隊發佈 Jan-v2-VL,專為長週期執行任務設計的多模態模型
Jan團隊發佈了Jan-v2-VL-Max,一個30B多模態模型,專為長週期執行任務設計。模型基於Qwen3-VL-30B-A3B-Thinking,並採用LoRA-based RLVR技術提升穩定性並減少多步執行中的誤差累積。 據介紹,該模型在“幻象遞減回報”基準測試中超越Gemini 2.5 Pro和DeepSeek R1,衡量了執行長度,被設計用於Agent自動化與UI控制等涉及多步穩定執
LLM 擴展方式的三年演進之路:複雜之後,迴歸簡單
編者按: 在當前 LLM 能力日益增強、擴展方式不斷演進的背景下,我們是否正在走向一種“越複雜越強大”的技術路徑?抑或,真正的突破恰恰源於迴歸簡單與通用? 今天我們為大家帶來的文章指出,儘管過去三年間出現了從插件、上下文協議、記憶功能等多種擴展機制,但最終的趨勢很可能是:賦予智能體通用的計算能力,並相信它能自主完成複雜任務,而非依賴過度設計的專用工具。 文章系統梳理了過去三年 LLM 擴展
LoongArch64 已成為 Debian 官方支持架構
Debian 項目宣佈:在進入 Debian Ports 兩年多之後,LoongArch 64-bit 架構(簡稱 loong64)正式成為 Debian 的官方架構之一,將包含在即將發佈的 Debian 14 “Forky” 版本中。 官方支持有助於加強軟件兼容性,提升 Debian 在 LoongArch 平台上的可用性和成熟度。這對國產架構生態是利好,尤其是在硬件和開源軟件協同發展的背景下,
Elasticsearch 9.2.3 發佈
Elasticsearch 是一個基於 Lucene 庫的搜索引擎。它提供了一個分佈式、支持多租户的全文搜索引擎,具有 HTTP Web 接口和無模式 JSON 文檔。Elasticsearch 基於 Java 開發,並在 SSPL + Elastic License 雙重授權許可下作為開源軟件發佈。 Elasticsearch 9.2.3 現已發佈,更新內容包括: Features and en
Qwen-Image-Edit-2511 開源發佈,一致性再提升
阿里通義Qwen團隊宣佈推出Qwen-Image-Edit-2511,稱相比於Qwen-Image-Edit-2509,新版本進行了包括一致性提升在內的多項增強。 如需體驗最新模型,訪問Qwen Chat並選擇“圖像編輯”功能。注意,線上版本有一定優化加速,如果要獲取模型最佳效果,可以去ModelScope本地部署以獲取最佳性能。 Qwen-Image-Edit-2511的主要特性包括:
智譜團隊預告即將發佈自研 IDE:Zcode
近日,智譜團隊在 r/LocalLLaMA 舉行了 AMA 問答,回答了關於模型迭代與開發生態等問題。在關於模型迭代的提問中,針對社區關於是否會有 GLM-4.8 或 GLM-4.9 版本的詢問,智譜團隊表示,版本號的命名取決於模型性能的進展。只有當模型性能有足夠顯著的改進時,才會將其命名為 GLM-5。 此外,團隊成員透露,公司內部正在開發一款名為 Zcode 的 IDE,並表示該 IDE 即
Lima v2.0 發佈,為安全 AI 工作流帶來新特性
Lima 項目團隊發佈了 Lima 的第二個重大版本。在此版本中,團隊將項目重點擴展到 AI 領域,同時繼續支持容器。 Lima(Linux Machines)是一個命令行工具,用於啓動本地 Linux 虛擬機,主要用於在筆記本上運行容器。該項目始於 2021 年 5 月,目標是向 Mac 用户推廣 containerd 和 nerdctl(contaiNERD CTL)。 v2.0 更新內容 插
Qwen3-TTS 全面升級: 音色設計與音色克隆
Qwen3-TTS家族新推出兩款模型,音色創造模型Qwen3-TTS-VD-Flash(可通過Qwen API訪問)和音色克隆模型Qwen3-TTS-VC-Flash(可通過Qwen API訪問)。 主要特點: 音色創造:Qwen3-TTS-VD-Flash 支持複雜自然語言指令輸入,實現對音色、韻律、情感、人設等的精細化調控,實現從“説什麼”到“如何説”的全面掌控,可以讓用户自由的定義
普利策得主領銜起訴六大 AI 巨頭
由兩屆普利策獎得主約翰·卡雷魯(John Carreyrou)領銜,數十位知名作家近日向美國加州北區地方法院提起集體訴訟,將OpenAI、谷歌、Meta、Anthropic、xAI與Perplexity AI六大AI公司列為共同被告,指控其系統性地使用盜版書籍訓練大模型,構成“故意版權侵權”。 若罪名成立,每部作品最高可索賠15萬美元,總賠償或達數十億乃至上百億美元。訴狀揭露,被告公司形成了一條清
Windows 11 畫圖工具迎來全新 AI 功能
Windows 11自帶的畫圖應用近日迎來了一系列實用更新,其中包括工具欄的自動隱藏功能,以及全新的AI功能。隨着畫圖工具的“現代化”界面更新,其頂部的工具欄體積也隨之增大,佔據了不少的屏幕空間。 為此,新版本加入了一個切換開關,用户現在可以設置自動隱藏工具欄,僅在需要調整畫筆大小、顏色或切換工具時呼出。 這不僅節省了屏幕空間,還能讓用户更專注於畫布,尤其是在進行精細編輯、縮放或最後潤色時。
Ant Design 6.0 嚐鮮:上手現代化組件開發
一、引言 組件體驗的革新 在前端開發領域,Ant Design 一直是企業級 React 應用的首選 UI 庫之一。隨着 Ant Design 6.0 的發佈,我們又見證了一次聚焦於組件功能與用户體驗的革新。本次更新不僅引入了多個全新組件,更對現有核心組件進行了功能性增強,使開發者能夠以更少的代碼實現更豐富的交互效果。 二、Masonry 瀑布流組件:智能動態佈局 傳統網格佈局在處理高度不一的元素
Meta 計劃在 2026 上半年發佈全新圖像視頻模型與文本模型
Meta 正在加緊推進下一代人工智能技術的研發,計劃於 2026 年上半年發佈一款全新的 圖像和視頻生成 AI 模型,代號為 “Mango”。這款模型目標是提升 Meta 在視覺生成 AI 領域的競爭力,對抗 Google、OpenAI 等行業對手。 與此同時,Meta 還在開發另一款內部稱為 “Avocado” 的 文本大型語言模型,重點增強編程與推理等語言能力。公司內部透露,這兩款新模型均由新
Cursor 收購 AI 代碼協作平台 Graphite
AI代碼協作平台Graphite近日宣佈已與Cursor簽署最終協議,正式加入後者。 交易預計在未來數週內完成,Graphite全體團隊將併入Cursor。 根據Graphite官方公告,交易完成後,Graphite將繼續作為獨立產品運營,並獲得更強資源支持。雙方將整合優勢,打造覆蓋代碼創建、審查與合併的端到端AI開發平台。 Graphite聯合創始人兼CEO Merrill Lutsky表示,
Anthropic 開源官方 Agent Skills 知識庫
Anthropic在GitHub上開源了官方的Agent Skills知識庫anthropics/skills,為Claude模型的技能系統提供了示範性技能與最佳實踐。該資源庫包含16個公開示例技能,覆蓋文檔處理、創意設計、開發技術、企業溝通等多個領域。 https://github.com/anthropics/skills 其中文檔處理技能(如docx、pdf處理)已在Claude的生產應用
馬斯克 xAI 旗下 AI 遊戲工作室開始招募人才
馬斯克在社交平台宣佈 xAI 正在打造名為“AI 遊戲工作室(AI gaming studio)”的重大項目,致力於開發革命性的 AI 驅動視頻遊戲。 該項目旨在利用 AI 技術構建完全動態且自動生成的遊戲世界,目前正面向全球招募具備從第一性原理(first principles)出發設計遊戲能力的開發者,感興趣的開發者可以通過 gamestudio@x.ai 郵箱進行聯繫,官方同步展示了相關技
清華大學與 OpenBMB 提出“H-Neurons”:LLM 幻覺相關神經元的存在、作用及其起源
清華大學自然語言處理實驗室(THUNLP)與 OpenBMB 團隊的研究人員發佈了題為《H-Neurons: On the Existence, Impact, and Origin of Hallucination-Associated Neurons in LLMs》的研究論文。該研究從識別、行為影響和起源三個維度,對Large Language Models (LLMs)中的幻覺關聯神經元(
從豆包手機談起:端側智能的願景與路線圖
本文轉載自:https://mp.weixin.qq.com/s/s13YBYD9R8y-PK7FO3Suyw 作者:OpenBMB開源社區 近日,字節跳動發佈的豆包手機助手在業內激起了廣泛討論。這不僅是一款新智能硬件的亮相,更標誌着大模型應用範式的一次重要躍遷——從“Chat(對話)”真正邁向“Action(行動)”。作為長期深耕大模型領域的研究者,我們將豆包手機助手定義為行業首
英偉達雲業務戰略調整,重心轉向內部 AI 開發
英偉達在其 CEO 黃仁勳的領導下,逐步調整了雲業務的戰略方向,日前宣佈對雲業務團隊進行重組。 根據內部備忘錄和知情人士的消息,這一變動意味着英偉達將不再積極與大型雲服務商如亞馬遜 AWS 展開競爭,而是將重心放在內部 AI 開發上。 新任命的高管 Alexis Black Bjorlin 於2023年從 Meta 加入英偉達,將在新的職位上推動雲團隊的整合。原本由數百人組成的雲業務團隊將併入英
MiniMax 開源視覺分詞器擴展技術 VTP
MiniMax 聯合華中科技大學首次開源了其視覺生成的關鍵技術 VTP (視覺分詞器預訓練) ,在不修改標準DiT的情況下,通過擴展視覺分詞器(Visual Tokenizers),實現了 65.8% 的生成性能提升。 與很多tokenizer工作不同的是,VTP在設定上不對下游的主模型(DiT)訓練過程做任何修改,僅通過前置優化tokenizer來實現端到端生成性能的倍數提升。 VTP預訓練範