人工智能在理解人類行為方面取得了突破性進展。得克薩斯農工大學(Texas AM University)的研究人員近日開發出一種名為“OmniPredict”的新型人工智能系統,該系統展現出了前所未有的“讀心”能力——它不僅能看見人類的動作,更能通過解讀視覺和環境線索,實時預判人類的下一步意圖。 這一研究成果標誌着自動駕駛技術從“被動反應”向“主動直覺”的重大跨越。傳統的自動駕駛系統通常只能識別行
新聞 RSS 訂閱
騰訊大模型團隊架構調整,新成立 AI Infra 部、AI Data 部、數據計算平台部
根據36氪《智能涌現》的獨家報道,騰訊近期完成了一次組織調整,正式新成立 AI Infra 部、AI Data 部、數據計算平台部。 報道稱,在 12 月 17 日下午發佈的內部公告中,騰訊表示,Vinces Yao 將出任“CEO / 總裁辦公室”首席 AI 科學家,向騰訊總裁劉熾平彙報;他同時兼任 AI Infra 部、大語言模型部負責人,向技術工程事業羣總裁盧山彙報。Vinces Yao 即
AI 數據平台 Databricks 啓動 L 輪融資,估值達 1340 億美元
根據《華爾街日報》的獨家報道,數據分析與AI軟件公司Databricks近日宣佈進行L輪融資,規模超40億美元,公司估值約1340億美元,較今夏提升34%。截至10月底,其年度經常性收入達48億美元。 公司計劃明年全球新增數千崗位,重點招聘AI研究人員,並繼續推進與OpenAI、Anthropic的合作,助力企業構建AI智能體。 本輪融資由Insight Partners、富達管理與研究公司及摩
智元提出 WholeBodyVLA,面向真實世界的人形機器人全身 VLA 框架
智元 AGIBOT 宣佈,來自香港大學、智元 AGIBOT、復旦大學和上海創智學院的聯合研究團隊提出了 WholeBodyVLA,這是一種面向真實世界的人形機器人全身 Vision–Language–Action 框架。 https://opendrivelab.com/WholeBodyVLA/ https://github.com/OpenDriveLab/WholebodyVLA 據
小米推出網頁版 AI 聊天服務:Xiaomi MiMO Studio
今日上午,小米公司在 2025 小米人車家全生態合作伙伴大會上正式發佈和開源最新 MoE 大模型 MiMo-V2-Flash,並同步推出網頁版 AI 聊天服務:Xiaomi MiMO Studio。用户可以在上面體驗開源 MiMO-V2-Flash 模型。 Xiaomi MiMO Studio支持深度搜索和聯網搜索,具備聊天問答、寫作編輯、邏輯分析、翻譯、創意頭腦風暴、編程輔助等多種功能。 用户
騰訊混元世界模型1.5發佈,首次開源業界最系統、最全面的實時世界模型框架
騰訊混元世界模型1.5(Tencent HY WorldPlay)已正式發佈,公告寫道: 它是易於創建的: 只需輸入文字描述或者圖片即可創建專屬的互動世界。 它是沉浸式實時交互的: 通過鍵盤、鼠標或手柄,即可實時控制虛擬相機的移動和轉向,讓你可以像玩遊戲一樣自由探索AI生成的世界。 它也是直接可用的: 在騰訊混元3D官網可申請使用(https://3d.hunyuan.tencent
萬相2.6系列模型正式發佈,上線國內首個角色扮演功能
萬相2.6系列模型已經正式發佈,面向專業影視製作和圖像創作場景進行了全面升級。 根據官方公告,全新的萬相2.6是國內首個支持角色扮演功能的視頻模型,支持音畫同步、多鏡頭生成及聲音驅動等功能。已同步上線阿里雲百鍊、萬相官網。 萬相2.6視頻生成升級亮點 角色扮演:萬物皆可入戲,萬相2.6能參考輸入視頻中的角色外觀和音色、實現角色扮演,按照提示詞生成單人、多人、人與物合拍的視頻。 多鏡頭敍事:
Xiaomi MiMO 大模型負責人羅福莉:MiMo-V2-Flash 是 AGI 路線圖中的第二步
今日上午,在小米2025小米人車家全生態合作伙伴大會上,Xiaomi MiMO大模型負責人羅福莉完成入職後的小米首秀,並正式發佈和開源最新MoE大模型MiMo-V2-Flash。 羅福莉同步在社交媒體發佈了對MiMo-V2-Flash的介紹: MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖中的第二步,但我想把一些真正產生決定性效果的工程選擇隨手記下來。 架構: 我們最終採用
Cherry Studio v1.7.4 發佈:MCP 生態擴容,瀏覽器自動化助攻
Cherry Studio 是一款跨平台的 AI 桌面應用,支持 Windows、macOS 和 Linux 系統。該工具近日同時發佈了新版本v1.7.4,下面是官方發佈公告。 Cherry Studio v1.7.4 正式發佈!本次更新不僅進一步拓寬了模型支持的邊界,修復了多項影響體驗的 Bug,以下是本次更新的詳細解讀: 🚀 核心亮點:MCP 能力深度進化 在 v1.7.4 中,我們引入了
英偉達收購開源工作負載管理提供商 SchedMD
英偉達宣佈收購 SchedMD,該公司是 Slurm 軟件的主要開發商,Slurm 是一款用於 HPC 和 AI 的開源工作負載管理系統。此次收購旨在幫助強化開源軟件生態系統,並推動研究人員、開發者和企業的 AI 創新。 英偉達將繼續開發並提供 Slurm 這一廠商中立的開源軟件,支持其在各種硬件和軟件環境中廣泛可用,並得到 HPC 和 AI 社區的支持。 HPC 和 AI 工作負載涉及在集羣上
OpenAI 發佈新版 ChatGPT Images,搭載 GPT Image 1.5 模型
OpenAI 已正式發佈新版 ChatGPT Images,搭載全新旗艦圖像生成模型 GPT Image 1.5。 據介紹,GPT Image 1.5 模型承諾提供比前代最多提升四倍圖像生成速度,強化了提示詞遵循能力,具備更精確的圖像編輯功能,可在修改過程中保持視覺一致性,能忠實保留原始圖像的光照、構圖及人物特徵,同時提升了處理更小、更密集文本和大量小尺寸人臉照片時的可靠性。 新版功能已在 Ch
Mozilla 新任 CEO 表態:繼續押注 AI,為 Firefox 打造可信任的 AI 功能
在經歷裁員、重組以及商業模式爭議之後,既是非營利組織又肩負營利壓力的 Mozilla 正迎來新的掌舵者。 該公司新任首席執行官 Anthony Enzor-DeMeo 在首次公開受訪時表示,在充滿不確定性的 AI 浪潮中,他看到的反而是機會——尤其是在用户對科技公司和 AI 系統日益失去信任的當下。 多年來,Mozilla 一直在平衡其“使命驅動型非營利組織”和“依賴市場收入賴以生存的公司”這兩種
小米開源 Xiaomi MiMo-V2-Flash:高效推理、代碼與 Agent 基座模型
小米正式宣佈開源Xiaomi MiMo-V2-Flash,這是小米專為極致推理效率自研的總參數 309B(激活15B)的 MoE 模型,通過引入 Hybrid 注意力架構創新及多層 MTP 推理加速,在多個 Agent 測評基準上進入全球開源模型 Top 2;代碼能力超過所有開源模型,比肩標杆閉源模型 Claude 4.5 Sonnet,但推理價格僅為其2.5%且生成速度提升至2 倍,成功將大模型
IBM 發佈開源可配置通用 AI 智能體框架:CUGA
IBM 近日發佈了名為 CUGA 的開源 AI agent 項目,旨在讓構建智能 agent 變得更容易、更靈活、更可控制。 據介紹,CUGA(Configurable Generalist Agent,可配置通用智能體)是一個開源的通用 AI 智能體框架,旨在幫助開發者輕鬆構建、配置和部署智能 agent,支持跨 API、Web 等複雜任務的自動化執行。它專注於解決傳統 agent 在複雜場景
開源強化學習框架 AReaL v0.5.0 發佈,新增解耦式 Agentic RL
AReaL 是一個面向算法設計,以開發效率和靈活性為核心的強化學習框架,由螞蟻百靈大模型團隊開源。它通過極簡的 API 和可擴展的插件機制降低用户的學習曲線和使用心智負擔,讓開發者聚焦於算法本身而非系統細節,具備大規模擴展、無侵入 Agentic RL、故障感知與自恢復等能力。 該項目近日發佈新版本 v0.5.0,帶來了解耦式 Agentic RL,以及 Single Controller 架構兩
Let’s Encrypt 將啓用新一代證書信任層級 Generation Y
Let’s Encrypt 公佈了未來幾年的證書體系調整計劃,核心方向圍繞“更短有效期、更嚴格用途、更強自動化”。 首先,Let’s Encrypt 將啓用新一代證書信任層級 Generation Y,引入新的根證書和中級證書,用於承載後續的新功能與合規要求。對普通 HTTPS 網站而言,這一變化在 ACME 自動化流程中幾乎無感。 其次,TLS 客户端認證(Client Auth)將逐步被移除
Thinking Machines Lab 正式發佈首款產品 Tinker
由 OpenAI 前 CTO Mira Murati 創辦的 Thinking Machines Lab宣佈其首款產品 Tinker 已正式 GA。 據介紹,Tinker 是一個為微調大模型設計的靈活 API。它的目標是讓研究人員和技術愛好者能專注於算法和數據,而將複雜的分佈式訓練交由平台處理,從而賦能更多人對前沿模型進行研究和定製,簡單來説 Tinker 可以極大地簡化 LLM 後訓練過程。
Flatpak 引入 Zstd 壓縮,提升 OCI 打包效率
Flatpak 在最新的 1.17 系列開發版本中增強了對 OCI(Open Container Initiative)鏡像的支持,新增使用 Zstd 壓縮構建 OCI bundle的能力。 相比傳統的 Gzip,Zstd 在壓縮和解壓速度上更快,同時還能減少包體積,有助於提升構建和分發效率。不過出於兼容性考慮,Flatpak 目前仍將 Gzip 作為默認選項。 除壓縮方式改進外,這一輪更新還加
日本開發者創造專為 LLM 代碼生成優化的編程語言:粋 (Sui)
日本數據科學家Takato Honda(本田崇人)創造了一門名為“Sui”的開源編程語言,宣稱可以讓 LLM 以 100% 的準確率編寫代碼。 據介紹,粋 (Sui) 名稱源於日本美學中“精煉”和“去除冗餘”的含義,意為摒棄所有不必要的元素,只保留必需品。其設計原則如下: 零語法錯誤率——結構上沒有發生任何語法錯誤。 零拼寫錯誤——變量是數字,不是名稱。 行級獨立性——每一行都是完全獨立的
微軟 AI 應用 Copilot “捆綁” LG 電視,不可卸載引發爭議
據techpowerup報道,有用户發現LG電視webOS系統更新後預裝了微軟Copilot AI應用。 報道稱,多位用户在 Reddit 等社區反饋同樣情況,稱Copilot以系統應用形式存在,無法通過常規方式卸載。部分用户擔憂此類AI集成可能帶來隱私與非必要數據處理問題。 此舉被視為微軟加速AI生態佈局、拓展至電視等日常設備的最新動作。目前該應用在電視端具體功能尚不明確。此外,LG電視內置
AI 視頻公司 Runway 發佈世界模型 GWM‑1
AI 視頻公司 Runway 近日宣佈推出通用“世界模型”家族 GWM-1,並同步更新其旗艦視頻生成模型 Gen‑4.5。 GWM-1 基於 Gen‑4.5 構建,可逐幀生成、實時運行,並通過攝像機姿態、機器人指令、音頻等動作進行交互式控制,包含「GWM Worlds」「GWM Avatars」「GWM Robotics」三種後訓練變體: GWM Worlds 能在長時間移動序列中維持空間連貫
Manus 1.6 發佈:Max 性能、移動開發和 Design View
通用智能體 Manus 正式發佈 1.6 版本,主要變化如下: 引入旗艦級別 Agent:Manus 1.6 Max 用於構建超越 Web 的應用的移動開發 以及用於交互式圖像創建的設計視圖。 本次發佈的核心是 Manus 1.6 Max,作為新的旗艦 Agent。它通過更先進的規劃和問題解決架構,帶來了可衡量的性能提升。 更高的任務成功率: Max 顯著提高了單次任務的成功率。現
英特爾悄然停止維護開源 Gaudi 用户空間驅動代碼
有跡象顯示,英特爾在其 Gaudi 加速器的開源軟件生態上遭遇新的挫折:負責 Gaudi 用户空間支持的開源項目 SynapseAI Core 已被歸檔並停止維護,這為相關內核驅動的未來蒙上陰影。 英特爾在 11 月底剛剛公開了面向 Gaudi 3 加速器的 Habana Labs 內核驅動代碼,準備提交上游合入 Linux 內核主線。此前,這一開源工作因公司內部裁員和人員流動屢次受阻,驅動維護
英偉達發佈 Nemotron 3 系列開放模型
英偉達宣佈推出 NVIDIA Nemotron™ 3 系列開放模型、數據和庫,為各個行業透明、高效的專業代理式 AI 開發提供助力。 Nemotron 3 系列MoE 模型提供 Nano、Super 和 Ultra 三種規模,採用突破性的異構潛在混合專家 (MoE) 架構,幫助開發者大規模開發並部署可靠的多智能體系統。 Nemotron 3 Nano:是一款具備 300 億參數的小型模型,每次