新聞 RSS 訂閱

新型 AI 模型“讀心”能力驚人:不僅看穿動作,更能預判意圖

封面 新聞

人工智能在理解人類行為方面取得了突破性進展。得克薩斯農工大學(Texas AM University)的研究人員近日開發出一種名為“OmniPredict”的新型人工智能系統,該系統展現出了前所未有的“讀心”能力——它不僅能看見人類的動作,更能通過解讀視覺和環境線索,實時預判人類的下一步意圖。 這一研究成果標誌着自動駕駛技術從“被動反應”向“主動直覺”的重大跨越。傳統的自動駕駛系統通常只能識別行

收藏 評論

騰訊大模型團隊架構調整,新成立 AI Infra 部、AI Data 部、數據計算平台部

封面 新聞

根據36氪《智能涌現》的獨家報道,騰訊近期完成了一次組織調整,正式新成立 AI Infra 部、AI Data 部、數據計算平台部。 報道稱,在 12 月 17 日下午發佈的內部公告中,騰訊表示,Vinces Yao 將出任“CEO / 總裁辦公室”首席 AI 科學家,向騰訊總裁劉熾平彙報;他同時兼任 AI Infra 部、大語言模型部負責人,向技術工程事業羣總裁盧山彙報。Vinces Yao 即

收藏 評論

AI 數據平台 Databricks 啓動 L 輪融資,估值達 1340 億美元

封面 新聞

根據《華爾街日報》的獨家報道,數據分析與AI軟件公司Databricks近日宣佈進行L輪融資,規模超40億美元,公司估值約1340億美元,較今夏提升34%。截至10月底,其年度經常性收入達48億美元。 公司計劃明年全球新增數千崗位,重點招聘AI研究人員,並繼續推進與OpenAI、Anthropic的合作,助力企業構建AI智能體。 本輪融資由Insight Partners、富達管理與研究公司及摩

收藏 評論

智元提出 WholeBodyVLA,面向真實世界的人形機器人全身 VLA 框架

封面 新聞

智元 AGIBOT 宣佈,來自香港大學、智元 AGIBOT、復旦大學和上海創智學院的聯合研究團隊提出了 WholeBodyVLA,這是一種面向真實世界的人形機器人全身 Vision–Language–Action 框架。 https://opendrivelab.com/WholeBodyVLA/ https://github.com/OpenDriveLab/WholebodyVLA 據

收藏 評論

小米推出網頁版 AI 聊天服務:Xiaomi MiMO Studio

封面 新聞

今日上午,小米公司在 2025 小米人車家全生態合作伙伴大會上正式發佈和開源最新 MoE 大模型 MiMo-V2-Flash,並同步推出網頁版 AI 聊天服務:Xiaomi MiMO Studio。用户可以在上面體驗開源 MiMO-V2-Flash 模型。 Xiaomi MiMO Studio支持深度搜索和聯網搜索,具備聊天問答、寫作編輯、邏輯分析、翻譯、創意頭腦風暴、編程輔助等多種功能。 用户

收藏 評論

騰訊混元世界模型1.5發佈,首次開源業界最系統、最全面的實時世界模型框架

封面 新聞

騰訊混元世界模型1.5(Tencent HY WorldPlay)已正式發佈,公告寫道: 它是易於創建的: 只需輸入文字描述或者圖片即可創建專屬的互動世界。 它是沉浸式實時交互的: 通過鍵盤、鼠標或手柄,即可實時控制虛擬相機的移動和轉向,讓你可以像玩遊戲一樣自由探索AI生成的世界。 它也是直接可用的: 在騰訊混元3D官網可申請使用(https://3d.hunyuan.tencent

收藏 評論

萬相2.6系列模型正式發佈,上線國內首個角色扮演功能

封面 新聞

萬相2.6系列模型已經正式發佈,面向專業影視製作和圖像創作場景進行了全面升級。 根據官方公告,全新的萬相2.6是國內首個支持角色扮演功能的視頻模型,支持音畫同步、多鏡頭生成及聲音驅動等功能。已同步上線阿里雲百鍊、萬相官網。 萬相2.6視頻生成升級亮點 角色扮演:萬物皆可入戲,萬相2.6能參考輸入視頻中的角色外觀和音色、實現角色扮演,按照提示詞生成單人、多人、人與物合拍的視頻。 多鏡頭敍事:

收藏 評論

Xiaomi MiMO 大模型負責人羅福莉:MiMo-V2-Flash 是 AGI 路線圖中的第二步

封面 新聞

今日上午,在小米2025小米人車家全生態合作伙伴大會上,Xiaomi MiMO大模型負責人羅福莉完成入職後的小米首秀,並正式發佈和開源最新MoE大模型MiMo-V2-Flash。 羅福莉同步在社交媒體發佈了對MiMo-V2-Flash的介紹: MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖中的第二步,但我想把一些真正產生決定性效果的工程選擇隨手記下來。 架構: 我們最終採用

收藏 評論

Cherry Studio v1.7.4 發佈:MCP 生態擴容,瀏覽器自動化助攻

封面 新聞

Cherry Studio 是一款跨平台的 AI 桌面應用,支持 Windows、macOS 和 Linux 系統。該工具近日同時發佈了新版本v1.7.4,下面是官方發佈公告。 Cherry Studio v1.7.4 正式發佈!本次更新不僅進一步拓寬了模型支持的邊界,修復了多項影響體驗的 Bug,以下是本次更新的詳細解讀: 🚀 核心亮點:MCP 能力深度進化 在 v1.7.4 中,我們引入了

收藏 評論

英偉達收購開源工作負載管理提供商 SchedMD

封面 新聞

英偉達宣佈收購 SchedMD,該公司是 Slurm 軟件的主要開發商,Slurm 是一款用於 HPC 和 AI 的開源工作負載管理系統。此次收購旨在幫助強化開源軟件生態系統,並推動研究人員、開發者和企業的 AI 創新。 英偉達將繼續開發並提供 Slurm 這一廠商中立的開源軟件,支持其在各種硬件和軟件環境中廣泛可用,並得到 HPC 和 AI 社區的支持。 HPC 和 AI 工作負載涉及在集羣上

收藏 評論

OpenAI 發佈新版 ChatGPT Images,搭載 GPT Image 1.5 模型

封面 新聞

OpenAI 已正式發佈新版 ChatGPT Images,搭載全新旗艦圖像生成模型 GPT Image 1.5。 據介紹,GPT Image 1.5 模型承諾提供比前代最多提升四倍圖像生成速度,強化了提示詞遵循能力,具備更精確的圖像編輯功能,可在修改過程中保持視覺一致性,能忠實保留原始圖像的光照、構圖及人物特徵,同時提升了處理更小、更密集文本和大量小尺寸人臉照片時的可靠性。 新版功能已在 Ch

收藏 評論

Mozilla 新任 CEO 表態:繼續押注 AI,為 Firefox 打造可信任的 AI 功能

封面 新聞

在經歷裁員、重組以及商業模式爭議之後,既是非營利組織又肩負營利壓力的 Mozilla 正迎來新的掌舵者。 該公司新任首席執行官 Anthony Enzor-DeMeo 在首次公開受訪時表示,在充滿不確定性的 AI 浪潮中,他看到的反而是機會——尤其是在用户對科技公司和 AI 系統日益失去信任的當下。 多年來,Mozilla 一直在平衡其“使命驅動型非營利組織”和“依賴市場收入賴以生存的公司”這兩種

收藏 評論

小米開源 Xiaomi MiMo-V2-Flash:高效推理、代碼與 Agent 基座模型

封面 新聞

小米正式宣佈開源Xiaomi MiMo-V2-Flash,這是小米專為極致推理效率自研的總參數 309B(激活15B)的 MoE 模型,通過引入 Hybrid 注意力架構創新及多層 MTP 推理加速,在多個 Agent 測評基準上進入全球開源模型 Top 2;代碼能力超過所有開源模型,比肩標杆閉源模型 Claude 4.5 Sonnet,但推理價格僅為其2.5%且生成速度提升至2 倍,成功將大模型

收藏 評論

IBM 發佈開源可配置通用 AI 智能體框架:CUGA

封面 新聞

IBM 近日發佈了名為 CUGA 的開源 AI agent 項目,旨在讓構建智能 agent 變得更容易、更靈活、更可控制。 據介紹,CUGA(Configurable Generalist Agent,可配置通用智能體)是一個開源的通用 AI 智能體框架,旨在幫助開發者輕鬆構建、配置和部署智能 agent,支持跨 API、Web 等複雜任務的自動化執行。它專注於解決傳統 agent 在複雜場景

收藏 評論

開源強化學習框架 AReaL v0.5.0 發佈,新增解耦式 Agentic RL

AReaL 是一個面向算法設計,以開發效率和靈活性為核心的強化學習框架,由螞蟻百靈大模型團隊開源。它通過極簡的 API 和可擴展的插件機制降低用户的學習曲線和使用心智負擔,讓開發者聚焦於算法本身而非系統細節,具備大規模擴展、無侵入 Agentic RL、故障感知與自恢復等能力。 該項目近日發佈新版本 v0.5.0,帶來了解耦式 Agentic RL,以及 Single Controller 架構兩

收藏 評論

Let’s Encrypt 將啓用新一代證書信任層級 Generation Y

封面 新聞

Let’s Encrypt 公佈了未來幾年的證書體系調整計劃,核心方向圍繞“更短有效期、更嚴格用途、更強自動化”。 首先,Let’s Encrypt 將啓用新一代證書信任層級 Generation Y,引入新的根證書和中級證書,用於承載後續的新功能與合規要求。對普通 HTTPS 網站而言,這一變化在 ACME 自動化流程中幾乎無感。 其次,TLS 客户端認證(Client Auth)將逐步被移除

收藏 評論

Thinking Machines Lab 正式發佈首款產品 Tinker

封面 新聞

由 OpenAI 前 CTO Mira Murati 創辦的 Thinking Machines Lab宣佈其首款產品 Tinker 已正式 GA。 據介紹,Tinker 是一個為微調大模型設計的靈活 API。它的目標是讓研究人員和技術愛好者能專注於算法和數據,而將複雜的分佈式訓練交由平台處理,從而賦能更多人對前沿模型進行研究和定製,簡單來説 Tinker 可以極大地簡化 LLM 後訓練過程。

收藏 評論

Flatpak 引入 Zstd 壓縮,提升 OCI 打包效率

Flatpak 在最新的 1.17 系列開發版本中增強了對 OCI(Open Container Initiative)鏡像的支持,新增使用 Zstd 壓縮構建 OCI bundle的能力。 相比傳統的 Gzip,Zstd 在壓縮和解壓速度上更快,同時還能減少包體積,有助於提升構建和分發效率。不過出於兼容性考慮,Flatpak 目前仍將 Gzip 作為默認選項。 除壓縮方式改進外,這一輪更新還加

收藏 評論

日本開發者創造專為 LLM 代碼生成優化的編程語言:粋 (Sui)

日本數據科學家Takato Honda(本田崇人)創造了一門名為“Sui”的開源編程語言,宣稱可以讓 LLM 以 100% 的準確率編寫代碼。 據介紹,粋 (Sui) 名稱源於日本美學中“精煉”和“去除冗餘”的含義,意為摒棄所有不必要的元素,只保留必需品。其設計原則如下: 零語法錯誤率——結構上沒有發生任何語法錯誤。 零拼寫錯誤——變量是數字,不是名稱。 行級獨立性——每一行都是完全獨立的

收藏 評論

微軟 AI 應用 Copilot “捆綁” LG 電視,不可卸載引發爭議

據techpowerup報道,有用户發現LG電視webOS系統更新後預裝了微軟Copilot AI應用。 報道稱,多位用户在 Reddit 等社區反饋同樣情況,稱Copilot以系統應用形式存在,無法通過常規方式卸載。部分用户擔憂此類AI集成可能帶來隱私與非必要數據處理問題。 此舉被視為微軟加速AI生態佈局、拓展至電視等日常設備的最新動作。目前該應用在電視端具體功能尚不明確。此外,LG電視內置

收藏 評論

AI 視頻公司 Runway 發佈世界模型 GWM‑1

封面 新聞

AI 視頻公司 Runway 近日宣佈推出通用“世界模型”家族 GWM-1,並同步更新其旗艦視頻生成模型 Gen‑4.5。 GWM-1 基於 Gen‑4.5 構建,可逐幀生成、實時運行,並通過攝像機姿態、機器人指令、音頻等動作進行交互式控制,包含「GWM Worlds」「GWM Avatars」「GWM Robotics」三種後訓練變體: GWM Worlds 能在長時間移動序列中維持空間連貫

收藏 評論

Manus 1.6 發佈:Max 性能、移動開發和 Design View

封面 新聞

通用智能體 Manus 正式發佈 1.6 版本,主要變化如下: 引入旗艦級別 Agent:Manus 1.6 Max 用於構建超越 Web 的應用的移動開發 以及用於交互式圖像創建的設計視圖。 本次發佈的核心是 Manus 1.6 Max,作為新的旗艦 Agent。它通過更先進的規劃和問題解決架構,帶來了可衡量的性能提升。 更高的任務成功率: Max 顯著提高了單次任務的成功率。現

收藏 評論

英特爾悄然停止維護開源 Gaudi 用户空間驅動代碼

封面 新聞

有跡象顯示,英特爾在其 Gaudi 加速器的開源軟件生態上遭遇新的挫折:負責 Gaudi 用户空間支持的開源項目 SynapseAI Core 已被歸檔並停止維護,這為相關內核驅動的未來蒙上陰影。 英特爾在 11 月底剛剛公開了面向 Gaudi 3 加速器的 Habana Labs 內核驅動代碼,準備提交上游合入 Linux 內核主線。此前,這一開源工作因公司內部裁員和人員流動屢次受阻,驅動維護

收藏 評論

英偉達發佈 Nemotron 3 系列開放模型

封面 新聞

英偉達宣佈推出 NVIDIA Nemotron™ 3 系列開放模型、數據和庫,為各個行業透明、高效的專業代理式 AI 開發提供助力。 Nemotron 3 系列MoE 模型提供 Nano、Super 和 Ultra 三種規模,採用突破性的異構潛在混合專家 (MoE) 架構,幫助開發者大規模開發並部署可靠的多智能體系統。 Nemotron 3 Nano:是一款具備 300 億參數的小型模型,每次

收藏 評論