騰訊混元世界模型1.5(Tencent HY WorldPlay)已正式發佈,公告寫道: 它是易於創建的: 只需輸入文字描述或者圖片即可創建專屬的互動世界。 它是沉浸式實時交互的: 通過鍵盤、鼠標或手柄,即可實時控制虛擬相機的移動和轉向,讓你可以像玩遊戲一樣自由探索AI生成的世界。 它也是直接可用的: 在騰訊混元3D官網可申請使用(https://3d.hunyuan.tencent
新聞 RSS 訂閱
萬相2.6系列模型正式發佈,上線國內首個角色扮演功能
萬相2.6系列模型已經正式發佈,面向專業影視製作和圖像創作場景進行了全面升級。 根據官方公告,全新的萬相2.6是國內首個支持角色扮演功能的視頻模型,支持音畫同步、多鏡頭生成及聲音驅動等功能。已同步上線阿里雲百鍊、萬相官網。 萬相2.6視頻生成升級亮點 角色扮演:萬物皆可入戲,萬相2.6能參考輸入視頻中的角色外觀和音色、實現角色扮演,按照提示詞生成單人、多人、人與物合拍的視頻。 多鏡頭敍事:
Xiaomi MiMO 大模型負責人羅福莉:MiMo-V2-Flash 是 AGI 路線圖中的第二步
今日上午,在小米2025小米人車家全生態合作伙伴大會上,Xiaomi MiMO大模型負責人羅福莉完成入職後的小米首秀,並正式發佈和開源最新MoE大模型MiMo-V2-Flash。 羅福莉同步在社交媒體發佈了對MiMo-V2-Flash的介紹: MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖中的第二步,但我想把一些真正產生決定性效果的工程選擇隨手記下來。 架構: 我們最終採用
Cherry Studio v1.7.4 發佈:MCP 生態擴容,瀏覽器自動化助攻
Cherry Studio 是一款跨平台的 AI 桌面應用,支持 Windows、macOS 和 Linux 系統。該工具近日同時發佈了新版本v1.7.4,下面是官方發佈公告。 Cherry Studio v1.7.4 正式發佈!本次更新不僅進一步拓寬了模型支持的邊界,修復了多項影響體驗的 Bug,以下是本次更新的詳細解讀: 🚀 核心亮點:MCP 能力深度進化 在 v1.7.4 中,我們引入了
英偉達收購開源工作負載管理提供商 SchedMD
英偉達宣佈收購 SchedMD,該公司是 Slurm 軟件的主要開發商,Slurm 是一款用於 HPC 和 AI 的開源工作負載管理系統。此次收購旨在幫助強化開源軟件生態系統,並推動研究人員、開發者和企業的 AI 創新。 英偉達將繼續開發並提供 Slurm 這一廠商中立的開源軟件,支持其在各種硬件和軟件環境中廣泛可用,並得到 HPC 和 AI 社區的支持。 HPC 和 AI 工作負載涉及在集羣上
OpenAI 發佈新版 ChatGPT Images,搭載 GPT Image 1.5 模型
OpenAI 已正式發佈新版 ChatGPT Images,搭載全新旗艦圖像生成模型 GPT Image 1.5。 據介紹,GPT Image 1.5 模型承諾提供比前代最多提升四倍圖像生成速度,強化了提示詞遵循能力,具備更精確的圖像編輯功能,可在修改過程中保持視覺一致性,能忠實保留原始圖像的光照、構圖及人物特徵,同時提升了處理更小、更密集文本和大量小尺寸人臉照片時的可靠性。 新版功能已在 Ch
Mozilla 新任 CEO 表態:繼續押注 AI,為 Firefox 打造可信任的 AI 功能
在經歷裁員、重組以及商業模式爭議之後,既是非營利組織又肩負營利壓力的 Mozilla 正迎來新的掌舵者。 該公司新任首席執行官 Anthony Enzor-DeMeo 在首次公開受訪時表示,在充滿不確定性的 AI 浪潮中,他看到的反而是機會——尤其是在用户對科技公司和 AI 系統日益失去信任的當下。 多年來,Mozilla 一直在平衡其“使命驅動型非營利組織”和“依賴市場收入賴以生存的公司”這兩種
小米開源 Xiaomi MiMo-V2-Flash:高效推理、代碼與 Agent 基座模型
小米正式宣佈開源Xiaomi MiMo-V2-Flash,這是小米專為極致推理效率自研的總參數 309B(激活15B)的 MoE 模型,通過引入 Hybrid 注意力架構創新及多層 MTP 推理加速,在多個 Agent 測評基準上進入全球開源模型 Top 2;代碼能力超過所有開源模型,比肩標杆閉源模型 Claude 4.5 Sonnet,但推理價格僅為其2.5%且生成速度提升至2 倍,成功將大模型
IBM 發佈開源可配置通用 AI 智能體框架:CUGA
IBM 近日發佈了名為 CUGA 的開源 AI agent 項目,旨在讓構建智能 agent 變得更容易、更靈活、更可控制。 據介紹,CUGA(Configurable Generalist Agent,可配置通用智能體)是一個開源的通用 AI 智能體框架,旨在幫助開發者輕鬆構建、配置和部署智能 agent,支持跨 API、Web 等複雜任務的自動化執行。它專注於解決傳統 agent 在複雜場景
開源強化學習框架 AReaL v0.5.0 發佈,新增解耦式 Agentic RL
AReaL 是一個面向算法設計,以開發效率和靈活性為核心的強化學習框架,由螞蟻百靈大模型團隊開源。它通過極簡的 API 和可擴展的插件機制降低用户的學習曲線和使用心智負擔,讓開發者聚焦於算法本身而非系統細節,具備大規模擴展、無侵入 Agentic RL、故障感知與自恢復等能力。 該項目近日發佈新版本 v0.5.0,帶來了解耦式 Agentic RL,以及 Single Controller 架構兩
Let’s Encrypt 將啓用新一代證書信任層級 Generation Y
Let’s Encrypt 公佈了未來幾年的證書體系調整計劃,核心方向圍繞“更短有效期、更嚴格用途、更強自動化”。 首先,Let’s Encrypt 將啓用新一代證書信任層級 Generation Y,引入新的根證書和中級證書,用於承載後續的新功能與合規要求。對普通 HTTPS 網站而言,這一變化在 ACME 自動化流程中幾乎無感。 其次,TLS 客户端認證(Client Auth)將逐步被移除
Thinking Machines Lab 正式發佈首款產品 Tinker
由 OpenAI 前 CTO Mira Murati 創辦的 Thinking Machines Lab宣佈其首款產品 Tinker 已正式 GA。 據介紹,Tinker 是一個為微調大模型設計的靈活 API。它的目標是讓研究人員和技術愛好者能專注於算法和數據,而將複雜的分佈式訓練交由平台處理,從而賦能更多人對前沿模型進行研究和定製,簡單來説 Tinker 可以極大地簡化 LLM 後訓練過程。
Flatpak 引入 Zstd 壓縮,提升 OCI 打包效率
Flatpak 在最新的 1.17 系列開發版本中增強了對 OCI(Open Container Initiative)鏡像的支持,新增使用 Zstd 壓縮構建 OCI bundle的能力。 相比傳統的 Gzip,Zstd 在壓縮和解壓速度上更快,同時還能減少包體積,有助於提升構建和分發效率。不過出於兼容性考慮,Flatpak 目前仍將 Gzip 作為默認選項。 除壓縮方式改進外,這一輪更新還加
日本開發者創造專為 LLM 代碼生成優化的編程語言:粋 (Sui)
日本數據科學家Takato Honda(本田崇人)創造了一門名為“Sui”的開源編程語言,宣稱可以讓 LLM 以 100% 的準確率編寫代碼。 據介紹,粋 (Sui) 名稱源於日本美學中“精煉”和“去除冗餘”的含義,意為摒棄所有不必要的元素,只保留必需品。其設計原則如下: 零語法錯誤率——結構上沒有發生任何語法錯誤。 零拼寫錯誤——變量是數字,不是名稱。 行級獨立性——每一行都是完全獨立的
微軟 AI 應用 Copilot “捆綁” LG 電視,不可卸載引發爭議
據techpowerup報道,有用户發現LG電視webOS系統更新後預裝了微軟Copilot AI應用。 報道稱,多位用户在 Reddit 等社區反饋同樣情況,稱Copilot以系統應用形式存在,無法通過常規方式卸載。部分用户擔憂此類AI集成可能帶來隱私與非必要數據處理問題。 此舉被視為微軟加速AI生態佈局、拓展至電視等日常設備的最新動作。目前該應用在電視端具體功能尚不明確。此外,LG電視內置
AI 視頻公司 Runway 發佈世界模型 GWM‑1
AI 視頻公司 Runway 近日宣佈推出通用“世界模型”家族 GWM-1,並同步更新其旗艦視頻生成模型 Gen‑4.5。 GWM-1 基於 Gen‑4.5 構建,可逐幀生成、實時運行,並通過攝像機姿態、機器人指令、音頻等動作進行交互式控制,包含「GWM Worlds」「GWM Avatars」「GWM Robotics」三種後訓練變體: GWM Worlds 能在長時間移動序列中維持空間連貫
Manus 1.6 發佈:Max 性能、移動開發和 Design View
通用智能體 Manus 正式發佈 1.6 版本,主要變化如下: 引入旗艦級別 Agent:Manus 1.6 Max 用於構建超越 Web 的應用的移動開發 以及用於交互式圖像創建的設計視圖。 本次發佈的核心是 Manus 1.6 Max,作為新的旗艦 Agent。它通過更先進的規劃和問題解決架構,帶來了可衡量的性能提升。 更高的任務成功率: Max 顯著提高了單次任務的成功率。現
英特爾悄然停止維護開源 Gaudi 用户空間驅動代碼
有跡象顯示,英特爾在其 Gaudi 加速器的開源軟件生態上遭遇新的挫折:負責 Gaudi 用户空間支持的開源項目 SynapseAI Core 已被歸檔並停止維護,這為相關內核驅動的未來蒙上陰影。 英特爾在 11 月底剛剛公開了面向 Gaudi 3 加速器的 Habana Labs 內核驅動代碼,準備提交上游合入 Linux 內核主線。此前,這一開源工作因公司內部裁員和人員流動屢次受阻,驅動維護
英偉達發佈 Nemotron 3 系列開放模型
英偉達宣佈推出 NVIDIA Nemotron™ 3 系列開放模型、數據和庫,為各個行業透明、高效的專業代理式 AI 開發提供助力。 Nemotron 3 系列MoE 模型提供 Nano、Super 和 Ultra 三種規模,採用突破性的異構潛在混合專家 (MoE) 架構,幫助開發者大規模開發並部署可靠的多智能體系統。 Nemotron 3 Nano:是一款具備 300 億參數的小型模型,每次
通義百聆語音雙子星升級並開源,大幅提升語音合成與識別能力
據通義大模型官方消息,通義百聆宣佈其語音大模型Fun-CosyVoice3與Fun-ASR完成重大升級並同步開源。此次升級聚焦核心性能與實用性,為開發者與企業提供更強大的語音AI工具。 Fun-CosyVoice3:實時、精準的語音合成 模型首包延遲降低50%,實現“輸入即發聲”。中英混説錯誤率大幅下降56.4%,並支持9種語言、18種方言及情感控制。其開源版本Fun-CosyVoice3-0
李彥宏接受《時代》週刊專訪,稱 2025 年是 AI 應用普及關鍵年
百度創始人李彥宏近日在《時代》週刊「AI 架構師」專題採訪中表示,2025 年將是 AI 應用普及的關鍵一年。他判斷,基礎模型層最終會留下少數幾家,但應用層的各個方向將涌現眾多成功參與者,「我認為那裏才是機會最多的地方」。 李彥宏強調,百度採取「應用驅動」策略,針對搜索、數字人等重點領域定向訓練模型以形成優勢,而非追求面向所有人的「萬能模型」。 李彥宏表示,全球 AI 競爭態勢趨於白熱化。與美國
高通宣佈收購 RISC-V 初創企業 Ventana 微系統公司
高通宣佈收購RISC-V初創企業Ventana微系統公司。此次收購意味着高通可能啓動雙架構並行戰略,未來其芯片產品將有望同時集成自研的Arm架構核心與高性能RISC-V架構核心。 Ventana成立於2018年,專注於開發面向數據中心及企業級市場的高性能RISC-V CPU設計,目前已成功推出多代產品。 高通表示,收購完成後將繼續推進自研Arm架構Oryon核心的研發,同時也將持續迭代Venta
Google Translate 全面升級,集成 Gemini 提升翻譯質量
谷歌宣佈對Google Translate進行重大更新,引入Gemini技術,顯著提升對習語、方言及俚語等複雜表達的翻譯準確性。 該功能現已在美國和印度上線,支持英語與近20種語言(包括中文、西班牙語、印地語、日語和德語)互譯,可通過Google搜索及iOS/Android版Translate應用使用。 同時,谷歌推出“實時語音翻譯”Beta功能,在Android端支持70餘種語言,保留説話
8 位科技領袖登上《時代》年度人物封面,被稱為“AI 構建者”
美國《時代》雜誌公佈了 2025 “年度人物”—— 一組被稱作“AI構建者”的科技行業領軍者,體現人工智能對當今世界的深遠影響。封面模仿了 1932 年經典攝影作品「摩天樓上的午餐」,將 8 位科技領袖並排置於鋼樑之上,象徵共同搭建新時代的技術結構。 封面出現的八位人物從左至右依次為:Meta CEO 扎克伯格、AMD CEO 蘇姿豐、xAI 創始人馬斯克、英偉達 CEO 黃仁勳、OpenAI