新聞 RSS 訂閱

騰訊混元世界模型1.5發佈,首次開源業界最系統、最全面的實時世界模型框架

封面 新聞

騰訊混元世界模型1.5(Tencent HY WorldPlay)已正式發佈,公告寫道: 它是易於創建的: 只需輸入文字描述或者圖片即可創建專屬的互動世界。 它是沉浸式實時交互的: 通過鍵盤、鼠標或手柄,即可實時控制虛擬相機的移動和轉向,讓你可以像玩遊戲一樣自由探索AI生成的世界。 它也是直接可用的: 在騰訊混元3D官網可申請使用(https://3d.hunyuan.tencent

收藏 評論

萬相2.6系列模型正式發佈,上線國內首個角色扮演功能

封面 新聞

萬相2.6系列模型已經正式發佈,面向專業影視製作和圖像創作場景進行了全面升級。 根據官方公告,全新的萬相2.6是國內首個支持角色扮演功能的視頻模型,支持音畫同步、多鏡頭生成及聲音驅動等功能。已同步上線阿里雲百鍊、萬相官網。 萬相2.6視頻生成升級亮點 角色扮演:萬物皆可入戲,萬相2.6能參考輸入視頻中的角色外觀和音色、實現角色扮演,按照提示詞生成單人、多人、人與物合拍的視頻。 多鏡頭敍事:

收藏 評論

Xiaomi MiMO 大模型負責人羅福莉:MiMo-V2-Flash 是 AGI 路線圖中的第二步

封面 新聞

今日上午,在小米2025小米人車家全生態合作伙伴大會上,Xiaomi MiMO大模型負責人羅福莉完成入職後的小米首秀,並正式發佈和開源最新MoE大模型MiMo-V2-Flash。 羅福莉同步在社交媒體發佈了對MiMo-V2-Flash的介紹: MiMo-V2-Flash 已正式上線。這只是我們 AGI 路線圖中的第二步,但我想把一些真正產生決定性效果的工程選擇隨手記下來。 架構: 我們最終採用

收藏 評論

Cherry Studio v1.7.4 發佈:MCP 生態擴容,瀏覽器自動化助攻

封面 新聞

Cherry Studio 是一款跨平台的 AI 桌面應用,支持 Windows、macOS 和 Linux 系統。該工具近日同時發佈了新版本v1.7.4,下面是官方發佈公告。 Cherry Studio v1.7.4 正式發佈!本次更新不僅進一步拓寬了模型支持的邊界,修復了多項影響體驗的 Bug,以下是本次更新的詳細解讀: 🚀 核心亮點:MCP 能力深度進化 在 v1.7.4 中,我們引入了

收藏 評論

英偉達收購開源工作負載管理提供商 SchedMD

封面 新聞

英偉達宣佈收購 SchedMD,該公司是 Slurm 軟件的主要開發商,Slurm 是一款用於 HPC 和 AI 的開源工作負載管理系統。此次收購旨在幫助強化開源軟件生態系統,並推動研究人員、開發者和企業的 AI 創新。 英偉達將繼續開發並提供 Slurm 這一廠商中立的開源軟件,支持其在各種硬件和軟件環境中廣泛可用,並得到 HPC 和 AI 社區的支持。 HPC 和 AI 工作負載涉及在集羣上

收藏 評論

OpenAI 發佈新版 ChatGPT Images,搭載 GPT Image 1.5 模型

封面 新聞

OpenAI 已正式發佈新版 ChatGPT Images,搭載全新旗艦圖像生成模型 GPT Image 1.5。 據介紹,GPT Image 1.5 模型承諾提供比前代最多提升四倍圖像生成速度,強化了提示詞遵循能力,具備更精確的圖像編輯功能,可在修改過程中保持視覺一致性,能忠實保留原始圖像的光照、構圖及人物特徵,同時提升了處理更小、更密集文本和大量小尺寸人臉照片時的可靠性。 新版功能已在 Ch

收藏 評論

Mozilla 新任 CEO 表態:繼續押注 AI,為 Firefox 打造可信任的 AI 功能

封面 新聞

在經歷裁員、重組以及商業模式爭議之後,既是非營利組織又肩負營利壓力的 Mozilla 正迎來新的掌舵者。 該公司新任首席執行官 Anthony Enzor-DeMeo 在首次公開受訪時表示,在充滿不確定性的 AI 浪潮中,他看到的反而是機會——尤其是在用户對科技公司和 AI 系統日益失去信任的當下。 多年來,Mozilla 一直在平衡其“使命驅動型非營利組織”和“依賴市場收入賴以生存的公司”這兩種

收藏 評論

小米開源 Xiaomi MiMo-V2-Flash:高效推理、代碼與 Agent 基座模型

封面 新聞

小米正式宣佈開源Xiaomi MiMo-V2-Flash,這是小米專為極致推理效率自研的總參數 309B(激活15B)的 MoE 模型,通過引入 Hybrid 注意力架構創新及多層 MTP 推理加速,在多個 Agent 測評基準上進入全球開源模型 Top 2;代碼能力超過所有開源模型,比肩標杆閉源模型 Claude 4.5 Sonnet,但推理價格僅為其2.5%且生成速度提升至2 倍,成功將大模型

收藏 評論

IBM 發佈開源可配置通用 AI 智能體框架:CUGA

封面 新聞

IBM 近日發佈了名為 CUGA 的開源 AI agent 項目,旨在讓構建智能 agent 變得更容易、更靈活、更可控制。 據介紹,CUGA(Configurable Generalist Agent,可配置通用智能體)是一個開源的通用 AI 智能體框架,旨在幫助開發者輕鬆構建、配置和部署智能 agent,支持跨 API、Web 等複雜任務的自動化執行。它專注於解決傳統 agent 在複雜場景

收藏 評論

開源強化學習框架 AReaL v0.5.0 發佈,新增解耦式 Agentic RL

AReaL 是一個面向算法設計,以開發效率和靈活性為核心的強化學習框架,由螞蟻百靈大模型團隊開源。它通過極簡的 API 和可擴展的插件機制降低用户的學習曲線和使用心智負擔,讓開發者聚焦於算法本身而非系統細節,具備大規模擴展、無侵入 Agentic RL、故障感知與自恢復等能力。 該項目近日發佈新版本 v0.5.0,帶來了解耦式 Agentic RL,以及 Single Controller 架構兩

收藏 評論

Let’s Encrypt 將啓用新一代證書信任層級 Generation Y

封面 新聞

Let’s Encrypt 公佈了未來幾年的證書體系調整計劃,核心方向圍繞“更短有效期、更嚴格用途、更強自動化”。 首先,Let’s Encrypt 將啓用新一代證書信任層級 Generation Y,引入新的根證書和中級證書,用於承載後續的新功能與合規要求。對普通 HTTPS 網站而言,這一變化在 ACME 自動化流程中幾乎無感。 其次,TLS 客户端認證(Client Auth)將逐步被移除

收藏 評論

Thinking Machines Lab 正式發佈首款產品 Tinker

封面 新聞

由 OpenAI 前 CTO Mira Murati 創辦的 Thinking Machines Lab宣佈其首款產品 Tinker 已正式 GA。 據介紹,Tinker 是一個為微調大模型設計的靈活 API。它的目標是讓研究人員和技術愛好者能專注於算法和數據,而將複雜的分佈式訓練交由平台處理,從而賦能更多人對前沿模型進行研究和定製,簡單來説 Tinker 可以極大地簡化 LLM 後訓練過程。

收藏 評論

Flatpak 引入 Zstd 壓縮,提升 OCI 打包效率

Flatpak 在最新的 1.17 系列開發版本中增強了對 OCI(Open Container Initiative)鏡像的支持,新增使用 Zstd 壓縮構建 OCI bundle的能力。 相比傳統的 Gzip,Zstd 在壓縮和解壓速度上更快,同時還能減少包體積,有助於提升構建和分發效率。不過出於兼容性考慮,Flatpak 目前仍將 Gzip 作為默認選項。 除壓縮方式改進外,這一輪更新還加

收藏 評論

日本開發者創造專為 LLM 代碼生成優化的編程語言:粋 (Sui)

日本數據科學家Takato Honda(本田崇人)創造了一門名為“Sui”的開源編程語言,宣稱可以讓 LLM 以 100% 的準確率編寫代碼。 據介紹,粋 (Sui) 名稱源於日本美學中“精煉”和“去除冗餘”的含義,意為摒棄所有不必要的元素,只保留必需品。其設計原則如下: 零語法錯誤率——結構上沒有發生任何語法錯誤。 零拼寫錯誤——變量是數字,不是名稱。 行級獨立性——每一行都是完全獨立的

收藏 評論

微軟 AI 應用 Copilot “捆綁” LG 電視,不可卸載引發爭議

據techpowerup報道,有用户發現LG電視webOS系統更新後預裝了微軟Copilot AI應用。 報道稱,多位用户在 Reddit 等社區反饋同樣情況,稱Copilot以系統應用形式存在,無法通過常規方式卸載。部分用户擔憂此類AI集成可能帶來隱私與非必要數據處理問題。 此舉被視為微軟加速AI生態佈局、拓展至電視等日常設備的最新動作。目前該應用在電視端具體功能尚不明確。此外,LG電視內置

收藏 評論

AI 視頻公司 Runway 發佈世界模型 GWM‑1

封面 新聞

AI 視頻公司 Runway 近日宣佈推出通用“世界模型”家族 GWM-1,並同步更新其旗艦視頻生成模型 Gen‑4.5。 GWM-1 基於 Gen‑4.5 構建,可逐幀生成、實時運行,並通過攝像機姿態、機器人指令、音頻等動作進行交互式控制,包含「GWM Worlds」「GWM Avatars」「GWM Robotics」三種後訓練變體: GWM Worlds 能在長時間移動序列中維持空間連貫

收藏 評論

Manus 1.6 發佈:Max 性能、移動開發和 Design View

封面 新聞

通用智能體 Manus 正式發佈 1.6 版本,主要變化如下: 引入旗艦級別 Agent:Manus 1.6 Max 用於構建超越 Web 的應用的移動開發 以及用於交互式圖像創建的設計視圖。 本次發佈的核心是 Manus 1.6 Max,作為新的旗艦 Agent。它通過更先進的規劃和問題解決架構,帶來了可衡量的性能提升。 更高的任務成功率: Max 顯著提高了單次任務的成功率。現

收藏 評論

英特爾悄然停止維護開源 Gaudi 用户空間驅動代碼

封面 新聞

有跡象顯示,英特爾在其 Gaudi 加速器的開源軟件生態上遭遇新的挫折:負責 Gaudi 用户空間支持的開源項目 SynapseAI Core 已被歸檔並停止維護,這為相關內核驅動的未來蒙上陰影。 英特爾在 11 月底剛剛公開了面向 Gaudi 3 加速器的 Habana Labs 內核驅動代碼,準備提交上游合入 Linux 內核主線。此前,這一開源工作因公司內部裁員和人員流動屢次受阻,驅動維護

收藏 評論

英偉達發佈 Nemotron 3 系列開放模型

封面 新聞

英偉達宣佈推出 NVIDIA Nemotron™ 3 系列開放模型、數據和庫,為各個行業透明、高效的專業代理式 AI 開發提供助力。 Nemotron 3 系列MoE 模型提供 Nano、Super 和 Ultra 三種規模,採用突破性的異構潛在混合專家 (MoE) 架構,幫助開發者大規模開發並部署可靠的多智能體系統。 Nemotron 3 Nano:是一款具備 300 億參數的小型模型,每次

收藏 評論

通義百聆語音雙子星升級並開源,大幅提升語音合成與識別能力

封面 新聞

據通義大模型官方消息,通義百聆宣佈其語音大模型Fun-CosyVoice3與Fun-ASR完成重大升級並同步開源。此次升級聚焦核心性能與實用性,為開發者與企業提供更強大的語音AI工具。 Fun-CosyVoice3:實時、精準的語音合成 模型首包延遲降低50%,實現“輸入即發聲”。中英混説錯誤率大幅下降56.4%,並支持9種語言、18種方言及情感控制。其開源版本Fun-CosyVoice3-0

收藏 評論

李彥宏接受《時代》週刊專訪,稱 2025 年是 AI 應用普及關鍵年

封面 新聞

百度創始人李彥宏近日在《時代》週刊「AI 架構師」專題採訪中表示,2025 年將是 AI 應用普及的關鍵一年。他判斷,基礎模型層最終會留下少數幾家,但應用層的各個方向將涌現眾多成功參與者,「我認為那裏才是機會最多的地方」。 李彥宏強調,百度採取「應用驅動」策略,針對搜索、數字人等重點領域定向訓練模型以形成優勢,而非追求面向所有人的「萬能模型」。 李彥宏表示,全球 AI 競爭態勢趨於白熱化。與美國

收藏 評論

高通宣佈收購 RISC-V 初創企業 Ventana 微系統公司

封面 新聞

高通宣佈收購RISC-V初創企業Ventana微系統公司。此次收購意味着高通可能啓動雙架構並行戰略,未來其芯片產品將有望同時集成自研的Arm架構核心與高性能RISC-V架構核心。 Ventana成立於2018年,專注於開發面向數據中心及企業級市場的高性能RISC-V CPU設計,目前已成功推出多代產品。 高通表示,收購完成後將繼續推進自研Arm架構Oryon核心的研發,同時也將持續迭代Venta

收藏 評論

Google Translate 全面升級,集成 Gemini 提升翻譯質量

封面 新聞

谷歌宣佈對Google Translate進行重大更新,引入Gemini技術,顯著提升對習語、方言及俚語等複雜表達的翻譯準確性。 該功能現已在美國和印度上線,支持英語與近20種語言(包括中文、西班牙語、印地語、日語和德語)互譯,可通過Google搜索及iOS/Android版Translate應用使用。 同時,谷歌推出“實時語音翻譯”Beta功能,在Android端支持70餘種語言,保留説話

收藏 評論

8 位科技領袖登上《時代》年度人物封面,被稱為“AI 構建者”

封面 新聞

美國《時代》雜誌公佈了 2025 “年度人物”—— 一組被稱作“AI構建者”的科技行業領軍者,體現人工智能對當今世界的深遠影響。封面模仿了 1932 年經典攝影作品「摩天樓上的午餐」,將 8 位科技領袖並排置於鋼樑之上,象徵共同搭建新時代的技術結構。 封面出現的八位人物從左至右依次為:Meta CEO 扎克伯格、AMD CEO 蘇姿豐、xAI 創始人馬斯克、英偉達 CEO 黃仁勳、OpenAI

收藏 評論