新聞

麥肯錫:九成組織已在用 AI,但“規模化”仍是瓶頸

麥肯錫《The state of AI in2025》報告指出,88% 的受訪者表示其組織在至少一個業務職能中常規使用AI,相比一年前(78%)顯著增長,表明AI使用正在普及。 但在企業級別實現規模化仍未普遍:約三分之二的受訪組織仍處於試驗或試點階段,只有約三分之一開始在更廣範圍內擴展AI計劃。大公司(年營收50億美元)比小型公司更容易進入規模化階段。 分析師評論:報告強調——工具普及並不等於

萬維網發明者認為 AI 將終結網頁廣告

據報道,萬維網(World Wide Web,WWW)發明者蒂姆·伯納斯·李表示,支撐互聯網經濟、產生鉅額收入的廣告模式可能會因生成式人工智能的興起而瓦解。其於週三在倫敦舉行的未來AI峯會上表示,大型語言模型最終可能會在消費互聯網內容方面取代人類。 伯納斯·李指出,用户正越來越多地直接從大型語言模型獲取信息,而不是點擊進入原始網頁。他警告稱:“如果所有網頁內容只有大型語言模型在讀,而人們不再直接瀏

OpenAI 達成百萬企業客户里程碑

OpenAI宣佈全球已經有100萬家企業正在直接使用該公司的服務。公告介紹稱,統計口徑包括所有主動為商業用途付費的組織,以及通過開發者平台直接消費模型的企業。 OpenAI此前在9月初曾披露,包含ChatGPT企業用户和校園版ChatGPT Edu的用户數量破百萬。隨着ChatGPT每週活躍用户超過8億人,消費市場的廣泛接受也推動企業採納AI——企業試用週期正變得越來越短、部署阻力越來越小。

科大訊飛發佈深度推理大模型:訊飛星火X1.5

科大訊飛正式發佈基於全國產算力的訊飛星火X1.5深度推理大模型。 訊飛星火X1.5採用MoE架構,總參數293B,激活參數30B,單台昇騰標配服務器即可部署,推理效率相較X1提升100%,端到端性能達到國際競品效率的93%以上。 模型在語言理解、文本生成、知識問答、邏輯推理、數學、代碼六大核心能力上對標國際主流大模型,數學能力持續保持國際領先。高考數學測評中,星火X1.5得分145分,超越GPT

Kimi K2 Thinking 模型開源發佈

月之暗面宣佈正式發佈 Kimi K2 Thinking —— Kimi 迄今能力最強的開源思考模型。 “Kimi K2 Thinking 是我們基於「模型即 Agent」理念訓練的新一代 Thinking Agent,它原生掌握「邊思考,邊使用工具」的能力。在人類最後的考試(Humanity's Last Exam)、自主網絡瀏覽能力(BrowseComp)、複雜信息收集推理(SEAL-0)等多項

抖音啓動 AI 仿冒專項治理:嚴禁使用 AI 技術偽造名人帶貨

抖音副總裁李亮發文迴應近期“温崢嶸被AI盜播帶貨”事件,表示該案例中提到的“三個直播間同時開播”並非發生在抖音平台,但平台確實發現存在部分利用AI技術仿冒名人進行帶貨的短視頻內容。 李亮指出,這類AI侵權仿冒行為嚴重損害了創作者、商家及平台在消費者心中的信任,也不符合平台的長期利益。抖音對此高度重視,已啓動專項治理行動,針對AI偽造人像、虛假帶貨等行為開展重點整治。 據介紹,AI內容侵權識別目前

Taro 4.1.8 發佈,BAT 小程序、H5 與 RN 端統一框架

Taro 4.1.8 現已發佈。Taro 是一個開放式跨端跨框架解決方案,支持使用 React/Vue/Nerv 等框架來開發微信 / 京東 / 百度 / 支付寶 / 字節跳動 / QQ 小程序 / H5 等應用。 特性(feat) feat: ts taro.request 支持useHighPerformanceMode字段 feat(inject): 小程序支持插入已有原生組件的副本組

評估工程正成為下一輪 Agent 演進的重點

作者:馬雲雷、望宸 導讀 在傳統軟件工程中,測試是保障質量與穩定性的核心環節。它驗證系統的確定性邏輯:基於預設的規則,驗證輸入的可靠性。而 AI 系統的核心能力不再是執行預設的規則,而是基於概率模型進行推理和生成。結果的不確定性、語義的多義性、以及上下文的敏感性,使得原有測試方法難以刻畫模型行為。這一轉變,促使評估工程成為下一輪 Agent 演進的重點。 評估工程,貫穿整個 AI 生命週期,它的目

大語言模型仍無法可靠區分信念與事實

在最新一期《自然·機器智能》發表的一篇論文中,美國斯坦福大學研究提醒:大語言模型(LLM)在識別用户錯誤信念方面存在明顯侷限性,仍無法可靠區分信念還是事實。研究表明,當用户的個人信念與客觀事實發生衝突時,LLM往往難以可靠地作出準確判斷。 這一發現為其在高風險領域(如醫學、法律和科學決策)的應用敲響警鐘,強調需要審慎對待模型輸出結果,特別是在處理涉及主觀認知與事實偏差的複雜場景時,否則LLM有可

特斯拉股東批准馬斯克的 1 萬億美元薪酬計劃

根據特斯拉年度股東大會上公佈的初步結果,特斯拉股東以壓倒性多數批准了埃隆·馬斯克的鉅額薪酬方案,該方案以 75% 的贊成票獲得通過。 根據新的計劃,馬斯克可以在10年內從特斯拉股票中賺取高達8780億美元。馬斯克將獲得高達1萬億美元的股票,但必須向特斯拉支付一些款項。 馬斯克要想獲得“萬億美元薪酬”需實現什麼目標?馬斯克若要拿滿所有獎勵,需要達到的最終目標是特斯拉公司市值超過8.5萬億美元,核心

上海首例涉 AI 提示詞著作權案宣判

上海市黃浦區人民法院(以下簡稱黃浦區人民法院)已對上海首例涉AI提示詞著作權侵權案作出一審判決,該案將爭議核心鎖定於輸入端,圍繞提示詞是否具備作品獨創性、是否屬於“表達”等問題展開論證,為人工智能領域的知識產權保護帶來思考與啓示。 案情回顧 原告系一家從事美術創作的公司,2022年撰寫了六組涉案提示詞,內容涵蓋畫作的藝術風格、主體元素、材質細節等,例如Art Nouveau style illus

微軟發佈 Visual Studio 最新 AI 功能演進路線圖

微軟發佈了旗下開發者IDE“Visual Studio”最新的 AI 功能演進路線圖,旨在將其從“代碼編輯工具”進一步轉型為“AI 協作平台”。 新路線圖涵蓋四大方向:支持自定義、測試與調試等多類智能體併發運行;優化聊天功能,引入斜槓命令提升交互效率;全面實施MCP規範,強化企業級安全管控;集成GPT-5 Codex等前沿模型,並推出自動模型選擇功能。 1. 更新 Agents 功能

Windsurf 新增“Codemaps”功能,讓開發者“先理解,再編碼”

AI 編碼工具公司 Cognition 宣佈推出 Windsurf Codemaps——一項專注於幫助開發者快速理解大型代碼庫結構的新功能,旨在解決工程師在進入陌生項目、切換任務時面臨的高成本“代碼理解”難題。 Cognition 指出,許多工程師往往需要數週甚至數月才能熟悉複雜系統,而現有 AI 工具更偏向代碼生成,缺乏對“跨文件、跨模塊結構理解”的支持。Codemaps 的目標是補足這一短板。

PageIndex - 基於推理的 RAG 系統

PageIndex是一個基於推理的 RAG系統,它構建長文檔的樹狀索引,並基於該索引進行推理以進行檢索。它模擬了人類專家如何通過樹狀搜索從長文檔中導航和提取知識,使語言學習者能夠思考和推理,從而找到最相關的文檔部分。它分兩步執行檢索: 生成文檔的“目錄”樹狀結構索引 通過樹搜索執行基於推理的檢索 功能 與傳統的基於向量的 RAG 相比,PageIndex 具有以下特點: 無需向

清華、北大等高校聯合推出 MotionTrans 框架

清華大學、北京大學、上海交通大學和武漢大學等高校聯合發佈了一種名為 MotionTrans 的人機協同訓練框架。 這一框架的創新之處在於,讓機器人能夠在沒有任何示範的情況下,僅通過觀察人類的動作,學習和執行新的技能。這標誌着機器人學習領域的一次重大突破。 傳統的機器人訓練需要大量的真實演示數據,收集這些數據的過程耗時且成本高昂。例如,教機器人如何擰瓶蓋,需要反覆操作並記錄每一個細節。而現在,Mo

為什麼 MiniMax M2 是一個 Full Attention 模型?

來源:為什麼MiniMax M2是一個Full Attention模型? 作為MiniMax M2預訓練的負責人,我收到了很多來自社區的詢問:“為什麼你們在MiniMax M2上開倒車,採用了 Full Attention 機制?” 在一次又一次的聊天中解釋了背後的故事後,我覺得是時候在一篇blog裏寫下我們的心路歷程。 我可以花一整個下午來討論為什麼應該構建應該做 Linear/Spars

小鵬第二代 VLA 大模型將面向全球開源

2025年11月5日,小鵬科技日上,小鵬汽車圍繞“物理AI”發佈了四項重要應用,包括小鵬第二代VLA、小鵬Robotaxi、全新一代IRON,以及匯天兩套飛行體系,勾勒出物理AI未來出行的清晰圖景,並且這四項AI應用已有明確的量產計劃。 據介紹,小鵬第二代VLA創新性地去掉了“語言轉譯”環節,首次實現從視覺信號到動作指令的端到端直接生成,探索全新物理模型範式。該模型是小鵬首個量產物理世界大模型,

開源 Rust 瀏覽器引擎 Servo 0.0.1 發佈

開源項目 Servo(一個用 Rust 編寫的網頁佈局/渲染引擎)發佈了 0.0.1 版本,Servo 最初由 Mozilla 基金會發起,後來交由 Linux 基金會接管。 雖然“0.0.x”是一個非常早期的版本號,但這是項目首次面向公眾提供預構建二進制文件,包括對 Linux 和 ARM 架構 macOS(Apple Silicon) 的支持,方便開發者快速體驗。 值得關注的是,Servo

開源企業級智能體平台 MaxKB v2.3.0 版本發佈

2025年11月3日,MaxKB開源企業級智能體平台正式發佈v2.3.0版本。 在MaxKB v2.3.0社區版本中,知識庫方面,新增文檔標籤管理功能;應用方面,新增支持文檔標籤檢索、變量拆分、變量聚合、參數提取、視頻理解節點,以滿足更為複雜的應用流程需求;資源授權方面,新增支持文件夾授權,普通用户僅可查看被授權的文件夾,授權文件夾時支持授權文件夾下已有的子資源,大幅提升了權限管理效率。 除此以外

IDC 最新預測:到 2029 年,代理式 AI 系統將佔全球 AI 投資的近一半

IDC 最新預測顯示,到 2027 年,全球一半以上的企業將通過代理式 AI 重新定義人機協作模式。這一預測揭示了 2026 年的關鍵主題——代理式AI時代的崛起。 IDC 研究揭示,AI 已成為企業轉型的引擎。領先者將 AI 視作核心基礎設施,全面嵌入決策、運營與客户體驗。 1. 駕馭顛覆的洋流 面對經濟不確定性、監管變革與地緣政治動盪,治理良好的 AI 體系可將這些擾動轉化為企業敏捷與增長的

輕量級 Linux 桌面環境 LXQt 2.3 發佈

輕量級 Linux 桌面環境 LXQt 推出最新版本 2.3,本次更新重點強化了對 Wayland 的支持,使其在現代 Linux 圖形棧上的可用性進一步提升。 新版帶來多項重要改進: 面板(Panel)在 Wayland 下支持更完善,桌面切換器也能適配更多支持 ext-workspaces-v1 協議的合成器。 自定義命令插件、截圖功能 在 Wayland 環境中得到增

Docker 28.5.2 發佈

Docker 28.5.2 現已發佈。此版本修復了 runc 中的三個高危安全漏洞: CVE-2025-31133 CVE-2025-52565 CVE-2025-52881 這三個漏洞最終都允許(通過不同的方法)繞過 runc 對寫入任意/proc文件的限制,從而實現完全的容器越獄。 Packaging updates 將 runc更新至v1.3.3。moby/moby#51394

谷歌擬加大對 Anthropic 投資,估值或超 3500 億美元

谷歌正在與人工智能公司 Anthropic 進行深入的投資合作談判,預計這一輪融資將使 Anthropic 的估值突破3500億美元。談判尚在進行中,具體的合作細節仍未確定,谷歌可能會通過提供更多雲計算服務、可轉換債券或新一輪的融資來加強與 Anthropic 的合作。 目前,谷歌已經向 Anthropic 投資超過30億美元,這使其獲得了該公司的14% 股權。根據《紐約時報》的報道,Anthr

美團 LongCat 團隊發佈 VitaBench:基於複雜生活場景的交互式 Agent 評測基準

由美團 LongCat 團隊研發的 VitaBench(Versatile Interactive Tasks Benchmark)正式發佈,這是當前高度貼近真實生活場景所面臨複雜問題的大模型智能體評測基準。 VitaBench 以外賣點餐、餐廳就餐、旅遊出行三大高頻真實生活場景為典型載體,構建了包含 66 個工具的交互式評測環境,並進行了跨場景的綜合任務設計,例如要求 agent 在一個旅行規