動態

詳情 返回 返回

2025 年 AI、機器學習與數據工程趨勢報告

本文已收錄在Github,關注我,緊跟本系列專欄文章,咱們下篇再續!

  • 🚀 魔都架構師 | 全網30W技術追隨者
  • 🔧 大廠分佈式系統/數據中台實戰專家
  • 🏆 主導交易系統百萬級流量調優 & 車聯網平台架構
  • 🧠 AIGC應用開發先行者 | 區塊鏈落地實踐者
  • 🌍 以技術驅動創新,我們的征途是改變世界!
  • 👉 實戰乾貨:編程嚴選網

0 關鍵要點

  • AI 技術的下一個前沿將是“物理智能”(Physical AI)
  • RAG已逐漸商品化,在企業應用中得到廣泛採用
  • AI 正從“助手”轉變為“共同創造者”。未來不僅是寫代碼更快,而是 AI 將參與應用的完整生命週期——開發、測試與發佈。
  • AI 驅動的 DevOps 流程與實踐 成為今年備受關注的熱點。
  • 人機交互(HCI) 領域強調技術要服務於真實人類需求,設計要融入人們的生活場景。
  • 新的協議如MCP與A2A將繼續推動 AI 客户端與後台系統間的互操作性。

AI/ML 趨勢報告為讀者提供人工智能、機器學習與數據工程領域的新興趨勢與技術概覽。本報告總結了與多位嘉賓的播客討論,重點介紹未來 12 個月值得關注趨勢。

1 AI與機器學習趨勢圖

報告中的核心部分是 年度趨勢圖(Trends Graph),展示了不同技術從“創新者階段”到“早期採用者”、“早期大眾”的演進路徑。

這一框架基於 Geoffrey Moore 的著作《跨越鴻溝》(Crossing the Chasm)。主要聚焦尚未“跨越鴻溝”的新興技術領域。

自 2022 年 11 月 ChatGPT 發佈以來,生成式 AI 與LLMs)徹底主導了 AI 技術版圖。各大科技巨頭持續推出更強的語言模型版本。延續過去幾年的爆發式增長,AI 領域在過去一年中出現了大量重大創新。

與去年趨勢報告的對比更新:

本文重點介紹趨勢圖中新增與更新的技術主題,並説明它們在採用曲線中的最新位置。

2 創新者階段

今年的“創新者”類別新增了多個前沿主題。

2.1 AI Agents

今年 AI 代理領域發展迅猛。Anthropic 推出了 Claude Subagents,Amazon 發佈 Bedrock Agents,AI 代理正從執行單一任務進化為能夠編排複雜工作流、做出上下文決策的系統。

其他重要進展包括:

  • OpenAI 公佈 通用 ChatGPT Agent,可在表格與演示類應用中自動執行任務。
  • Amazon 開源 Strands Agents SDK,用於構建 AI 代理。
  • NVIDIA 推出 Visual AI Agents,用於視頻分析。

Daniel Dominguez 指出:

我們正從簡單的聊天機器人,邁向能幫我們安排會議、更新數據庫、啓動雲資源的 AI 助手。如 Amazon Bedrock Agents 能在不管理基礎設施的前提下,基於任意基礎模型創建生產級代理,這些代理可安全地鏈式調用任務與服務,將“代理範式”引入 AWS 生態中,大大縮短從實驗到生產的路徑。

Anthony Alford 補充:

代理功能強大但也潛藏風險。如能訪問文件系統的代理若執行錯誤命令(如“rm -rf”)可能造成災難性後果。這些工具極大地提高了生產力,但也放大了安全隱患——當 AI 能訪問你的銀行賬户或刪除硬盤時,安全問題比以往更嚴峻。

2.2 多模態語言模型(Multi-Modal LLMs)

語言模型如今具備多模態能力,可同時處理文本、圖像、音頻與視頻等多種數據類型,實現更深層的語義理解與跨模態推理,從而生成更準確、有價值的輸出。


2.3 物理智能(Physical AI)

物理智能 是今年 AI 技術格局中的重大突破,即 AI 在機器人和本地設備中的實體化。

  • Google 推出 Gemma 3n,專為手機、筆記本和平板設計的生成式模型
  • Microsoft 推出 Mu,用於 Windows 系統設置的輕量級小語言模型(SLM),每秒可生成上百 token
  • Google DeepMind 發佈 Gemini Robotics On-Device,讓 Gemini 2.0 的多模態推理與現實理解延伸至本地機器人設備
  • NVIDIA 推出完整的三層物理 AI 開發體系:DGX 超算(訓練)、Omniverse 與 Cosmos(仿真)、Jetson AGX Thor(機器人推理),實現從訓練到部署的全流程物理 AI 開發。

Savannah Kunovsky 表示:

當 AI 進入家庭等私密空間時,設計“可信賴的邊緣體驗”至關重要。用户更希望數據在本地處理,而不是傳輸到遙遠的服務器。未來的物理 AI 應在實用性與隱私保護之間取得平衡,讓人們願意“邀請”它進入生活。

Anthony Alford 補充:

推理型語言模型正成為機器人智能的重要路徑。NVIDIA 的機器人主管 Jim Fan 認為:“若沒有實體化,AGI 永遠不會到來。”換言之,真正的通用人工智能必須以物理形式存在。

2.4 MCP

Anthropic 於 2024 年 11 月提出,是一種開放標準,在為LLM提供統一的數據集成接口,減少碎片化和定製化集成的複雜度。

OpenAI、Microsoft、Google 均宣佈支持 MCP。

Anthony Alford

MCP 已被廣泛採納,它是實現 AI 代理互通的關鍵技術。儘管存在安全挑戰,但它已成為主流,如用於運行測試的 Playwright MCP 服務器、或讓代理讀取 Figma 原型的應用,都是當前熱門場景。

Daniel Dominguez

MCP 最令人興奮的地方在於“互操作性”。它讓不同公司的模型與數據源共享同一協議,實現多代理系統協作,真正讓 AI 跨平台協同工作。

2.5 人機交互(HCI)

藉助 Agentic AIPhysical AI,人機交互正迎來重大變革。我們與軟件交互的方式將更加自然與情境化。

Savannah Kunovsky(IDEO 設計專家):

如今要用好大語言模型,必須懂得“提示工程”,這阻礙了大眾採用。我們應讓技術界面更流動、更自然。比如,信息應出現在我們需要的地方:烹飪時顯示食譜、行走時輕鬆回覆消息,而非停下來掏出手機。技術的目標是將信息嵌入日常情境中

她還提到 AI 在設計行業的應用:

設計師現在能用生成式工具更快表達創意。如 IDEO 的一位設計師利用 AI 為兒童玩具設計製作“預告片”,通過視覺短片展示可持續材料的理念,溝通效率顯著提高。這種跨領域協作正在改變設計的創作方式。

其他新增至“創新者”類別的趨勢還包括 推理模型(Reasoning Models)AI DevOps


3 早期採用者階段

主要關注:語言模型創新RAG

3.1 語言模型創新

大型語言模型是生成式 AI 的基礎。

今年出現了多種新類型與突破:視覺語言模型(VLM)、小語言模型(SLM)、推理模型與狀態空間模型(SSM)等。

代表性成果包括:

  • OpenAI 的 GPT-5
  • OpenAI Sora:開創性的生成視頻模型

小語言模型(SLM) 繼續在端側推理、隱私保護與成本優化領域擴展應用。

Anthony Alford

GPT-5 的發佈方式讓人意外:用户無需選擇,系統自動選用最合適的模型版本。
這解決了命名混亂問題(如 4o 與 o4),簡化了體驗。

Savannah Kunovsky

這種做法旨在簡化用户界面
隨着技術成熟,真正的差異化將來自“交互體驗”,
即如何讓普通用户更自然地使用這些強大能力。

3.2 RAG

過去一年,RAG 應用在企業級開發中實現了爆發式增長,已從創新走向標準配置

Anthony Alford

幾乎所有擁有大量文檔與知識庫的企業,都在考慮構建自己的 RAG 系統。

Savannah Kunovsky

RAG 改變了我們的設計調研方式。以往我們需要與多人訪談、收集資料;現在系統能自動整合公司內部文件與報告,讓設計團隊在動手前就獲得充足上下文。這讓非技術團隊也能輕鬆構建基於 RAG 的應用。

此外,自動化機器學習(AutoML) 也進入早期採用階段,已被多家機構納入生產流程。

4 早期大眾階段

以下技術已在各類組織的開發團隊中普遍採用:

  • 向量數據庫(Vector DBs)
  • MLOps
  • 合成數據(Synthetic Data)

5 晚期大眾階段

這些技術現已完全成熟,成為企業核心架構的一部分:

  • 數據湖倉(Lakehouses)
  • 流式處理(Stream Processing)
  • 分佈式計算(如 Apache Storm)

6 總結

AI 技術正從“任務執行者”演變為值得信賴的智能協作者,能夠解決現實世界的複雜問題。AI 將持續深化並拓展至我們尚未設想的領域。未來一年預測:

  • AI 代理與 AI 驅動開發工具 將持續發展
  • 真正對人有用的 AI 應用 將奠定下一代互聯網的基礎
  • 視頻 RAG 將興起,區分真人與 AI 生成視頻將成為新挑戰
  • 業界可能開始討論“AI 泡沫”,並非因技術失效,而是行業結構面臨調整
  • AI 將更加隱形與上下文化,成為生活中自然、幕後運行的一部分
user avatar
0 用戶, 點贊了這篇動態!

發表 評論

Some HTML is okay.