Stories

Detail Return Return

從開發者視角解讀 Google Cloud Next 25 - Stories Detail

每年的 Google Cloud Next 大會都是雲計算世界的風向標,展示技術趨勢,也為開發者指明方向。這次我有幸以思否觀察團成員身份,親臨 2025 年 4 月 9–11 日在拉斯維加斯舉辦的 Google Cloud Next 25 大會,三天滿滿的議程中,最讓我感受到衝擊與啓發的,是第一天的主題演講。

本文我將從開發者視角出發,分享我在 Keynote 中聽到的重點內容,並結合出海需求講講:Google Cloud 為中國開發者考慮了些什麼。

如果要一句話來總結,我會説:本次主題演講清晰展現了 Google Cloud「以開發者為中心」的技術戰略,其核心方向有三點: (1) 全面擁抱人工智能;(2) 持續提升底層基礎設施能力;以及 (3) 不斷優化開發者體驗和生產力。

全球基礎設施升級:構建全球產品的底座

Google Cloud CEO Thomas Kurian 一開場就帶來了幾個關鍵數字:全球已有 400 萬開發者使用 Gemini 構建應用,Vertex AI 使用量在一年內增長 20 倍。

這些成果背後,是 Google 在基礎設施上的長期投入——目前已建成覆蓋 200 多個國家和地區的 42 個雲區域,配套超過 200 萬英里的海底和陸地光纜,打造出幾乎零延遲的「Google 速度」網絡。

特別值得一提的是 Cloud Wide Area Network (WAN),已全面開放給企業客户,官方表示它可將延遲和成本各降低約 40%。對開發者來説,這意味着部署在全球不同地區的服務能更快、更穩、更便宜。

對於我來説,400 萬開發者和 20 倍增長本身或許只是表象,更值得關注的是:它的能力是否夠強?是否匹配我的需求?是否穩定?是否能讓我專注在構建產品,而不用擔心底層問題?

📌 對中國出海開發者而言,這種網絡與算力覆蓋,是構建全球產品的底層前提。我們可以將服務部署在靠近目標市場的地理區域,大幅降低延遲,帶來更好的用户體驗。這也是很多出海產品最關注的第一步。

Ironwood TPU 與 AI 超級計算:把 AI 性能推到極致

接着登台的 Google CEO Sundar Pichai 在現場公佈了第七代 TPU —— Ironwood,預計將在今年晚些時候正式推出。這一硬件是 Google 為了滿足 AI 推理與訓練日益增長的需求所打造的重磅升級。

與第一代 TPU 相比,Ironwood 的性能提升了驚人的 3600 倍;即便是與前一代 Trillium 相比,其峯值算力也提升了 5 倍,同時 高帶寬內存(HBM)容量提升 6 倍,能效更是達到了 Trillium 的兩倍。換句話説,用更少的電,做更多的事。

每個 Ironwood pod 最多可搭載 9216 顆芯片,整體算力高達 42.5 exaflops,並通過高度優化的數據通路設計,將芯片間的數據移動與延遲降至最低。這對於像 Gemini 2.5 Pro、Veo 2 這類需要巨量計算支撐的思維模型與多模態模型來説,是不可或缺的基建後盾。

這還只是第一層。在大會上,Google 還公佈了 AI Hypercomputer 的全面增強:

  • 集成 Ironwood TPU,成為支撐 AI 的超級計算平台;
  • 全新推出 400G Cloud Interconnect,是上一代 100G 的 4 倍帶寬,適配大模型高速通信;
  • 引入 Anywhere Cache 與 Rapid Storage,其中 Rapid Storage 是業界首個支持區域級對象存儲的架構,隨機讀寫延遲比業界最快方案低 5 倍;
  • 支持 vLLM(高效推理框架)與大規模推理負載調度。

更貼近開發者的部分是:GKE(Google Kubernetes Engine)現在也原生支持 AI 推理優化。根據 Google 現場分享的測試數據:使用 GKE 新功能後,服務成本可降低高達 30%,尾部延遲減少 60%,吞吐量提升 40%。

📌 對 AI 開發者來説,這意味着三件事:

  1. 大模型的部署成本正在快速下降;
  2. 開發者可以藉助現成的容器工具(如 GKE)部署高性能推理服務;
  3. 從底層硬件到上層平台,Google 正在打通一條「從想法到上線」的最短路徑,真正實現雲原生 AI。

📌 這場關於硬件和基礎設施的更新,表面看是技術參數的疊加,實則是 Google 向開發者遞出的強有力承諾 —— 如果你選擇在這裏構建 AI,Google 已經替你鋪好了地基。

Vertex AI:從模型到智能體的統一平台

Vertex AI 是 Google Cloud 上用於訓練、部署和管理 AI 模型的一站式平台。本次大會宣佈了不少升級,比如:

  • 正式支持 Meta 的 Llama 4 模型;
  • 全新的 Vertex AI Dashboards 可以更方便地監控延遲、吞吐等運行狀態;
  • Model Optimizer 會根據請求特性,自動選擇最優模型;
  • Live API 讓我們可以將實時音視頻流接入 Gemini,進行實時互動。

更值得一提的是,Vertex AI 現在也支持「多智能體系統」的構建 —— 一個系統中可包含多個 AI 智能體,相互協作,完成更復雜的工作流。

📌 對開發者來説,Vertex AI 的這些能力意味着:你不需要自己搭建複雜的訓練、部署、監控平台,也不用擔心服務穩定性和多區域訪問的問題;對於初創團隊來説更是重要。

Gemini 2.5 Pro 與 Flash 雙引擎上陣

在這次 Keynote 上,Google 展示了 Gemini 2.5 系列的兩款核心推理模型:Gemini 2.5 Pro 和即將上線的 Gemini 2.5 Flash。這對組合各有所長:Pro 面向高精度任務,Flash 面向低延遲高頻交互。它們支持「思維鏈式推理(Thought Chaining)」,能一步步推理出結論,幾乎覆蓋了從複雜推理到實時互動的所有主流 AI 應用場景。

🧠 Gemini 2.5 Pro 是主打精度與深度的旗艦模型,支持文本與圖像等多模態輸入。超長的上下文使得它特別適用於代碼審查、長文本總結、法律或金融場景的推理輔助等對記憶與邏輯要求極高的任務。

⚡ Gemini 2.5 Flash 則是 Google 為追求高響應、高頻調用、高性價比而打造的輕量級推理模型,預計不久之後(就是現在還沒)在 Vertex AI 上開放使用。它的最大特點是:響應快、成本低、還能動態調節複雜度。

並且,Flash 模型還會自動根據問題複雜度調整回答邏輯!例如遇到簡單常識型問題就會快速回應,不再「認真地進行五段式推理」,而當面臨複雜任務時也能適當延長處理時間,確保輸出質量。對於需要高併發調用的客服系統、摘要生成器、問答機器人等業務,這種智能調節機制非常實用,也能極大降低使用成本。

此外,Flash 模型還允許開發者自定義「推理預算」——簡單來説,你可以設定更偏向快一點、準一點,還是省一點錢,Google 幫你在不同目標間找到最優解。

📌 這兩款模型未來都將在 Vertex AI 中穩定提供服務,支持與其他 Google 模型與服務無縫集成。你可以根據產品需求靈活切換:複雜問題交給 Pro,高頻響應交給 Flash,從容應對不同規模和節奏的 AI 應用需求。

這裏也補充一點:很多開發者可能還不知道的是,在以人類偏好作為評測標準的權威大語言模型的測評榜單 Chatbot Arena 中,Gemini-2.5-Pro-Exp-03-25 的排名是全球第一,這是經過真人實測的結果,也是許多模型推出前會參與進行測評的首選榜單。

多模態生成的 AI 創作工具箱再進化:圖像、音頻、音樂、視頻全面升級

除了 Gemini 系列模型,Google 也在本次 Keynote 中展示了旗下多模態生成模型矩陣的全面升級:圖像生成的 Imagen 3、音頻生成的 Chirp 3、音樂生成的 Lyria,以及視頻生成的 Veo 2,每一個都直指一個特定的創意工作場景。

📸 Imagen 3:作為 Google 最新的文本生成圖像模型,它不僅支持高保真圖像生成,還強化了對圖像局部的修復與再創作能力(inpainting/outpainting)。其對 prompt 的理解程度業界領先,適合用於產品視覺、廣告、插圖生成等場景。

🎤 Chirp 3:僅需 10 秒音頻,即可生成定製語音語音風格!應用在客服語音、品牌人設、可訪問內容生成等領域。它延續了 Chirp 系列對自然音色與語義表達的高保真要求。

🎵 Lyria:這是 Google 推出的企業級文本生成音樂模型,只要輸入一句描述,即可生成 30 秒音樂片段,適合創作配樂、短影音 BGM、遊戲音效等內容。現已開放申請內測(申請入口: https://docs.google.com/forms/d/1YktCIiIzyZe6TxfKnQ9PzybXGLzO...)。

🎬 Veo 2:本次最值得關注的,是 Google 的旗艦級文本生成視頻模型 Veo 2,它不再只是視頻生成工具,而是一個視頻創作與編輯平台,包含以下強大功能:

  • P 視頻(去除元素):可自動刪除視頻中不需要的物體(如路人),提升畫面純淨度;
  • 關鍵幀生成:通過輸入起始幀和結束幀,自動生成中間段落,保持畫面流暢自然;
  • 擴展畫面:將原有橫屏視頻自然擴展為豎屏,便於社媒平台分發(如抖音、小紅書);
  • 鏡頭控制:可以指定攝像機移動方向、構圖風格,甚至模擬延時攝影或無人機跟拍。

值得一提的是,Google 自家的 VideoFX 服務正是基於 Veo 2 構建,未來這項能力有望進入 Workspace 與 YouTube 創作者工具中。

同樣的,Veo2 目前已開放候補名單申請(申請入口: https://docs.google.com/forms/d/e/1FAIpQLSfdksQf4brbFzAx5l1ge...)。

📌 對於內容創作者、品牌出海團隊、媒體機構來説,這組四件套讓我們能從一段文字、一條語音出發,可以快速生成圖像、音頻、音樂和視頻;當然,坊間也有許多這類的工具,也希望大家也都能比較嘗試,並且在社區反饋你的體驗和推薦。


智能體(Agent)生態系統:從概念走向實用,開發者可以立即上手

這次 Google 用 “Agents for everyone” 概括它的新願景,背後是多個已上線的功能組件,正式將「多智能體系統(Multi-agent Systems)」帶入開發者可用的階段。

更具體地説,開發者現在可以通過 Vertex AI 的以下能力,構建具協作能力的 AI 智能體系統:

  • Agent Development Kit(ADK):這是一個開源的開發框架,用户僅需不到 100 行 Python 代碼,就能完成他第一個智能體,並且支持工作記憶、對話狀態、外部 API 插件調用等功能。非常適合快速開發客服助手、業務流程機器人等場景。
  • Agent2Agent 協議(A2A):Google 是首家發佈開放 Agent 協議的主流雲平台,支持多個 Agent 之間基於標準協議交換信息。例如,一個智能體可以調用另一個智能體的能力,實現「AI 調用 AI」。這對於構建複雜任務處理流程至關重要。
  • Agent Garden:這是一個智能體樣例和連接器集合,包含 100 多個可用的預構建模塊,支持連接 BigQuery、Google Workspace、Slack、GitHub 等常用工具和服務,大大降低集成成本。
  • Chrome & Workspace 集成:Agentspace 已整合進 Chrome Enterprise 和 Google Workspace,普通員工也可以直接在瀏覽器或文檔中調用智能體,快速搜索、對話與執行任務。

這些能力目前已可以通過 Vertex AI 訪問使用,ADK 的開源項目也已經上線(可在 GitHub 上獲取),其中部分進階功能(如複雜智能體協調)雖然還處於預覽階段,但基本能力已經可以在真實項目中使用。

📌 適用場景舉例:

  • 在跨國客服系統中,同時部署訂單查詢智能體、翻譯智能體與風險識別智能體,三者協作響應用户問題;
  • 構建一個面向內部團隊的“多 AI 工具箱”,一鍵生成報告、摘要郵件、提取數據,提升員工效率;
  • 在遊戲、教育、金融等領域構建具備腳本調用能力的 AI 角色。

📌 對於出海開發團隊而言,這樣的多智能體能力正是擴展產品差異化體驗、提升本地服務效率的關鍵武器。以往我們可能需要組建一整套微服務 + 對話系統 + 插件機制,現在 Google Cloud 提供了一套統一、開箱即用的解決方案,能讓中小團隊以極低成本快速驗證與迭代,就連運營、市場、銷售等非技術開發員工,也能通過低代碼方式使用 AI 工具。

數據智能、部署效率與國際化支持:開發者在出海路上的三大底氣

本次主題演講,在大數據分析方面,BigQuery 推出了 Conversational Analytics API(預覽版)和 BigQuery Knowledge Engine(預覽版)。前者讓用户能以自然語言與數據交互,後者則利用 Gemini 的能力智能分析數據模式並推薦業務術語。Looker 也集成了 Gemini,支持自然語言的數據分析和儀表盤創建。強大的數據分析能力是驅動全球業務增長的關鍵,BigQuery 和 Looker 的 AI 增強,能更加助力中國開發者更高效地獲取和利用數據洞察,更好地理解全球用户行為,優化產品和運營策略。

在無服務器和容器化方面,Cloud Run 提供了更好的容器化應用部署能力,Cloud Functions 則讓開發者能更輕鬆地構建可擴展的後端服務。Google Kubernetes Engine (GKE) 也新增了針對生成式 AI 工作負載的優化,包括自動縮放和負載均衡,這對於降低全球分佈式應用的成本和提升性能非常有幫助。

除了技術創新,Google Cloud 在國際化支持方面也做得非常出色。Translation API 支持多種語言,Firebase Hosting 的 i18n 重寫功能方便開發者根據用户偏好或地理位置交付特定語言的內容。更重要的是,Google Cloud 提供了廣泛的合規性服務,滿足全球各地的監管要求。這對於想要在全球市場合規運營的中國企業至關重要。

合規、安全與主權雲:解決出海最大隱憂

主題演講中也宣佈了 Google 全球主權雲佈局,目前已覆蓋 14 個國家、32 個區域,支持本地數據駐留與合規運營,配合 Deloitte 德勤、Accenture 埃森哲 等夥伴共同提供服務。

📌 這對中國企業尤其關鍵:我們常在出海過程中遇到數據合規、隱私保護等挑戰,尤其是在對數據主權高度敏感的地區,例如歐洲(GDPR)、中東和東南亞市場。Google Cloud 推出的主權雲方案,配合其全球合作伙伴生態,不僅能幫助企業符合法規要求,還能保障數據不出境、訪問路徑可控,大幅降低出海合規風險。

全新上線的 Google Unified Security(GUS)平台,也為企業帶來真正統一的安全視圖。它整合了端點、網絡、雲服務與應用的威脅檢測能力,所有數據會自動與 Google 的威脅情報服務(Threat Intelligence)結合分析,搭配 Gemini 實現半自動化的響應與防護。

📌 對於開發者來説,這意味着兩件事:

  • 我們不再需要東拼西湊各種安全工具,就能獲得一個集成的安全防護體系;
  • 安全不再只是「後期補救」的麻煩事,而是從 Day 1 起就可以融入應用生命週期。

這是一種「內建安全、合規隨行」的開發範式,特別適合對隱私與法規要求嚴苛的行業,比如醫療、教育、金融,以及各類 B2B SaaS 出海產品。

中國開發者出海的優選:Google Cloud

結合本次 Google Cloud Next 25 的發佈內容,我認為至少有以下 5 個理由,讓 Google Cloud 成為中國開發者出海的優選平台:

  1. 全球部署靈活、網絡延遲極低:支撐產品真正做到全球化分發與本地化響應;
  2. AI 模型與基礎設施全球領先:從推理模型到訓練芯片都在行業前沿,助力打造下一代 AI 產品;
  3. 工具鏈高度整合:從數據、模型到智能體,構建路徑統一、開箱即用;
  4. 合規、安全體系完整:主權雲與 GUS 安全平台減少出海風險,滿足多地區法規要求;
  5. 以開發者為中心的體驗設計:讓你更少“踩坑”,專注產品開發,提升迭代效率。

當然,各家雲服務商都有各自的定位和長處,本文只是藉由 Google Cloud Next 25 的內容,分享我的觀察與判斷。但最終的體驗還是要靠開發者社羣的共同反饋,才能形成真實的「口碑生態」。

📌 在此,我也想分享一句關於「出海」的心裏話:

真正能走出去的,不只是產品和技術,也不只是我們所在的物理位置,還包括我們對世界不同文化的好奇、對市場和用户的理解、以及和全球技術生態的深度連接。

出海,永遠不只是「把產品翻譯成英文」,而是要重新用世界多元的視角看清楚我們提供的核心價值。

後記:谷歌在 Agent 正在下一盤大旗?

看到 Google 推出 A2A(Agent-to-Agent 協議)和 ADK(Agent Developer Kit),我立刻聯想到當年的 Docker 與 Kubernetes。

當初 Docker 是第一個將容器技術真正落地並普及的革命性工具。開發者開始用它來打包、部署應用,但本質上它還是一個工具層,雖然一度風靡,卻沒能發展成一整套完整的管理系統。

後來,Google 主導推出了 Kubernetes(k8s),不僅解決了「怎麼運行容器」的問題,更是一口氣搞定了「如何大規模管理容器」的難題:部署、擴容、負載均衡、自我修復……整個系統完全掌控。

更關鍵的是,Google 在開源 Kubernetes 之後,將其交由 CNCF 管理,打造了一箇中立的開源社區,使得 AWS、Azure、IBM 等雲服務巨頭也願意加入共建,最終成為事實標準。

結果就是:Docker 領風騷,Kubernetes 定江山。

現在回到 AI 世界。雖然 Anthropic 的 MCP 搶佔了先機,定義了模型(Model)如何調用外部 API 和應用,但 Google 推出的 A2A + ADK + AgentSpace 看起來不僅是「補上拼圖」,更像是想主導下一代 Agent 生態。

特別是 ADK,雖然它是通過 MCP 來訪問外部 API 和資源的,但開發者在實際使用時是直接接入 ADK,對 MCP 的感知可能會變弱。MCP 可能悄然成為默認的底層通道,逐漸在生態中被邊緣化。
如果再往遠了想,假如 Google 按照當年 Kubernetes 的路徑,再打造一個面向 AI 的“CNCF”式開源組織——不僅定義 A2A 協議,還推動開發工具、框架、生態治理的一整套體系,會不會又是一場關於標準制定權的戰役呢?就留待與各位一同見證未來吧!


本文作者:Richard 林旅強 —— Google Cloud Next 25 思否觀察團成員、開源社聯合創始人、RTE開發者社區主理人,Dev.Together 開發者生態大會 2025 聯席主席。

如果你對於開源、AI、開發者生態等議題感興趣,歡迎在社區和我繼續交流!

user avatar shuirong1997 Avatar sfbc Avatar
Favorites 2 users favorite the story!
Favorites

Add a new Comments

Some HTML is okay.