博客 / 詳情

返回

AI推理硬件選型指南:CPU 與 GPU 的抉擇

AI基礎設施的建設不應追逐硬件潮流,而在於為任務選擇最合適的工具。

Akamai全球分佈式邊緣網絡能獨特地為實時應用提供可擴展、高性價比的AI推理服務。通過對CPU的戰略性使用,Akamai進一步降低了多種推理工作負載的成本與能耗,且無需犧牲性能。

如您所在的企業正在考慮構建和部署 AI 賦能應用程序,或您正在尋找合適的 AI 推理運行環境
點擊鏈接瞭解 Akamai AI 推理雲解決方案,現在申請試用可得高達 500 美元專屬額度

決策邊界:CPU 還是 GPU?

下表將助您根據模型架構、延遲需求與部署環境,做出正確的基礎設施選擇。

在 Akamai Cloud 上部署 AI 推理的 9 個步驟

以下將引導您如何使用基礎設施即代碼(IaC)在Akamai Cloud上快速部署AI應用。利用Terraform,您能以最小手動成本,在邊緣快速創建可擴展、可移植的環境。
開始前,請仔細閲讀每一步驟,確保理解流程以高效完成設置。
1.準備環境
2.克隆或分叉項目倉庫
3.妥善保存密鑰信息
4.按需配置(可選)
5.初始化並應用配置
6.設置自定義域名(可選)
7.訪問應用
8.成本估算
9.清理資源
1. 準備環境
若已完成以下步驟,可跳過。但請確保在配置基礎設施前所有前置條件均已滿足。

  • 安裝Terraform : HashiCorp ,使用Terrform在 Linode 上配置基礎設施
  • 生成API令牌:Akamai 個人訪問令牌管理指南
  • 註冊SSH密鑰:SSH 密鑰生成指南

2.克隆或fork項目倉庫

  • 進入您想要存放項目的文件夾,例如:cd ~/Projects
  • 運行 git clone https://github.com/jgdynamite10/moviemind-public.git
  • 進入項目目錄:cd moviemind-public
    注意:若您計劃對代碼進行修改,應首先 Fork 此代碼庫:
  • 訪問您正在使用的 GitHub 代碼庫頁面。
  • 點擊頁面右上角 Watch 和 Star 選項卡之間的 Fork 按鈕。
  • 隨後即可創建屬於您自己的 jgdynamite10/moviemind-public.git 代碼庫副本。

3.妥善保存密鑰信息
遵循開發安全最佳實踐,保護敏感數據。
注意:切勿將密碼、密鑰和令牌存入GitHub,請將 .env、secrets.tfvars 等文件加入 .gitignore。

4. 按需配置(可選)
編輯 variables.tf 中的可定製變量,使基礎設施符合應用需求:

  • Label: 為實例命名以便追蹤
  • Region: 選擇靠近用户或數據源的位置
  • Instance_type: 根據工作負載匹配計算資源(見表2)


注意:請在基礎設施配置完成後再設置域名變量,以確保所需信息可用。

5. 初始化並應用配置
運行 terraform plan 預覽Terraform將創建、修改或銷燬的資源,此操作不會實際應用配置,是驗證變量與配置是否正確的好方法。

設置變量後,初始化Terraform工作區並應用配置以部署基礎設施:
terraform init
terraform apply -var-file="secrets.tfvars"
Terraform會在創建資源前請求確認。此過程大約需要5至10分鐘。完成後,將輸出實例的公網IP及其他有用信息。

6. 設置自定義域名(可選)
若需使用品牌域名,請遵循Akamai配置自定義域名指南並啓用HTTPS加密。
提示:若部署到計算實例,請創建一條A記錄指向實例的公網IP。為加速DNS解析,建議將TTL降至300秒。
7. 訪問應用
部署完成後,Terraform會輸出實例的公網IP。

  • 等待約1分鐘,待服務完全初始化。
  • 在瀏覽器中訪問:https://<您的實例IP>:8080
    若訪問遇到問題,請參考下一節的故障排除提示。

8. 成本估算
使用Akamai雲服務成本計算器來配置和估算基礎設施成本,並可對比Akamai與AWS、GCP和Azure的定價,瞭解潛在節省。

9. 清理資源
若不再需要該基礎設施,請運行:terraform destroy,並同時清理:

  • DNS記錄(如果使用了自定義域名)
  • 本地的密鑰或臨時文件

故障排除提示

配置問題:

  • 運行 terraform validate 檢查語法錯誤或缺失變量。
  • 確保API令牌有效且賬户配額充足。

服務器創建卡住或離線
若過程卡頓超過3分鐘或無進展,或服務器看似創建但持續離線,最佳選擇是刪除此服務器並重新運行 terraform apply -var-file="secrets.tfvars"。

Terraform 無法建立 SSH 連接
確保SSH代理正在運行且已添加SSH密鑰。

進程在任何階段卡住
若部署過程卡頓超過3分鐘且無進展,請按 Ctrl+C 中斷,然後重新運行 terraform apply -var-file="secrets.tfvars",通常可解決問題。

應用無法加載

  • 確認使用的IP地址和端口正確。
  • 使用 dig 或 nslookup 驗證域名解析是否正確。
  • 若SSL證書配置失敗(常見原因),請重新運行 terraform apply 命令。
  • 檢查防火牆規則與端口開放狀態。
  • 在Akamai Linode控制枱確認SSH密鑰與實例狀態。
  • 使用 curl 或 Postman 測試API端點。
    若以上步驟未能解決問題,請查看Akamai服務日誌或聯繫Akamai技術支持團隊獲取進一步協助。

恭喜!

您已成功在Akamai邊緣平台上使用CPU部署了AI推理服務。此設置支持多種實時應用,並可擴展自定義域名、HTTPS及可擴展基礎設施。

匹配硬件與用例,避免浪費時間和金錢

評估AI推理硬件時,不應只關注算力,更需思考CPU和GPU如何與您的機器學習任務及數據集相匹配。多核CPU能高效處理序列任務、控制功能及數據處理;而GPU則為深度神經網絡、大語言模型及其他高性能計算工作負載提供強大的並行處理能力。

CUDA或Tensor等框架利用GPU加速器來提升模型訓練速度、減少瓶頸,尤其適用於重度依賴矩陣乘法與高吞吐量的算法。同時,CPU對於多數推理任務仍是高性價比之選,兼具能效與跨計算系統的可移植性。
無論您的AI項目涉及聊天機器人、生成式AI還是數據科學的大型數據集,理解CPU與GPU(以及Intel、AMD和NVIDIA的各類產品)的核心差異,都將助您精準匹配硬件與用例,避免浪費訓練時間與基礎設施成本。

如您所在的企業正在考慮構建和部署 AI 賦能應用程序,或您正在尋找合適的 AI 推理運行環境
點擊鏈接瞭解 Akamai AI 推理雲解決方案,現在申請試用可得高達 500 美元專屬額度

user avatar tencent_yinshipinxiaojiejie 頭像 u_17521085 頭像 baidujiagoushi 頭像 u_17582364 頭像 xiuji 頭像 240cgxo4 頭像 u_16213612 頭像 u_15675241 頭像 u_16099347 頭像
9 位用戶收藏了這個故事!

發佈 評論

Some HTML is okay.