Dec 24 2025
觀測雲 -
KubeCost 可觀測最佳實踐
FinOps 背景需求
在典型的互聯網公司的成本組成中,IT 成本佔比並不低,技術成本與人力成本的比例差不多在 1:2 ~ 1:2.5 左右, 降低 IT 成本顯然能帶來立竿見影的效果。
近 10 年來雲計算、雲原生、容器、Kubernetes、DevOps 等技術的高速發展,使得 IT 成本的管理變得更加複雜,也給成本的管理帶來了更多的挑戰。目前大多數互聯網公司,都基於 Kubernetes 實
kubernetes
Nov 24 2025
觀測雲 -
Kubernetes CRD 方式配置容器日誌採集最佳實踐
一、概述
DataKit 通過 Kubernetes Custom Resource Definition (CRD) 提供了一種聲明式的容器日誌採集配置方式。用户可以通過創建 ClusterLoggingConfig 資源來自動配置 DataKit 的日誌採集,無需手動修改 DataKit 配置文件或重啓 DataKit,同樣也無需重啓業務。
二、前置條件
Kubernetes 集羣版本 1
日誌分析
Nov 13 2025
觀測雲 -
JAVA Heap Dump 採集最佳實踐
JAVA dump 堪稱 JVM 運行時的“高清 CT 影像”:其中 heap dump 以二進制 hprof 格式完整記錄堆內每一個存活對象、類加載器及錯綜複雜的引用鏈,藉助 retained size 計算可精準量化內存泄漏源頭;thread dump 則瞬間捕獲全部 JAVA 線程的調用棧、鎖競爭、等待隊列與 CPU 使用快照,一眼即可識別死鎖、線程池耗盡或慢調用瓶頸。
觀測雲在此基礎上進一
JAVA
Nov 07 2025
觀測雲 -
阿里雲 RDS PostgreSQL 可觀測最佳實踐
阿里雲 RDS PostgreSQL
阿里雲RDS PostgreSQL 是阿里雲提供的一種穩定、可靠、可擴展的關係型數據庫服務,基於開源對象-關係型數據庫 PostgreSQL 打造,兼容 SQL 標準,支持複雜查詢、事務處理、JSON 數據類型以及強大的擴展能力(如 PostGIS、hstore 等)。RDS PostgreSQL 提供全自動的主備高可用架構,支持跨可用區部署,確保業務連續性。
postgresql
Nov 06 2025
觀測雲 -
攜手SelectDB,觀測雲實現性能與成本的雙重飛躍
在剛剛落下帷幕的2024雲棲大會上,觀測雲又一次迎來了全面革新。攜手SelectDB,實現了技術的飛躍,這不僅彰顯了觀測雲在監控觀測領域的技術實力,也預示着我們可以為全球用户提供更加高效、穩定的數據監測與分析服務。這一技術升級,無疑將引領整個行業向更高層次的發展。
觀測雲的核心優勢在於其「一個平台、一份數據、一個團隊」的理念。我們服務於全球用户,覆蓋全球8個服務可用區,實現了真正的全球化監控觀測
日誌
Nov 06 2025
觀測雲 -
KafkaMQ 日誌採集最佳實踐
概述
Kafka 是由 LinkedIn 開發、後由Apache軟件基金會維護的分佈式流處理平台,採用Scala和Java編寫。它本質是一個高吞吐、持久化的發佈-訂閲消息系統,專注於處理實時數據流(如用户行為日誌、點擊流等)。在收集日誌的場景中,Kafka 可以作為一個消息中間件,用於接收、存儲和轉發大量的日誌,鏈路,指標數據。
觀測雲
觀測雲是一款專為 IT 工程師打造的全鏈路可觀測產品,它集成
kafka
Nov 06 2025
觀測雲 -
通過 KafkaMQ 接入Skywalking 數據最佳實踐
Skywalking
SkyWalking 是一個開源的分佈式追蹤系統,主要用於監控和分析分佈式系統的性能和行為。它支持多種語言和框架,能夠實時收集和分析服務間的調用鏈路數據、性能指標和日誌信息,幫助開發者快速定位系統瓶頸和問題。
SkyWalking Java Agent 是 SkyWalking 提供的針對 Java 應用的自動追蹤工具。它通過字節碼增強技術,在不修改應用代碼的情況下,自動注入
kafka
Nov 06 2025
觀測雲 -
Kafka4.0 可觀測性最佳實踐
Kafka4.0 介紹
Kafka4.0 的重大變革 —— KRaft 模式。Kafka4.0 最具革命性的變化,默認運行在 KRaft(Kafka Raft)模式下,徹底摒棄了對 Apache ZooKeeper 的依賴。KRaft 模式的引入,可謂是 Kafka 架構演進的一次重大飛躍。它基於 Raft 一致性算法構建共識機制,將元數據管理功能巧妙地集成到 Kafka 自身的體系之中,從而實現
kafka
Nov 05 2025
觀測雲 -
RabbitMQ 可觀測性最佳實踐
RabbitMQ 簡介
RabbitMQ 是一個開源的消息代理和隊列服務器,用 Erlang 語言編寫,支持多種客户端。它通過使用交換機(Exchanges)、隊列(Queues)和綁定(Bindings)來路由消息,提供靈活的路由功能。RabbitMQ 支持多種消息協議,包括 AMQP 等,使其能夠輕鬆地與多種應用程序集成。
RabbitMQ 作為一款流行的消息隊列中間件,其監控對於確保系統的穩
rabbitmq
Nov 05 2025
觀測雲 -
阿里雲 RabbitMQ 可觀測性最佳實踐
阿里雲 RabbitMQ
阿里雲 RabbitMQ 是一款高性能、高可靠的消息中間件,支持多種消息協議和豐富的功能特性。它提供消息隊列功能,能夠實現應用間的消息解耦和異步通信,提升系統擴展性和穩定性。其支持多種消息持久化策略,確保消息不丟失;具備靈活的路由和負載均衡能力,可高效分發消息;還提供豐富的管理功能,如隊列監控、消息追蹤和權限管理等,幫助用户輕鬆管理和優化消息隊列,廣泛應用於分佈式系統、微
rabbitmq
Nov 05 2025
觀測雲 -
Memcached 可觀測性最佳實踐
Memcached 介紹
Memcached 是一個高性能、分佈式的內存對象緩存系統,用於動態 Web 應用程序以減輕數據庫負載。它通過將數據緩存在內存中,極大地減少了數據庫查詢的次數,從而提高應用程序的響應速度。Memcached 最早由 LiveJournal 的 Danga Interactive 開發,目前已成為許多大型互聯網公司使用的基礎技術之一。
Memcached 的監控是保障應用性
memcached
Nov 04 2025
觀測雲 -
Tomcat 下部署若依單體應用可觀測最佳實踐
實現目標
採集指標信息
採集鏈路信息
採集日誌信息
採集 RUM 信息
會話重放 即用户訪問前端的一系列過程的會話錄製信息,包括點擊某個按鈕、操作界面、停留時間等,有助於客户真是意圖、操作復現
版本信息
Tomcat (9.0.81)
Springboot(2.6.2)
JDK (=8)
DDTrace (=1.0)
特別説明:如果是 Springboot 項目,Tomc
tomcat
Nov 04 2025
觀測雲 -
OpenTelemetry WebSocket 監控終極方案:打通最後一公里
概述
OpenTelemetry,以下簡稱 OTEL,是由 CNCF 託管的“一站式可觀測性標準”,把指標、鏈路、日誌三大信號統一為單一 SDK/API,零侵入地採集從瀏覽器、移動端到後端、容器、雲服務的全棧遙測數據,並支持 40+ 後端一鍵導出,讓分佈式系統的黑盒瞬間變透明。
OpenTelemetry-JS 是 OpenTelemetry 開源的 JavaScript/TypeScript 觀
websocket
Oct 26 2025
觀測雲 -
阿里雲 RDS MySQL 可觀測性最佳實踐
阿里雲 RDS MySQL
阿里雲 RDS MySQL (Relational Database Service) 是一種穩定可靠、可彈性伸縮的在線雲數據庫服務,它基於阿里巴巴 MySQL 源碼分支的深度優化。RDS MySQL 支持實例管理、賬號管理、數據庫管理、備份恢復、白名單、透明數據加密以及數據遷移等基本功能。開箱即用,默認採用一主一備的高可用架構,故障時自動切換等等,可根據業務壓力彈性擴
MySQL
,
阿里雲
Oct 26 2025
觀測雲 -
Nginx Tracing 最佳實踐
簡介
Nginx 是一款流行的高性能 HTTP 和反向代理服務器,以輕量、穩定、併發處理能力強著稱。對 Nginx 進行鏈路追蹤,能在分佈式系統中清晰呈現請求經 Nginx 轉發後的完整路徑,這不僅讓問題定位更高效,可快速鎖定延遲、錯誤等問題發生的具體環節,還能通過追蹤其處理請求的耗時、轉發延遲等數據,精準識別系統性能瓶頸,為優化資源分配和架構設計提供依據。
觀測雲
觀測雲採集器 DataKit
Nginx
Oct 26 2025
觀測雲 -
雲原生架構下微服務接入 SkyWalking 最佳實踐
背景
本文介紹在 Kubernetes 集羣中,如何通過 Sidecar 模式為 Java 應用無侵入式部署 SkyWalking 探針,並利用 DataKit 內置的 SkyWalking 採集器,一站式收集鏈路數據(Trace)與應用日誌(Log),最終在觀測雲平台實現強大的鏈路與日誌聯動查詢,全面提升可觀測性能力。
部署 SkyWalking 探針
SkyWalking Agent Side
skywalking
,
JAVA
Sep 26 2025
觀測雲 -
解鎖DQL高級玩法——對日誌關鍵信息提取和分析
背景
許多用户在日誌查詢方面已經積累了一定的使用習慣,尤其是習慣於使用某些查詢語法進行高效檢索。現在,日誌數據全面接入觀測雲並通過 DataKit 進行採集,用户最關心的問題是:能否通過 DQL 實現以往熟悉的查詢方式,甚至更進一步提升效率?答案是肯定的,DQL 不僅具備高度靈活性,還能提供更強大的日誌處理能力。下面我們通過一個脱敏後的真實案例,逐步演示如何利用 DQL 高效解析和統計日誌。
示例
日誌分析
Sep 10 2025
觀測雲 -
Openresty Tracing 最佳實踐
簡介
OpenResty 是基於 Nginx 的高性能 Web 平台,它通過集成 Lua 腳本引擎和一系列模塊,擴展了 Nginx 的功能,使開發者可以使用 Lua 編寫複雜的應用邏輯。對 OpenResty 進行鏈路追蹤,能在分佈式系統中清晰呈現請求經 Nginx 轉發後的完整路徑,這不僅讓問題定位更高效,可快速鎖定延遲、錯誤等問題發生的具體環節,還能通過追蹤其處理請求的耗時、轉發延遲等數據,精
openresty
Sep 05 2025
觀測雲 -
連鎖門店可用性監測和進程監測最佳實踐
前言
在連鎖零售企業的數字化運營中,多門店通過網絡實時訪問總部業務系統(如收銀、庫存、會員管理等核心模塊)是其日常經營的基礎支撐。然而,由於門店分佈廣泛、網絡環境複雜,網絡或應用服務的任何中斷都可能直接阻斷交易流程、影響顧客體驗,進而造成即時營收損失與長期品牌信任損耗。據行業調研,門店單次網絡中斷平均會造成 15-30 分鐘的業務停滯,高峯時段(如週末、節假日)單店每小時營收損失可達數千元,疊加顧
監控
Aug 13 2025
觀測雲 -
觀測雲接收 OpenTelemetry Collector 數據最佳實踐
OpenTelemetry 簡介
如果你在做系統運維或開發,建設可觀測性必然是近年來一個少不了的課題,同時相信你對 OpenTelemetry 也一定不陌生。OpenTelemetry 提供了一個統一、開放且不受特定廠商限制的標準和工具集,使得我們可以一次性集成 OTel SDK,全面採集應用的指標、日誌和鏈路追蹤數據,並自由地將數據發送到任何支持 OTel 協議的後端。
觀測雲
觀測雲是一個統一
監控
Aug 01 2025
觀測雲 -
觀測雲基於 ToB/ToC 業務可觀測最佳實踐
作為系統運維或者開發的你,如果企業同時擁有 ToB (面向企業)和 ToC (面向消費者)業務時,需要兼顧兩者的不同特點和需求,是不是有時候會有些茫然?
比如説,如果是一個電器生產製造企業,在 ToC 領域,產品線涵蓋各類電器,通過品牌專賣店、電商平台等渠道銷售給消費者;而在 ToB 領域,也同時為商業客户提供系統和解決方案,滿足客户需求。我們經常碰到的 ToC 領域,包括面對消費者用户的服務,以
監控
Jul 25 2025
觀測雲 -
Undertow 可觀測性最佳實踐
Undertow 介紹
Undertow 是 Red Hat 開發的一款高性能、靈活的 Java Web 服務器,也是 WildFly 應用服務器的嵌入式組件。它支持非阻塞 I/O,基於 NIO 構建,並提供了 HTTP/2、WebSockets 和 Servlet 4.0 等現代 Web 技術支持。Undertow 以其輕量級、嵌入式友好 的特性而聞名,開發者可以輕鬆將其集成到自己的應用程序中,
監控
Jul 23 2025
觀測雲 -
Promtail 對接日誌最佳實踐
Promtail 介紹
Promtail 是由 Grafana Labs 開發的日誌收集代理,主要用於從本地系統或容器中採集日誌,並將其發送到 Loki 或兼容 Loki 協議的系統,本次為對接到觀測雲。
觀測雲
觀測雲是一款專為 IT 工程師打造的全鏈路可觀測產品,它集成了基礎設施監控、應用程序性能監控和日誌管理,為整個技術棧提供實時可觀察性。這款產品能夠幫助工程師全面瞭解端到端的用户體驗追蹤,
日誌分析