tag 高可用

標籤
貢獻37
85
01:15 PM · Nov 05 ,2025

@高可用 / 博客 RSS 訂閱

技術博客領航者 - MAC分層分佈式架構

一、網站架構的模式 1、分層 分層是將軟件進行橫向切分。網站軟件系統分為應用層,服務層,數據層 分層架構對網站支持高併發向分佈式方向發展至關重要。因此在網站規模還很小的時候就應該採用分層的架構,這樣 將來網站做大時才能更好地應對。 2、分割 分割是將軟件進行縱向切分。將不同的功能和服務分割開來,包裝成高內聚低耦合的模塊單元。 3、

服務器 , MAC分層分佈式架構 , 緩存 , 架構 , 後端開發 , 高可用

收藏 評論

kalii - MySQL高可用方案

一 主從異步複製(MySQL 默認方案) master binlog 實時複製到 slave 的 relay-log 重放 存在延時 優勢 對 master 無影響,支持 master 掛載多個 slave,同時 slave 也可以繼續掛着載 slave(級聯複製) slave 中斷重連可以從記錄的 binlog 最後位置繼續複製 缺點

MySQL , 數據庫 , 高可用 , kv存儲 , 後端

收藏 評論

想出家的涼麪 - 接入層高可用架構設計:EdgeOne實戰

1.背景 接觸多家客户後,發現大家的接入層架構大都如下圖所示,WAF/DDoS組件客户要麼選其中之一,要麼都不選或自薦。CLB後面掛CVM,CVM上面部署Nginx或者Kong等組件。從這個架構圖可以看出,客户有考慮高可用,但僅關注自己的組件層面,沒有關注外部基礎設施(如DNS)、政策法規的影響、運營商鏈路的不穩定性等,所以往往並不不全面。要分析優化這個問題,就要先搞清楚接入層定義、接入層故障域和

安全防護 , 運維 , 架構設計 , 高可用 , 後端

收藏 評論

京東雲開發者 - 基於Raft算法的DLedger-Library分析 | 京東物流技術團隊

1 背景 在分佈式系統應用中,高可用、一致性是經常面臨的問題,針對不同的應用場景,我們會選擇不同的架構方式,比如master-slave、基於ZooKeeper選主。隨着時間的推移,出現了基於Raft算法自動選主的方式,Raft是在Paxos的基礎上,做了一些簡化和限制,比如增加了日誌必須是連續的,只支持領導者、跟隨者和候選人三種狀態,在理解和算法實現上都相對容易許多。 1)DLedger 是op

算法 , raft , 分佈式系統 , 高可用

收藏 評論

神龍大俠 - DolphinScheduler的高可靠性高擴展性設計實現

Apache DolphinScheduler介紹 Apache DolphinScheduler 是一個分佈式易擴展的可視化DAG工作流任務調度開源系統。適用於企業級場景,提供了一個可視化操作任務、工作流和全生命週期數據處理過程的解決方案。 要適應於企業級場景,兩個特色必不可少 High Reliability 高可靠性: 去中心化設計,確保穩定性。 原生 HA 任務隊列支持,提供過載容錯

dolphinscheduler , 可擴展性 , 高可用

收藏 評論

IT獨行俠客 - Prometheus和阿里短信服務器實現報警服務器

隨通信行業不斷的業務迭代,新的賽道為業務帶來了新變化,生態合作和渠道的規模上量給系統帶來了模式創新的同時,也帶來了更大的壓力。 同時,國際站的地域環境和當地政策法規的因素,給全球化的建設也帶來了全新的機遇和挑戰。 本文將探討雲原生時代下的網關技術,面向全球化、平台化、精細化的時代背景,如何在雲原生時代挖掘自我蜕變的契機,又如何拖着沉重的技術負債實現涅槃重生,實現高性能

雲計算 , 運維 , 系統架構 , 雲原生 , 高可用

收藏 評論

數據庫知識分享者 - 雲原生場景下高可用架構的最佳實踐

01 引言 隨着雲原生技術的快速發展以及在企業 IT 領域的深入應用,雲原生場景下的高可用架構,對於企業服務的可用性、穩定性、安全性越發重要。通過合理的架構設計和雲平台的技術支持,雲原生高可用架構可以提供高可用性、彈性擴展性、簡化運維管理、提升可靠性和安全性等方面的優勢,為企業提供了更加可靠和高效的應用運行環境。 Kubernetes 是雲原生的核心技術之一,提供了容器編排和管理的能力,包括基礎設

雲計算 , 阿里雲 , 雲原生 , 高可用

收藏 評論

doscommand - RocketMQ 5.0 大手筆,擁抱雲原生,支持流處理,高可用架構升級!

RocketMQ 5.0核心升級:控制器架構革新與分層存儲實踐 你是否還在為分佈式消息系統的高可用部署而煩惱?是否面臨消息存儲成本與持久化需求的兩難抉擇?Apache RocketMQ 5.0版本帶來了顛覆性的架構升級,通過全新的Controller選主機制和靈活的分層存儲方案,徹底解決傳統部署模式的痛點。本文將深入解析這兩大核心特性,帶你掌握從架構設計到實際配置的

消息傳遞 , 消息中間件 , 後端開發 , 高可用 , Python

收藏 評論

崖山數據庫系統YashanDB - YashanDB大咖對話 | 國產替代深水區,共享集羣為何成為核心場景最優解?

11月26日,YashanDB V23.5線上發佈會成功舉辦,期間聚焦“共享集羣:高端場景下的技術突破和規模化實踐”的主題,舉辦了一場線上大咖對話。該環節由《韓鋒頻道》公眾號主理人、數據庫行業資深專家韓鋒主持,匯聚了在數據庫領域深耕多年的技術專家:Oracle技術老兵、數據庫資深專家羅敏,雲和恩墨聯合創始人兼數據庫管理服務產品羣總經理張樂奕,YashanDB共享集羣資深技術專家同

oracle , yashandb , 崖山數據庫 , 數據庫 , 高可用

收藏 評論

daleiwang - RAG架構設計圖

高可用不僅包括:系統失敗或者崩潰、應用層或者中間層錯誤、網絡失敗、介質失敗、人為失誤還包括:分級與容災、計劃宕機與維護,也就是説高可用不僅僅是應該考慮到系統本身的問題還應該考慮到天災人禍,並且有一套簡單的系統維護方法。 最佳的實例,其中最上面3泰代表客户端的應用主機,接下來是1+1的dataguard環境,而dataguard的primarysit

oracle , RAG架構設計圖 , 架構 , 數據庫 , 後端開發 , 單點故障 , 高可用

收藏 評論

京東雲開發者 - 一文了解電商大促系統的高可用保障思路 | 京東雲技術團隊

本文面向受眾可以是運營、可以是產品、也可以是研發、測試人員,作者希望通過如下思路(知歷史-清家底-明目標-定戰略-做戰術-促成長)幫助大家能夠了解電商大促系統的高可用保障,減少哪些高深莫測的黑話和高大尚的論調,而是希望有個體系化的知識讓讀者有所得。 一、【知歷史】電商大促的簡介 1.1、什麼是電商大促 電商大促是電商平台組織的一種大型銷售推廣活動,目的是通過提供各種優惠、折扣等方法,提高商品銷售額

電商 , 高可用 , 安全 , 後端 , 前端

收藏 評論

想出家的涼麪 - TCM服務網格同城雙活設計方案

1、TCM服務網格能力概述 1.1 架構概述 上篇文章,講述了接入層高可用架構設計,這篇文章我們聊聊TCM(服務網格)。TCM(服務網格)是騰訊雲提供的微服務流量治理雲產品,100% 兼容支持 Istio API,TCM與騰訊雲基礎設施原生集成,提供全託管服務化的支撐能力,輕鬆保障和管理網格生命週期。簡易架構如下圖: 騰訊雲託管網格主要是增強了Control plane,默認與騰訊雲

kubernetes , 微服務 , 架構 , 高可用 , 後端

收藏 評論

騰訊雲開發者 - 降本增笑P0事故頻發,構建持續高可用系統的破局之道

導讀 2023年的互聯網世界,“草台班子”、“降本增笑”、“開猿節流”成為大家互相調侃的關鍵詞。苦笑過後,問題還在,事故終要覆盤,未來仍需規劃。從架構角度看,我們應該怎麼去認清高可用的本質,並真正在業務場景中做好高可用,這是本文想跟大家探討的問題。讀完全文還可以參加文末龍年紅包封面抽獎活動哦! 目錄 1 高可用的達摩克利斯之劍 2 構建持續高可用系統的困境 3 破局之道? 2023年過去了,但是

高可用

收藏 評論

爛漫樹林 - 阿里雲 - 大數據生態中的 RocketMQ 5.0 - 阿里巴巴雲原生

你是否還在為分佈式消息系統的高可用部署而煩惱?是否面臨消息存儲成本與持久化需求的兩難抉擇?Apache RocketMQ 5.0版本帶來了顛覆性的架構升級,通過全新的Controller選主機制和靈活的分層存儲方案,徹底解決傳統部署模式的痛點。本文將深入解析這兩大核心特性,帶你掌握從架構設計到實際配置的完整實踐路徑。 一、Controller模式:重構高可用基石 1.

消息傳遞 , 消息中間件 , 後端開發 , 高可用 , Python

收藏 評論

IvorySQL - 當數據庫宕機時,PostgreSQL 高可用在背後做了什麼?

本文整理自 IvorySQL 2025 生態大會暨 PostgreSQL 高峯論壇的演講分享,演講嘉賓:孟飛龍,瀚高股份研發工程師。 本文主要從以下 4 個方面進行分享: 前言 故障檢測與轉移 問題探討 結語 前言 前言部分主要介紹一些 PostgreSQL 高可用相關的概念,讓大家對高可用有一個大概的瞭解。 PostgreSQL 高可用簡述 高可用的作用 在數據庫宕機的

postgresql , 高可用

收藏 評論

極狐GitLab - 滴滴、阿里雲、語雀相繼宕機,損失巨大,軟件的高可用失效了麼?

在北京寒冬的夜裏,小程加班完成了當天最後一個任務,他拖着疲憊的身體離開了位於西二旗的工位,走到辦公樓下,下意識地拿出手機打開滴滴,準備打車回家,但是他卻發現滴滴的打車頁面顯示網絡異常。起初小程以為是手機流量沒開或者手機欠費,經過反覆確認後發現不是話費欠費問題,於是他重啓了滴滴app,甚至重啓了手機,但都是一樣的結果: 在寒風中折騰了半個小時,將本來就沒穿秋褲的小程凍得瑟瑟發抖,直到在DevOps

語雀 , 阿里雲 , 宕機 , 高可用 , 滴滴出行

收藏 評論

數據庫知識分享者 - 慢調用鏈診斷利器 - ARMS 代碼熱點

可觀測技術背景 從最早的 Google 發表的一篇名為《Dapper, a Large-Scale Distributed Systems Tracing Infrastructure》的論文開始,到後來以:Metrics(指標)、Tracing(鏈路追蹤)以及 Logging(日誌)三大方向互為補充的可觀測解決方案逐漸被業界所接受併成為事實標準。 基於上述全棧可觀測方案技術,診斷一個問題從之前

雲計算 , 阿里雲 , 雲原生 , 消息隊列 , 高可用

收藏 評論

KaiwuDB - KaiwuDB 數據庫高可用方案及落地實現

數據庫停機將會帶來諸如客户流失、聲譽受損、經濟損失等嚴重後果,對於終端用户而言,不論是計劃內或是計劃外的停機,都是難以接受的。因此,用户逐漸意識到選擇生產數據庫除了考慮功能、性能、易用性等維度,高可用性也成為一項至關重要的評估標準。 一、什麼是數據庫的高可用 高可用,英文翻譯為”High Availability”。從字面上理解,即是需要做到服務 full-time 的持續可用。 工業領域內有一套

數據庫 , 高可用

收藏 評論

衞斯理 - 高可用hadoop yarn 8088如何修改

HA 即 (high available)高可用,又被叫做雙機熱備,用於關鍵性業務。 簡單理解就是,有兩台機器A和B,正常是A提供服務,B待命閒置,當A宕機或服務宕掉,會切換至B機器繼續提供服務。常用實現高可用的開源軟件有heartbeat和keepalived,其中keepalived有負載均衡的功能。 ignore_js_op

服務器 , 大數據 , 運維 , hadoop , Nginx , 高可用

收藏 評論

京東雲開發者 - 【618備戰巡禮】“三高”之第一高--如何打造高可用系統 | 京東雲技術團隊

前言 我們經常會説互聯網“三高”,那什麼是三高呢?我們常説的三高,高併發、高可用、高性能,這些技術是構建現代互聯網應用程序所必需的。對於京東618備戰來説,所有的中台系統服務,無疑都是圍繞着三高來展開的。對於一個程序員,或多或少都能説出一些跟三高系統有關的技術點,而我本篇文章的目的,就是幫大家系統的梳理一下三高系統中的第一高:高可用性。 首先來説,互聯網的業務特點決定了他必須保證“三高”, 同時,

系統設計 , 系統 , 高可用

收藏 評論

遊俠小影 - 去虛擬化後無法開機

兩年前,我曾寫過一篇#有關理論型高可用#的文章,目的是為了警示使用者,切莫重理論,輕實踐,不把系統可用性當回事,這種思想很危險。 一轉眼,兩年過去了,這樣的事件還是日常工作中頻頻發生。 説兩個今年的案例,畢竟還熱乎着。 上個月,我們某個產線系統遭遇了一次數據庫宕機事件,整個控制枱服務停止響應近一小時。

虛擬化 , 去虛擬化後無法開機 , 服務器 , 雲計算 , 數據庫 , 高可用

收藏 評論

京東雲開發者 - 分佈式服務高可用實現:複製 | 京東物流技術團隊

1. 為什麼需要複製 我們可以考慮如下問題: 當數據量、讀取或寫入負載已經超過了當前服務器的處理能力,如何實現負載均衡? 希望在單台服務器出現故障時仍能繼續工作,這該如何實現? 當服務的用户遍佈全球,並希望他們訪問服務時不會有較大的延遲,怎麼才能統一用户的交互體驗? 這些問題其實都能通過“複製”來解決:複製,即在不同的節點上保存相同的副本,提供數據冗餘。如果一些節點不可用,剩餘的節點仍然

複製 , 數據庫 , 分佈式 , 高可用

收藏 評論

崖山數據庫系統YashanDB - YashanDB V23.5:YAC高可用全面升級,全庫閃回、SCAN與VIP、主備自動切換……

*作者:馬志宏 YashanDB高可用架構師 核心業務的規模化部署,本質上是對“高可用”的極致考驗,任何一層的故障都可能導致業務中斷、數據丟失,唯有構建覆蓋從客户端鏈接到底層存儲的全鏈路高可用體系,才能讓企業真正放心託付。 YashanDB V23.5以“驅動崖山共享集羣YAC全面邁向規模化商用”為核心定位,對連接層、服務層、存儲層的高可用能

oracle , yashandb , 崖山數據庫 , 數據庫 , 高可用

收藏 評論

a朋 - n9e告警可高用的實現機制分析

n9e=nightingale n9e監控告警框架,提供了監控繪圖、監控告警以及通知等一體的監控運維體系,在雲原生時代,可以認為是Open-falcon的升級版。 一. 告警的數據流 指標存儲:使用push模式 categraf採集後push給n9e-server; n9e-server將指標值push給時序庫prometheus; 指標告警:使用pull模式 由n9e-server使

prometheus , 告警 , 高可用 , 監控工具

收藏 評論