11月26日,YashanDB V23.5線上發佈會成功舉辦,期間聚焦“共享集羣:高端場景下的技術突破和規模化實踐”的主題,舉辦了一場線上大咖對話。該環節由《韓鋒頻道》公眾號主理人、數據庫行業資深專家韓鋒主持,匯聚了在數據庫領域深耕多年的技術專家:Oracle技術老兵、數據庫資深專家羅敏,雲和恩墨聯合創始人兼數據庫管理服務產品羣總經理張樂奕,YashanDB共享集羣資深技術專家同二鵬,四位專家從架構價值、技術內核、場景實踐、生態合作四大維度,深度剖析共享集羣的核心競爭力與國產化替代路徑。

YashanDB大咖對話 | 國產替代深水區,共享集羣為何成為核心場景最優解?_高可用

以下為對話實錄精華整理,全程保留嘉賓核心觀點與經典語錄,只為呈現最硬核的行業洞見。

YashanDB大咖對話 | 國產替代深水區,共享集羣為何成為核心場景最優解?_yashandb_02

核心價值錨定

共享集羣緣何穩坐核心系統“首選架構”

韓鋒(主持人):當前企業核心系統升級改造時,常會面臨分佈式與共享集羣架構的選擇困境。羅敏老師作為見證Oracle RAC從誕生到普及的行業老兵,您認為RAC架構能長期佔據核心系統主流地位的核心價值是什麼?

羅敏:我是在2001年加入Oracle的,正好趕上RAC第一個版本隨Oracle 9i發佈,親歷了它在國內各行各業的落地歷程。RAC架構之所以能成為核心系統的首選,核心在於三大特性:高可用性、高性能、可擴展性,更關鍵的是它能讓數據庫保持整體性,實現應用部署“大道至簡”。不像分佈式數據庫,應用可能需要做大量改造,共享集羣架構能讓開發者聚焦業務邏輯,無需過多關注底層架構細節,這一點在核心繫統中尤為重要。

主持人韓鋒:這三個特性的確也是客户非常看重的能力。下面請張總從場景選擇上來談一談,在實際的業務環境中,共享集羣最能解決客户的哪些關鍵痛點?

張樂奕:我先簡單提及下數據庫領域目前的兩大流派:一是強調單機能力的集中式架構,另一個是強調橫向擴展的分佈式架構。兩種流派有不同的適用場景,其中分佈式的適用場景很明確——如果你的業務是全球業務部署,擁有數億級用户超大併發場景,那目前來看分佈式可能是唯一合適的架構,但至少在我的經驗裏,這種場景並不是主流。我們不提那種需要在應用層做路由、大量修改應用才能適配的分佈式數據庫,我個人認為那種分佈式數據庫會逐漸退出市場。對應用透明在數據庫層自主進行智能數據分佈的分佈式數據庫會長期存在並繼續發展,只是,成本和運維管理難度是硬傷,對很多企業而言成本投入太高,運維又過於複雜。而對於90%的行業核心系統來説,包括金融、政府、製造業等,一個能力強大的單機數據庫內核就足以支撐業務。

但只是單機部署客户會擔心什麼?擔心無法滿足極致高可用及一定程度性能可擴展。很多客户選擇分佈式,就是因為單個節點故障時應用不會掛,而傳統單機主備切換需要幾十秒甚至幾分鐘,核心系統根本無法接受。

共享集羣恰恰解決了這個痛點:既有強大的單機內核,又能實現超低應用切換(Failover)時間。雲和恩墨在一體機環境中測試崖山共享集羣YAC,應用恢復時間基本控制在2-10秒內,這是我覺得共享集羣架構最強大的地方,也是我們認可崖山共享集羣YAC的原因。

主持人韓鋒:感謝張總認可崖山共享集羣。在國產共享集羣產品空白期,不少客户因擔憂傳統集中式架構高可用能力不足,而考慮用分佈式架構來規避風險。但這也帶來了新的挑戰,在多數場景中分佈式架構推高了總體擁有成本(TCO),比如改造成本高昂、運維資源無法複用等。

當前眾多客户在核心繫統上的首選仍是共享集羣架構,其架構優勢也經過大量工程實踐驗證,技術成熟。所以今天我們也很開心能看到國內廠商能做出類RAC產品,如崖山共享集羣YAC能夠達到Oracle RAC的高性能、高可用水平,也為國產化替代進入規模化商用階段,進入核心場景做了一個良好的鋪墊。

接下來想請同老師從廠商視角談談,YashanDB設計崖山共享集羣YAC的初衷,想要解決哪些根本性問題?

同二鵬:剛前面兩位老師也聊到了共享集羣的優勢以及不同架構間的差異對比,也是基於對國產化替代痛點的深刻洞察,崖山在成立之初就做出了一個艱難但我們認為是必要且正確的選擇——做國產全自研數據庫。

全自研意味着從零開始。面對一個動輒數百萬行代碼的數據庫產品,其研發難度和資源投入無疑是巨大的。但這是一個比較堅定的選擇。一方面,我們着眼於安全合規,致力於解決“卡脖子”問題;另一方面,我們認為,唯有全自研才能從根本上摒棄落後的架構設計,實現對數據庫技術的完全掌控,從而具備持續創新與演進的能力。

當前國產規模化替代面臨最大的難題是,如何提供和Oracle對等的產品力,並能以更低成本去完成這個事情。目前很多替代方案靠“堆硬件”或分佈式策略彌補內核不足,但無法從根本上提升單節點執行能力,反而堆高了總體擁有成本(TCO)。像剛才張總也談到,目前90%的場景,或者説數據量在幾十TB至百TB級別的系統中——Oracle或者説Oracle RAC仍是更優選擇。

因此,崖山提出“1:1平替”Oracle的理念。不僅是在功能和語法的兼容,更是從產品設計理念、產品能力、體系架構、運維生態和用户體驗的系統性平替。崖山從一開始就在YashanDB的底層設計裏植入了共享集羣基因,在存儲結構、事務引擎、併發鎖機制、緩存協同等方面都做了前瞻性規劃,這也是YAC能夠快速實現技術突破、直面核心難題的根本原因。

YashanDB大咖對話 | 國產替代深水區,共享集羣為何成為核心場景最優解?_崖山數據庫_03

技術內核揭秘

如何規避過度依賴Cache Fusion

主持人韓鋒:談到共享集羣技術,Cache Fusion(內存融合技術)是繞不開的核心。羅敏老師能否從技術角度解讀,高效的Cache Fusion設計為何關鍵?它直接決定了集羣的哪些性能表現?

羅敏:Cache Fusion是Oracle RAC最核心的技術創新,正是它解決了早期OPS集羣性能差的問題。它的工作原理很清晰:數據訪問優先查本地內存(納秒級),找不到再通過Cache Fusion查集羣其他節點內存(微秒級),最後才查硬盤(毫秒級)——本質是通過層級優先級選擇,規避磁盤IO瓶頸,提升響應速度。

但要注意,Cache Fusion不是“銀彈”。RAC最受詬病的擴展性問題,根源就是過度依賴Cache Fusion,沒有做到數據訪問本地化。如果把RAC當單機用,節點間數據衝突和私網流量會激增,可能出現“1+1<1”的情況。真正的最優實踐是儘量本地訪問,做好節點間數據訪問分離,例如基於分區技術,讓不同節點訪問不同數據,才能實現“1+1>1”的擴展效果。所以高效的Cache Fusion設計,核心是平衡全局緩存共享與本地訪問優先級,這直接決定了集羣的擴展性和整體性能。

主持人韓鋒:感謝羅老師。羅老師也提及不要去神話某一技術,應該通過對Cache Fusion原理的瞭解去發揮他最大的作用,才能揚長避短,提高共享集羣架構的擴展能力。接下來請問同二鵬老師,針對傳統架構的痛點,崖山共享集羣YAC在Cache Fusion機制上做了哪些創新突破?

同二鵬:首先我們完全認同“本地緩存訪問性能最優”的原則,因此崖山共享集羣YAC的核心優化思路就是“本地化”,並通過自研事務引擎重構Cache Fusion工作模式:

第一,事務狀態本地化:YAC採用去中心化的事務管理機制,每個實例擁有獨立的私有UNDO表空間,管理本實例的業務歷史數據和事務信息,減少跨實例事務交互。

第二,輕量級可見性判斷:YAC採用基於時間戳的同步機制,僅在事務提交或頁面傳遞時做輕量時間同步,就能保證全局數據一致性,避免複雜的分佈式鎖開銷。

第三,事務槽位鎖(XSLOT)設計:YAC在數據頁面中嵌入事務槽位鎖,事務信息隨跨實例頁面傳輸同步傳遞,減少實例間的額外信息交互,提升訪問效率。

第四,批量化redo處理:在高併發場景下,數據塊傳輸頻繁,YAC將髒塊傳輸中的redo日誌做批量化異步處理,提升IO通透性和整體性能。

這些優化本質上是讓Cache Fusion的核心操作儘量在本地完成,從根源上規避傳統架構中跨實例交互頻繁的問題,這也是YashanDB V23.5在擴展性和高性能上實現突破的關鍵。

主持人韓鋒:國產共享集羣正處於技術突破與生態構建的關鍵階段,軟硬協同創新也是一個重要突破口。想請問張總,雲和恩墨作為崖山重要合作伙伴,目前合作有哪些階段性成果?

張樂奕:我們與崖山的合作可以用“天然適配”來形容。雲和恩墨的zData X一體機內置了專為企業級數據庫設計的zStorage分佈式存儲,但之前一直缺少類RAC架構的國產共享集羣產品來發揮其性能優勢。

崖山共享集羣YAC的出現完美解決了這個問題。目前雙方已完成全部聯合測試,推出了“zData X + YashanDB YAC”軟硬一體化方案:在“2計算節點+3存儲節點”配置的zData X 3.5上,默認8k塊大小可提供超過500萬IOPS,延遲低至0.3毫秒。更重要的是,這套方案開箱即用,YAC本身安裝簡單,結合一體機的可視化管理界面,進一步降低了部署和運維成本。

性能測試結果也讓我們非常驚喜:YAC單節點tpmC可達230多萬,雙節點壓測能到345萬,實現了75%的性能線性比——這在共享集羣架構中是非常出色的表現。此外,我們還做了全面的破壞性測試,即使強制關閉一個計算節點,應用會話也能在15-16秒內自動切換到存活節點,tpcc壓測無縫續跑,充分驗證了YAC的高可用能力。

目前雲和恩墨和崖山的“zData X + YashanDB”合作進展非常順利,也期待能儘快在客户側上線用起來。

YashanDB大咖對話 | 國產替代深水區,共享集羣為何成為核心場景最優解?_高可用_04

規模化商用驗證

YAC如何適配核心場景

主持人韓鋒:羅敏老師能否分享一個RAC的典型應用場景,以及如何才能真正用好RAC,充分發揮其架構優勢?

羅敏:首先IT系統是一個整體,成功落地必須結合具體行業的業務場景,做到揚長避短,才能規避前面提及的Cache Fusion性能不足問題。如果你把RAC當作單機來用,這種部署方式是達不到最佳效果的,一定要在不同節點訪問不同的數據,才能實現最優性能。我印象最深的是某金融核心系統,早期部署RAC時沒有做數據分區,所有節點都隨機訪問全量數據,導致節點間私網流量暴增,性能甚至不如單機。

此外,因為RAC的高可用只是Oracle MAA(Maximum Availability Architecture)架構的一個環節,它能解決主機或系統故障,但不具備容災能力、防人為誤操作能力和在線變更能力。所以國產數據庫如果要對標Oracle,不僅要做好集羣本身的高可用,還要構建完整的高可用體系,同時引導用户做好應用部署和數據架構設計,才能真正發揮共享集羣的價值。

主持人韓鋒:感謝羅敏老師的分享,Oracle RAC架構在國內有着豐富的優秀實踐,也為國產共享集羣提供了寶貴的經驗參考。

羅老師對國產數據庫也提出了更高的體系化要求,那接下來也想問問崖山的同二鵬老師,崖山共享集羣YAC與其他同類技術方案相比,YAC的差異化優勢體現在哪裏?

同二鵬:YAC的核心優勢是“全面性”,從部署架構到分層設計,構建了全棧高可用能力,同時保持極致的應用兼容性:

在擴展性上,YAC支持“輕量級適配”:無需修改SQL語句,僅通過業務部署調整和表分區設計,就能實現極致擴展;如果用户不需要極致擴展性,也可以透明接入,內核會在計劃層、執行層自動優化,讓數據訪問儘量本地化。

在高可用上,YAC是系統性設計而非單點功能:部署形態上支持主備共享集羣、同城雙活、兩地三中心容災方案;架構分層上,應用連接層提供負載均衡、TAF、SCAN與VIP能力,實現故障透明切換和在線擴縮容;服務層支持實例故障在線恢復;存儲層通過YFS文件系統提供多副本冗餘;還具備全維度閃回能力(庫級、表級、事務級閃回及閃回查詢),可防範人為誤操作。

這種全面的設計,讓崖山共享集羣YAC不僅能解決傳統集羣的性能和擴展痛點,更能滿足核心系統對高可用、數據一致性的嚴苛要求,真正具備規模化商用能力。

主持人韓鋒:從同老師的分享中,我也總結出了一個關鍵詞——全面。崖山從應用連接層、服務層、存儲層等多個方面都有不同的技術實現來保障YAC高可用能力,這是一套完整、體系化的設計,而非單點突破。我想,這正是YashanDB V23.5版本敢於提出YAC已具備規模化商用能力的底氣所在。

最後想請張總分享一下,未來雲和恩墨與YashanDB的合作展望,以及對用户的選型建議?

張樂奕:正如前面提到的,共享集羣架構比分佈式更適合90%的企業核心系統,因此我們的合作展望和目標都很明確。如果説Oracle數據庫國產化替代已進入核心場景,那麼YashanDB YAC就是當下最理想的替代選擇。

未來雲和恩墨和崖山將深化“產品+服務+解決方案”的全面戰略合作,把“zData X + YashanDB YAC”的軟硬一體化方案推向更多行業客户,讓用户享受到“開箱即用、高性能、易運維”的價值。

同時我個人也非常佩服崖山的研發實力。RAC架構看似原理簡單,實則實現難度極大,從理解其功能設計,到內部原理實現,再到交付一個成熟、完整、穩定的產品,甚至在某些方面實現優化,都需要極其硬核的技術能力。而YAC不僅做到了兼容,並在各個層級做了優化通過。

我也相信,一個數據庫只要能越來越多地讓用户瞭解他們產品和理念,就會有越來越多的用户喜歡它。這也是當年Oracle如此吸引人的一個重要原因。崖山已經支持了10053、10046等深度診斷能力,期待未來能提供更豐富的可觀測性工具。崖山依靠自己的研發實力,把這些都紮實做出來,那一定是未來可期。

YashanDB大咖對話 | 國產替代深水區,共享集羣為何成為核心場景最優解?_高可用_05

寫在最後

這場深度對話讓我們清晰看到:共享集羣憑藉高可用、高性能、易擴展的核心優勢,仍是90%以上企業核心系統的最優解。崖山共享集羣YAC通過全自研路線構建的技術內核、本地化創新的Cache Fusion機制、全棧分層的高可用設計,以及與雲和恩墨等夥伴的生態協同,不僅實現了對Oracle RAC的1:1系統性平替,更在高可用、性能、擴展性和部署成本上形成差異化優勢。

隨着YashanDB V23.5的發佈,YAC已完全具備核心系統規模化商用能力,為企業核心系統國產化替代提供了成熟、可靠、高性價比的選擇。未來,在更多行業專家的見證與生態夥伴的支持下,YashanDB將持續深耕共享集羣技術,推動國產數據庫從“形似”走向“神似”並最終超越,為中國企業的數字化轉型保駕護航。