小亦平台會持續給大家科普一些運維過程中常見的問題解決案例,運維朋友們可以在往期文章中查看更多案例
問題概述
- 客户的工單系統出現訪問異常,客户反饋故障時間點為2023.11.08 9:21分、11點12分左右、16:06分左右
-
排查範圍:
- MySQL錯誤日誌
- 慢查詢日誌
- 配置參數
- 操作系統狀態(sar日誌,每10分鐘記錄)
問題分析
1. 日誌排查結果
- MySQL錯誤日誌:未發現異常
存在 Got timeout reading communication packets 警告(原理解釋:MySQL服務端主動關閉空閒連接或應用端未正確斷開連接)
- 慢查詢日誌:11月8日僅1條慢SQL(10:09:47),與故障時間點無關
- 操作系統狀態(sar):使用少量swap內存,但未發現異常
2. 配置參數風險
- innodb_flush_log_at_trx_commit=2:極端情況下可能丟失已提交事務
- sync_binlog=10:極端情況下可能丟失binlog數據
3.部署環境問題
- MySQL數據文件存儲在 NFS 上(性能與可靠性風險)
- MySQL與 nginx、Java應用 共享服務器(資源競爭風險)
解決方案
1. 修改關鍵參數(避免極端異常情況下mysql數據丟失風險)
innodb_flush_log_at_trx_commit=1 # 確保事務提交時立即刷盤
sync_binlog=1 # 確保每次事務提交同步binlog
2. 優化存儲方案
- 將MySQL數據遷移至 本地SSD磁盤,替代NFS存儲
3. 調整部署架構
- 將MySQL部署到 獨立服務器,與nginx/Java應用隔離
立即查看更多mysql的相關內容:https://www.ces-xiaoyi.com.cn/#/welcome/knowledge/panel/detai...
運維工作中遇到難題?立即提交工單:https://www.ces-xiaoyi.com.cn/#/workOrder?marketing_code=arti... 小亦平台工程師火速響應,助您快速修復故障!