一、keepalived簡介
keepalived是vrrp協議的實現,原生設計目的是為了高可用ipvs服務,keepalived能夠配置文件中的定義生成ipvs規則,並能夠對各RS的健康狀態進行檢測;通過共用的虛擬IP地址對外提供服務;每個熱備組內同一時刻只有一台主服務器提供服務,其他服務器處於冗餘狀態,若當前在線的服務器宕機,其虛擬IP地址將會被其他服務器接替(優先級決定接替順序),實現高可用為後端主機提供服務。
二、keepalived組件
Keepalived組件介紹
core:keepalived核心組件,主進程的啓動和維護,全局配置等。
vrrp stack:keepalived是基於vrrp協議實現高可用vps服務,vrrp則為相關子進程為其提供服務
check:檢測keepalived的健康狀態相關進程
system call:系統調用
watch dog:監控check和vrrp進程的看管者,check負責檢測器子進程的健康狀態,當其檢測到master上的服務不可用時則通告vrrp將其轉移至backup服務器上。
三、環境準備
MySQL、Keepalived的具體版本,虛擬主機等配置,都儘可能參考客户目前的生產環境安裝規範來準備:
|
軟件名稱
|
版本
|
|
MySQL
|
5.7.39
|
|
Keepalived
|
2.0.20
|
準備2台虛擬主機,具體環境信息為:
|
系統版本
|
主機名
|
IP地址
|
主機內存
|
磁盤空間
|
|
CentOS 7.5
|
db1
|
192.168.116.138
|
1G
|
20G
|
|
CentOS 7.5
|
db2
|
192.168.116.138
|
1G
|
20G
|
規劃業務連接的vip為:192.168.116.130
MySQL軟件下載地址:https://downloads.mysql.com/archives/community/Keepalived軟件下載地址:https://www.keepalived.org/download.html
四、MySQL安裝
略。。。。
五、MySQL主主配置
master1(138)中my.cnf文件配置
server-id=1 #數據庫唯一ID,主從的標識號絕對不能重複。
log-bin=mysql-bin #開啓bin-log,並指定文件目錄和文件名前綴
binlog-do-db=lw #需要同步liting數據庫。如果是多個同步庫,就以此格式另寫幾行即可。如果不指明對某個具體庫同步,就去掉此行,表示同步所有庫(除了ignore忽略的庫)。
binlog-ignore-db=mysql,performance_schema,informantion_schema,sys #不同步mysql系統數據庫。如果是多個不同步庫,就以此格式另寫幾行;也可以在一行,中間逗號隔開。
sync_binlog = 1 #確保binlog日誌寫入後與硬盤同步
binlog_checksum = none #跳過現有的採用checksum的事件,mysql5.6.5以後的版本中binlog_checksum=crc32,而低版本都是binlog_checksum=none
binlog_format = mixed #bin-log日誌文件格式,設置為MIXED可以防止主鍵重複。
auto_increment_offset=1 表示自增長字段從那個數開始,取值範圍是1 .. 65535。這個就是序號。如果有n台mysql機器,則從第一台開始分為設1,2...n
auto_increment_increment=2 表示自增長字段每次遞增的量,其默認值是1,取值範圍是1 .. 65535。如果有n台mysql機器,這個值就設置為n。
温馨提示:在主服務器上最重要的二進制日誌設置是sync_binlog,這使得mysql在每次提交事務的時候把二進制日誌的內容同步到磁盤上,即使服務器崩潰也會把事件寫入日誌中。
sync_binlog這個參數是對於MySQL系統來説是至關重要的,他不僅影響到Binlog對MySQL所帶來的性能損耗,而且還影響到MySQL中數據的完整性。對於"sync_binlog"參數的各種設置的説明如下:
sync_binlog=0,當事務提交之後,MySQL不做fsync之類的磁盤同步指令刷新binlog_cache中的信息到磁盤,而讓Filesystem自行決定什麼時候來做同步,或者cache滿了之後才同步到磁盤。
sync_binlog=n,當每進行n次事務提交之後,MySQL將進行一次fsync之類的磁盤同步指令來將binlog_cache中的數據強制寫入磁盤。
配置master1 (138)數據庫
grant replication slave, replication client on *.* to 'repl'@'192.168.116.%' identified by "123456";
flush privileges;
flush tables with read lock; /* 注意該參數設置後,如果自己同步對方數據,同步前一定要記得先解鎖!*/
show master status;
結果如下:
show master status;
+-----------------+----------+--------------+------------------+------------------------------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
+-----------------+----------+--------------+------------------+------------------------------------------+
| mybinlog.000115 | 150 | | mysql,performance_schema,informantion_schema,sys | |
+-----------------+----------+--------------+------------------+------------------------------------------+
1 row in set (0.00 sec)
master2(139)中my.cnf文件配置
server-id=2 #數據庫唯一ID,主從的標識號絕對不能重複。
log-bin=mysql-bin #開啓bin-log,並指定文件目錄和文件名前綴
binlog-do-db=lw #需要同步liting數據庫。如果是多個同步庫,就以此格式另寫幾行即可。如果不指明對某個具體庫同步,就去掉此行,表示同步所有庫(除了ignore忽略的庫)。
binlog-ignore-db=mysql,performance_schema,informantion_schema,sys #不同步mysql系統數據庫。如果是多個不同步庫,就以此格式另寫幾行;也可以在一行,中間逗號隔開。
sync_binlog = 1 #確保binlog日誌寫入後與硬盤同步
binlog_checksum = none #跳過現有的採用checksum的事件,mysql5.6.5以後的版本中binlog_checksum=crc32,而低版本都是binlog_checksum=none
binlog_format = mixed #bin-log日誌文件格式,設置為MIXED可以防止主鍵重複。
auto_increment_offset=2 表示自增長字段從那個數開始,取值範圍是1 .. 65535。這個就是序號。如果有n台mysql機器,則從第一台開始分為設1,2...n
auto_increment_increment=2 表示自增長字段每次遞增的量,其默認值是1,取值範圍是1 .. 65535。如果有n台mysql機器,這個值就設置為n。
温馨提示:在主服務器上最重要的二進制日誌設置是sync_binlog,這使得mysql在每次提交事務的時候把二進制日誌的內容同步到磁盤上,即使服務器崩潰也會把事件寫入日誌中。
sync_binlog這個參數是對於MySQL系統來説是至關重要的,他不僅影響到Binlog對MySQL所帶來的性能損耗,而且還影響到MySQL中數據的完整性。對於"sync_binlog"參數的各種設置的説明如下:
sync_binlog=0,當事務提交之後,MySQL不做fsync之類的磁盤同步指令刷新binlog_cache中的信息到磁盤,而讓Filesystem自行決定什麼時候來做同步,或者cache滿了之後才同步到磁盤。
sync_binlog=n,當每進行n次事務提交之後,MySQL將進行一次fsync之類的磁盤同步指令來將binlog_cache中的數據強制寫入磁盤。
配置master2 (139)數據庫
grant replication slave, replication client on *.* to 'repl'@'192.168.116.%' identified by "123456";
flush privileges;
flush tables with read lock; /* 注意該參數設置後,如果自己同步對方數據,同步前一定要記得先解鎖!*/
show master status;
結果如下:
show master status;
+-----------------+----------+--------------+------------------+------------------------------------------+
| File | Position | Binlog_Do_DB | Binlog_Ignore_DB | Executed_Gtid_Set |
+-----------------+----------+--------------+------------------+------------------------------------------+
| mybinlog.000115 | 150 | | mysql,performance_schema,informantion_schema,sys | |
+-----------------+----------+--------------+------------------+------------------------------------------+
1 row in set (0.00 sec)
Master1 同步 Master2
在master1(138)上做以下操作,注意master_host輸入master2地址,以及master2的show master status信息:
mysql -uroot -p'123456'
unlock tables; /*先解鎖,將對方數據同步到自己的數據庫中*/
stop slave;
change master to master_host='192.168.116.139', master_user='repl', master_password='123456', master_log_file='mybinlog.000115', master_log_pos=150;
start slave;
查看同步狀態,如下出現兩個“Yes”,表明同步成功:
show slave status\G
...
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
Master2 同步 Master1
在master2(139)上做以下操作,注意master_host輸入master1地址,以及master1的show master status信息:
mysql -uroot -p'123456'
unlock tables; /*先解鎖,將對方數據同步到自己的數據庫中*/
stop slave;
change master to master_host='192.168.116.138', master_user='repl', master_password='123', master_log_file='mybinlog.000115', master_log_pos=150;
start slave;
查看同步狀態,如下出現兩個“Yes”,表明同步成功:
show slave status\G
...
Slave_IO_Running: Yes
Slave_SQL_Running: Yes
驗證主主同步正常
在master1(138)上創建一個測試庫lw1;創建表haha,插入一條數據,然後去master2(139)查詢確認同步;
在master2(139)上創建一個測試庫lw2;創建表haha2,插入一條數據,然後去master1(138)查詢確認同步。
1)在master1數據庫上寫入新數據
mysql> unlock tables;
Query OK, 0 rows affected (0.00 sec)
mysql> create database lw1;
Query OK, 1 row affected (0.01 sec)
mysql> use lw1;
Database changed
mysql> create table if not exists haha ( id int(10) PRIMARY KEY AUTO_INCREMENT, name varchar(50) NOT NULL);
Query OK, 0 rows affected (0.04 sec)
mysql> insert into haha values(2,'guojing');
Query OK, 1 row affected (0.00 sec)
mysql> insert into haha values(1,"huangrong");
Query OK, 1 row affected (0.00 sec)
mysql> select * from haha;
+----+-----------+
| id | name |
+----+-----------+
| 1 | huangrong |
| 2 | guojing |
+----+-----------+
2 rows in set (0.00 sec)
然後在master2數據庫上查看,發現數據已經同步過來了!
mysql> select * from lw1.haha;
+----+-----------+
| id | name |
+----+-----------+
| 1 | huangrong |
| 2 | guojing |
+----+-----------+
2 rows in set (0.00 sec)
六、Keepalived安裝部署
安裝keepalived軟件
需要準備的系統依賴包:
gcc
libnl-1.1.4-2.el6.x86_64
libnl-devel-1.1.4-2.el6.x86_64
libnfnetlink-1.0.0-1.el6.x86_64
libnfnetlink-devel-1.0.0-1.el6.x86_64
openssl-devel-1.0.1e-58.el6_10.x86_64
配置好yum源,使用yum install安裝對應的包。
yum install gcc libnl libnl-devel libnfnetlink libnfnetlink-devel openssl-devel
編譯安裝keepalived
解壓及配置:
tar -xvf keepalived-2.0.20.tar.gz
mv keepalived-2.0.20 /usr/local/src/
cd /usr/local/src/keepalived-2.0.20
./configure --prefix=/usr/local/keepalived
編譯安裝:
make && make install
配置keepalived服務
配置服務文件
mkdir /etc/keepalived
cp /usr/local/keepalived/etc/keepalived/keepalived.conf /etc/keepalived/keepalived.conf
cp /usr/local/keepalived/etc/sysconfig/keepalived /etc/sysconfig/
cp /usr/local/keepalived/sbin/keepalived /usr/sbin
cp /usr/local/src/keepalived-2.0.20/keepalived/etc/init.d/keepalived /etc/rc.d/init.d/keepalived
加keepalived服務
chkconfig --list |grep keepalived
chkconfig --add keepalived
chkconfig keepalived on
配置keepalived日誌
keepalived的日誌默認是輸出到/var/log/messages中,這樣不便於查看。如何自定義keepalived的日誌輸出文件呢?
如果是用service啓動的,修改/etc/sysconfig/keepalived文件
vi /etc/sysconfig/keepalived
KEEPALIVED_OPTIONS="-D -d -S 0"
如果不是,則啓動的時候指定以上參數,如:
/usr/local/keepalived/sbin/keepalived -d -D -S 0
修改/etc/syslog.conf(RHEL6.8以後配置/etc/rsyslog.conf)
# keepalived -S 0
local0.* /var/log/keepalived.log
重啓syslog:
# RHEL 5&6:
service syslog restart
# RHEL 7:
service rsyslog restart
注:RHEL6.8也是按照RHEL7的方法來操作。
配置keepalived的MySQL故障轉移
master1(138)機器上的keepalived.conf配置:
注:下面配置中沒有使用lvs的負載均衡功能,所以不需要配置虛擬服務器virtual server
cd /etc/keepalived/
mv keepalived.conf keepalived.conf.bak
vi /etc/keepalived/keepalived.conf
! Configuration File for keepalived
vrrp_script chk_mysql_port {
script "/etc/keepalived/check_mysql.sh"
interval 2
weight -5
fall 2
rise 1
}
vrrp_instance VI_1 {
state MASTER
interface ens33 #指定虛擬ip的網卡接口
mcast_src_ip 192.168.116.138 #指定本服務器物理ip地址
virtual_router_id 130 #路由器標識,MASTER和BACKUP必須是一致的,取值1-255,注意同一內網中不應有相同virtual_router_id的集羣,可以考慮使用vip的最後一位進行標示。
priority 101
advert_int 1
authentication {
auth_type PASS
auth_pass 888888
}
virtual_ipaddress {
192.168.116.130 #指定虛擬ip地址
}
track_script {
chk_mysql_port
}
}
編輯 /etc/keepalived/check_mysql.sh
vi /etc/keepalived/check_mysql.sh
#!/bin/bash
counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)
if [ "${counter}" -eq 0 ]; then
/etc/init.d/keepalived stop
fi
# 修改chk_mysql.sh權限
chmod 755 /etc/keepalived/check_mysql.sh
# 啓動keepalived
# service keepalived start
Starting keepalived: [ OK ]
master2(139)機器上的keepalived.conf配置:
cd /etc/keepalived/
mv keepalived.conf keepalived.conf.bak
vi /etc/keepalived/keepalived.conf
! Configuration File for keepalived
vrrp_script chk_mysql_port {
script "/etc/keepalived/check_mysql.sh"
interval 2
weight -5
fall 2
rise 1
}
vrrp_instance VI_1 {
state BACKUP
interface ens33
mcast_src_ip 192.168.116.139
virtual_router_id 130
priority 99
advert_int 1
authentication {
auth_type PASS
auth_pass 888888
}
virtual_ipaddress {
192.168.116.130
}
track_script {
chk_mysql_port
}
}
編輯check_mysql.sh
vi /etc/keepalived/check_mysql.sh
#!/bin/bash
counter=$(netstat -na|grep "LISTEN"|grep "3306"|wc -l)
if [ "${counter}" -eq 0 ]; then
/etc/init.d/keepalived stop
fi
chmod 755 /etc/keepalived/check_mysql.sh
啓動keepalived:
service keepalived start
Starting keepalived: [ OK ]
查看keepalived日誌:
tail -200f /var/log/keepalived.log
創建數據庫、用户並賦權
--創建業務用户:
create user 'admin'@'%' identified by '123456';
--賦予業務用户權限(默認):
grant insert,update,delete,select,alter,create,index,SHOW VIEW on lw1.* to 'admin'@'%';
此時應用側已經可以使用命令mysql -uadmin -p -h192.168.1.130或者客户端連接工具,登錄到數據庫進行相關操作了。
mysql -uadmin -p -h192.168.116.130
七、Mysql+keepalived故障轉移的高可用測試
停止master1機器上的mysql服務,根據配置中的腳本,mysql服務停了,keepalived也會停,從而vip資源將會切換到master2機器上。(mysql服務沒有起來的時候,keepalived服務也無法順利啓動!)
再次啓動master1的mysql和keepalived服務。(注意:如果restart重啓mysql,那麼還要啓動下keepalived,因為mysql重啓,根據腳本會造成keepalived關閉)
注意:一定要先啓動mysql服務,然後再啓動keepalived服務。如果先啓動keepalived服務,按照上面的配置,mysql沒有起來,就會自動關閉keepalived。
八、Keepalived的搶佔和非搶佔模式
keepalive是基於vrrp協議在linux主機上以守護進程方式,根據配置文件實現健康檢查。
VRRP是一種選擇協議,它可以把一個虛擬路由器的責任動態分配到局域網上的VRRP路由器中的一台。
控制虛擬路由器IP地址的VRRP路由器稱為主路由器,它負責轉發數據包到這些虛擬IP地址。
一旦主路由器不可用,這種選擇過程就提供了動態的故障轉移機制,這就允許虛擬路由器的IP地址可以作為終端主機的默認第一跳路由器。
keepalive通過組播,單播等方式(自定義),實現keepalive主備推選。工作模式分為搶佔和非搶佔(通過參數nopreempt來控制)。
1)搶佔模式:
主服務正常工作時,虛擬IP會在主上,備不提供服務,當主服務優先級低於備的時候,備會自動搶佔虛擬IP,這時,主不提供服務,備提供服務。
也就是説,工作在搶佔模式下,不分主備,只管優先級。
如上配置,不管keepalived.conf裏的state配置成master還是backup,只看誰的priority優先級高(一般而言,state為MASTER的優先級要高於BACKUP)。
priority優先級高的那一個在故障恢復後,會自動將VIP資源再次搶佔回來!!
2)非搶佔模式:
這種方式通過參數nopreempt(一般設置在advert_int的那一行下面)來控制。不管priority優先級,只要MASTER機器發生故障,VIP資源就會被切換到BACKUP上。
並且當MASTER機器恢復後,也不會去將VIP資源搶佔回來,直至BACKUP機器發生故障時,才能自動切換回來。
千萬注意:
nopreempt這個參數只能用於state為backup的情況,所以在配置的時候要把master和backup的state都設置成backup,這樣才會實現keepalived的非搶佔模式!
也就是説:
a)當state狀態一個為master,一個為backup的時候,加不加nopreempt這個參數都是一樣的效果。即都是根據priority優先級來決定誰搶佔vip資源的,是搶佔模式!
b)當state狀態都設置成backup,如果不配置nopreempt參數,那麼也是看priority優先級決定誰搶佔vip資源,即也是搶佔模式。
c)當state狀態都設置成backup,如果配置nopreempt參數,那麼就不會去考慮priority優先級了,是非搶佔模式!即只有vip當前所在機器發生故障,另一台機器才能接管vip。即使優先級高的那一台機器恢復 後也不會主動搶回vip,只能等到對方發生故障,才會將vip切回來。
九、mysql狀態檢測腳本優化
上面的mysql監測腳本有點過於簡單且粗暴,即腳本一旦監測到Master的mysql服務關閉,就立刻把keepalived服務關閉,從而實現vip轉移!
下面對該腳本進行優化,優化後,當監測到Master的mysql服務關閉後,就會將vip切換到Backup上(但此時Master的keepalived服務不會被暴力kill)
當Master的mysql服務恢復後,就會再次將VIP資源切回來!
#!/bin/bash
MYSQL=/usr/bin/mysql
MYSQL_HOST=localhost
MYSQL_USER=root
MYSQL_PASSWORD=1qaz@WSX
CHECK_TIME=3
#mysql is working MYSQL_OK is 1 , mysql down MYSQL_OK is 0
MYSQL_OK=1
function check_mysql_helth (){
$MYSQL -h $MYSQL_HOST -u $MYSQL_USER -p${MYSQL_PASSWORD} -e "show status;" >/dev/null 2>&1
if [ $? = 0 ] ;then
MYSQL_OK=1
else
MYSQL_OK=0
fi
return $MYSQL_OK
}
while [ $CHECK_TIME -ne 0 ]
do
let "CHECK_TIME -= 1"
check_mysql_helth
if [ $MYSQL_OK = 1 ] ; then
CHECK_TIME=0
exit 0
fi
if [ $MYSQL_OK -eq 0 ] && [ $CHECK_TIME -eq 0 ]
then
pkill keepalived
exit 1
fi
sleep 1
done