Login | Register For Free | Help
Search for: (Advanced)

Mailing List Archive: Linux-HA: Japanese

$B%$%s%?!<%U%'!<%9%@(B$B%&%s$N>c32;~$K$D$$$F(B

 

 

Linux-HA japanese RSS feed   Index | Next | Previous | View Threaded


sekiya_kyuusaku at yahoo

Aug 9, 2011, 12:40 AM

Post #1 of 12 (583 views)
Permalink
$B%$%s%?!<%U%'!<%9%@(B$B%&%s$N>c32;~$K$D$$$F(B

$B$O$8$a$^$7$F4XC+$H?=$7$^$9!#(B

$B;HMQ(BOS$B!'(BRHEL5.4
pacemaker$B$N%P!<%8%g%s!'(B1.0.10-1.4

$B8=:_(B2$BBf9=@.$G%/%i%9%?%j%s%0$rAH$s$G$$$^$9!#(B

$BF1;~$K0J2<$N%j%=!<%9$r5/F0$9$k$h$&$K$7$F$$$^$9!#(B
mysql4$B7O(B
mysql5$B7O(B
postgres9$B7O(B

$B$5$i$K>e5-(BDB$B$KBP$7$F0l$D$:$D(BVIP$B$r:n@.$9$k$h$&$K$7$F$"$j$^$9!#(B

$B0J2<$N$h$&$J9=@.$G$9!#(B
pacemaker
$B-x(Bmysql4$B$N(BVIP$B!](Bmysql4
$B-x(Bmysql5$B$N(BVIP$B!](Bmysql5
$B-x(Bpostgres9$B$N(BVIP$B!](Bpostgres9

db01$B!D%j%=!<%92TF/Cf(B
db02$B!D%j%=!<%9BT5!Cf(B

$B4pK\E*$K$O>e<j$/F0$$$F$$$k$N$G$9$,!"(B
$B%$%s%?!<%U%'!<%9%@%&%s$N>c32;~$K0J2<$N$h$&$J%a%C%;!<%8$,(B
$B1J1s$H%m%0$K=PB3$1$^$9!#(B

$B!Z(Bdb01$B![(B
Aug 09 15:53:47 db01 heartbeat: [2363]: WARN: Rexmit of seq 66672 requested. 3 is max.

$B!Z(Bdb02$B![(B
Aug 09 15:53:47 db02 heartbeat: [4661]: WARN: Gmain_timeout_dispatch: Dispatch function for retransmit request took too long to execute: 20 ms (> 10 ms) (GSource: 0x9822230)

$B%W%m%;%9%@%&%s!"(BVIP$B%@%&%s!"(Bheartbeat$B$N%@%&%s(B
$B$J$I$N>c32;~$K$O$3$N$h$&$J$3$H$K$J$i$J$$$G$9!#(B
$B%$%s%?!<%U%'!<%9%@%&%s;~$N$_$G$9!#(B
($B [at] 53$K$O%$%s%?!<%U%'!<%9%"%C%W;~$G$9$,(B)

$B<B;\$7$?>c32%F%9%H!\I|5l$NN.$l$O0J2<$K$J$j$^$9!#(B
$B-!(Bdb01$B%$%s%?!<%U%'!<%9%@%&%s(B
$B-"(Bdb02$B$K(BVIP$B!\%j%=!<%9$,0\F0$7!"@5>o2TF/(B
$B-#(Bdb01$B%$%s%?!<%U%'!<%9$r%"%C%W(B

$B>e5-<j=g$N-#$r<B;\8e$K%m%0$,=P;O$a$^$9!#(B
($B-"$H-#$N4V$K(Bdb01$B$N(Bheartbeat$B$N:F5/F0$r<B;\$7$F$b7k2L$OF1$8$G$7$?(B)

db01$B$N(Bheartbeat$B$rDd;_$7$F$b(Bdb02$B$N%m%0$O=PB3$1$^$9!#(B
$B$H$$$&$o$1$G!"(Bdb01$B!"(Bdb02$B$N(Bheartbeat$B$r;_$a$J$$$H%m%0$,=PNO$5$l$k>u67$OJQ2=$J$7$G$7$?!#(B
$B#2Bf$H$bDd;_"M5/F08e$O%m%0=PNO$b$H$^$j$^$7$?!#(B

$B$5$i$K!"(Bsar$B%3%^%s%I$r;H$C$F3:Ev$9$k;~4V$N2TF/>pJs$r=P$7$F$_$?$i0J2<$N$h$&$J7k2L$,$G$^$7$?!#(B
$B!Z(Bdb01$B$N7k2L![(B
CPU %user %nice %system %iowait %steal %idle
15:50:01 all 106.63 0.00 106.63 106.64 106.64 0.00
pgpgin/s pgpgout/s fault/s majflt/s
15:50:01 432866871482.24 432866871481.63 432866871446.10 432866871482.27

db02$B$NJ}$O@5>o$J?tCM$G$7$?!#(B
$B$J$s$+$H$s$G$b$J$$?tCM$,$G$F$7$^$C$F$$$^$7$?!#(B
$B%P%0$J$s$G$7$g$&$+!&!&!&!#(B

<crm$B%3%s%U%#%0(B>
node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
attributes standby="off"
node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
attributes standby="off"
primitive res_mysql4 ocf:heartbeat:mysql4 \
op monitor interval="10s"
primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_mysql5 ocf:heartbeat:mysql5 \
op monitor interval="10s"
primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_pgsql9 ocf:heartbeat:pgsql9 \
op monitor interval="10s"
primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_pingd ocf:heartbeat:pingd \
params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
op monitor on-fail="block" interval="10s"
group grp_mysql4 res_mysql4_vip res_mysql4 \
meta target-role="Started"
group grp_mysql5 res_mysql5_vip res_mysql5
group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
meta target-role="Started"
clone clone_pingd res_pingd
location grp_mysql4_location grp_mysql4 \
rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
location grp_mysql5_location grp_mysql5 \
rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
location grp_pgsql9_location grp_pgsql9 \
rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
property $id="cib-bootstrap-options" \
dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3" \
cluster-infrastructure="Heartbeat" \
last-lrm-refresh="1312538205" \
no-quorum-policy="ignore" \
stonith-enabled="false"
rsc_defaults $id="rsc-options" \
resource-stickiness="INFINITY" \
migration-threshold="3"

<db01 ha.cf>
pacemaker on
node db01
node db02
ucast eth0 172.0.0.2
udpport 694

keepalive 5
warntime 10
deadtime 15
initdead 15

logfile /var/log/heartbeat/ha.log
debug 0
logfacility none

watchdog /dev/watchdog
respawn root /usr/lib64/heartbeat/ifcheckd

<db02 ha.cf>
pacemaker on
node db01
node db02
ucast eth0 172.0.0.1
udpport 694

keepalive 5
warntime 10
deadtime 15
initdead 15

logfile /var/log/heartbeat/ha.log
debug 0
logfacility none

watchdog /dev/watchdog
respawn root /usr/lib64/heartbeat/ifcheckd


iwasaki at 3ware

Aug 9, 2011, 6:43 PM

Post #2 of 12 (577 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

岩崎です

興味深い症状ですね。
もしかするとバグっぽい動きなので、私の方でも調査してみようと思います。
ときに、ご利用のHeartbeatのバージョンはいくつでしょうか。
同じような環境でやってみようと思いますのでOSのアーキテクチャも教えてくださいー

余談ですが3.0.4だとパケロスしたときに変な動作になってエラーログを吐きまくる症状があって、それは3.0.5で解消されています。


On Tue, 9 Aug 2011 16:40:28 +0900 (JST), sekiya_kyuusaku [at] yahoo
wrote:
> はじめまして関谷と申します。
>
> 使用OS:RHEL5.4
> pacemakerのバージョン:1.0.10-1.4
>
> 現在2台構成でクラスタリングを組んでいます。
>
> 同時に以下のリソースを起動するようにしています。
> mysql4系
> mysql5系
> postgres9系
>
> さらに上記DBに対して一つずつVIPを作成するようにしてあります。
>
> 以下のような構成です。
> pacemaker
> ∟mysql4のVIP-mysql4
> ∟mysql5のVIP-mysql5
> ∟postgres9のVIP-postgres9
>
> db01…リソース稼働中
> db02…リソース待機中
>
> 基本的には上手く動いているのですが、
> インターフェースダウンの障害時に以下のようなメッセージが
> 永遠とログに出続けます。
>
> 【db01】
> Aug 09 15:53:47 db01 heartbeat: [2363]: WARN: Rexmit of seq 66672
> requested. 3 is max.
>
> 【db02】
> Aug 09 15:53:47 db02 heartbeat: [4661]: WARN: Gmain_timeout_dispatch:
> Dispatch function for retransmit request took too long to execute: 20
> ms (> 10 ms) (GSource: 0x9822230)
>
> プロセスダウン、VIPダウン、heartbeatのダウン
> などの障害時にはこのようなことにならないです。
> インターフェースダウン時のみです。
> (正確にはインターフェースアップ時ですが)
>
> 実施した障害テスト+復旧の流れは以下になります。
> ①db01インターフェースダウン
> ②db02にVIP+リソースが移動し、正常稼働
> ③db01インターフェースをアップ
>
> 上記手順の③を実施後にログが出始めます。
> (②と③の間にdb01のheartbeatの再起動を実施しても結果は同じでした)
>
> db01のheartbeatを停止してもdb02のログは出続けます。
> というわけで、db01、db02のheartbeatを止めないとログが出力される状況は変化なしでした。
> 2台とも停止⇒起動後はログ出力もとまりました。
>
> さらに、sarコマンドを使って該当する時間の稼働情報を出してみたら以下のような結果がでました。
> 【db01の結果】
> CPU %user %nice %system %iowait
> %steal %idle
> 15:50:01 all 106.63 0.00 106.63 106.64
> 106.64 0.00
> pgpgin/s pgpgout/s fault/s majflt/s
> 15:50:01 432866871482.24 432866871481.63 432866871446.10
> 432866871482.27
>
> db02の方は正常な数値でした。
> なんかとんでもない数値がでてしまっていました。
> バグなんでしょうか・・・。
>
> <crmコンフィグ>
> node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
> attributes standby="off"
> node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
> attributes standby="off"
> primitive res_mysql4 ocf:heartbeat:mysql4 \
> op monitor interval="10s"
> primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
> params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
> op monitor interval="10s"
> primitive res_mysql5 ocf:heartbeat:mysql5 \
> op monitor interval="10s"
> primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
> params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
> op monitor interval="10s"
> primitive res_pgsql9 ocf:heartbeat:pgsql9 \
> op monitor interval="10s"
> primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
> params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
> op monitor interval="10s"
> primitive res_pingd ocf:heartbeat:pingd \
> params name="default_ping_set" host_list="" multiplier="100"
> dampen="1" \
> op monitor on-fail="block" interval="10s"
> group grp_mysql4 res_mysql4_vip res_mysql4 \
> meta target-role="Started"
> group grp_mysql5 res_mysql5_vip res_mysql5
> group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
> meta target-role="Started"
> clone clone_pingd res_pingd
> location grp_mysql4_location grp_mysql4 \
> rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set
> or default_ping_set lt 100
> location grp_mysql5_location grp_mysql5 \
> rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set
> or default_ping_set lt 100
> location grp_pgsql9_location grp_pgsql9 \
> rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set
> or default_ping_set lt 100
> property $id="cib-bootstrap-options" \
> dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3"
> \
> cluster-infrastructure="Heartbeat" \
> last-lrm-refresh="1312538205" \
> no-quorum-policy="ignore" \
> stonith-enabled="false"
> rsc_defaults $id="rsc-options" \
> resource-stickiness="INFINITY" \
> migration-threshold="3"
>
> <db01 ha.cf>
> pacemaker on
> node db01
> node db02
> ucast eth0 172.0.0.2
> udpport 694
>
> keepalive 5
> warntime 10
> deadtime 15
> initdead 15
>
> logfile /var/log/heartbeat/ha.log
> debug 0
> logfacility none
>
> watchdog /dev/watchdog
> respawn root /usr/lib64/heartbeat/ifcheckd
>
> <db02 ha.cf>
> pacemaker on
> node db01
> node db02
> ucast eth0 172.0.0.1
> udpport 694
>
> keepalive 5
> warntime 10
> deadtime 15
> initdead 15
>
> logfile /var/log/heartbeat/ha.log
> debug 0
> logfacility none
>
> watchdog /dev/watchdog
> respawn root /usr/lib64/heartbeat/ifcheckd

--
----------------------------------------------------------------------
岩崎  登 (株)サードウェア

Noboru Iwasaki 274-0815 千葉県船橋市西習志野3-39-8
iwasaki [at] 3ware URL: http://www.3ware.co.jp/
Phone: 047-496-3341 Fax: 047-496-3370

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


sekiya_kyuusaku at yahoo

Aug 9, 2011, 10:00 PM

Post #3 of 12 (684 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

関谷です。

heartbeatのバージョンは3.0.4でした。
バージョンアップすると直るような気もしてきました・・・。
ちょっとやってみようと思います。

OSのアーキテクチャはx86_64になります。


--- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:

> 岩崎です
>
> 興味深い症状ですね。
> もしかするとバグっぽい動きなので、私の方でも調査してみようと思います。
> ときに、ご利用のHeartbeatのバージョンはいくつでしょうか。
> 同じような環境でやってみようと思いますのでOSのアーキテクチャも教えてくださいー
>
> 余談ですが3.0.4だとパケロスしたときに変な動作になってエラーログを吐きまくる症状があって、それは3.0.5で解消されています。
>
>
> On Tue, 9 Aug 2011 16:40:28 +0900 (JST), sekiya_kyuusaku [at] yahoo
> wrote:
> > はじめまして関谷と申します。
> >
> > 使用OS:RHEL5.4
> > pacemakerのバージョン:1.0.10-1.4
> >
> > 現在2台構成でクラスタリングを組んでいます。
> >
> > 同時に以下のリソースを起動するようにしています。
> > mysql4系
> > mysql5系
> > postgres9系
> >
> > さらに上記DBに対して一つずつVIPを作成するようにしてあります。
> >
> > 以下のような構成です。
> > pacemaker
> >      ∟mysql4のVIP-mysql4
> >      ∟mysql5のVIP-mysql5
> >      ∟postgres9のVIP-postgres9
> >
> > db01…リソース稼働中
> > db02…リソース待機中
> >
> > 基本的には上手く動いているのですが、
> > インターフェースダウンの障害時に以下のようなメッセージが
> > 永遠とログに出続けます。
> >
> > 【db01】
> > Aug 09 15:53:47 db01 heartbeat: [2363]: WARN: Rexmit of seq 66672
> > requested. 3 is max.
> >
> > 【db02】
> > Aug 09 15:53:47 db02 heartbeat: [4661]: WARN: Gmain_timeout_dispatch:
> > Dispatch function for retransmit request took too long to execute: 20
> > ms (> 10 ms) (GSource: 0x9822230)
> >
> > プロセスダウン、VIPダウン、heartbeatのダウン
> > などの障害時にはこのようなことにならないです。
> > インターフェースダウン時のみです。
> > (正確にはインターフェースアップ時ですが)
> >
> > 実施した障害テスト+復旧の流れは以下になります。
> > ①db01インターフェースダウン
> > ②db02にVIP+リソースが移動し、正常稼働
> > ③db01インターフェースをアップ
> >
> > 上記手順の③を実施後にログが出始めます。
> > (②と③の間にdb01のheartbeatの再起動を実施しても結果は同じでした)
> >
> > db01のheartbeatを停止してもdb02のログは出続けます。
> > というわけで、db01、db02のheartbeatを止めないとログが出力される状況は変化なしでした。
> > 2台とも停止⇒起動後はログ出力もとまりました。
> >
> > さらに、sarコマンドを使って該当する時間の稼働情報を出してみたら以下のような結果がでました。
> > 【db01の結果】
> >                   CPU     %user     %nice   %system   %iowait
> > %steal     %idle
> > 15:50:01          all    106.63      0.00    106.63    106.64
> > 106.64      0.00
> >                pgpgin/s pgpgout/s   fault/s  majflt/s
> > 15:50:01    432866871482.24 432866871481.63 432866871446.10
> > 432866871482.27
> >
> > db02の方は正常な数値でした。
> > なんかとんでもない数値がでてしまっていました。
> > バグなんでしょうか・・・。
> >
> > <crmコンフィグ>
> > node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
> >         attributes standby="off"
> > node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
> >         attributes standby="off"
> > primitive res_mysql4 ocf:heartbeat:mysql4 \
> >         op monitor interval="10s"
> > primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
> >         params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_mysql5 ocf:heartbeat:mysql5 \
> >         op monitor interval="10s"
> > primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
> >         params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_pgsql9 ocf:heartbeat:pgsql9 \
> >         op monitor interval="10s"
> > primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
> >         params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_pingd ocf:heartbeat:pingd \
> >         params name="default_ping_set" host_list="" multiplier="100"
> > dampen="1" \
> >         op monitor on-fail="block" interval="10s"
> > group grp_mysql4 res_mysql4_vip res_mysql4 \
> >         meta target-role="Started"
> > group grp_mysql5 res_mysql5_vip res_mysql5
> > group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
> >         meta target-role="Started"
> > clone clone_pingd res_pingd
> > location grp_mysql4_location grp_mysql4 \
> >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set
> > or default_ping_set lt 100
> > location grp_mysql5_location grp_mysql5 \
> >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set
> > or default_ping_set lt 100
> > location grp_pgsql9_location grp_pgsql9 \
> >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set
> > or default_ping_set lt 100
> > property $id="cib-bootstrap-options" \
> >         dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3"
> > \
> >         cluster-infrastructure="Heartbeat" \
> >         last-lrm-refresh="1312538205" \
> >         no-quorum-policy="ignore" \
> >         stonith-enabled="false"
> > rsc_defaults $id="rsc-options" \
> >         resource-stickiness="INFINITY" \
> >         migration-threshold="3"
> >
> > <db01 ha.cf>
> > pacemaker on
> > node db01
> > node db02
> > ucast eth0 172.0.0.2
> > udpport 694
> >
> > keepalive 5
> > warntime 10
> > deadtime 15
> > initdead 15
> >
> > logfile /var/log/heartbeat/ha.log
> > debug 0
> > logfacility none
> >
> > watchdog /dev/watchdog
> > respawn root /usr/lib64/heartbeat/ifcheckd
> >
> > <db02 ha.cf>
> > pacemaker on
> > node db01
> > node db02
> > ucast eth0 172.0.0.1
> > udpport 694
> >
> > keepalive 5
> > warntime 10
> > deadtime 15
> > initdead 15
> >
> > logfile /var/log/heartbeat/ha.log
> > debug 0
> > logfacility none
> >
> > watchdog /dev/watchdog
> > respawn root /usr/lib64/heartbeat/ifcheckd
>
> --
> ----------------------------------------------------------------------
> 岩崎  登               (株)サードウェア
>
> Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> Phone: 047-496-3341      Fax: 047-496-3370
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


iwasaki at 3ware

Aug 9, 2011, 10:11 PM

Post #4 of 12 (581 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

$B4d:j$G$9(B

On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
wrote:
> $B4XC+$G$9!#(B
>
> heartbeat$B$N%P!<%8%g%s$O(B3.0.4$B$G$7$?!#(B
> $B%P!<%8%g%s%"%C%W$9$k$HD>$k$h$&$J5$$b$7$F$-$^$7$?!&!&!&!#(B
> $B$A$g$C$H$d$C$F$_$h$&$H;W$$$^$9!#(B
>
> OS$B$N%"!<%-%F%/%A%c$O(Bx86_64$B$K$J$j$^$9!#(B
>

$BN;2r$G$9!<!#$b$7>I>u$,2~A1$5$l$k$h$&$G$7$?$i>pJs(BML$B$KEj$2$F$/$l$k$H$&$l$7$$$G$9!#(B

--
----------------------------------------------------------------------
$B4d:j!!!!EP(B ($B3t(B)$B%5!<%I%&%'%"(B

Noboru Iwasaki 274-0815 $B [at] iMU)A%66;T@>=,;VLn(B3-39-8
iwasaki [at] 3ware URL: http://www.3ware.co.jp/
Phone: 047-496-3341 Fax: 047-496-3370

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


sekiya_kyuusaku at yahoo

Aug 15, 2011, 11:53 PM

Post #5 of 12 (523 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

関谷です。

heartbeatのバージョンを3.0.5にアップしたら
バグっぽい動作は改善され問題は解決しました。
有益な情報ありがとうございました。とても助かりました。

ただ、一点挙動として気になることがあります。

①1号機のインターフェースダウン
②1号機のdefault_ping_setの値が0になりリソースが2号機へフェールオーバ
※ここまではOK
③1号機のインターフェースアップ
④1号機のdefault_ping_setの値が100に戻り、リソースが1号機へフェールバック

1号機のインターフェースがアップし、ping疎通が復活したとしても
自動でフェールバックさせたくないのですが、これは仕様でしょうか?
default_ping_setの値が100に戻って欲しくないのですが。。。

以下設定の一部です。
primitive res_pingd ocf:db_cluster:pingd \
params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
op monitor on-fail="block" interval="10s"
clone clone_pingd res_pingd
location grp_mysql4_location grp_mysql4 \
rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
location grp_mysql5_location grp_mysql5 \
rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
location grp_pgsql9_location grp_pgsql9 \
rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100

※host_listの値はRAのpingdに直接書き込んでいます。


--- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:

> 岩崎です
>
> On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
> wrote:
> > 関谷です。
> >
> > heartbeatのバージョンは3.0.4でした。
> > バージョンアップすると直るような気もしてきました・・・。
> > ちょっとやってみようと思います。
> >
> > OSのアーキテクチャはx86_64になります。
> >
>
> 了解ですー。もし症状が改善されるようでしたら情報MLに投げてくれるとうれしいです。
>
> --
> ----------------------------------------------------------------------
> 岩崎  登               (株)サードウェア
>
> Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> Phone: 047-496-3341      Fax: 047-496-3370
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


renayama19661014 at ybb

Aug 16, 2011, 12:04 AM

Post #6 of 12 (573 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

関谷さん

こんにちは、山内です。

全体設定を見ていないのですが、リソースの配置完了後のスコアに問題がある為、
リソースが1号機の回復後にスコアに従って、フェールバックしているのだと思います。

crm設定に、

### Resource Defaults ###
rsc_defaults \
resource-stickiness="INFINITY"

を加えてください。

この設定で、他の設定が影響していなければ、リソースが起動した方のスコアは最大に
なるので、1号機を回復しても2号機のスコアが上になります。

ただし、他の設定が影響しているかも知れませんので、うまくいかないかも知れません。

以上、よろしく御願いいたします。

--- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:

> 関谷です。
>
> heartbeatのバージョンを3.0.5にアップしたら
> バグっぽい動作は改善され問題は解決しました。
> 有益な情報ありがとうございました。とても助かりました。
>
> ただ、一点挙動として気になることがあります。
>
> ①1号機のインターフェースダウン
> ②1号機のdefault_ping_setの値が0になりリソースが2号機へフェールオーバ
> ※ここまではOK
> ③1号機のインターフェースアップ
> ④1号機のdefault_ping_setの値が100に戻り、リソースが1号機へフェールバック
>
> 1号機のインターフェースがアップし、ping疎通が復活したとしても
> 自動でフェールバックさせたくないのですが、これは仕様でしょうか?
> default_ping_setの値が100に戻って欲しくないのですが。。。
>
> 以下設定の一部です。
> primitive res_pingd ocf:db_cluster:pingd \
>         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
>         op monitor on-fail="block" interval="10s"
> clone clone_pingd res_pingd
> location grp_mysql4_location grp_mysql4 \
>         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> location grp_mysql5_location grp_mysql5 \
>         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> location grp_pgsql9_location grp_pgsql9 \
>         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
>
> ※host_listの値はRAのpingdに直接書き込んでいます。
>
>
> --- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:
>
> >  岩崎です
> >
> >  On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
> >  wrote:
> > > 関谷です。
> > >
> > > heartbeatのバージョンは3.0.4でした。
> > > バージョンアップすると直るような気もしてきました・・・。
> > > ちょっとやってみようと思います。
> > >
> > > OSのアーキテクチャはx86_64になります。
> > >
> >
> >  了解ですー。もし症状が改善されるようでしたら情報MLに投げてくれるとうれしいです。
> >
> > --
> >  ----------------------------------------------------------------------
> >  岩崎  登               (株)サードウェア
> >
> >  Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> >  iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> >  Phone: 047-496-3341      Fax: 047-496-3370
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux-ha-japan [at] lists
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


sekiya_kyuusaku at yahoo

Aug 16, 2011, 12:22 AM

Post #7 of 12 (671 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

山内さん

ご教授ありがとうございます。

> ### Resource Defaults ###
> rsc_defaults \
> resource-stickiness="INFINITY"
ただ、この設定は入っていました。
もう少し設定をいじってみようと思います。

以下、全体の設定になります。
<crmコンフィグ>
node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
attributes standby="off"
node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
attributes standby="off"
primitive res_mysql4 ocf:heartbeat:mysql4 \
op monitor interval="10s"
primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_mysql5 ocf:heartbeat:mysql5 \
op monitor interval="10s"
primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_pgsql9 ocf:heartbeat:pgsql9 \
op monitor interval="10s"
primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_pingd ocf:heartbeat:pingd \
params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
op monitor on-fail="block" interval="10s"
group grp_mysql4 res_mysql4_vip res_mysql4 \
meta target-role="Started"
group grp_mysql5 res_mysql5_vip res_mysql5
group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
meta target-role="Started"
clone clone_pingd res_pingd
location grp_mysql4_location grp_mysql4 \
rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
location grp_mysql5_location grp_mysql5 \
rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
location grp_pgsql9_location grp_pgsql9 \
rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
property $id="cib-bootstrap-options" \
dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3" \
cluster-infrastructure="Heartbeat" \
last-lrm-refresh="1312538205" \
no-quorum-policy="ignore" \
stonith-enabled="false"
rsc_defaults $id="rsc-options" \
resource-stickiness="INFINITY" \
migration-threshold="3"

<db01 ha.cf>
pacemaker on
node db01
node db02
ucast eth0 172.0.0.2
udpport 694

keepalive 5
warntime 10
deadtime 15
initdead 15

logfile /var/log/heartbeat/ha.log
debug 0
logfacility none

watchdog /dev/watchdog
respawn root /usr/lib64/heartbeat/ifcheckd

<db02 ha.cf>
pacemaker on
node db01
node db02
ucast eth0 172.0.0.1
udpport 694

keepalive 5
warntime 10
deadtime 15
initdead 15

logfile /var/log/heartbeat/ha.log
debug 0
logfacility none

watchdog /dev/watchdog
respawn root /usr/lib64/heartbeat/ifcheckd



--- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:

> 関谷さん
>
> こんにちは、山内です。
>
> 全体設定を見ていないのですが、リソースの配置完了後のスコアに問題がある為、
> リソースが1号機の回復後にスコアに従って、フェールバックしているのだと思います。
>
> crm設定に、
>
> ### Resource Defaults ###
> rsc_defaults \
>         resource-stickiness="INFINITY"
>
> を加えてください。
>
> この設定で、他の設定が影響していなければ、リソースが起動した方のスコアは最大に
> なるので、1号機を回復しても2号機のスコアが上になります。
>
> ただし、他の設定が影響しているかも知れませんので、うまくいかないかも知れません。
>
> 以上、よろしく御願いいたします。
>
> --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
>
> > 関谷です。
> >
> > heartbeatのバージョンを3.0.5にアップしたら
> > バグっぽい動作は改善され問題は解決しました。
> > 有益な情報ありがとうございました。とても助かりました。
> >
> > ただ、一点挙動として気になることがあります。
> >
> > ①1号機のインターフェースダウン
> > ②1号機のdefault_ping_setの値が0になりリソースが2号機へフェールオーバ
> > ※ここまではOK
> > ③1号機のインターフェースアップ
> > ④1号機のdefault_ping_setの値が100に戻り、リソースが1号機へフェールバック
> >
> > 1号機のインターフェースがアップし、ping疎通が復活したとしても
> > 自動でフェールバックさせたくないのですが、これは仕様でしょうか?
> > default_ping_setの値が100に戻って欲しくないのですが。。。
> >
> > 以下設定の一部です。
> > primitive res_pingd ocf:db_cluster:pingd \
> >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> >         op monitor on-fail="block" interval="10s"
> > clone clone_pingd res_pingd
> > location grp_mysql4_location grp_mysql4 \
> >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > location grp_mysql5_location grp_mysql5 \
> >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > location grp_pgsql9_location grp_pgsql9 \
> >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> >
> > ※host_listの値はRAのpingdに直接書き込んでいます。
> >
> >
> > --- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:
> >
> > >  岩崎です
> > >
> > >  On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
> > >  wrote:
> > > > 関谷です。
> > > >
> > > > heartbeatのバージョンは3.0.4でした。
> > > > バージョンアップすると直るような気もしてきました・・・。
> > > > ちょっとやってみようと思います。
> > > >
> > > > OSのアーキテクチャはx86_64になります。
> > > >
> > >
> > >  了解ですー。もし症状が改善されるようでしたら情報MLに投げてくれるとうれしいです。
> > >
> > > --
> > >  ----------------------------------------------------------------------
> > >  岩崎  登               (株)サードウェア
> > >
> > >  Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> > >  iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> > >  Phone: 047-496-3341      Fax: 047-496-3370
> > >
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux-ha-japan [at] lists
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > >
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux-ha-japan [at] lists
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


renayama19661014 at ybb

Aug 16, 2011, 12:31 AM

Post #8 of 12 (520 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

関谷さん

こんにちは、山内です。

入っていましたか。。。。

初期のgrp_mysql4,grp_mysql5,grp_mysql9について、
1号機、2号機のスコアを記載したらどうなりますでしょうか?

以下は、例です。

location rsc_location-1 prmIpPostgreSQLDB \
rule 200: #uname eq srv01 \
rule 100: #uname eq srv02 \
rule -inf: not_defined default_ping_set or default_ping_set lt 100

もしそれでもおかしいようであれば、hb_reportで情報を収集して投稿して
頂いた方がよさそうです。

以上、よろしく御願いいたします。


--- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:

> 山内さん
>
> ご教授ありがとうございます。
>
> > ### Resource Defaults ###
> > rsc_defaults \
> >         resource-stickiness="INFINITY"
> ただ、この設定は入っていました。
> もう少し設定をいじってみようと思います。
>
> 以下、全体の設定になります。
> <crmコンフィグ>
> node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
>         attributes standby="off"
> node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
>         attributes standby="off"
> primitive res_mysql4 ocf:heartbeat:mysql4 \
>         op monitor interval="10s"
> primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
>         params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
>         op monitor interval="10s"
> primitive res_mysql5 ocf:heartbeat:mysql5 \
>         op monitor interval="10s"
> primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
>         params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
>         op monitor interval="10s"
> primitive res_pgsql9 ocf:heartbeat:pgsql9 \
>         op monitor interval="10s"
> primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
>         params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
>         op monitor interval="10s"
> primitive res_pingd ocf:heartbeat:pingd \
>         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
>         op monitor on-fail="block" interval="10s"
> group grp_mysql4 res_mysql4_vip res_mysql4 \
>         meta target-role="Started"
> group grp_mysql5 res_mysql5_vip res_mysql5
> group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
>         meta target-role="Started"
> clone clone_pingd res_pingd
> location grp_mysql4_location grp_mysql4 \
>         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> location grp_mysql5_location grp_mysql5 \
>         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> location grp_pgsql9_location grp_pgsql9 \
>         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> property $id="cib-bootstrap-options" \
>         dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3" \
>         cluster-infrastructure="Heartbeat" \
>         last-lrm-refresh="1312538205" \
>         no-quorum-policy="ignore" \
>         stonith-enabled="false"
> rsc_defaults $id="rsc-options" \
>         resource-stickiness="INFINITY" \
>         migration-threshold="3"
>
> <db01 ha.cf>
> pacemaker on
> node db01
> node db02
> ucast eth0 172.0.0.2
> udpport 694
>
> keepalive 5
> warntime 10
> deadtime 15
> initdead 15
>
> logfile /var/log/heartbeat/ha.log
> debug 0
> logfacility none
>
> watchdog /dev/watchdog
> respawn root /usr/lib64/heartbeat/ifcheckd
>
> <db02 ha.cf>
> pacemaker on
> node db01
> node db02
> ucast eth0 172.0.0.1
> udpport 694
>
> keepalive 5
> warntime 10
> deadtime 15
> initdead 15
>
> logfile /var/log/heartbeat/ha.log
> debug 0
> logfacility none
>
> watchdog /dev/watchdog
> respawn root /usr/lib64/heartbeat/ifcheckd
>
>
>
> --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
>
> > 関谷さん
> >
> > こんにちは、山内です。
> >
> > 全体設定を見ていないのですが、リソースの配置完了後のスコアに問題がある為、
> > リソースが1号機の回復後にスコアに従って、フェールバックしているのだと思います。
> >
> > crm設定に、
> >
> > ### Resource Defaults ###
> > rsc_defaults \
> >         resource-stickiness="INFINITY"
> >
> > を加えてください。
> >
> > この設定で、他の設定が影響していなければ、リソースが起動した方のスコアは最大に
> > なるので、1号機を回復しても2号機のスコアが上になります。
> >
> > ただし、他の設定が影響しているかも知れませんので、うまくいかないかも知れません。
> >
> > 以上、よろしく御願いいたします。
> >
> > --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
> >
> > > 関谷です。
> > >
> > > heartbeatのバージョンを3.0.5にアップしたら
> > > バグっぽい動作は改善され問題は解決しました。
> > > 有益な情報ありがとうございました。とても助かりました。
> > >
> > > ただ、一点挙動として気になることがあります。
> > >
> > > ①1号機のインターフェースダウン
> > > ②1号機のdefault_ping_setの値が0になりリソースが2号機へフェールオーバ
> > > ※ここまではOK
> > > ③1号機のインターフェースアップ
> > > ④1号機のdefault_ping_setの値が100に戻り、リソースが1号機へフェールバック
> > >
> > > 1号機のインターフェースがアップし、ping疎通が復活したとしても
> > > 自動でフェールバックさせたくないのですが、これは仕様でしょうか?
> > > default_ping_setの値が100に戻って欲しくないのですが。。。
> > >
> > > 以下設定の一部です。
> > > primitive res_pingd ocf:db_cluster:pingd \
> > >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> > >         op monitor on-fail="block" interval="10s"
> > > clone clone_pingd res_pingd
> > > location grp_mysql4_location grp_mysql4 \
> > >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > location grp_mysql5_location grp_mysql5 \
> > >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > location grp_pgsql9_location grp_pgsql9 \
> > >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > >
> > > ※host_listの値はRAのpingdに直接書き込んでいます。
> > >
> > >
> > > --- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:
> > >
> > > >  岩崎です
> > > >
> > > >  On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
> > > >  wrote:
> > > > > 関谷です。
> > > > >
> > > > > heartbeatのバージョンは3.0.4でした。
> > > > > バージョンアップすると直るような気もしてきました・・・。
> > > > > ちょっとやってみようと思います。
> > > > >
> > > > > OSのアーキテクチャはx86_64になります。
> > > > >
> > > >
> > > >  了解ですー。もし症状が改善されるようでしたら情報MLに投げてくれるとうれしいです。
> > > >
> > > > --
> > > >  ----------------------------------------------------------------------
> > > >  岩崎  登               (株)サードウェア
> > > >
> > > >  Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> > > >  iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> > > >  Phone: 047-496-3341      Fax: 047-496-3370
> > > >
> > > > _______________________________________________
> > > > Linux-ha-japan mailing list
> > > > Linux-ha-japan [at] lists
> > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > >
> > >
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux-ha-japan [at] lists
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > >
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux-ha-japan [at] lists
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


renayama19661014 at ybb

Aug 16, 2011, 12:52 AM

Post #9 of 12 (517 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

関谷さん

こんにちは、山内です。

設定に関して2点ほど。。。。

①pingdですが、pingdの疎通が3つのgrp_mysqlリソース起動の条件になっていると思いますので、orderを組んだ方が起動を確実に出来ます。

 例:order rsc_order-1 0: clnPingd grpPostgreSQLDB

②pingdのdampen値ですが、attrdの処理の都合上、3sあたりに設定して頂いた方がおかしな現象に遭遇する可能性が下がります。

以上、宜しくお願いいたします。


--- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:

> 関谷さん
>
> こんにちは、山内です。
>
> 入っていましたか。。。。
>
> 初期のgrp_mysql4,grp_mysql5,grp_mysql9について、
> 1号機、2号機のスコアを記載したらどうなりますでしょうか?
>
> 以下は、例です。
>
> location rsc_location-1 prmIpPostgreSQLDB \
>         rule  200: #uname eq srv01 \
>         rule  100: #uname eq srv02 \
>         rule -inf: not_defined default_ping_set or default_ping_set lt 100
>
> もしそれでもおかしいようであれば、hb_reportで情報を収集して投稿して
> 頂いた方がよさそうです。
>
> 以上、よろしく御願いいたします。
>
>
> --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
>
> > 山内さん
> >
> > ご教授ありがとうございます。
> >
> > > ### Resource Defaults ###
> > > rsc_defaults \
> > >         resource-stickiness="INFINITY"
> > ただ、この設定は入っていました。
> > もう少し設定をいじってみようと思います。
> >
> > 以下、全体の設定になります。
> > <crmコンフィグ>
> > node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
> >         attributes standby="off"
> > node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
> >         attributes standby="off"
> > primitive res_mysql4 ocf:heartbeat:mysql4 \
> >         op monitor interval="10s"
> > primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
> >         params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_mysql5 ocf:heartbeat:mysql5 \
> >         op monitor interval="10s"
> > primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
> >         params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_pgsql9 ocf:heartbeat:pgsql9 \
> >         op monitor interval="10s"
> > primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
> >         params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_pingd ocf:heartbeat:pingd \
> >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> >         op monitor on-fail="block" interval="10s"
> > group grp_mysql4 res_mysql4_vip res_mysql4 \
> >         meta target-role="Started"
> > group grp_mysql5 res_mysql5_vip res_mysql5
> > group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
> >         meta target-role="Started"
> > clone clone_pingd res_pingd
> > location grp_mysql4_location grp_mysql4 \
> >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > location grp_mysql5_location grp_mysql5 \
> >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > location grp_pgsql9_location grp_pgsql9 \
> >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > property $id="cib-bootstrap-options" \
> >         dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3" \
> >         cluster-infrastructure="Heartbeat" \
> >         last-lrm-refresh="1312538205" \
> >         no-quorum-policy="ignore" \
> >         stonith-enabled="false"
> > rsc_defaults $id="rsc-options" \
> >         resource-stickiness="INFINITY" \
> >         migration-threshold="3"
> >
> > <db01 ha.cf>
> > pacemaker on
> > node db01
> > node db02
> > ucast eth0 172.0.0.2
> > udpport 694
> >
> > keepalive 5
> > warntime 10
> > deadtime 15
> > initdead 15
> >
> > logfile /var/log/heartbeat/ha.log
> > debug 0
> > logfacility none
> >
> > watchdog /dev/watchdog
> > respawn root /usr/lib64/heartbeat/ifcheckd
> >
> > <db02 ha.cf>
> > pacemaker on
> > node db01
> > node db02
> > ucast eth0 172.0.0.1
> > udpport 694
> >
> > keepalive 5
> > warntime 10
> > deadtime 15
> > initdead 15
> >
> > logfile /var/log/heartbeat/ha.log
> > debug 0
> > logfacility none
> >
> > watchdog /dev/watchdog
> > respawn root /usr/lib64/heartbeat/ifcheckd
> >
> >
> >
> > --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
> >
> > > 関谷さん
> > >
> > > こんにちは、山内です。
> > >
> > > 全体設定を見ていないのですが、リソースの配置完了後のスコアに問題がある為、
> > > リソースが1号機の回復後にスコアに従って、フェールバックしているのだと思います。
> > >
> > > crm設定に、
> > >
> > > ### Resource Defaults ###
> > > rsc_defaults \
> > >         resource-stickiness="INFINITY"
> > >
> > > を加えてください。
> > >
> > > この設定で、他の設定が影響していなければ、リソースが起動した方のスコアは最大に
> > > なるので、1号機を回復しても2号機のスコアが上になります。
> > >
> > > ただし、他の設定が影響しているかも知れませんので、うまくいかないかも知れません。
> > >
> > > 以上、よろしく御願いいたします。
> > >
> > > --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
> > >
> > > > 関谷です。
> > > >
> > > > heartbeatのバージョンを3.0.5にアップしたら
> > > > バグっぽい動作は改善され問題は解決しました。
> > > > 有益な情報ありがとうございました。とても助かりました。
> > > >
> > > > ただ、一点挙動として気になることがあります。
> > > >
> > > > ①1号機のインターフェースダウン
> > > > ②1号機のdefault_ping_setの値が0になりリソースが2号機へフェールオーバ
> > > > ※ここまではOK
> > > > ③1号機のインターフェースアップ
> > > > ④1号機のdefault_ping_setの値が100に戻り、リソースが1号機へフェールバック
> > > >
> > > > 1号機のインターフェースがアップし、ping疎通が復活したとしても
> > > > 自動でフェールバックさせたくないのですが、これは仕様でしょうか?
> > > > default_ping_setの値が100に戻って欲しくないのですが。。。
> > > >
> > > > 以下設定の一部です。
> > > > primitive res_pingd ocf:db_cluster:pingd \
> > > >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> > > >         op monitor on-fail="block" interval="10s"
> > > > clone clone_pingd res_pingd
> > > > location grp_mysql4_location grp_mysql4 \
> > > >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > location grp_mysql5_location grp_mysql5 \
> > > >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > location grp_pgsql9_location grp_pgsql9 \
> > > >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > >
> > > > ※host_listの値はRAのpingdに直接書き込んでいます。
> > > >
> > > >
> > > > --- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:
> > > >
> > > > >  岩崎です
> > > > >
> > > > >  On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
> > > > >  wrote:
> > > > > > 関谷です。
> > > > > >
> > > > > > heartbeatのバージョンは3.0.4でした。
> > > > > > バージョンアップすると直るような気もしてきました・・・。
> > > > > > ちょっとやってみようと思います。
> > > > > >
> > > > > > OSのアーキテクチャはx86_64になります。
> > > > > >
> > > > >
> > > > >  了解ですー。もし症状が改善されるようでしたら情報MLに投げてくれるとうれしいです。
> > > > >
> > > > > --
> > > > >  ----------------------------------------------------------------------
> > > > >  岩崎  登               (株)サードウェア
> > > > >
> > > > >  Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> > > > >  iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> > > > >  Phone: 047-496-3341      Fax: 047-496-3370
> > > > >
> > > > > _______________________________________________
> > > > > Linux-ha-japan mailing list
> > > > > Linux-ha-japan [at] lists
> > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > >
> > > >
> > > > _______________________________________________
> > > > Linux-ha-japan mailing list
> > > > Linux-ha-japan [at] lists
> > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > >
> > >
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux-ha-japan [at] lists
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > >
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux-ha-japan [at] lists
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


renayama19661014 at ybb

Aug 16, 2011, 6:30 PM

Post #10 of 12 (524 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

関谷さん

こんにちは、山内です。

気になる現象でしたので、念の為、手元の環境(RHEL5.6 [at] Esxの2台)で確認してみました。
(ha.cfの通信はbcast通信ですが、ほとんど同じです)
(order設定、ホストへのスコア設定をしていないのでリソースはsrv01,srv02のどちらかで起動する形になります)

--利用したcrm:Dummyに変更してpingdの疎通先はパラメータでセット--
primitive res_mysql4 ocf:heartbeat:Dummy \
op monitor interval="10s"
primitive res_mysql4_vip ocf:heartbeat:Dummy \
params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_mysql5 ocf:heartbeat:Dummy \
op monitor interval="10s"
primitive res_mysql5_vip ocf:heartbeat:Dummy \
params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_pgsql9 ocf:heartbeat:Dummy \
op monitor interval="10s"
primitive res_pgsql9_vip ocf:heartbeat:Dummy \
params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
op monitor interval="10s"
primitive res_pingd ocf:heartbeat:pingd \
params name="default_ping_set" host_list="192.168.40.1" multiplier="100" dampen="1" \
op monitor on-fail="block" interval="10s"
group grp_mysql4 res_mysql4_vip res_mysql4 \ meta target-role="Started"
group grp_mysql5 res_mysql5_vip res_mysql5
group grp_pgsql9 res_pgsql9_vip res_pgsql9 \ meta target-role="Started"
clone clone_pingd res_pingd
location grp_mysql4_location grp_mysql4 \ rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
location grp_mysql5_location grp_mysql5 \ rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
location grp_pgsql9_location grp_pgsql9 \ rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
property $id="cib-bootstrap-options" \ cluster-infrastructure="Heartbeat" \ no-quorum-policy="ignore" \ stonith-enabled="false"
rsc_defaults $id="rsc-options" \ resource-stickiness="INFINITY" \ migration-threshold="3"



1)起動後
[root [at] srv0 ~]# crm_mon -1 -f
============
Last updated: Wed Aug 17 19:22:27 2011
Stack: Heartbeat
Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
2 Nodes configured, unknown expected votes
0 Resources configured.
============

Online: [ srv01 srv02 ]


Migration summary:
* Node srv02:
* Node srv01:


2)crm投入後
[root [at] srv0 ~]# crm_mon -1 -f
============
Last updated: Wed Aug 17 19:23:03 2011
Stack: Heartbeat
Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
2 Nodes configured, unknown expected votes
4 Resources configured.
============

Online: [ srv01 srv02 ]

Resource Group: grp_mysql4
res_mysql4_vip (ocf::heartbeat:Dummy): Started srv01
res_mysql4 (ocf::heartbeat:Dummy): Started srv01
Resource Group: grp_mysql5
res_mysql5_vip (ocf::heartbeat:Dummy): Started srv02
res_mysql5 (ocf::heartbeat:Dummy): Started srv02
Resource Group: grp_pgsql9
res_pgsql9_vip (ocf::heartbeat:Dummy): Started srv01
res_pgsql9 (ocf::heartbeat:Dummy): Started srv01
Clone Set: clone_pingd
Started: [ srv01 srv02 ]

Migration summary:
* Node srv02:
* Node srv01:

3)srv01でのpingdをiptablesで遮断後

[root [at] srv0 ~]# crm_mon -1 -f
============
Last updated: Wed Aug 17 19:23:57 2011
Stack: Heartbeat
Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
2 Nodes configured, unknown expected votes
4 Resources configured.
============

Online: [ srv01 srv02 ]

Resource Group: grp_mysql4
res_mysql4_vip (ocf::heartbeat:Dummy): Started srv02
res_mysql4 (ocf::heartbeat:Dummy): Started srv02
Resource Group: grp_mysql5
res_mysql5_vip (ocf::heartbeat:Dummy): Started srv02
res_mysql5 (ocf::heartbeat:Dummy): Started srv02
Resource Group: grp_pgsql9
res_pgsql9_vip (ocf::heartbeat:Dummy): Started srv02
res_pgsql9 (ocf::heartbeat:Dummy): Started srv02
Clone Set: clone_pingd
Started: [ srv01 srv02 ]

Migration summary:
* Node srv02:
* Node srv01:


4)srv01での遮断を解除後(srv01へのフェイルバックはしていない)

[root [at] srv0 ~]# crm_mon -1 -f
============
Last updated: Wed Aug 17 19:25:27 2011
Stack: Heartbeat
Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
2 Nodes configured, unknown expected votes
4 Resources configured.
============

Online: [ srv01 srv02 ]

Resource Group: grp_mysql4
res_mysql4_vip (ocf::heartbeat:Dummy): Started srv02
res_mysql4 (ocf::heartbeat:Dummy): Started srv02
Resource Group: grp_mysql5
res_mysql5_vip (ocf::heartbeat:Dummy): Started srv02
res_mysql5 (ocf::heartbeat:Dummy): Started srv02
Resource Group: grp_pgsql9
res_pgsql9_vip (ocf::heartbeat:Dummy): Started srv02
res_pgsql9 (ocf::heartbeat:Dummy): Started srv02
Clone Set: clone_pingd
Started: [ srv01 srv02 ]

Migration summary:
* Node srv02:
* Node srv01:

どうも、遮断解除後にsrv01へのフェイルバックはしないようです。

pingdのhostlistをRA内に設定しているとのことですが、どのような設定をされているのでしょうか?

以上、宜しく御願いいたします。



--- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:

> 関谷さん
>
> こんにちは、山内です。
>
> 設定に関して2点ほど。。。。
>
> ①pingdですが、pingdの疎通が3つのgrp_mysqlリソース起動の条件になっていると思いますので、orderを組んだ方が起動を確実に出来ます。
>
>  例:order rsc_order-1 0: clnPingd          grpPostgreSQLDB
>
> ②pingdのdampen値ですが、attrdの処理の都合上、3sあたりに設定して頂いた方がおかしな現象に遭遇する可能性が下がります。
>
> 以上、宜しくお願いいたします。
>
>
> --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
>
> > 関谷さん
> >
> > こんにちは、山内です。
> >
> > 入っていましたか。。。。
> >
> > 初期のgrp_mysql4,grp_mysql5,grp_mysql9について、
> > 1号機、2号機のスコアを記載したらどうなりますでしょうか?
> >
> > 以下は、例です。
> >
> > location rsc_location-1 prmIpPostgreSQLDB \
> >         rule  200: #uname eq srv01 \
> >         rule  100: #uname eq srv02 \
> >         rule -inf: not_defined default_ping_set or default_ping_set lt 100
> >
> > もしそれでもおかしいようであれば、hb_reportで情報を収集して投稿して
> > 頂いた方がよさそうです。
> >
> > 以上、よろしく御願いいたします。
> >
> >
> > --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
> >
> > > 山内さん
> > >
> > > ご教授ありがとうございます。
> > >
> > > > ### Resource Defaults ###
> > > > rsc_defaults \
> > > >         resource-stickiness="INFINITY"
> > > ただ、この設定は入っていました。
> > > もう少し設定をいじってみようと思います。
> > >
> > > 以下、全体の設定になります。
> > > <crmコンフィグ>
> > > node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
> > >         attributes standby="off"
> > > node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
> > >         attributes standby="off"
> > > primitive res_mysql4 ocf:heartbeat:mysql4 \
> > >         op monitor interval="10s"
> > > primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
> > >         params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
> > >         op monitor interval="10s"
> > > primitive res_mysql5 ocf:heartbeat:mysql5 \
> > >         op monitor interval="10s"
> > > primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
> > >         params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
> > >         op monitor interval="10s"
> > > primitive res_pgsql9 ocf:heartbeat:pgsql9 \
> > >         op monitor interval="10s"
> > > primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
> > >         params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
> > >         op monitor interval="10s"
> > > primitive res_pingd ocf:heartbeat:pingd \
> > >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> > >         op monitor on-fail="block" interval="10s"
> > > group grp_mysql4 res_mysql4_vip res_mysql4 \
> > >         meta target-role="Started"
> > > group grp_mysql5 res_mysql5_vip res_mysql5
> > > group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
> > >         meta target-role="Started"
> > > clone clone_pingd res_pingd
> > > location grp_mysql4_location grp_mysql4 \
> > >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > location grp_mysql5_location grp_mysql5 \
> > >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > location grp_pgsql9_location grp_pgsql9 \
> > >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > property $id="cib-bootstrap-options" \
> > >         dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3" \
> > >         cluster-infrastructure="Heartbeat" \
> > >         last-lrm-refresh="1312538205" \
> > >         no-quorum-policy="ignore" \
> > >         stonith-enabled="false"
> > > rsc_defaults $id="rsc-options" \
> > >         resource-stickiness="INFINITY" \
> > >         migration-threshold="3"
> > >
> > > <db01 ha.cf>
> > > pacemaker on
> > > node db01
> > > node db02
> > > ucast eth0 172.0.0.2
> > > udpport 694
> > >
> > > keepalive 5
> > > warntime 10
> > > deadtime 15
> > > initdead 15
> > >
> > > logfile /var/log/heartbeat/ha.log
> > > debug 0
> > > logfacility none
> > >
> > > watchdog /dev/watchdog
> > > respawn root /usr/lib64/heartbeat/ifcheckd
> > >
> > > <db02 ha.cf>
> > > pacemaker on
> > > node db01
> > > node db02
> > > ucast eth0 172.0.0.1
> > > udpport 694
> > >
> > > keepalive 5
> > > warntime 10
> > > deadtime 15
> > > initdead 15
> > >
> > > logfile /var/log/heartbeat/ha.log
> > > debug 0
> > > logfacility none
> > >
> > > watchdog /dev/watchdog
> > > respawn root /usr/lib64/heartbeat/ifcheckd
> > >
> > >
> > >
> > > --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
> > >
> > > > 関谷さん
> > > >
> > > > こんにちは、山内です。
> > > >
> > > > 全体設定を見ていないのですが、リソースの配置完了後のスコアに問題がある為、
> > > > リソースが1号機の回復後にスコアに従って、フェールバックしているのだと思います。
> > > >
> > > > crm設定に、
> > > >
> > > > ### Resource Defaults ###
> > > > rsc_defaults \
> > > >         resource-stickiness="INFINITY"
> > > >
> > > > を加えてください。
> > > >
> > > > この設定で、他の設定が影響していなければ、リソースが起動した方のスコアは最大に
> > > > なるので、1号機を回復しても2号機のスコアが上になります。
> > > >
> > > > ただし、他の設定が影響しているかも知れませんので、うまくいかないかも知れません。
> > > >
> > > > 以上、よろしく御願いいたします。
> > > >
> > > > --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
> > > >
> > > > > 関谷です。
> > > > >
> > > > > heartbeatのバージョンを3.0.5にアップしたら
> > > > > バグっぽい動作は改善され問題は解決しました。
> > > > > 有益な情報ありがとうございました。とても助かりました。
> > > > >
> > > > > ただ、一点挙動として気になることがあります。
> > > > >
> > > > > ①1号機のインターフェースダウン
> > > > > ②1号機のdefault_ping_setの値が0になりリソースが2号機へフェールオーバ
> > > > > ※ここまではOK
> > > > > ③1号機のインターフェースアップ
> > > > > ④1号機のdefault_ping_setの値が100に戻り、リソースが1号機へフェールバック
> > > > >
> > > > > 1号機のインターフェースがアップし、ping疎通が復活したとしても
> > > > > 自動でフェールバックさせたくないのですが、これは仕様でしょうか?
> > > > > default_ping_setの値が100に戻って欲しくないのですが。。。
> > > > >
> > > > > 以下設定の一部です。
> > > > > primitive res_pingd ocf:db_cluster:pingd \
> > > > >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> > > > >         op monitor on-fail="block" interval="10s"
> > > > > clone clone_pingd res_pingd
> > > > > location grp_mysql4_location grp_mysql4 \
> > > > >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > location grp_mysql5_location grp_mysql5 \
> > > > >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > location grp_pgsql9_location grp_pgsql9 \
> > > > >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > >
> > > > > ※host_listの値はRAのpingdに直接書き込んでいます。
> > > > >
> > > > >
> > > > > --- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:
> > > > >
> > > > > >  岩崎です
> > > > > >
> > > > > >  On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
> > > > > >  wrote:
> > > > > > > 関谷です。
> > > > > > >
> > > > > > > heartbeatのバージョンは3.0.4でした。
> > > > > > > バージョンアップすると直るような気もしてきました・・・。
> > > > > > > ちょっとやってみようと思います。
> > > > > > >
> > > > > > > OSのアーキテクチャはx86_64になります。
> > > > > > >
> > > > > >
> > > > > >  了解ですー。もし症状が改善されるようでしたら情報MLに投げてくれるとうれしいです。
> > > > > >
> > > > > > --
> > > > > >  ----------------------------------------------------------------------
> > > > > >  岩崎  登               (株)サードウェア
> > > > > >
> > > > > >  Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> > > > > >  iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> > > > > >  Phone: 047-496-3341      Fax: 047-496-3370
> > > > > >
> > > > > > _______________________________________________
> > > > > > Linux-ha-japan mailing list
> > > > > > Linux-ha-japan [at] lists
> > > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > > >
> > > > >
> > > > > _______________________________________________
> > > > > Linux-ha-japan mailing list
> > > > > Linux-ha-japan [at] lists
> > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > >
> > > >
> > > > _______________________________________________
> > > > Linux-ha-japan mailing list
> > > > Linux-ha-japan [at] lists
> > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > >
> > >
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux-ha-japan [at] lists
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > >
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux-ha-japan [at] lists
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


sekiya_kyuusaku at yahoo

Aug 16, 2011, 7:48 PM

Post #11 of 12 (509 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

関谷です。

検証までしていただいてありがとうございます。

今までpingdは以下のものを改修してつかっていました
/usr/lib/ocf/resource.d/pacemaker/pingd

山内さんの設定を見て気づいたのですが
/usr/lib/ocf/resource.d/heartbeat/pingd
こっちのpingdを使うようにしたらうまく動くようになりました。

諸々解決しました、
どうもありがとうございました。


--- On Wed, 2011/8/17, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:

> 関谷さん
>
> こんにちは、山内です。
>
> 気になる現象でしたので、念の為、手元の環境(RHEL5.6 [at] Esxの2台)で確認してみました。
> (ha.cfの通信はbcast通信ですが、ほとんど同じです)
> (order設定、ホストへのスコア設定をしていないのでリソースはsrv01,srv02のどちらかで起動する形になります)
>
> --利用したcrm:Dummyに変更してpingdの疎通先はパラメータでセット--
> primitive res_mysql4 ocf:heartbeat:Dummy \
>         op monitor interval="10s"
> primitive res_mysql4_vip ocf:heartbeat:Dummy \
>         params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
>         op monitor interval="10s"
> primitive res_mysql5 ocf:heartbeat:Dummy \
>         op monitor interval="10s"
> primitive res_mysql5_vip ocf:heartbeat:Dummy \
>         params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
>         op monitor interval="10s"
> primitive res_pgsql9 ocf:heartbeat:Dummy \
>         op monitor interval="10s"
> primitive res_pgsql9_vip ocf:heartbeat:Dummy \
>         params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
>         op monitor interval="10s"
> primitive res_pingd ocf:heartbeat:pingd \
>         params name="default_ping_set" host_list="192.168.40.1" multiplier="100" dampen="1" \
>         op monitor on-fail="block" interval="10s"
> group grp_mysql4 res_mysql4_vip res_mysql4 \        meta target-role="Started"
> group grp_mysql5 res_mysql5_vip res_mysql5
> group grp_pgsql9 res_pgsql9_vip res_pgsql9 \        meta target-role="Started"
> clone clone_pingd res_pingd
> location grp_mysql4_location grp_mysql4 \        rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> location grp_mysql5_location grp_mysql5 \        rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> location grp_pgsql9_location grp_pgsql9 \        rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> property $id="cib-bootstrap-options" \        cluster-infrastructure="Heartbeat" \        no-quorum-policy="ignore" \        stonith-enabled="false"
> rsc_defaults $id="rsc-options" \        resource-stickiness="INFINITY" \        migration-threshold="3"
>
>
>
> 1)起動後
> [root [at] srv0 ~]# crm_mon -1 -f
> ============
> Last updated: Wed Aug 17 19:22:27 2011
> Stack: Heartbeat
> Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
> Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
> 2 Nodes configured, unknown expected votes
> 0 Resources configured.
> ============
>
> Online: [ srv01 srv02 ]
>
>
> Migration summary:
> * Node srv02:
> * Node srv01:
>
>
> 2)crm投入後
> [root [at] srv0 ~]# crm_mon -1 -f
> ============
> Last updated: Wed Aug 17 19:23:03 2011
> Stack: Heartbeat
> Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
> Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
> 2 Nodes configured, unknown expected votes
> 4 Resources configured.
> ============
>
> Online: [ srv01 srv02 ]
>
> Resource Group: grp_mysql4
>      res_mysql4_vip     (ocf::heartbeat:Dummy): Started srv01
>      res_mysql4 (ocf::heartbeat:Dummy): Started srv01
> Resource Group: grp_mysql5
>      res_mysql5_vip     (ocf::heartbeat:Dummy): Started srv02
>      res_mysql5 (ocf::heartbeat:Dummy): Started srv02
> Resource Group: grp_pgsql9
>      res_pgsql9_vip     (ocf::heartbeat:Dummy): Started srv01
>      res_pgsql9 (ocf::heartbeat:Dummy): Started srv01
> Clone Set: clone_pingd
>      Started: [ srv01 srv02 ]
>
> Migration summary:
> * Node srv02:
> * Node srv01:
>
> 3)srv01でのpingdをiptablesで遮断後
>
> [root [at] srv0 ~]# crm_mon -1 -f
> ============
> Last updated: Wed Aug 17 19:23:57 2011
> Stack: Heartbeat
> Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
> Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
> 2 Nodes configured, unknown expected votes
> 4 Resources configured.
> ============
>
> Online: [ srv01 srv02 ]
>
> Resource Group: grp_mysql4
>      res_mysql4_vip     (ocf::heartbeat:Dummy): Started srv02
>      res_mysql4 (ocf::heartbeat:Dummy): Started srv02
> Resource Group: grp_mysql5
>      res_mysql5_vip     (ocf::heartbeat:Dummy): Started srv02
>      res_mysql5 (ocf::heartbeat:Dummy): Started srv02
> Resource Group: grp_pgsql9
>      res_pgsql9_vip     (ocf::heartbeat:Dummy): Started srv02
>      res_pgsql9 (ocf::heartbeat:Dummy): Started srv02
> Clone Set: clone_pingd
>      Started: [ srv01 srv02 ]
>
> Migration summary:
> * Node srv02:
> * Node srv01:
>
>
> 4)srv01での遮断を解除後(srv01へのフェイルバックはしていない)
>
> [root [at] srv0 ~]# crm_mon -1 -f
> ============
> Last updated: Wed Aug 17 19:25:27 2011
> Stack: Heartbeat
> Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
> Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
> 2 Nodes configured, unknown expected votes
> 4 Resources configured.
> ============
>
> Online: [ srv01 srv02 ]
>
> Resource Group: grp_mysql4
>      res_mysql4_vip     (ocf::heartbeat:Dummy): Started srv02
>      res_mysql4 (ocf::heartbeat:Dummy): Started srv02
> Resource Group: grp_mysql5
>      res_mysql5_vip     (ocf::heartbeat:Dummy): Started srv02
>      res_mysql5 (ocf::heartbeat:Dummy): Started srv02
> Resource Group: grp_pgsql9
>      res_pgsql9_vip     (ocf::heartbeat:Dummy): Started srv02
>      res_pgsql9 (ocf::heartbeat:Dummy): Started srv02
> Clone Set: clone_pingd
>      Started: [ srv01 srv02 ]
>
> Migration summary:
> * Node srv02:
> * Node srv01:
>
> どうも、遮断解除後にsrv01へのフェイルバックはしないようです。
>
> pingdのhostlistをRA内に設定しているとのことですが、どのような設定をされているのでしょうか?
>
> 以上、宜しく御願いいたします。
>
>
>
> --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
>
> > 関谷さん
> >
> > こんにちは、山内です。
> >
> > 設定に関して2点ほど。。。。
> >
> > ①pingdですが、pingdの疎通が3つのgrp_mysqlリソース起動の条件になっていると思いますので、orderを組んだ方が起動を確実に出来ます。
> >
> >  例:order rsc_order-1 0: clnPingd          grpPostgreSQLDB
> >
> > ②pingdのdampen値ですが、attrdの処理の都合上、3sあたりに設定して頂いた方がおかしな現象に遭遇する可能性が下がります。
> >
> > 以上、宜しくお願いいたします。
> >
> >
> > --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
> >
> > > 関谷さん
> > >
> > > こんにちは、山内です。
> > >
> > > 入っていましたか。。。。
> > >
> > > 初期のgrp_mysql4,grp_mysql5,grp_mysql9について、
> > > 1号機、2号機のスコアを記載したらどうなりますでしょうか?
> > >
> > > 以下は、例です。
> > >
> > > location rsc_location-1 prmIpPostgreSQLDB \
> > >         rule  200: #uname eq srv01 \
> > >         rule  100: #uname eq srv02 \
> > >         rule -inf: not_defined default_ping_set or default_ping_set lt 100
> > >
> > > もしそれでもおかしいようであれば、hb_reportで情報を収集して投稿して
> > > 頂いた方がよさそうです。
> > >
> > > 以上、よろしく御願いいたします。
> > >
> > >
> > > --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
> > >
> > > > 山内さん
> > > >
> > > > ご教授ありがとうございます。
> > > >
> > > > > ### Resource Defaults ###
> > > > > rsc_defaults \
> > > > >         resource-stickiness="INFINITY"
> > > > ただ、この設定は入っていました。
> > > > もう少し設定をいじってみようと思います。
> > > >
> > > > 以下、全体の設定になります。
> > > > <crmコンフィグ>
> > > > node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
> > > >         attributes standby="off"
> > > > node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
> > > >         attributes standby="off"
> > > > primitive res_mysql4 ocf:heartbeat:mysql4 \
> > > >         op monitor interval="10s"
> > > > primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
> > > >         params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
> > > >         op monitor interval="10s"
> > > > primitive res_mysql5 ocf:heartbeat:mysql5 \
> > > >         op monitor interval="10s"
> > > > primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
> > > >         params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
> > > >         op monitor interval="10s"
> > > > primitive res_pgsql9 ocf:heartbeat:pgsql9 \
> > > >         op monitor interval="10s"
> > > > primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
> > > >         params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
> > > >         op monitor interval="10s"
> > > > primitive res_pingd ocf:heartbeat:pingd \
> > > >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> > > >         op monitor on-fail="block" interval="10s"
> > > > group grp_mysql4 res_mysql4_vip res_mysql4 \
> > > >         meta target-role="Started"
> > > > group grp_mysql5 res_mysql5_vip res_mysql5
> > > > group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
> > > >         meta target-role="Started"
> > > > clone clone_pingd res_pingd
> > > > location grp_mysql4_location grp_mysql4 \
> > > >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > location grp_mysql5_location grp_mysql5 \
> > > >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > location grp_pgsql9_location grp_pgsql9 \
> > > >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > property $id="cib-bootstrap-options" \
> > > >         dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3" \
> > > >         cluster-infrastructure="Heartbeat" \
> > > >         last-lrm-refresh="1312538205" \
> > > >         no-quorum-policy="ignore" \
> > > >         stonith-enabled="false"
> > > > rsc_defaults $id="rsc-options" \
> > > >         resource-stickiness="INFINITY" \
> > > >         migration-threshold="3"
> > > >
> > > > <db01 ha.cf>
> > > > pacemaker on
> > > > node db01
> > > > node db02
> > > > ucast eth0 172.0.0.2
> > > > udpport 694
> > > >
> > > > keepalive 5
> > > > warntime 10
> > > > deadtime 15
> > > > initdead 15
> > > >
> > > > logfile /var/log/heartbeat/ha.log
> > > > debug 0
> > > > logfacility none
> > > >
> > > > watchdog /dev/watchdog
> > > > respawn root /usr/lib64/heartbeat/ifcheckd
> > > >
> > > > <db02 ha.cf>
> > > > pacemaker on
> > > > node db01
> > > > node db02
> > > > ucast eth0 172.0.0.1
> > > > udpport 694
> > > >
> > > > keepalive 5
> > > > warntime 10
> > > > deadtime 15
> > > > initdead 15
> > > >
> > > > logfile /var/log/heartbeat/ha.log
> > > > debug 0
> > > > logfacility none
> > > >
> > > > watchdog /dev/watchdog
> > > > respawn root /usr/lib64/heartbeat/ifcheckd
> > > >
> > > >
> > > >
> > > > --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
> > > >
> > > > > 関谷さん
> > > > >
> > > > > こんにちは、山内です。
> > > > >
> > > > > 全体設定を見ていないのですが、リソースの配置完了後のスコアに問題がある為、
> > > > > リソースが1号機の回復後にスコアに従って、フェールバックしているのだと思います。
> > > > >
> > > > > crm設定に、
> > > > >
> > > > > ### Resource Defaults ###
> > > > > rsc_defaults \
> > > > >         resource-stickiness="INFINITY"
> > > > >
> > > > > を加えてください。
> > > > >
> > > > > この設定で、他の設定が影響していなければ、リソースが起動した方のスコアは最大に
> > > > > なるので、1号機を回復しても2号機のスコアが上になります。
> > > > >
> > > > > ただし、他の設定が影響しているかも知れませんので、うまくいかないかも知れません。
> > > > >
> > > > > 以上、よろしく御願いいたします。
> > > > >
> > > > > --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
> > > > >
> > > > > > 関谷です。
> > > > > >
> > > > > > heartbeatのバージョンを3.0.5にアップしたら
> > > > > > バグっぽい動作は改善され問題は解決しました。
> > > > > > 有益な情報ありがとうございました。とても助かりました。
> > > > > >
> > > > > > ただ、一点挙動として気になることがあります。
> > > > > >
> > > > > > ①1号機のインターフェースダウン
> > > > > > ②1号機のdefault_ping_setの値が0になりリソースが2号機へフェールオーバ
> > > > > > ※ここまではOK
> > > > > > ③1号機のインターフェースアップ
> > > > > > ④1号機のdefault_ping_setの値が100に戻り、リソースが1号機へフェールバック
> > > > > >
> > > > > > 1号機のインターフェースがアップし、ping疎通が復活したとしても
> > > > > > 自動でフェールバックさせたくないのですが、これは仕様でしょうか?
> > > > > > default_ping_setの値が100に戻って欲しくないのですが。。。
> > > > > >
> > > > > > 以下設定の一部です。
> > > > > > primitive res_pingd ocf:db_cluster:pingd \
> > > > > >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> > > > > >         op monitor on-fail="block" interval="10s"
> > > > > > clone clone_pingd res_pingd
> > > > > > location grp_mysql4_location grp_mysql4 \
> > > > > >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > > location grp_mysql5_location grp_mysql5 \
> > > > > >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > > location grp_pgsql9_location grp_pgsql9 \
> > > > > >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > >
> > > > > > ※host_listの値はRAのpingdに直接書き込んでいます。
> > > > > >
> > > > > >
> > > > > > --- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:
> > > > > >
> > > > > > >  岩崎です
> > > > > > >
> > > > > > >  On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
> > > > > > >  wrote:
> > > > > > > > 関谷です。
> > > > > > > >
> > > > > > > > heartbeatのバージョンは3.0.4でした。
> > > > > > > > バージョンアップすると直るような気もしてきました・・・。
> > > > > > > > ちょっとやってみようと思います。
> > > > > > > >
> > > > > > > > OSのアーキテクチャはx86_64になります。
> > > > > > > >
> > > > > > >
> > > > > > >  了解ですー。もし症状が改善されるようでしたら情報MLに投げてくれるとうれしいです。
> > > > > > >
> > > > > > > --
> > > > > > >  ----------------------------------------------------------------------
> > > > > > >  岩崎  登               (株)サードウェア
> > > > > > >
> > > > > > >  Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> > > > > > >  iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> > > > > > >  Phone: 047-496-3341      Fax: 047-496-3370
> > > > > > >
> > > > > > > _______________________________________________
> > > > > > > Linux-ha-japan mailing list
> > > > > > > Linux-ha-japan [at] lists
> > > > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > > > >
> > > > > >
> > > > > > _______________________________________________
> > > > > > Linux-ha-japan mailing list
> > > > > > Linux-ha-japan [at] lists
> > > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > > >
> > > > >
> > > > > _______________________________________________
> > > > > Linux-ha-japan mailing list
> > > > > Linux-ha-japan [at] lists
> > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > >
> > > >
> > > > _______________________________________________
> > > > Linux-ha-japan mailing list
> > > > Linux-ha-japan [at] lists
> > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > >
> > >
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux-ha-japan [at] lists
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > >
> >
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


renayama19661014 at ybb

Aug 16, 2011, 7:57 PM

Post #12 of 12 (631 views)
Permalink
Re: インターフェースダウンの障害時について [In reply to]

関谷さん

こんにちは、山内です。

pacemaker/pingdに何か問題があるのかも知れませんね。
(最近は、pacemaker/pingdの方が使われているような気もしますが)

また時間を見て問題の確認が出来たら投稿してみます。

以上、ご連絡ありがとうございました。

--- On Wed, 2011/8/17, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:

> 関谷です。
>
> 検証までしていただいてありがとうございます。
>
> 今までpingdは以下のものを改修してつかっていました
> /usr/lib/ocf/resource.d/pacemaker/pingd
>
> 山内さんの設定を見て気づいたのですが
> /usr/lib/ocf/resource.d/heartbeat/pingd
> こっちのpingdを使うようにしたらうまく動くようになりました。
>
> 諸々解決しました、
> どうもありがとうございました。
>
>
> --- On Wed, 2011/8/17, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
>
> > 関谷さん
> >
> > こんにちは、山内です。
> >
> > 気になる現象でしたので、念の為、手元の環境(RHEL5.6 [at] Esxの2台)で確認してみました。
> > (ha.cfの通信はbcast通信ですが、ほとんど同じです)
> > (order設定、ホストへのスコア設定をしていないのでリソースはsrv01,srv02のどちらかで起動する形になります)
> >
> > --利用したcrm:Dummyに変更してpingdの疎通先はパラメータでセット--
> > primitive res_mysql4 ocf:heartbeat:Dummy \
> >         op monitor interval="10s"
> > primitive res_mysql4_vip ocf:heartbeat:Dummy \
> >         params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_mysql5 ocf:heartbeat:Dummy \
> >         op monitor interval="10s"
> > primitive res_mysql5_vip ocf:heartbeat:Dummy \
> >         params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_pgsql9 ocf:heartbeat:Dummy \
> >         op monitor interval="10s"
> > primitive res_pgsql9_vip ocf:heartbeat:Dummy \
> >         params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
> >         op monitor interval="10s"
> > primitive res_pingd ocf:heartbeat:pingd \
> >         params name="default_ping_set" host_list="192.168.40.1" multiplier="100" dampen="1" \
> >         op monitor on-fail="block" interval="10s"
> > group grp_mysql4 res_mysql4_vip res_mysql4 \        meta target-role="Started"
> > group grp_mysql5 res_mysql5_vip res_mysql5
> > group grp_pgsql9 res_pgsql9_vip res_pgsql9 \        meta target-role="Started"
> > clone clone_pingd res_pingd
> > location grp_mysql4_location grp_mysql4 \        rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > location grp_mysql5_location grp_mysql5 \        rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > location grp_pgsql9_location grp_pgsql9 \        rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > property $id="cib-bootstrap-options" \        cluster-infrastructure="Heartbeat" \        no-quorum-policy="ignore" \        stonith-enabled="false"
> > rsc_defaults $id="rsc-options" \        resource-stickiness="INFINITY" \        migration-threshold="3"
> >
> >
> >
> > 1)起動後
> > [root [at] srv0 ~]# crm_mon -1 -f
> > ============
> > Last updated: Wed Aug 17 19:22:27 2011
> > Stack: Heartbeat
> > Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
> > Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
> > 2 Nodes configured, unknown expected votes
> > 0 Resources configured.
> > ============
> >
> > Online: [ srv01 srv02 ]
> >
> >
> > Migration summary:
> > * Node srv02:
> > * Node srv01:
> >
> >
> > 2)crm投入後
> > [root [at] srv0 ~]# crm_mon -1 -f
> > ============
> > Last updated: Wed Aug 17 19:23:03 2011
> > Stack: Heartbeat
> > Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
> > Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
> > 2 Nodes configured, unknown expected votes
> > 4 Resources configured.
> > ============
> >
> > Online: [ srv01 srv02 ]
> >
> > Resource Group: grp_mysql4
> >      res_mysql4_vip     (ocf::heartbeat:Dummy): Started srv01
> >      res_mysql4 (ocf::heartbeat:Dummy): Started srv01
> > Resource Group: grp_mysql5
> >      res_mysql5_vip     (ocf::heartbeat:Dummy): Started srv02
> >      res_mysql5 (ocf::heartbeat:Dummy): Started srv02
> > Resource Group: grp_pgsql9
> >      res_pgsql9_vip     (ocf::heartbeat:Dummy): Started srv01
> >      res_pgsql9 (ocf::heartbeat:Dummy): Started srv01
> > Clone Set: clone_pingd
> >      Started: [ srv01 srv02 ]
> >
> > Migration summary:
> > * Node srv02:
> > * Node srv01:
> >
> > 3)srv01でのpingdをiptablesで遮断後
> >
> > [root [at] srv0 ~]# crm_mon -1 -f
> > ============
> > Last updated: Wed Aug 17 19:23:57 2011
> > Stack: Heartbeat
> > Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
> > Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
> > 2 Nodes configured, unknown expected votes
> > 4 Resources configured.
> > ============
> >
> > Online: [ srv01 srv02 ]
> >
> > Resource Group: grp_mysql4
> >      res_mysql4_vip     (ocf::heartbeat:Dummy): Started srv02
> >      res_mysql4 (ocf::heartbeat:Dummy): Started srv02
> > Resource Group: grp_mysql5
> >      res_mysql5_vip     (ocf::heartbeat:Dummy): Started srv02
> >      res_mysql5 (ocf::heartbeat:Dummy): Started srv02
> > Resource Group: grp_pgsql9
> >      res_pgsql9_vip     (ocf::heartbeat:Dummy): Started srv02
> >      res_pgsql9 (ocf::heartbeat:Dummy): Started srv02
> > Clone Set: clone_pingd
> >      Started: [ srv01 srv02 ]
> >
> > Migration summary:
> > * Node srv02:
> > * Node srv01:
> >
> >
> > 4)srv01での遮断を解除後(srv01へのフェイルバックはしていない)
> >
> > [root [at] srv0 ~]# crm_mon -1 -f
> > ============
> > Last updated: Wed Aug 17 19:25:27 2011
> > Stack: Heartbeat
> > Current DC: srv02 (65955f30-20f6-431d-9c75-6454f74995e7) - partition WITHOUT quorum
> > Version: 1.0.9-da7075976b5ff0bee71074385f8fd02f296ec8a3
> > 2 Nodes configured, unknown expected votes
> > 4 Resources configured.
> > ============
> >
> > Online: [ srv01 srv02 ]
> >
> > Resource Group: grp_mysql4
> >      res_mysql4_vip     (ocf::heartbeat:Dummy): Started srv02
> >      res_mysql4 (ocf::heartbeat:Dummy): Started srv02
> > Resource Group: grp_mysql5
> >      res_mysql5_vip     (ocf::heartbeat:Dummy): Started srv02
> >      res_mysql5 (ocf::heartbeat:Dummy): Started srv02
> > Resource Group: grp_pgsql9
> >      res_pgsql9_vip     (ocf::heartbeat:Dummy): Started srv02
> >      res_pgsql9 (ocf::heartbeat:Dummy): Started srv02
> > Clone Set: clone_pingd
> >      Started: [ srv01 srv02 ]
> >
> > Migration summary:
> > * Node srv02:
> > * Node srv01:
> >
> > どうも、遮断解除後にsrv01へのフェイルバックはしないようです。
> >
> > pingdのhostlistをRA内に設定しているとのことですが、どのような設定をされているのでしょうか?
> >
> > 以上、宜しく御願いいたします。
> >
> >
> >
> > --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
> >
> > > 関谷さん
> > >
> > > こんにちは、山内です。
> > >
> > > 設定に関して2点ほど。。。。
> > >
> > > ①pingdですが、pingdの疎通が3つのgrp_mysqlリソース起動の条件になっていると思いますので、orderを組んだ方が起動を確実に出来ます。
> > >
> > >  例:order rsc_order-1 0: clnPingd          grpPostgreSQLDB
> > >
> > > ②pingdのdampen値ですが、attrdの処理の都合上、3sあたりに設定して頂いた方がおかしな現象に遭遇する可能性が下がります。
> > >
> > > 以上、宜しくお願いいたします。
> > >
> > >
> > > --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
> > >
> > > > 関谷さん
> > > >
> > > > こんにちは、山内です。
> > > >
> > > > 入っていましたか。。。。
> > > >
> > > > 初期のgrp_mysql4,grp_mysql5,grp_mysql9について、
> > > > 1号機、2号機のスコアを記載したらどうなりますでしょうか?
> > > >
> > > > 以下は、例です。
> > > >
> > > > location rsc_location-1 prmIpPostgreSQLDB \
> > > >         rule  200: #uname eq srv01 \
> > > >         rule  100: #uname eq srv02 \
> > > >         rule -inf: not_defined default_ping_set or default_ping_set lt 100
> > > >
> > > > もしそれでもおかしいようであれば、hb_reportで情報を収集して投稿して
> > > > 頂いた方がよさそうです。
> > > >
> > > > 以上、よろしく御願いいたします。
> > > >
> > > >
> > > > --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
> > > >
> > > > > 山内さん
> > > > >
> > > > > ご教授ありがとうございます。
> > > > >
> > > > > > ### Resource Defaults ###
> > > > > > rsc_defaults \
> > > > > >         resource-stickiness="INFINITY"
> > > > > ただ、この設定は入っていました。
> > > > > もう少し設定をいじってみようと思います。
> > > > >
> > > > > 以下、全体の設定になります。
> > > > > <crmコンフィグ>
> > > > > node $id="20ed5d8a-8d4e-409d-a718-4aa3995565b5" db02 \
> > > > >         attributes standby="off"
> > > > > node $id="a494a68c-796a-423e-8995-559acdc23502" db01 \
> > > > >         attributes standby="off"
> > > > > primitive res_mysql4 ocf:heartbeat:mysql4 \
> > > > >         op monitor interval="10s"
> > > > > primitive res_mysql4_vip ocf:heartbeat:IPaddr2 \
> > > > >         params ip="172.0.0.3" nic="eth0" cidr_netmask="25" \
> > > > >         op monitor interval="10s"
> > > > > primitive res_mysql5 ocf:heartbeat:mysql5 \
> > > > >         op monitor interval="10s"
> > > > > primitive res_mysql5_vip ocf:heartbeat:IPaddr2 \
> > > > >         params ip="172.0.0.4" nic="eth0" cidr_netmask="25" \
> > > > >         op monitor interval="10s"
> > > > > primitive res_pgsql9 ocf:heartbeat:pgsql9 \
> > > > >         op monitor interval="10s"
> > > > > primitive res_pgsql9_vip ocf:heartbeat:IPaddr2 \
> > > > >         params ip="172.0.0.5" nic="eth0" cidr_netmask="25" \
> > > > >         op monitor interval="10s"
> > > > > primitive res_pingd ocf:heartbeat:pingd \
> > > > >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> > > > >         op monitor on-fail="block" interval="10s"
> > > > > group grp_mysql4 res_mysql4_vip res_mysql4 \
> > > > >         meta target-role="Started"
> > > > > group grp_mysql5 res_mysql5_vip res_mysql5
> > > > > group grp_pgsql9 res_pgsql9_vip res_pgsql9 \
> > > > >         meta target-role="Started"
> > > > > clone clone_pingd res_pingd
> > > > > location grp_mysql4_location grp_mysql4 \
> > > > >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > location grp_mysql5_location grp_mysql5 \
> > > > >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > location grp_pgsql9_location grp_pgsql9 \
> > > > >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > property $id="cib-bootstrap-options" \
> > > > >         dc-version="1.0.10-da7075976b5ff0bee71074385f8fd02f296ec8a3" \
> > > > >         cluster-infrastructure="Heartbeat" \
> > > > >         last-lrm-refresh="1312538205" \
> > > > >         no-quorum-policy="ignore" \
> > > > >         stonith-enabled="false"
> > > > > rsc_defaults $id="rsc-options" \
> > > > >         resource-stickiness="INFINITY" \
> > > > >         migration-threshold="3"
> > > > >
> > > > > <db01 ha.cf>
> > > > > pacemaker on
> > > > > node db01
> > > > > node db02
> > > > > ucast eth0 172.0.0.2
> > > > > udpport 694
> > > > >
> > > > > keepalive 5
> > > > > warntime 10
> > > > > deadtime 15
> > > > > initdead 15
> > > > >
> > > > > logfile /var/log/heartbeat/ha.log
> > > > > debug 0
> > > > > logfacility none
> > > > >
> > > > > watchdog /dev/watchdog
> > > > > respawn root /usr/lib64/heartbeat/ifcheckd
> > > > >
> > > > > <db02 ha.cf>
> > > > > pacemaker on
> > > > > node db01
> > > > > node db02
> > > > > ucast eth0 172.0.0.1
> > > > > udpport 694
> > > > >
> > > > > keepalive 5
> > > > > warntime 10
> > > > > deadtime 15
> > > > > initdead 15
> > > > >
> > > > > logfile /var/log/heartbeat/ha.log
> > > > > debug 0
> > > > > logfacility none
> > > > >
> > > > > watchdog /dev/watchdog
> > > > > respawn root /usr/lib64/heartbeat/ifcheckd
> > > > >
> > > > >
> > > > >
> > > > > --- On Tue, 2011/8/16, renayama19661014 [at] ybb <renayama19661014 [at] ybb> wrote:
> > > > >
> > > > > > 関谷さん
> > > > > >
> > > > > > こんにちは、山内です。
> > > > > >
> > > > > > 全体設定を見ていないのですが、リソースの配置完了後のスコアに問題がある為、
> > > > > > リソースが1号機の回復後にスコアに従って、フェールバックしているのだと思います。
> > > > > >
> > > > > > crm設定に、
> > > > > >
> > > > > > ### Resource Defaults ###
> > > > > > rsc_defaults \
> > > > > >         resource-stickiness="INFINITY"
> > > > > >
> > > > > > を加えてください。
> > > > > >
> > > > > > この設定で、他の設定が影響していなければ、リソースが起動した方のスコアは最大に
> > > > > > なるので、1号機を回復しても2号機のスコアが上になります。
> > > > > >
> > > > > > ただし、他の設定が影響しているかも知れませんので、うまくいかないかも知れません。
> > > > > >
> > > > > > 以上、よろしく御願いいたします。
> > > > > >
> > > > > > --- On Tue, 2011/8/16, sekiya_kyuusaku [at] yahoo <sekiya_kyuusaku [at] yahoo> wrote:
> > > > > >
> > > > > > > 関谷です。
> > > > > > >
> > > > > > > heartbeatのバージョンを3.0.5にアップしたら
> > > > > > > バグっぽい動作は改善され問題は解決しました。
> > > > > > > 有益な情報ありがとうございました。とても助かりました。
> > > > > > >
> > > > > > > ただ、一点挙動として気になることがあります。
> > > > > > >
> > > > > > > ①1号機のインターフェースダウン
> > > > > > > ②1号機のdefault_ping_setの値が0になりリソースが2号機へフェールオーバ
> > > > > > > ※ここまではOK
> > > > > > > ③1号機のインターフェースアップ
> > > > > > > ④1号機のdefault_ping_setの値が100に戻り、リソースが1号機へフェールバック
> > > > > > >
> > > > > > > 1号機のインターフェースがアップし、ping疎通が復活したとしても
> > > > > > > 自動でフェールバックさせたくないのですが、これは仕様でしょうか?
> > > > > > > default_ping_setの値が100に戻って欲しくないのですが。。。
> > > > > > >
> > > > > > > 以下設定の一部です。
> > > > > > > primitive res_pingd ocf:db_cluster:pingd \
> > > > > > >         params name="default_ping_set" host_list="" multiplier="100" dampen="1" \
> > > > > > >         op monitor on-fail="block" interval="10s"
> > > > > > > clone clone_pingd res_pingd
> > > > > > > location grp_mysql4_location grp_mysql4 \
> > > > > > >         rule $id="grp_mysql4-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > > > location grp_mysql5_location grp_mysql5 \
> > > > > > >         rule $id="grp_mysql5-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > > > location grp_pgsql9_location grp_pgsql9 \
> > > > > > >         rule $id="grp_pgsql9-rule" -inf: not_defined default_ping_set or default_ping_set lt 100
> > > > > > >
> > > > > > > ※host_listの値はRAのpingdに直接書き込んでいます。
> > > > > > >
> > > > > > >
> > > > > > > --- On Wed, 2011/8/10, 岩崎@サードウェア <iwasaki [at] 3ware> wrote:
> > > > > > >
> > > > > > > >  岩崎です
> > > > > > > >
> > > > > > > >  On Wed, 10 Aug 2011 14:00:02 +0900 (JST), sekiya_kyuusaku [at] yahoo
> > > > > > > >  wrote:
> > > > > > > > > 関谷です。
> > > > > > > > >
> > > > > > > > > heartbeatのバージョンは3.0.4でした。
> > > > > > > > > バージョンアップすると直るような気もしてきました・・・。
> > > > > > > > > ちょっとやってみようと思います。
> > > > > > > > >
> > > > > > > > > OSのアーキテクチャはx86_64になります。
> > > > > > > > >
> > > > > > > >
> > > > > > > >  了解ですー。もし症状が改善されるようでしたら情報MLに投げてくれるとうれしいです。
> > > > > > > >
> > > > > > > > --
> > > > > > > >  ----------------------------------------------------------------------
> > > > > > > >  岩崎  登               (株)サードウェア
> > > > > > > >
> > > > > > > >  Noboru Iwasaki           274-0815 千葉県船橋市西習志野3-39-8
> > > > > > > >  iwasaki [at] 3ware      URL: http://www.3ware.co.jp/
> > > > > > > >  Phone: 047-496-3341      Fax: 047-496-3370
> > > > > > > >
> > > > > > > > _______________________________________________
> > > > > > > > Linux-ha-japan mailing list
> > > > > > > > Linux-ha-japan [at] lists
> > > > > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > > > > >
> > > > > > >
> > > > > > > _______________________________________________
> > > > > > > Linux-ha-japan mailing list
> > > > > > > Linux-ha-japan [at] lists
> > > > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > > > >
> > > > > >
> > > > > > _______________________________________________
> > > > > > Linux-ha-japan mailing list
> > > > > > Linux-ha-japan [at] lists
> > > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > > >
> > > > >
> > > > > _______________________________________________
> > > > > Linux-ha-japan mailing list
> > > > > Linux-ha-japan [at] lists
> > > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > > >
> > > >
> > > > _______________________________________________
> > > > Linux-ha-japan mailing list
> > > > Linux-ha-japan [at] lists
> > > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > > >
> > >
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux-ha-japan [at] lists
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan

Linux-HA japanese RSS feed   Index | Next | Previous | View Threaded
 
 


Interested in having your list archived? Contact Gossamer Threads
 
  Web Applications & Managed Hosting Powered by Gossamer Threads Inc.