Login | Register For Free | Help
Search for: (Advanced)

Mailing List Archive: Linux-HA: Japanese

Emergency Shutdown: Attempting to kill everything ourselves $B$N%a%C%;!<%8$K$D$$$F(B

 

 

Linux-HA japanese RSS feed   Index | Next | Previous | View Threaded


_(B<k.mori at qloog

Oct 24, 2011, 7:25 PM

Post #1 of 4 (255 views)
Permalink
Emergency Shutdown: Attempting to kill everything ourselves $B$N%a%C%;!<%8$K$D$$$F(B

$B=i$a$FEj9F$5$;$FD:$-$^$9!"?9$H8@$$$^$9!#(B

CentOS5.7 $B!\(B DRBD + heartbeat-2.1.3-3.el5.centos

$B$r;HMQ$7$F$*$j$^$9$,!"5^$K%O!<%H%S!<%H$N%W%m%;%9$,Dd;_$9$k8=>]$,(B
$BH/@8$7$^$7$?!#(B
$B$G!"%m%0!J(B/var//log/messages$B!K$r3NG'$7$F$$$k$H(B
$B0J2<$N%a%C%;!<%8$,3NG'=PMh$^$7$?!#(B
Oct 25 08:51:53 pbx2304 heartbeat: [18332]: WARN: Shutdown delayed until
current resource activity finishes.
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: CRIT: Emergency Shutdown:
Attempting to kill everything ourselves
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing go_standby
process group 18651 with signal 9
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing
/usr/lib/heartbeat/ast-check.sh process group 18364 with signal 9
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing
/usr/lib/heartbeat/check_network process group 18365 with signal 9
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBWRITE
process 18337 with signal 9
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBREAD process
18338 with signal 9
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBFIFO process
18334 with signal 9
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBWRITE
process 18335 with signal 9
Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBREAD process
18336 with signal 9

$B0l;~4V8e$H$$$&$N$G$bD4$Y$F$_$k$H!"(B
http://sourceforge.jp/projects/linux-ha/lists/archive/japan/2009-April/000181.html

$B$N>pJs$r8+$D$1$^$7$?!#(B
$B$?$@!"Dd;_$9$k$^$G$N0l;~4V$O@5>o$K;HMQ$G$-$F$$$?$h$&$G$9!#(B

1$B;~4V8e$KDd;_$9$k$3$N5!G=$rDd;_$9$k$3$H$O2DG=$G$7$g$&$+!#(B
ha.cf$B$N$I$3$+$K5-:\$9$l$P2DG=$G$7$g$&$+!)(B

$B$b$7$/$O!"(BV2,V3$B$J$I$r;H$($P$3$A$i$NH/@8$rM^$($k$3$H$,2DG=$G$7$g$&$+!#(B

$B0J>e$G$9!"$h$m$7$/$*4j$$CW$7$^$9!#(B



--
----------------------------------
$B"#"#"#(B $B3t<02q<R%/%k!<%0(B
$B"#"#"#(B $B!!(B
$B"#"#(B $B""(B $B?9!!7=N<(B
----------------------------------
email: k.mori [at] qloog
url: http://qloog.com
tel: 078-327-8001 / fax: 078-327-8002
add: $B")(B650-0022 $BJ<8K8)?@8M;TCf1{6h85D.DL(B3-9-7
$B!!(B $B2.86%S%k(B2F

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


renayama19661014 at ybb

Oct 24, 2011, 8:51 PM

Post #2 of 4 (237 views)
Permalink
Re: Emergency Shutdown: Attempting to kill everything ourselves のメッセージについて [In reply to]

森さん

こんにちは、山内です。

2.1.4やHeartbeat3.0系(Pacemakerと組み合わせる場合)のソースコードを見る限りでは、
発生しているEmergency停止は、v2モードを採用することで回避できると思います。
(v2モードに入った時点で、管理用のフラグがFALSEに設定されているので、回避できると思います)

念の為、VM環境などで試されることをお勧めします。

以上、宜しく御願いいたします。

--- On Tue, 2011/10/25, QLOOG 森 圭亮 <k.mori [at] qloog> wrote:

> 初めて投稿させて頂きます、森と言います。
>
> CentOS5.7 + DRBD + heartbeat-2.1.3-3.el5.centos
>
> を使用しておりますが、急にハートビートのプロセスが停止する現象が
> 発生しました。
> で、ログ(/var//log/messages)を確認していると
> 以下のメッセージが確認出来ました。
> Oct 25 08:51:53 pbx2304 heartbeat: [18332]: WARN: Shutdown delayed until
> current resource activity finishes.
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: CRIT: Emergency Shutdown:
> Attempting to kill everything ourselves
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing go_standby
> process group 18651 with signal 9
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing
> /usr/lib/heartbeat/ast-check.sh process group 18364 with signal 9
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing
> /usr/lib/heartbeat/check_network process group 18365 with signal 9
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBWRITE
> process 18337 with signal 9
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBREAD process
> 18338 with signal 9
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBFIFO process
> 18334 with signal 9
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBWRITE
> process 18335 with signal 9
> Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBREAD process
> 18336 with signal 9
>
> 一時間後というのでも調べてみると、
> http://sourceforge.jp/projects/linux-ha/lists/archive/japan/2009-April/000181.html
>
> の情報を見つけました。
> ただ、停止するまでの一時間は正常に使用できていたようです。
>
> 1時間後に停止するこの機能を停止することは可能でしょうか。
> ha.cfのどこかに記載すれば可能でしょうか?
>
> もしくは、V2,V3などを使えばこちらの発生を抑えることが可能でしょうか。
>
> 以上です、よろしくお願い致します。
>
>
>
> --
> ----------------------------------
> ■■■   株式会社クルーグ
> ■■■  
> ■■ □  森 圭亮
> ----------------------------------
> email: k.mori [at] qloog
> url: http://qloog.com
> tel: 078-327-8001 / fax: 078-327-8002
> add: 〒650-0022 兵庫県神戸市中央区元町通3-9-7
>     荻原ビル2F
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


_(B<k.mori at qloog

Oct 25, 2011, 12:30 AM

Post #3 of 4 (232 views)
Permalink
Re: Emergency Shutdown: Attempting to kill everything ourselves $B$N%a%C%;!<%8$K$D$$$F(B [In reply to]

$B;3Fb$5$s(B

$B$"$j$,$H$&8f:B$$$^$9!#(B

V1$B$+$i(BV2$B%b!<%I$X$N0\9T$O!"(B
crm on

$B$rDI2C$9$k;v$G2DG=$G$7$g$&$+!#(B
$B$?$@!"$3$l$r9T$&$H(Bheartbeat$B$O(Bxml$B$r;HMQ$9$k$h$&$K$J$k$H(B
$B9M$($F$*$j:#$^$G$N [at] _D$+$iJQ99$9$kI,MW$,$"$k$HM=A[$7$F$$$^$9!#(B

$B$3$A$i$O;d$N4*0c$$$G$7$g$&$+!)(B
$B$b$74V0c$C$F$$$?$i$4;XE&2<$5$$!#(B

V1$B$@$1$NLdBj$H8@$&$3$H$G$7$g$&$+!)(B




> $B?9$5$s(B
>
> $B$3$s$K$A$O!";3Fb$G$9!#(B
>
> 2.1.4$B$d(BHeartbeat3.0$B7O(B(Pacemaker$B$HAH$_9g$o$;$k>l9g!K$N%=!<%9%3!<%I$r8+(B
$B$k8B$j$G$O!"(B
> $BH/@8$7$F$$$k(BEmergency$BDd;_$O!"(Bv2$B%b!<%I$r:NMQ$9$k$3$H$G2sHr$G$-$k$H;W$$(B
$B$^$9!#(B
> (v2$B%b!<%I$KF~$C$?;~E@$G!"4IM}MQ$N%U%i%0$,(BFALSE$B$K [at] _D$5$l$F$$$k$N$G!"2s(B
$BHr$G$-$k$H;W$$$^$9!K(B
>
> $BG0$N0Y!"(BVM$B4D6-$J$I$G;n$5$l$k$3$H$r$*4+$a$7$^$9!#(B
>
> $B0J>e!"59$7$/8f4j$$$$$?$7$^$9!#(B
>
> > --- On Tue, 2011/10/25, QLOOG $B?9(B $B7=N<(B <k.mori $B!w(B qloog.com> wrote:
> >
> > $B=i$a$FEj9F$5$;$FD:$-$^$9!"?9$H8@$$$^$9!#(B
> >
> > CentOS5.7 $B!\(B DRBD + heartbeat-2.1.3-3.el5.centos
> >
> > $B$r;HMQ$7$F$*$j$^$9$,!"5^$K%O!<%H%S!<%H$N%W%m%;%9$,Dd;_$9$k8=>]$,(B
> > $BH/@8$7$^$7$?!#(B
> > $B$G!"%m%0!J(B/var//log/messages$B!K$r3NG'$7$F$$$k$H(B
> > $B0J2<$N%a%C%;!<%8$,3NG'=PMh$^$7$?!#(B
> > Oct 25 08:51:53 pbx2304 heartbeat: [18332]: WARN: Shutdown delayed >
until
> > current resource activity finishes.
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: CRIT: Emergency Shutdown:
> > Attempting to kill everything ourselves
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing go_standby
> > process group 18651 with signal 9
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing
> > /usr/lib/heartbeat/ast-check.sh process group 18364 with signal 9
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing
> > /usr/lib/heartbeat/check_network process group 18365 with signal 9
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBWRITE
> > process 18337 with signal 9
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBREAD >
>process
> > 18338 with signal 9
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBFIFO process
> > 18334 with signal 9
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBWRITE
> > process 18335 with signal 9
> > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBREAD process
> > 18336 with signal 9
> >
> > $B0l;~4V8e$H$$$&$N$G$bD4$Y$F$_$k$H!"(B
> >
http://sourceforge.jp/projects/linux-ha/lists/archive/japan/2009-April/000181.html
> >
> > $B$N>pJs$r8+$D$1$^$7$?!#(B
> > $B$?$@!"Dd;_$9$k$^$G$N0l;~4V$O@5>o$K;HMQ$G$-$F$$$?$h$&$G$9!#(B
> >
> > 1$B;~4V8e$KDd;_$9$k$3$N5!G=$rDd;_$9$k$3$H$O2DG=$G$7$g$&$+!#(B
> > ha.cf$B$N$I$3$+$K5-:\$9$l$P2DG=$G$7$g$&$+!)(B
> >
> > $B$b$7$/$O!"(BV2,V3$B$J$I$r;H$($P$3$A$i$NH/@8$rM^$($k$3$H$,2DG=$G$7$g$&$+!#(B
> >
> > $B0J>e$G$9!"$h$m$7$/$*4j$$CW$7$^$9!#(B
> >
> >
> >
> > --
> > ----------------------------------
> > $B"#"#"#(B $B3t<02q<R%/%k!<%0(B
> > $B"#"#"#(B $B!!(B
> > $B"#"#(B $B""(B $B?9!!7=N<(B
> > ----------------------------------
> > email: k.mori $B!w(B qloog.com
> > url: http://qloog.com
> > tel: 078-327-8001 / fax: 078-327-8002
> > add: $B")(B650-0022 $BJ<8K8)?@8M;TCf1{6h85D.DL(B3-9-7
> > $B!!(B $B2.86%S%k(B2F
> >
> > _______________________________________________
> > Linux-ha-japan mailing list
> > Linux-ha-japan $B!w(B lists.sourceforge.jp
> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> >



--
----------------------------------
$B"#"#"#(B $B3t<02q<R%/%k!<%0(B
$B"#"#"#(B $B!!(B
$B"#"#(B $B""(B $B?9!!7=N<(B
----------------------------------
email: k.mori [at] qloog
url: http://qloog.com
tel: 078-327-8001 / fax: 078-327-8002
add: $B")(B650-0022 $BJ<8K8)?@8M;TCf1{6h85D.DL(B3-9-7
$B!!(B $B2.86%S%k(B2F

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan


renayama19661014 at ybb

Oct 25, 2011, 12:53 AM

Post #4 of 4 (246 views)
Permalink
Re: Emergency Shutdown: Attempting to kill everything ourselves のメッセージについて [In reply to]

森さん

こんにちは、山内です。

v2モードへの移行は、ha.cf内では森さんのおっしゃる通り、crm onで可能です。
#v2モードでは、Heartbeatのserrial通信はサポートされていませんので、nic通信のみになります。

また、設定に関しては、haresourceからcib.xmlへ変更する必要があり、記述もかなり大変です。

また、お使いのHeartbeatのバージョンですが、2.1.3とのことですが、色々とバグもありますので、少なくとも2.1.4あたりまでアップされることをお勧めします。

cib.xmlへ変更するのを期に、Heartbeat+Pacemakerの組み合わせをお勧めしたい所ですが。。。

#haresourceをcib.xmlへ移行できれば、Heartbeat+Pacemakerへの移行もそんなに難しくはありません。

2.1.3及び2.1.4には、v2への移行ツールとして、tools/haresources2cib.pyが付いていますので、試してみる手もあります。
#どこまで変換できるかも微妙ですが。。。。
#もしかすると、手でcib.xmlは修正する必要があるかも知れません。

余談ですが、Heartbeat+Pacemakerでは、crmという設定ツールもあります。
こちらはかなりcib.xmlを作成するよりは楽になっています。

山内



--- On Tue, 2011/10/25, QLOOG 森 圭亮 <k.mori [at] qloog> wrote:

> 山内さん
>
> ありがとう御座います。
>
> V1からV2モードへの移行は、
> crm on
>
> を追加する事で可能でしょうか。
> ただ、これを行うとheartbeatはxmlを使用するようになると
> 考えており今までの設定から変更する必要があると予想しています。
>
> こちらは私の勘違いでしょうか?
> もし間違っていたらご指摘下さい。
>
> V1だけの問題と言うことでしょうか?
>
>
>
>
> > 森さん
> >
> > こんにちは、山内です。
> >
> > 2.1.4やHeartbeat3.0系(Pacemakerと組み合わせる場合)のソースコードを見
> る限りでは、
> > 発生しているEmergency停止は、v2モードを採用することで回避できると思い
> ます。
> > (v2モードに入った時点で、管理用のフラグがFALSEに設定されているので、回
> 避できると思います)
> >
> > 念の為、VM環境などで試されることをお勧めします。
> >
> > 以上、宜しく御願いいたします。
> >
> > > --- On Tue, 2011/10/25, QLOOG 森 圭亮 <k.mori @ qloog.com> wrote:
> > >
> > > 初めて投稿させて頂きます、森と言います。
> > >
> > > CentOS5.7 + DRBD + heartbeat-2.1.3-3.el5.centos
> > >
> > > を使用しておりますが、急にハートビートのプロセスが停止する現象が
> > > 発生しました。
> > > で、ログ(/var//log/messages)を確認していると
> > > 以下のメッセージが確認出来ました。
> > > Oct 25 08:51:53 pbx2304 heartbeat: [18332]: WARN: Shutdown delayed >
> until
> > > current resource activity finishes.
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: CRIT: Emergency Shutdown:
> > > Attempting to kill everything ourselves
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing go_standby
> > > process group 18651 with signal 9
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing
> > > /usr/lib/heartbeat/ast-check.sh process group 18364 with signal 9
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing
> > > /usr/lib/heartbeat/check_network process group 18365 with signal 9
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBWRITE
> > > process 18337 with signal 9
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBREAD >
> >process
> > > 18338 with signal 9
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBFIFO process
> > > 18334 with signal 9
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBWRITE
> > > process 18335 with signal 9
> > > Oct 25 09:51:54 pbx2304 heartbeat: [18332]: info: killing HBREAD process
> > > 18336 with signal 9
> > >
> > > 一時間後というのでも調べてみると、
> > >
> http://sourceforge.jp/projects/linux-ha/lists/archive/japan/2009-April/000181.html
> > >
> > > の情報を見つけました。
> > > ただ、停止するまでの一時間は正常に使用できていたようです。
> > >
> > > 1時間後に停止するこの機能を停止することは可能でしょうか。
> > > ha.cfのどこかに記載すれば可能でしょうか?
> > >
> > > もしくは、V2,V3などを使えばこちらの発生を抑えることが可能でしょうか。
> > >
> > > 以上です、よろしくお願い致します。
> > >
> > >
> > >
> > > --
> > > ----------------------------------
> > > ■■■   株式会社クルーグ
> > > ■■■  
> > > ■■ □  森 圭亮
> > > ----------------------------------
> > > email: k.mori @ qloog.com
> > > url: http://qloog.com
> > > tel: 078-327-8001 / fax: 078-327-8002
> > > add: 〒650-0022 兵庫県神戸市中央区元町通3-9-7
> > >     荻原ビル2F
> > >
> > > _______________________________________________
> > > Linux-ha-japan mailing list
> > > Linux-ha-japan @ lists.sourceforge.jp
> > > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> > >
>
>
>
> --
> ----------------------------------
> ■■■   株式会社クルーグ
> ■■■  
> ■■ □  森 圭亮
> ----------------------------------
> email: k.mori [at] qloog
> url: http://qloog.com
> tel: 078-327-8001 / fax: 078-327-8002
> add: 〒650-0022 兵庫県神戸市中央区元町通3-9-7
>     荻原ビル2F
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux-ha-japan [at] lists
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>

_______________________________________________
Linux-ha-japan mailing list
Linux-ha-japan [at] lists
http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan

Linux-HA japanese RSS feed   Index | Next | Previous | View Threaded
 
 


Interested in having your list archived? Contact Gossamer Threads
 
  Web Applications & Managed Hosting Powered by Gossamer Threads Inc.