アーカイブ

‘oomkiller’ タグのついている投稿

自宅サーバが不安定で(ちょっと備忘録的に・・・)

2011 年 5 月 8 日 Comments off

最近といっても数日前にサーバを移行したのですがスペックがあがっても謎のサーバダウンしてしまい、原因がわからないです。

これが見れているということは、今のところサーバダウンしてないです。
けれど1日のうちに何度かダウンしているときがあるのでもし「サーバが応答しません」と表示されていれば多分落ちているときでしょう。

また、訪問してください(^^;

早急に対処して連続運用できるようにしていきますので今後もごひいきにお願いします(^^)

******************************
昨日からログの解析をしていますがよくわからんです。
とりあえずシステムログを確認

/var/log/messages

May 7 23:42:33 nsbaseball kernel: 17792 pages shared
May 7 23:42:41 nsbaseball kernel: 0 pages writeback
May 7 23:43:28 nsbaseball kernel: [c045d0e7] out_of_memory+0x72/0x1a3
May 7 23:44:35 nsbaseball kernel: [c045e64e] __alloc_pages+0x24e/0x2cf
May 7 23:44:38 nsbaseball kernel: [c045f967] __do_page_cache_readahead+0xc4/0x183
May 7 23:44:47 nsbaseball kernel: [c045c66e] filemap_nopage+0x157/0x349
May 7 23:44:47 nsbaseball kernel: [c0465b36] __handle_mm_fault+0x177/0xaac
May 7 23:45:02 nsbaseball kernel: [c044ff1c] __do_IRQ+0x0/0xd6
May 7 23:47:27 nsbaseball kernel: [c04074f2] do_IRQ+0xb5/0xc3
May 7 23:47:27 nsbaseball kernel: [c06220b0] do_page_fault+0x23a/0x52d
May 7 23:55:17 nsbaseball kernel: [c0621e76] do_page_fault+0x0/0x52d
May 7 23:55:28 nsbaseball kernel: [c0405abd] error_code+0x39/0x40
May 7 23:55:32 nsbaseball kernel: =======================
May 7 23:55:33 nsbaseball kernel: Mem-info:
May 7 23:57:01 nsbaseball kernel: Normal per-cpu:
May 8 00:01:59 nsbaseball kernel: HighMem per-cpu: empty
May 8 00:02:34 nsbaseball kernel: lowmem_reserve[]: 0 0 239 239
May 8 00:07:22 nsbaseball kernel: lowmem_reserve0] do_page_fault+0x23a/0x52d
May 8 00:07:22 nsbaseball kernel: [c0621e76] do_page_fault+0x0/0x52d
May 8 00:07:22 nsbaseball kernel: [c0405abd] error_code+0x39/0x40
May 8 00:07:22 nsbaseball kernel:=======================
・・・・・・・・
・・・・・・・・

見る限りでは、メモリが無くなってそのあとoom killer が発動し次々とプロセスを殺してるようです。(このログの後、OOM Killerの表示あり)
(ちなみにoom killerとは、OOM Killer(Out of Memory Killer)は,システムが実メモリーと仮想メモリー空間(スワップ領域)を使い切り,必要なメモリー領域を新たに確保できない場合に,プロセスを強制終了させて空きメモリーを確保する,Linuxカーネルの仕組みだそうです)
ネットで検索するとMYSQLとapacheのユーザ数やプロセス数を制限して安定したとかの記事を確認しましたが、このサイト自体そんな高負荷になるほどアクセスは多くないので別の問題かなと思います。
一応/etc/sysctl.confやらapacheのconfを確認してチューニングまでいかないけど少し変更しましたが変化なしです。
ほかの理由かな?
実際旧サーバ(Fedora7)では、たまに落ちるけどほぼ安定して運用できていたので原因がわかりません。
マシンスペックも現在のほうがやや良いのに?
(K6Ⅲ350Mhzメモリ256Mbyte→セレロン400Mhzメモリ256Mbyte)
ひとつ気になったのがメモリの障害
fedora7で使用していたメモリを流用したのですがもしかしてこのメモリの一部が壊れたかもしくは、今のマザボと相性が悪いのかもということ。
明日にでもmemtest86でメモリチェックしようかと思います。
あとは、CentOSとPHPとMySQLとApacheのバージョンが合わないのかな?

後の手段としてSwap領域を拡張ですね

(現在512Mbyte→2G位にすればどうなる?)

後日原因がわかれば報告したいと思います。

全然最近のシュリンプネタじゃないけど・・・・・(^^;