SHAMAN KING ふんばりクロニクル ディレクター臼井です。
お客様におかれましては断続的なメンテナンスが続いており大変ご迷惑をおかけいたしま
して誠に申し訳ございません。
昨日より発生しておりますサーバーの状況について現状のご報告をさせて頂きます。
◆発生事象
ゲームサーバーが一定時間ごとに繋がらない状態が発生する
◆発生要因
多数用意されたサーバーの利用メモリ増加により発生する、サーバーの自動ライフサイク
ル反映影響
多くのアクセスを想定し用意したサーバーの「数」については問題がない状態です。
しかしながらこれらのサーバーは立ち上がって概ね 4 時間ほどで利用メモリがピークを迎
えています。
本来はメモリが適切に管理され消費メモリが安定するのが最も望ましいですが、
昨今は「Kubernetes」と呼ばれる、不安定なサーバー(Pod)を自動で切り離し、新しいサー
バーを自動で用意しながら健全なサービス状態を維持できるコンテナ管理システムがあり
ます。
今回のふんばりクロニクルでは上記のサービスを用いておりますが、現状このシステムに
よって、不安定になりはじめたサーバーの切り離し・新しく用意されたサーバーの追加時に
ゲームサービスに影響が出ることが現状調査より判明しています。
◆対策中の作業
現在 Kubernetes 内の Pod の in/out について準備状態のシステム確認が適切に行われてい
ない兆候があり、追加された Pod の確認(Liveness Status Probe)を準備中です。
おおむね 4 時間ほどで発生している Pod の入れ替えは 18 時頃が予測されており、次にこ
れらを迎えるタイミングでのメンテナンスを実施させて頂き、上記対応を管理サーバーへ
適応いたします。
◆総括
サーバーの数の点では問題がなくこれらの健全性の維持が課題となります。
上記の対策が想定どおりになれば、サーバーが不安定になる兆候を前に in/out が発生し、
準備完了を待ってサービスへ導入される為、サービスの健全性が担保されると現時点で判
断しています。
少しずつではありますがメンテナンスごとに事前想定と異なる点の把握と課題解消は進ん
でおります。多くのユーザー様に快適に遊んで頂けますよう、引き続き行える対応を最速で進めて参り
ます。