タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

運用と障害対応に関するyouheyのブックマーク (2)

  • 障害対応的ディレクションスキル : LINE Corporation ディレクターブログ

    モバイルメディアの久野です。 今回は障害対応時のディレクションについて書いてみたいと思います。 障害対応時のディレクターって非常に微妙です。自分自身が復旧に努めるわけではなく、手が出せない場合がほとんどだと思います。しかし、そんな状況でどう対応するかが、ディレクターとしての能力をはっきりさせるひとつの指標かとも思っております。 ■障害とは? サービスに支障をきたすもの全てが障害です。 ただのリンク切れの404でも障害ですし、運営側は障害と思わなくても、ユーザーやクライアントや提携先が障害と捉えた時点でそれは障害ということになります。 ■障害対応においてやるべきこと ▼障害発生〜復旧までの経緯を記録しておくこと ・障害はいつまで続くか分かりません。1時間の場合も数週間の場合もあります。 常に、いつどこでだれがなにをどのようにした、ということを意識して記録(記憶)しておくことが大切です。 状況

    障害対応的ディレクションスキル : LINE Corporation ディレクターブログ
  • サーバ障害と向き合うには : LINE Corporation ディレクターブログ

    こんにちは。モバイルサイトディレクターの早岡です。 突然ですが、みなさんは『livedoor Blog』が何台のサーバで構成されていると思いますか? 100台? 200台? いいえ、違います。パソコンとモバイル合わせて1000台を超える大規模のサーバ群で構成されています。これほどの規模だと、アプリケーション側だけでなく、サーバサイドでのトラブルも多々発生します。 今回は「障害対応的ディレクションスキル」というエントリーを受けて、「サーバ障害とどう向き合うか」について書きたいと思います。 ■障害の連絡を受けたとき 私が担当している『livedoor Blog』のサーバは、弊社ネットワーク事業部が管理するデータセンターに置かれています。サーバに障害が発生すると、データセンターの担当者から電話連絡がきます。 ネットワークエンジニアだけで解決できる障害であれば、その場で対応してもらって問題ありませ

    サーバ障害と向き合うには : LINE Corporation ディレクターブログ
  • 1