本連載は、企業の成長に不可欠な「データ活用」を推進していくために必要なデータ基盤の基礎を“あらためて”解説していきます。今回は、Oracle Databaseのクラスタリング機能である「Oracle Real Application Clusters(Oracle RAC)」の基礎と仕組みを解説します。【更新版】
「障害が発生しても止まらないシステムを実現したい」「災害に備えたリアルタイムの遠隔バックアップやシステムの二重化を行いたい」「大容量データをバックアップしたい」---震災以来、これらはシステムにとっての大きな課題となっている。 これらを実現するHA(高可用性)システムは、無償で利用できるオープンソースソフトウエア(OSS)で実現できる。そのためのOSS群が「Linux-HAクラスタスタック」である。 Linux-HAクラスタスタックは、仮想化環境やクラウド環境で使うこともできる。今回を含めて5回にわたって、Linux-HAクラスタスタックおよびこれを構成するソフトウエアの概要を紹介する。 HAクラスタの仕組み サーバーハードウエアの故障やメンテナンス、ソフトウエアの動作障害については、2台のサーバーを用意して、Linux-HAクラスタスタックのHeartbeatとPacemakerなどのク
オープンソース・ソフトウェア「Hadoop」のMapReduceジョブは、標準ではJavaで記述します(その他には、Pig、Hive、JAQLといったものがあります)。しかし、意外と初心者には分かりにくいと筆者は感じます。本記事では、MapReduceジョブのサンプルコードを使って、できる限り正しくコードの意味を理解し、MapReduceへの入り口を示したいと思います。 HadoopでMapReduceを記述するときに使うAPIが、0.19から0.20に変わるところで新しくなっています。実は、現時点でHadoopプロジェクト本体からでさえも、新APIを使ったサンプルが提示されていません。本記事では、新しいAPIで筆者が書き直したサンプルを使って解説しますので、このサンプルは0.19以前のHadoopでは動かないことに注意してください。この記事は、0.20.2を使って検証し、解説しています。
今回は、4台のサーバーからなるHadoopクラスタの構築手順を紹介します。10台程度までは、そのまま計算ノードを増やすことができますので、本格活用に向けた実験を始めるのに最適な構成です。 「Hadoopは安価なコモディティ・サーバーを使用する」と説明されることがありますが、これは、あくまで標準的なx86サーバーを使用するという意味です。大量のデータを高速に処理するには、それなりのスペックが必要で、Hadoopのデフォルト設定では、8コアのCPUと8GBのメモリーを搭載したサーバーが想定されています。 Hadoopの導入手順 ここでは、図1の4台のサーバーを使用します。ホストネームは、管理ノードがhdpmgmt01、計算ノードがhdpnode01~03です。それぞれ、4コアのCPUと4GBのメモリーを搭載したサーバーとします。異なるスペックのサーバーの場合は、後述の設定パラメータを変更してく
VMware ESX Serverでは複数のゲストOSを稼働できる。そのため,ハードウエアに障害が発生し,VMware ESX Serverがダウンした場合,ビジネスに対する影響が非常に大きい。VMware ESX ServerやゲストOSの可用性,信頼性を高める必要がある。 そのためには,高可用性,高信頼性をもつサーバー・マシンを選択することも考えられるが,ソフトウエア機能によって可用性を向上させることも可能である。例えば仮想マシンのクラスタリング,VMotion,VMware HA,VMware DRSといったVMware機能によるソリューションである。ここでは,このような仮想サーバー環境の高可用性を実現する機能について,概要と構成上の注意点について説明する。 仮想マシンのクラスタリング構成 VMware ESX Server上で稼働する仮想マシン同士で,クラスタリングを構成することが
仮想化ソフトウエアによって,1台の物理的なコンピュータ上で複数のOSを稼働できるようになった。仮想化は,データ・センターのような大規模環境でのサーバー統合にも適用できる。 だが,仮想マシンをどんどん増やしていくと,ふと気づくことがある。仮想化ソフトウエアによるサーバー統合には,1台の物理サーバーで1つのOSだけを稼働している環境ではありえなかった大きな「課題」が存在するのだ。その課題とは,「複数の仮想マシンが1台の物理的なコンピュータのリソースを互いに奪い合う事象をどのように制御するのか」である。すなわち,各仮想マシンに対するリソースの割り当て方法である。 コンピュータのリソースとは,一般的に次の4つを指し示すことが多い。(1)プロセッサ,(2)メモリー,(3)ディスク,そして(4)ネットワークだ。ここでは,これらのうち,VMware Infrastructure 3で機能が大幅に拡張され
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く