顧客からのフィードバックを受け、地道に改良を積み重ねていく Amazon が、パブリック・クラウド業界を当面のところリードし続けるように思う。
と書いたその日に、Amazon が Hadoop を使った Amazon Elastic MapReduce のベータ版サービス開始を発表した。いよいよ他のパブリック・クラウド・プロバイダを引き離しにかかった感がある。
『Googleを支える技術 -- 巨大システムの内側の世界』の第4章で紹介されているように、MapReduce は Google が開発した大規模分散ストレージ上にあるデータの並列処理技術であり、Hadoop はそのオープンソースの実装である。Google のクラウド環境(たとえば Google AppEngine)だとプログラミング言語が Python に限定されるが、Amazon Elastic MapReduce では、Java、Ruby、Perl、Python、PHP、R、C++ の中から選択することができる。
Amazon のクラウド(Amazon Web Services)の魅力は、手元に PC 1台とクレジットカードさえあれば、大規模な並列計算機とストレージを使うことができることにある。大量の情報のインデックス付け、シミュレーション、データマイニング、集合知プログラミング…。世の中に溢れ出る生データを利用できる形式に変換したり、あるいは意味のある情報を抽出したりする大規模な計算を、分散・並列処理の勉強をきちんとしさえすれば、誰もが実行できる時代である。
追記
- Amazon Elastic MapReduceを使ってみた:プリファード インフラストラクチャ 太田一樹氏による早速の試用記
- MapReduce:はてな 伊藤直也氏による MapReduce 解説
- Hadoop 解析資料:NTTレゾナントと Preferred Infrastructure による Hadoop 技術解析
クラウド・コンピューティングに関するエントリ
- 2009.3.5:「クラウドを超えて」("Above the Clouds")を読んで
- 2009.3.6:『クラウドの衝撃』、『クラウド化する世界』(The Big Switch)
- 2009.3.17:クラウド・コンピューティング --- The Economist:「企業 IT 特集」を読む ---
- 2009.3.19:「UNIX Magazine クラウド特集」、"Programming Amazon Web Services"、『仮想化大全』
- 2009.3.20:ティム・オライリー、「Web 2.0 とクラウド・コンピューティング」を語る --- ネットワーク外部性の観点より
- 2009.3.30:Sun の徹底的にオープンなクラウド戦略
- 2009.4.2:クラウド・プロバイダをめぐる動き --- IBM、Sun、Cisco、Amazon、「オープン・クラウド宣言」
- 2009.4.3:来た来た! Amazon + Hadoop = Amazon Elastic MapReduce