タグ

bigdataに関するseapig_dolphinのブックマーク (8)

  • ビッグデータが解き明かす!ももクロ・ブレイクの理由|【Tech総研】

    アイドル戦国時代!ポストAKBとなるのは誰か? 星の数ほどある(?)アイドルグループの中からAKB48、ももいろクローバーZ、Berryz工房、スマイレージ、東京女子流、私立恵比寿中学を選び、ビッグデータで解明する。 ブログと「ブレイク」との相関関係を探る 「アイドルグループ戦国時代」と呼ばれる現在、彼女たちの方向は2つに分かれる。ブレイクするアイドルと、そうでないアイドルだ。では、その差は何か。さまざまな要因があるとは思うが、ビッグデータを使って解明できないかと考えた。 今年6月に行われた「2012年第4回AKB選抜総選挙」。覚えている人も多いだろうが、この順位をビッグデータを使って予測し、「選抜メンバーとなる上位16人中15人」(順不同)を的中させた会社がある。株式会社ルグランである。今回は同社が「アイドルグループ・ブレイクの法則」について、クチコミデータ(ブログ)とブレイクとの相関関

  • NHK クローズアップ現代

  • 顧客との接点は「ビッグデータ」にある

    リアルタイムに時々刻々と生成される大量のデータから、いかに知見を見出してビジネス戦略に生かすか――。ビッグデータ活用が情報システムのあり方と企業戦略を大きく変えようとしている。ビッグデータに注力するITベンダーに、ビッグデータ活用の重要性および従来の戦略的データ活用との違いなどを聞いた。(聞き手は井上健太郎/田島篤=ITpro) データの戦略的活用という点でBIとビッグデータの違いは何か。 BIからおさらいしていこう。BIを一言でまとめると、「生産・販売・開発といったさまざまな企業活動のなかで、現場で何が起きているかを、経営層や営業部門がリアルタイムに近い形で把握して、その場のビジネス判断に生かすこと」となる。 従来のBIの使われ方からすると、「既存の情報を集めてきて表示するだけ」と思われがちだが、これだけでも簡単ではない。国内の活動だけなら実現できているかもしれないが、海外進出先の現場で

    顧客との接点は「ビッグデータ」にある
  • リクルート式Hadoopの使い方

    リクルート式Hadoopの使い方 - Presentation Transcript リクルート式Hadoopの使い方 株式会社リクルートMIT システム基盤推進室インフラソリューショングループ石川 信行 はじめに・・・ □名前 石川 信行 (   ground_beetle) □出身 福島県 いわき市 □経歴 ・2009年リクルート新卒入社 ・営業支援システムのコーダー(java)、DBAとして参加。 ・JavascriptのLibであるSenchaを用いたスマホサイト開発 ・現Hadoop推進担当 □趣味 ・外国産カブト虫飼育 ・スキューバダイビング ・海水魚飼育 リクルートの組織体制について 旅行C 営業 企画 自動車C 営業 企画 住宅C 営業 企画 MIT United 事業担当MIT  事業担当MIT  事業担当MIT  ・マーケティング・分析チーム  ・インフラ基盤チーム  

  • 試すのが難しい―機械学習の常識はMahoutで変わる

    ビッグデータ時代―なぜ、いま機械学習なのか Apache Hadoop(以下、Hadoop)の登場で、今まで捨てていたデータ、貯めるだけで処理しきれなかったデータを活用できるようになりました。 活用手段として最近とみに注目されている技術が「機械学習」であり、Hadoopの強みを生かし簡単に機械学習を行うためのライブラリが、「Apache Mahout」(以下、Mahout)です。 稿ではMahoutを動かしてみることで、機械学習の常識を身に付けます。 そもそも、機械学習とは? 機械学習とは、一定のデータをコンピュータ・プログラムに「学習」させ(すなわち、そのデータに潜むパターンや規則性を表す「モデル」を自動的に構築させ)、他のデータにそのモデルを適用すれば、あたかも人間のように複雑で柔軟な判断が行えるようにするという試みです。 機械学習をビジネスに活用した例は、レコメンド(ユーザーや商品

    試すのが難しい―機械学習の常識はMahoutで変わる
  • 大規模データ技術の現状と今後の方向性

    また、データの全件処理、特にI/Oの性能が求められる多重のバッチ処理にはMapReduceが新たな選択肢として加わります。MapReduceはデータインデックシングや非構造化データの前処理(ETL、クレンジング)への適用が有名ですが、より汎用的なバッチ処理のインフラ技術[3]として適用範囲が広がっています。 こうした技術の選択肢の中で、特にスケールさせるためにはデータを分割し、分散配置させることと、データの配置場所に処理を持っていくこと、つまり、シェアードナッシングのデータベース技術がアプリケーションアーキテクチャーに大きな影響を及ぼしています。 非構造化データを含めた大規模データ分析MapReduceで実行し、その結果の集計やレポート機能にRDBを利用して分析結果の可視化をするのが現在は主流となっています。しかし、この方法は十分に全体最適化がされてなく、データ転送コストの無駄が発生して

    大規模データ技術の現状と今後の方向性
  • [Cloud & BigData]「Hadoopは神のようなエンジニアを不要にした」――。米アマゾンが講演

    「10Gバイトのデータでもビッグデータだ。神のようなエンジニアを不要にするHadoopを使えばビッグデータ活用コストを下げられる」――。米アマゾン・ウェブ・サービシズ(AWS)のJohn Rauser Principal Quantitative Engineerは2012年2月28日、聴衆にこう語りかけた。同氏はクラウドコンピューティングの専門展「Cloud Days Tokyo/スマートフォン&タブレット/ビッグデータEXPO」で、「The Changing Economics of Data: A View From Inside Amazon」と題して、米アマゾンにおけるビッグデータ活用の実際を事例を交えながら講演した。 Rauser氏はまず米アマゾンにおけるビッグデータ活用の事例を話した。2008年、アマゾンのアフィリエイトシステムは性能面の限界を迎えていた。そこで複数台で分散処

    [Cloud & BigData]「Hadoopは神のようなエンジニアを不要にした」――。米アマゾンが講演
  • 情報爆発時代、いかに大量データを収益につなげるか

    近年、企業を取り巻くデータ量が増大している。だが、めまぐるしく変わる市場環境に追従するためには、従来からある構造化データだけではなく、ソーシャルメディア上のテキストデータなど、非構造化データも活用対象としなければならない。 @IT情報マネジメント編集部からのお知らせ 大量・多種類のデータから、どうすれば“ビジネスの価値”を引き出せるのか? ビジネス/テクノロジサイドが同じ目的を見据え、収益向上、ブランディングにつなげる“現実的なポイント”を伝授!第16回@IT情報マネジメントカンファレンス『ROI最大化、収益向上に寄与するビッグデータの真意と活用の鍵』を3月8日(木)に開催します! 詳しくはカンファレンス紹介ページへ こうした「大量データを収益向上に生かす取り組み」として「ビッグデータ」という言葉が注目されているが、大量・多種類の情報を効率的に収集・蓄積し、分析、予測するなど、データを眠ら

    情報爆発時代、いかに大量データを収益につなげるか
  • 1