Jubatusチームの熊崎です。 6/29(日)にドワンゴさんの 会場 をお借りして、 Jubatus Casual Talks #3 ビジネス応用編 を開催しました。 多くの方にお集まりいただき、Jubatusをビジネスに応用した事例及びその際の苦労を共有いただきました。 ...
1. Jubatus Casual Talk #3 「Meteor: Jubatusをベースにした オーディエンスの分析エンジンの紹介」 2014年6月29日 株式会社Intimate Merger 渡部創史 2. Intimate Merger 会社概要 2 商号 出資元の情報 株式会社Intimate Merger インティメート・マージャー 設⽴立立 2013年年6⽉月 オフィス 六六本⽊木cross point 代表 簗島 亮亮次 ⾼高度度な広告配信技術を持つフリークアウトと検 索索・データマイニング技術に強みを持つPFIとの ジョイントベンチャー グリーでデータマイニング、ポータル、編成、 API、SDKなど複数部⾨門のマネジメントしてい た⼈人間を中⼼心としたデータマネジメント企業 “ビックデータをお⾦金金に換える“をテーマにビッ クデータの活⽤用や利利⽤用環境の構築を⽬
2. ! NTT SIC*とPreferred Infrastructureによる共同開発 ! 2011年年10⽉月よりOSSで公開 http://jubat.us/ Jubatus 2 分散並列列 リアルタイム 深い解析 * NTT研究所 サイバーコミュニケーション研究所 ソフトウェアイノベーションセンタ 4. 0.6.0が2014年年6⽉月23⽇日にリリースされました! ! 新機能 ! 学習データの忘却機能の追加 ! string_rules の拡張 ! classifier に delete_class を追加 ! nearest_neighbor_recommender の clear_row のサポート ! 主な変更更点 ! Jubatus のコア部分を jubatus_core として分離離 ! nearest_neighbor のメソッド名
This document summarizes a presentation about using online machine learning with Jubatus for a real estate search service called SUUMO. Toru Shimogaki from NTT DATA Corporation presented on how SUUMO uses Jubatus classifier and multidimensional scaling to learn users' preferences and provide personalized search results. The system presents users with two candidate properties and learns their taste
はじめに 先日の Jubatus Casual Talks で、OpenCVを使った一般物体認識の概要と、注意しなければならないポイントについて発表させていただきました。 Jubatus opencv from Kazuya Gokita 詳しくは上記のスライドを御覧ください。 一般物体認識とは 要するに、画像を与えた時にそこに何が写っているのかを推定することです。 ゾウの写真ならゾウ、自転車の写真なら自転車だとコンピュータに判断させるのが目的です。 ところが、これがなかなか難しい問題であまりうまくいっていません。 Googleの画像検索は一見この問題を解決しているように見えますが、画像検索の場合はその画像の周辺にあるテキスト情報が利用できるのでちょっと違います。 たとえば、写真のすぐ下に「ウサギかわいい」って書いてあったらたぶんウサギの写真だろうと判断できます。 このような情報が与えられ
Jubatus : オンライン機械学習向け分散処理フレームワーク¶ Jubatusは「分散したデータ」を「常に素早く」「深く分析」することを狙った分散基盤技術です。 Jubatusの名前の由来は、俊敏な動物であるチータの学術名からの命名で、「ユバタス」と読みます。株式会社Preferred NetworksとNTTソフトウェアイノベーションセンタが共同開発した、日本発のオープンソースプロダクトです。 最終的に全ての人にスケーラブルなオンライン機械学習フレームワークを提供することがJubatusの目標です。 Jubatus は以下の特徴を持ったオンライン機械学習向け分散処理フレームワークです。 オンライン機械学習ライブラリ: 多値分類、線形回帰、推薦(近傍探索)、グラフマイニング、異常検知、クラスタリング 特徴ベクトル変換器 (fv_converter): データの前処理と特徴抽出 フォルト
2. ⾃自⼰己紹介 l ⽐比⼾戸将平(HIDO Shohei) l TwitterID: @sla l 専⾨門:データマイニング、機械学習 l 経歴: l 2006-2012: IBM東京基礎研究所データ解析グループ l 機械学習(特に異異常検知)のアルゴリズム研究開発 l お客様案件でデータ解析プロジェクトに従事 l 2012-: 株式会社プリファードインフラストラクチャー l ⼤大規模オンライン分散機械学習基盤Jubatusチームリーダー l 趣味 l 京都(京都検定三級) l 寺社仏閣巡り(⻄西国・洛洛陽三⼗十三観⾳音霊場満願) l 茶茶道(裏裏千家) 2 l 野外⾳音楽フェス(フジロック⾏行行きたい!!!)
比戸です。 先週Jubatusの最新0.4.0がリリースされましたが、外れ値検知機能の追加が目玉の一つとなっています(jubaanomaly)。昨年PFIへ入社して初めて手がけた仕事が公開されたということで感慨ひとしおですが、便乗してあまり語られることのない異常検知の世界について書きたいと思います。以下の資料は昨年のFIT2012で使ったものです。 異常検知とは簡単にいえば、「他に比べて変なデータを見つけ出す」タスクです。お正月にテレビで繰り返し流れた、おすぎとピーコのCM(*1)がわかりやすいイメージですね。機械学習の枠組みで言えば”教師無し学習”に属します。分類や回帰、クラスタリングなど応用も多く人気も研究熱も高いタスクに比べると、マイナーです。SVMとか、Random Forestとか、Boostingとか、最近だとDeep Neural Networkとか、有名な必殺技アルゴリズム
ツイート via http://jubat.usDevelopers Summit 2012 の2日目、 13:10〜14:00 の【17-E-3】「オンライン機械学習で実現する大規模データ処理」だけに参加してきたので、わたしがとってきたメモを共有したいと思います。 [Cloud Development] 13:10〜14:00【17-E-3】オンライン機械学習で実現する大規模データ処理 西川 徹 氏 【17-E-3】 オンライン機械学習で実現する大規模データ処理 View more presentations from Developers Summit <講演概要> 大規模データ処理は、Hadoopの普及や大手ベンダーの参入により、ますます盛り上がってきました。大規模データを活用しようとするこのビッグウェーブは、まだ始まったばかりです。データの量が増えるだけでなく、扱うデータの多様性は
Jubatus(ユバタス)は、大規模データをリアルタイムに解析するための、”大規模分散リアルタイム機械学習基盤”です。 人類が取り扱うデータ量は、年々指数関数的に増大しています。「ビッグデータ」と呼ばれるこうした巨大なデータがあらゆる分野で生まれ始めています。これらは単に生み出されるデータ量が増えているということを示すだけではありません。従来は処理対象ではなかったような詳細なログデータや多種多様なセンサーの生データも含まれ、またテキストや動画像のような非構造化データの割合が大きくなっています。一方で、こうした膨大なデータから有用な情報を見つけ出すことが、計算能力の面でもデータ解析技術の面でも可能になりつつあります。しかしながら、Hadoopを含む既存フレームワークの多くは集計やレポーティングなどの単純な分析バッチ処理にとどまっています。 大量のデータをリアルタイムで効率的に処理し、いち早く
先日、NTTと共同研究開発したJubatusを公開しました。 OSSで公開されてますので、興味がある方は使ってみるなり、ソースコードを眺めるなり、できればプロジェクトに参加していただけたらと思います。 Jubatus(ユバタス)は、大規模分散上でリアルタイムで機械学習を行うためのフレームワークです。 このプロジェクトは元々、機械学習やデータ解析が好きなPFIと、ネットワークやシステム運用実績が豊富で技術力があるNTT情報流通プラットフォーム研究所と組んで何かできないかということで始めました。 「大規模分散」+「リアルタイム」+「深い解析」という三つの特徴を持った上でデータを分析するためにどのようなアーキテクチャが考えられて、その上でどのような解析ができるのかというのを日々試行錯誤して作っています。 今回はリリース第1段ということで、手法としては分類(教師有学習の多クラス分類)に絞ってOSS
(報道発表資料) 2011年10月26日 日本電信電話株式会社 株式会社プリファードインフラストラクチャー ビッグデータのリアルタイム処理を可能にする大規模データ分析基盤技術を世界に先駆けて開発 ~10月27日よりオープンソースソフトウェアとして公開~ 日本電信電話株式会社(東京都千代田区、代表取締役社長:三浦 惺、以下「NTT」)と株式会社プリファードインフラストラクチャー(東京都文京区、代表取締役社長:西川 徹、以下「PFI社」)は、ビッグデータ*1と呼ばれる大規模データをリアルタイムに高速分析処理する基盤技術「Jubatus*2」(第1版)を開発しました。 直近の潮流変化を調べる等、対象データの新しさを意識したビッグデータ分析アプリケーションを作成するニーズに対して、従来のバッチ処理による定期的な一括処理は、新しいデータの分析が次の実行タイミングまで待たされる点で十分ではありませんで
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く