ちなみに、この分析のために必要とされるMapReduceのコードであるが、そのサイズはわずか20ステップだという。Yahoo!のプレゼンテーターである、エリック・バルデシュバイラー氏によると、たとえ経験の浅いエンジニアであっても、MapReduceによるプログラミングは可能であるとされる。 また、VISAのジョー・カニンガム氏からも、貴重なデータが提供されていたので以下に紹介する。同社では、1日に1億トランザクションが発生するため、2年間で700億強のトランザクションログが蓄積され、そのデータ量は36テラバイトに至るという。こうしたスケールのデータを、従来のRDBを用いて分析するには、約1カ月の時間が必要とされてきたが、Hadoopを用いることで13分に短縮されたという。 これまでは、Yahoo!にしろVISAにしろ、膨大なデータをRDBに押し込むほかに方法はなく、その分析に数十日を要する
はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28
One of the most bizarre statistical facts in relation to browser use has to be the virtual widespread numbers that currently exist in the use of Internet Explorer versions 6, 7 and 8. As of this writing, Internet Explorer holds about a 65% market share combined across all their currently used browsers. In the web development community, this number is much lower, showing about a 40% share. The inte
触発されて. Kazuho@Cybozu Labs: Cppref: reading cppreference.com docs offline, like man or info or perldoc はてなブログ language command C man C++ cppref Perl perldoc Ruby ri, refe Python pydoc, IPython ... ... ターミナルで使えるリファレンスマニュアル - プログラミング言語編 - (ひ)メモ アレッ,PHPなくね?そりゃそうか...テンプレートエンジンだからな...プログラミング言語じゃないしな....いやいやいや,ぼくらPHPerだってターミナルで作業してんだい!! 追記:もうリストに加えてくれました! id:hirose31 さんありがとうございます. ってことで作った.(すごいとか言ってますが自分
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 Railsにおけるrestful_authenticationやMerbのビルトイン認証機構に比べると、Sinatraには「とりあえずこれを使っておけ」というような認証ライブラリが無いような気がします。強いて言えばRack::Auth::Basicかな。ちょっと機能不足のように感じます。 という事で、Sinatraで使える認証用ライブラリをリストアップ。 Rack::Auth::Basic Basic認証をする。 Rack::Auth::Digest 同様にDigest認証を行う。 Rack::Auth::OpenID OpenIDを使って認証。ruby-openidが必要。 Rack::Auth::OpenIDAuth 同
BGM Foxとは Firefoxのサイドバー上でニコニコ動画とYouTubeの動画をまとめて扱うことが出来るアドオンです. 名前から分かるようにそれらの動画をまるで音楽のように扱うことができます. 具体的にはサイドバー上で動画の検索,再生そしてプレイリストで動画を管理できます. 動画画面を開かなくても再生,シーク,音量の調節などは全て上のコントロールバーでできます. 使用上の注意 ニコニコ動画へのツール経由のアクセスは原則として禁止されているようです(開発者ブログより). 従って,使用は自己責任でお願いします.当アドオンを使用することで発生したいかなるトラブルに関して一切の責任を負いません. また,ニコニコ動画の仕様変更に伴い,当アドオンは使用できなくなる可能性があります.予めご了承下さい. 必要なもの ニコニコ動画への自動ログインにC#で作成したアプリケーションを使用しているため,Mi
突然Cでコードを書きたくなったので,なんちゃって転置インデクスを用いた検索プログラムを書いてみた. 転置インデクスとは,索引語と呼ばれる単語が出現する文書情報 (場合によっては位置情報も) を保持したデータ構造のことで,索引語と,それに対応する転置リストによって構成される. # 索引語 -> 転置リスト hoge -> 5: 1,2,3,4,5 fuga -> 3: 1,4,5 piyo -> 2: 4,5これは,hogeという単語が文書1,2,3,4,5に出現し,fugaという単語が文書1,4,5に出現し,piyoという単語が文書4,5に出現する情報を保持している.最初の5,3,2という数字はそれぞれ索引語がいくつの文書に出現したかという文書頻度 (document frequency; DF) を表している. 検索クエリhogeが入力された場合には,文書1,2,3,4,5を検索結果とし
「1000のアルゴリズムを持つ男」vs.「やわらか頭脳」:最強最速アルゴリズマー養成講座(1/3 ページ) 典型的なアルゴリズムをたくさん知っている人間が最強か――? いいえ、典型的なアルゴリズムを知らなくても、違ったアプローチで答えに迫る方法はいくらでも存在します。短い実行時間で正確な答えを導き出せるかを考える習慣をつけましょう。 アルゴリズマー養成講座と銘打ってスタートした本連載。もしかすると読者の方の興味は、はやりのアルゴリズムや汎用的なアルゴリズムを知ることにあるのかもしれません。しかし、今回は、いわゆる「典型的なアルゴリズム」を用いずに進めていきたいと思います。 なぜ典型的なアルゴリズムを用いないのか。それは、典型的なアルゴリズムばかりを先に覚え、それだけでTopCoderなどを戦っていこうとした場合、それに少しでもそぐわない問題が出た場合に、まったく太刀打ちできなくなってしまう
アクセス解析のデータをもとにサイトを改善していく場合、共通点が多い集団に絞り込んで分析するセグメンテーション手法が有効だ。このセグメンテーションを簡単に実現できるGoogle Analyticsの「アドバンスセグメント」は、アクセス解析を行う上で、とても重要な機能になることは前回や前々回の記事で、その設定方法とともに解説してきた。 しかし、絞り込みまではできても、その後どうやって改善していくのか? 担当者が知りたいのはそこではないだろうか。今回はその取り組み方の例を紹介しよう。 ブランドワードを軸にした改善方法ここからは、架空のホテルサイト「ウェブタンホテル※」を例に進めていくことにする。このホテルは、十分な検討を行ったうえで見は見栄えの良いデザインのサイトを作ったつもりだったが、お客様から「サイトがわかりにくい」と言われてショックを受けていた。そこで、どうしたものかと僕に相談が来た。 ※
「ニコニコ動画はたまたま当たったと思っている人は多いだろう。危ないところに踏み込んだから成功したと思いたがる人もいるだろうが、そうではない」――ニコニコ動画を運営するドワンゴの川上量生(のぶお)会長は言う。 才能ある技術者1人が思いつきで作り、大ヒットしたネットサービスは少なくない。ネット業界では、そんなサービスや開発ストーリーがもてはやされる傾向もある。だがニコ動は全く違った。 社内で半年にわたる議論を重ね、プロトタイプを作り、あらゆるリスクを考え、準備万端でリリースしたのだ。 モバゲーを作りたかった 2006年始めごろ、ドワンゴは次の一手に悩んでいた。 過去には携帯ゲームや着メロ、着ボイスでヒットを飛ばしていたが、着うたの急拡大で着メロが失速し、06年の連結決算が赤字に転落。次の手は待ったなしだった。 チャレンジは繰り返していた。携帯向けのストリーミング放送サービス「パケラジ」や、携帯
Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの本文抽出がひとつの鍵になっています。今回はその本文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。 本モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。 【追記】大事なこと書き忘れ。本モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont
新着動画一覧 最強タンクの迷宮攻略~体力9999のレアスキル持ちタンク、勇者パーティーを追放される~ 第07話 02/18 11:17 カテゴリ:アニメ 『ゴジラ-1.0』VFXメイキング<大ヒット上映中!> 02/17 22:41 カテゴリ:映画 【映画『帰ってきた あぶない刑事』公開記念!傑作エピソード特別配信】『もっとあぶない刑事』第09話 乱脈 [公式] 02/17 07:27 カテゴリ:ドラマ プロハンター 第01話[公式] 02/17 07:26 カテゴリ:ドラマ 【本編】『化石の荒野』<2週間限定公開> 02/16 22:22 カテゴリ:映画 即死チートが最強すぎて、異世界のやつらがまるで相手にならないんですが。 第07話 02/16 06:33 カテゴリ:アニメ 魔法少女にあこがれて 第07話 「逆境アズール」 02/15 07:09 カテゴリ:アニメ 悪役令嬢レベル99~
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く