In this tutorial, I will describe how to write a simple MapReduce program for Hadoop in the Python programming language. Motivation Even though the Hadoop framework is written in Java, programs for Hadoop need not to be coded in Java but can also be developed in other languages like Python or C++ (the latter since version 0.14.1). However, the documentation and the most prominent Python example o
それぞれ入手して、インストールしてください。 設定 特別な設定をしなくても、動作します。 ただし、Windows環境下にてmatplotlibはIDLEやコンソール等の対話モードで使用すると、フリーズすることがあります。 この点に関しては、本家サイトのFAQに記載されています。 My matplotlib window is freezing 設定を変更することで、動作を改善することができます。 私の環境では、コンソールやIDLEの対話モードの状況は改善しませんでしたが、 PyCrustでは、フリーズすることがなくなりました。 なお、PyCrustは、wxPythonのデモコードに付属しているツールです。 設定内容は、以下のとおりです。 C:\Documents and Settings\yourname\.matplotlibにmatplotlibrcファイルをつくる matplotli
以下のサンプルプログラムをダウンロードしよう。 ドキュメントフォルダに python という名前のフォルダを作って、 リンクで右クリック → [対象をファイルに保存] → 保存先を上記のフォルダに指定 →「ファイルの種類」を「すべてのファイル」にして → [保存] ファイル名に拡張子 .txt が付いてしまった人は名前を変更して .txt を取っておこう。 circleratio.py / 実行例 ... 円周率を計算するプログラム (1万桁もあっという間) Napier.py / 実行例 ... ネピア数(自然対数の底)を求めるプログラム (1万桁もあっという間) rootx.py / 実行例 ... 自然数の平方根を求めるプログラム (1万桁もあっという間) primetable.py / 実行例 ... 素数表を作るプログラム (百万までの素数表もあっという間) twinprime.
Peter Norvig / 青木靖 訳 先週、2人の友人(ディーンとビル)がそれぞれ別個にGoogleが極めて早く正確にスペル修正できるのには驚くばかりだと私に言った。たとえば speling のような語でGoogleを検索すると、0.1秒くらいで答えが返ってきて、もしかして: spelling じゃないかと言ってくる(YahooやMicrosoftのものにも同様の機能がある)。ディーンとビルが高い実績を持ったエンジニアであり数学者であることを思えば、スペル修正のような統計的言語処理についてもっと知っていて良さそうなものなのにと私は驚いた。しかし彼らは知らなかった。よく考えてみれば、 別に彼らが知っているべき理由はないのだった。 間違っていたのは彼らの知識ではなく、私の仮定の方だ。 このことについてちゃんとした説明を書いておけば、彼らばかりでなく多くの人に有益かもしれない。Googleの
The Google PageRank Algorithm in 126 Lines of Python Reading How Google Finds Your Needle in the Web's Haystack I was surprised by the simplicity of the math underlying the google PageRank algorithm, and the ease with which it seemed to be efficiently implementable. Being able to do a google-style ranking seems useful for a wide range of cases, and since I had wanted to take a look at python for
Pythonの勉強にローカルプロキシ書いてみた。./cache/に読み込んだCSS/JS/IMG/HTMLデータをディレクトリ構造を再現してコピーする。ローカル保存スクリプトを兼ねてみた。 #eoncoding:shift_jis import SimpleHTTPServer import threading import BaseHTTPServer import select import socket import SocketServer import urlparse import urllib2 import os import fileinput Thread = threading.Thread class HttpdThread(Thread): def __init__(self): self.httpd = Httpd( ("" ,8080), ProxyServe
Threaded data collection in Python - with example code! davidnaylor.co.uk — The example used is an RSS aggregator, and the writer provides the full code of each stage of its design, while explaining the pros and cons of each model. A great introduction to threaded programming in Python, essential if you want to be the next Google!
1. 初めに 紫藤は xyzzy という emacs 風のエディタを使って HTML を書いています。 このエディターから抜け出さないでファンクションキーひとつでファイルをアップロードするスクリプトを 書いてみました。xyzzy Lisp を使ってアップロードの 入力ファイルを作るスクリプトを書き、 入力ファイルに基づいてアップロードを行うスクリプトを Python で書きました。 ここでは Python で書いた部分について解説します。 100 行ほどの短いスクリプトで書くことができます。 このスクリプトは短いのですが、それなりのテクニックを使っているので、 皆様の参考になればと思い、紹介します。 2. 仕様 2.1. 入出力ファイルを作るディレクトリ 入力ファイルおよび出力ファイルは環境変数 TEMP または TMP で定義されたディレクトリに 作成します。両方とも定義されていなければ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く