ウィリアムのいたずらが、街歩き、食べ物、音楽等の個人的見解を主に書くブログです(たま~にコンピューター関係も) Wekaでロジスティック分析して、予測を行う際のメモ。 ロジスティック回帰をつかうと、たとえば、いくつかの変数があって、今日は、かさを持っていくべき?いかないべき?なんていう予測もできちゃう。「いくつかの変数」は名義尺度(晴れ、くもり、雨)もOK。 (めちゃおーざっぱな説明。統計やっている人に怒られそうだ) なお、これは、手法を書いているだけで、結果は、気にするな。 ■1.データを作成 今回は、できあいのデータを利用しましょう。以下のサイト データマイニングツールボックス "Weka" の使い方 http://web.sfc.keio.ac.jp/~soh/dm03/man_w_03.html の「2.2 入力ファイルを作る」の ------ ここから -------------
What is Balie? features: language identification tokenization sentence boundary detection named-entity recognition see ca.uottawa.balie.test.samplecode.java legal: machine learning using Weka open source software (GNU GPL) Get the latest version! >> Download Balie v1.8 (Ungava release) at SourceForge now! Screenshots:
オープンソースのデータマイングライブラリWekaを使って予測というか分類というかまあClassifierを作ろうという話。 準備 Wekaを入れる 学習データを用意する 実装 分類機を作る 学習データを作る (必要なら)評価機を作って性能を確かめる 分類したい事例を作る 分類する 学習データは付属のサンプルを使う @relation weather @attribute outlook {sunny, overcast, rainy} @attribute temperature real @attribute humidity real @attribute windy {TRUE, FALSE} @attribute play {yes, no} @data sunny,85,85,FALSE,no sunny,80,90,TRUE,no overcast,83,86,FALSE,ye
正解率 (精度, accuracy):正や負と予測したデータのうち,実際にそうであるものの割合 \[\mathrm{Accuracy}=\frac{TP+TN}{TP+FP+TN+FN}\] 適合率 (precision):正と予測したデータのうち,実際に正であるものの割合 \[\mathrm{Precision}=\frac{TP}{TP+FP}\] 再現率 (recall, 感度, sensitivity):実際に正であるもののうち,正であると予測されたものの割合 \[\mathrm{Recall}=\frac{TP}{TP+FN}\] 特異度 (specificity):実際に負であるもののうち,負であると予測されたものの割合 \[\mathrm{Specificity}=\frac{TN}{FP+TN}\] F値 (F尺度, F-measure):再現率と適合率の調和平均. \[\
2 :名無しさん@3周年:04/11/24 21:03:16 おい、誰か2 ゲットしろよ! 3 :名無しさん@3周年:04/11/25 01:07:37 誰も書き込みしてくれないなんて。。。 /ヽ /ヽ / ヽ / ヽ ______ /U ヽ___/ ヽ | ____ / U :::::::::::U:\ | |?/// /Vヽ // ___ \ ::::::::::::::| 何このスレ…? | |?ll l lノノノ))〉| | | U :::::::::::::| | |ヽl ´∀`ノ|||U | | ::::::U::::| | ||/ヽ!トv^ リ?| ├―-┤ U.....:::::::::::::::::::/ | |____ ヽ .....:::::::::::::::::::::::< └__
データは、dataアイコンの操作メニューのConfigureを左クリックし、データが置かれているフォルダを開きデータファイルをクリックすることで読み込まれる。 上記の操作で、データが正しく読み込まれているかを確認するため、Visualizationタブをアクティブ化し、テキストの表示コンポーネントTextViewerをカンバスに取り込み、図12のようにコンポーネントアイコンを連結する。 アイコンの連結は、基本的にはデータの流れの先後の順に行う。アイコンを右クリックするとアイコンの操作メニューが開かれる。メニューのConnectionの中のdataSetを選択し、マウスのポインタを連結すべきアイコンまで引き、つなぎ合うことでアイコン同士が連結される。連結の切断は、アイコン操作のメニューを開き、連結されている項目を左クリックする。 アイコンの連結操作が終わったら、dataアイコンの操作メニュー
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く