下記はNTCIRで構築し、使用したテストコレクション(実験用データセット)です。研究目的での利用に限り使用可能です(但し、一部の文書データはNIIからの配布を行っていません。お申し込み前に各テストコレクションの説明文をご確認ください)。 なおテストコレクションに含まれる文書データは、作成機関等から有償または無償でNTCIRで使用するために提供されたものです。いずれも、著作権があり、商品としての価値もあるものですが、情報アクセス研究におけるテストコレクションの重要性に鑑み、とくに、研究目的での使用を許諾していただきました。我 々研究者は、今後も継続して文書データが研究に使用できるように、文書データ作成・提供機関からの信頼に応え、良好な関係を保つことが求められます。覚書、利用申請書、利用規定等をよく理解し、文書データ作成・提供機関の権利を侵害しないように十分に配慮し、研究目的に限って使用してく
日本語新聞記事データ入手方法 NTCIR用読売新聞本紙(1998-1999) 記事データ 1.読売新聞本紙(1998-1999) 記事データの取得 ワークショップ参加者以外の新規申込の方はCD-読売新聞記事データを日本データベース開発(株)より、研究目的用1998年版、1999年版が購入できます。 2. NTCIR用記事データへの変換 1.で購入した記事データを、NTCIRテストコレクション用文書データとしては使用するためには.下記のURLより、スクリプトをダウンロードし、フォーマットをNTCIR用に変換してください。 読売新聞データ(1998-1999)自体のREADME:http://research.nii.ac.jp/ntcir/permission/ntcir-4/script/READMEforYomiuri98+99.txt スクリプトscript yomi2ntcir.pl
海外・国内それぞれで公開されているデータセットをまとめました。 情報推薦(推薦システム)に関する研究で利用することを想定し、アイテム(商品や映画等)とそれに対する評価情報がペアになっているものをピックアップしています。 <海外> GroupLens Dataset http://grouplens.org/datasets/movielens/ 映画に対する5段階評価 (1-5) 100,000 / 1,000,000 / 10,000,000 ratings 1,000 / 6,000 / 72,000 users 1,700 / 4,000 / 10,000 movies 最も有名で、最も利用されているデータセット。 データサイズは100k, 1M, 10Mの3種類が用意されている。 The Book-Crossing Dataset http://www.informatik.uni
トップ ホームページアドレス(URL)の変更 ホームページアドレス(URL)の変更 The address of our website has changed 当サイトにアクセスいただきありがとうございます。 この度、ホームページアドレス(URL)を変更いたしました。 つきましては、下記の新アドレスへアクセスをお願いいたします。 また、お気に入りやブックマークなどに登録されているお客さまはお手数ですが設定のご変更をお願いいたします。 今後とも当サイトを宜しくお願いいたします。
Documentation for package ‘datasets’ version 4.4.1 DESCRIPTION file. Help Pages A B C D E F H I J L M N O P Q R S T U V W
情報推薦研究に役立つデータセットやWebサービスAPI,参考図書をまとめています. 研究用データセット WebサービスAPI 参考図書 研究用データセット 研究用に公開されているデータセットです.利用規約などについては,それぞれのリンク先を参照してください. GroupLens公開データセット MovieLens Data Sets:GroupLensが公開しているMovieLensのデータセット MovieLens 100k Data Set:映画データセット 100,000 ratings, 1,682 movies, 943 users MovieLens 1M Data Set:映画データセット 1,000,209 ratings, 3,900 movies, 6,040 users MovieLens 10M Data Set:映画データセット 10,000,054 rating
はじめに 統計解析の手法を学ぶのに、教科書を読むのは素晴らしい学習方法です。 しかし、教科書で理論的なことを学んだだけでは、統計手法を使いこなせるようにはなりません。 統計解析手法を身につけるには、実際のデータについて手法を適用し、パラメータを変えるなどの試行錯誤を行い、結果を考察するというような経験を積むことが大切です。 それでは実際のデータをどうやって手に入れましょうか? 実験や調査をして実際のデータを得るのは大変でお金もかかります。 幸運なことに、世の中には適度なサイズの自由に使えるデータがたくさん存在します。 例えば、統計言語 R には、100以上ものデータセットがデフォルトで付属しています。 ただし、不幸なことに、それらのほとんどは英語で説明が書かれています。 英語は、いつかは乗り越えなければならない壁ですが、最初のうちはちょっと避けて通りたいところです。 というわけで、今日は、
DoDStat@d データ指向統計データベース Data oriented Database of Statistics based on Analysis Scenario/Story
This dataset was collected and prepared by the CALO Project (A Cognitive Assistant that Learns and Organizes). It contains data from about 150 users, mostly senior management of Enron, organized into folders. The corpus contains a total of about 0.5M messages. This data was originally made public, and posted to the web, by the Federal Energy Regulatory Commission during its investigation. The emai
The Amazon Web Services (AWS) Open Data Sponsorship Program covers the cost of storage for publicly available high-value cloud-optimized datasets. We work with data providers who seek to: Democratize access to data by making it available for analysis on AWS Develop new cloud-native techniques, formats, and tools that lower the cost of working with data Encourage the development of communities that
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く