[B! 形態素解析] bm0329のブックマーク

bm0329 id:bm0329

形態素解析に関するbm0329のブックマーク (9)

小説形態素解析CGI - E.N.Nach
データ送信について、気になる方向けに文章をマスキングする機能を用意しました。 Enterする前に下記ボタンを押すことで、サーバーにデータを送信する前に、ブラウザ上でマスキング処理を実施することができます。マスキング実施 ※注意書きマスキングの結果については必ずご自身でご確認ください。できる限り元の品詞などを保持していますが、当然ながら解析結果には少なくない影響を与えることはご了解ください。本システムの送信データの取り扱いについては小説形態素解析 CGIとは？をご確認ください。
bm0329 2016/11/03
cgi

形態素解析

文章

writing

text
リンク
自然言語のテキストを属性で区分する - その後のその後
NSLinguisticTaggerを用いると、自然言語のテキストを品詞（名詞、動詞、代名詞）や「個人名」「地名」といった属性で区分（トークンに分解）することができます。日本語の形態素解析も可能です。使い方は非常にシンプルで、基本的な手順は 1. スキームを引数に渡してNSLinguisticTaggerオブジェクトを生成 2. 処理対象テキストをセット 3. トークン分解開始の3ステップです。 // スキーム NSArray *schemes = @[NSLinguisticTagSchemeLexicalClass]; // NSLinguisticTaggerオブジェクトを生成 NSLinguisticTagger *tagger = [[NSLinguisticTagger alloc] initWithTagSchemes:schemes options:0]; // 処理対
bm0329 2014/01/29
Objective-C

形態素解析

iphone

development

objective-c

cocoa
リンク
ワードサラダ技術について
後半部分が重要で、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である　ということです。さて、実例です。たとえば次の文章を考えてみます。「通信販売大手セシールは９日、生命保険の販売に本格参入する方針を明らかにした。」まず形態素解析するとこんな感じになります。通信名詞,サ変接続,*,*,*,*,通信,ツウシン,ツーシン販売名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ大手名詞,一般,*,*,*,*,大手,オオテ,オーテセシール名詞,固有名詞,組織,*,*,*,セシール,セシール,セシールは助詞,係助詞,*,*,*,*,は,ハ,ワ９名詞,数,*,*,*,*,９,キュウ,キュー日名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ、記号,読点,*,*,*,*,、,、,、生命名詞,一般,*,*,*,*,生命,セイメイ,セイメイ保険名詞,一般
bm0329 2007/07/13
形態素解析

nlp

algorithm
リンク
キーワード抽出モジュール Lingua::JA::Summarize を使うコツ (nakatani @ cybozu labs)
いわゆる「Web2.0」っぽい要素である「タグ」。一般にはタグ付けは手動で行うわけですが、自然言語テキストへのタグ付け(キーワード抽出)を自動で行うことができれば、あれこれと可能性が広がって楽しそう……しかし、それは実現が難しかったり高コストだったりして、簡単に手を出せる解はあまりありません。ラボの奥さんの作成したキーワード抽出モジュール Lingua::JA::Summarize は次の特徴を持っています。動作要件の敷居が低い辞書のメンテナンスをしなくても、未知語や熟語もある程度抽出してくれる希望の結果に近づけるためのチューニングが可能本モジュールを使って、サイボウズ・ラボ内での情報交換を行っている社内掲示板をスレッド単位で解析しているのですが、辞書を一切チューニングしていない状態でも「しょこたん☆ぶろぐ」や「猫かぶり隊隊員ニャンコ達」などの特徴的なキーワードが抽出されます（
bm0329 2007/07/10
形態素解析

perl

nlp

mecab
リンク
NExT - NE Tagger
概要 Abstract 【主な特徴】 Named Entity Extraction Tool(以下NExT)は、固有表現抽出ツールです。大量のテキスト文書情報に含まれる人名、組織名、地名、数量表現を自動的に判別し、様々な形式で抽出・タグ付けします。NExTは、形態素解析処理済のテキスト情報を入力とすることで、より精度の高い処理が可能です。現在は、茶筅(ChaSen Ver.2.02[Matsumoto1998], chasen-2.3.0[Matsumoto2003])および Juman version 3.0[Kurohashi1996]の形態素解析システムの処理結果が利用可能です。 NExTは、 Perl で記述しています。NExTは、NExT開発 Project によって開発されています。 NExTは、Perlが動作する環境であれば、UNIX, Win32, OS/2 を
bm0329 2007/05/05
nlp

形態素解析

固有名詞
リンク
http://www.ling.gu.se/~lager/mutbl.html
bm0329 2007/04/11
形態素解析
リンク
[を] 形態素解析と検索APIとTF-IDFでキーワード抽出
形態素解析と検索APIとTF-IDFでキーワード抽出 2005-10-12-1 [Programming][Algorithm] 形態素解析器と Yahoo! Web 検索 API と TF-IDF を使ってキーワード抽出するという先日の検索会議でのデモ、KEYAPI[2005-09-30-3]。教科書に載っているような基本中の基本ですが、あらためてエッセンスを簡単な例で解説したいと思います。目的：キーワード抽出対象テキストから、そのテキストを代表するキーワードを抽出します。TF-IDF という指標を用います。（この値が大きいほどその単語が代表キーワードっぽいということでよろしく。） TF-IDF を計算するためには、 (1) キーワード抽出対象テキスト中の代表キーワード候補出現数 (TF)、 (2) 全てのドキュメント数 (N)、 (3) 代表キーワード
bm0329 2005/10/25
形態素解析

Bulkfeeds
リンク
Bulkfeeds を使って特徴的単語を表示 - bricklife.weblog.*
Bulkfeeds を使って特徴的単語を表示 Bulkfeeds: Similarity Search を表示していると、ときどき「これどの単語でひっかけてんだよ」という謎の記事が関連付けられることがあります。記事一覧と一緒に関連付けに用いられた特徴的単語も表示できるといいなぁ、と思っていたら、特徴的単語を取得する API が用意されました。 blog.bulknews.net: Bulkfeeds: Similarity API 更新 Bulkfeeds の Similarity REST API で、どの単語が特徴的単語かを bulkfeeds:similarTerms というエレメントからとれるようにしました。 ... 単語だけほしいんだ！というひとは、similar.xml の方をつかってください。早速 quick hack。similar.xml のほうを使って、エントリーの特
bm0329 2005/10/24
perl

Bulkfeeds

形態素解析
リンク
Bulkfeeds APIの形態素解析 + 特徴語抽出
Bulkfeeds APIで形態素解析 + 特徴語抽出を使ってみようと思い、APIKEYを取得してやってみたんだけど、termが空の要素しか返ってこない。特にエラーメッセージが出てるわけでもないので、いろいろやってみたけど結局うまく利用することができなかった。現在形態素解析 + 特徴語抽出のAPIって使えるんでしょうか？
bm0329 2005/10/18
bulkfeed

API

形態素解析
リンク
1