タグ

nlpに関するmakimotoのブックマーク (155)

  • 「川崎市」と「川崎さん」の区別が容易に--富士通、固有名詞の高精度抽出技術を開発

    富士通研究所は11月24日、文章中の人名や組織名、地名などの固有名詞を高精度に抽出する技術を開発したと発表した。これにより、新聞記事から約97%の精度で人名を正しく抽出する。従来の抽出手法と比較して抽出ミスを60%近く減少できるという。 新聞の編集やウェブサイトの更新など大量の文書データを扱う業務では、キーワード検索やそれを用いた文書作成が業務の中で大きな割合を占める。しかし「川崎さん」や「川崎市」の「川崎」のような単語は、「人名」か「地名」かの区別がつきづらく、目的のキーワードとは無関係な結果が数多く表示されてしまっていた。 そのため必要な情報を見つけるのに手間がかかっていたほか、人名や地名などの辞書データを人手で作成しなければならず、辞書の自動生成が大きな課題となっていた。 今回開発された技術は、精度の高い固有名詞を抽出するため、固有名詞辞書の自動生成手法と生成した辞書を用いる抽出を実

    「川崎市」と「川崎さん」の区別が容易に--富士通、固有名詞の高精度抽出技術を開発
    makimoto
    makimoto 2009/11/24
  • LUULULU | Eiji ARAMAKI, Ph.D.

    Eiji ARAMAKI, Ph.D. Professor, NAIST, Japan B.S. Kyoto University, 2000. Ph.D. University of Tokyo, 2005. 荒牧英治 奈良先端科学技術大学院大学・ 先端科学技術研究科・ ソーシャル・コンピューティング研究室・教授 CREST「バイオDX」研究代表者 2000: 京都大学・総合人間学部・卒業. 2005: 東京大学大学院・情報理工学系研究科・修了;博士(情報理工学) natural language processing for medical medical applications of social media see ▶︎[RESEARCH page] (English). 電子カルテテキストの解析,医療コミュニケーション解析,ソーシャルメディアの医療応用など. 多くを学べる機会を

    makimoto
    makimoto 2009/10/01
    かっこいい
  • Japanese WSD task (奥村研究室ホームページ)

    Organizers Manabu Okumura(Tokyo Institute of Technology) Kiyoaki Shirai(Japan Advanced Institute of Science and Technology) △go top of this page What's new 2010.1.7 The schedule of the task was decided as follows: Release of traning data: February 1st Release of test data: March 24th Submission deadline of the result: March 31st Release of the answer data for the test data: April 2nd We appreciate

    makimoto
    makimoto 2009/09/14
  • ACL Anthology » D09

    ACL Anthology A Digital Archive of Research Papers in Computational Linguistics Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing D09-1 [bib]: Entire volume D09-1000: Front Matter D09-1001 [bib]: Hoifung Poon; Pedro Domingos Unsupervised Semantic Parsing D09-1002 [bib]: Hagen Fürstenau; Mirella Lapata Graph Alignment for Semi-Supervised Semantic Role Labeling D

    makimoto
    makimoto 2009/08/07
  • ACL Anthology » P09

    ACL Anthology A Digital Archive of Research Papers in Computational Linguistics Proceedings of the Joint Conference of the 47th Annual Meeting of the ACL and the 4th International Joint Conference on Natural Language Processing of the AFNLP P09-1 [bib]: Entire volume P09-1000: Front Matter P09-1001 [bib]: Qiang Yang; Yuqiang Chen; Gui-Rong Xue; Wenyuan Dai; Yong Yu Heterogeneous Transfer Learning

    makimoto
    makimoto 2009/08/07
  • 文脈解析で隠語も判別 NICT、有害情報検出技術の研究をKDDI研に委託

    独立行政法人・情報通信研究機構(NICT)はこのほど、インターネット上の違法・有害情報監視を効率化するための支援技術の研究・開発を、KDDI研究所に委託すると発表した。 単語の前後の文脈を解析し、隠語も自動抽出できる技術の研究開発を委託。違法・有害情報の候補を自動抽出することで、監視業務を行う人員を半分程度に抑えることが目標だ。NGワード検出など既存の技術は隠語に対応できず、目視による監視に頼っていた。 研究期間は、2011年度までの3年間。2009年度の予算の上限は1億8000万円程度。 4~6月に公募し、5件の応募があり、学識経験者で構成する評価委員会の評価を経て決定した。 関連記事 犯行予告収集サイト「予告.in」公開 「0億円、2時間で作った」 「総務相が、ネット上の犯行予告を検知できるソフトの開発費を来年度予算の概算要求に盛り込むと発言した。費用は数億円」という報道を受け、開発者

    文脈解析で隠語も判別 NICT、有害情報検出技術の研究をKDDI研に委託
  • NLP若手の会(YANS) Web Site -   第4回 (2009年)

    シンポジウムは、下記の日程で、情報処理学会自然言語処理研究会と同会場にて連続開催になっております。 2009年9月28日(月)-29日(火) 情報処理学会自然言語処理研究会 注:こちらの開催会場は京都大学 工学部3号館2階 北棟N2講義室です。 発表募集要項以下のとおり研究発表を募集します。 発表テーマ自然言語処理 音声言語処理 人工知能 その他、関連分野 発表資格発表者は40歳までの年齢の方とします。 言語処理学会の会員・非会員を問いませんが、入会をお勧めします。 発表区分すべて、短い口頭発表(2分程度)を伴うポスター発表とします。 (プログラム編成上,多少変更になる場合があります) 論文提出論文の提出は任意です。論文の提出を希望する方は、発表申込時にその旨をお知らせください。提出していただいた論文は、オンライン予稿集としてウェブページに掲載します。 発表申

    makimoto
    makimoto 2009/07/07
  • NLP若手の会(YANS) Web Site -   第4回 (2009年)

    開催趣旨シンポジウムは、自然言語処理および関連分野の若手研究者の交流を促進し、若手のアクティビティを高めることを目指しています。これから始まる、または始まったばかりの研究の発表を歓迎し、活発な議論を行う場を実現したいと考えています。以下のように研究発表を募集しますので、奮ってご応募ください。 また、招待講演や国際会議参加報告などの特別セッションを通じて、自然言語処理の普及・啓蒙を図り、若手研究者の育成につなげていきたいと考えています。 主催:言語処理学会 日時:2009年9月30日(水)〜10月1日(木) 場所:京都大学 国際交流ホールIII (京都市左京区吉田町) 参加費:無料 (懇親会費は別途) 発表募集要項以下のとおり研究発表を募集します。 発表テーマ自然言語処理 音声言語処理 人工知能 その他、関連分野 発表資格発表者は40歳までの年齢の

    makimoto
    makimoto 2009/06/11
  • Sequential Labeling based Transliteration

    Transliteration by CRF. List of Contents What's new Demonstration Result Sample What's new 2009-03-17: This page is available. Demonstration : English to other languages Input an English Named Entity (such as "John"), and push exec. Result Sample eiji.aramaki@gmail.com

    makimoto
    makimoto 2009/06/10
    多言語翻字システム
  • テキスト解析:キーフレーズ抽出API - Yahoo!デベロッパーネットワーク

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    テキスト解析:キーフレーズ抽出API - Yahoo!デベロッパーネットワーク
  • ACL-IJCNLP 2009 に short paper として採択されました - 武蔵野日記

    まだ手許には査読結果が返ってきていないのだが、今年はシンガポールで開催される自然言語処理の最大級の国際会議、ACL-IJCNLP 2009 の List of accepted short papers が発表されているようだ(@sassano さん経由)。 EMNLP 2009 の authors' response は渋い結果だったので期待していなかったが、こちらに出した論文はもっとフォーカスを絞って書いたし通ってくれるかなとは思っていたので、無事アクセプトされていてほっとした。 ちなみに short paper というのは普通の論文(full paper)と比べて短いが速報性が高い内容や、あまり結果が芳しくなかった実験、もしくは実験はまだでもこういうことをやりたいですよというような内容に加点されるもので、一般的には full paper よりは通りやすいと思う。自然言語処理分野の国際

    ACL-IJCNLP 2009 に short paper として採択されました - 武蔵野日記
  • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

    MeCabは形態素解析のためのソフトウェアです。日語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日語や、正しく書かれた日語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

    MeCabの辞書にはてなキーワードを追加しよう - 不可視点
    makimoto
    makimoto 2009/05/31
  • ohmm(オンラインEMによるHMM学習)をリリースしました - DO++

    Ohmm-0.01をリリースしました [Ohmm 日語] [Ohmm English] これは、以前のブログで書いた、オンラインEM法をそのまま素直に隠れマルコフモデル(HMM)に対し適用したライブラリです。 使う場合は、単語(アクセス履歴とかなんでもよい)に分けられているテキストを入力として与えれば、HMMによる学習を行い、結果を出力します。他で利用できるように、パラメータを出力したり、単語のクラスタリング結果を出力します。 HMM自体は、言語情報やアクセス履歴、生物情報(DNA)といったシーケンス情報において、前後の情報を用いて各要素をクラスタリングしたい場合に用います。 ライブラリの特徴はオンラインEMの特徴通り、従来のEMよりも速く収束します。一応標準的な最適化手法(スケーリング、スパースな期待値情報の管理)もいれているので、そこそこ高速に動きます 速度的には100万語、隠れ状

    ohmm(オンラインEMによるHMM学習)をリリースしました - DO++
  • plda - Google Code

    Code Archive Skip to content Google About Google Privacy Terms

    makimoto
    makimoto 2009/05/18
    A parallel C++ implementation of fast Gibbs sampling of Latent Dirichlet Allocation
  • http://202.218.239.69/~pingpong/

    makimoto
    makimoto 2009/05/17
  • Stanford School of Engineering

    Topics: Logistics, Goals Of The Field Of NLP, Is The Problem Just Cycles?, Why NLP Is Difficult? The Hidden Structure Of Language, Why NLP Is Difficult: Newspaper Headlines, Machine Translation, Machine Translation History, Centauri/Arcturan Example Transcript: HTML | PDF

  • ACL-IJCNLP 2009, 2-7 August 2009, Singapore

    Highlights from ACL-IJCNLP 2009: A Fusion of AI Linguistics and Machine Learning The 2009 joint conference of the Association for Computational Linguistics (ACL) and the International Joint Conference on Natural Language Processing (IJCNLP) brought together a plethora of insights into the burgeoning fields of language processing and artificial intelligence. Held from August 2nd to August 7th in Si

    makimoto
    makimoto 2009/04/15
  • 学生実験

    形態素解析プログラムの作成(情報メディア創成学類) 自然言語処理(情報(科)学類) - 辞書と日語単語分割 - 担当教官 山幹雄 ; myama AT cs.tsukuba.ac.jp ( 内線6559, 総B908 ) 実施学期 2012年度2学期 第1回目(9/5(水)は12:30に3A311(天王台地区第3エリア)に集合.できれば実験テキストを印刷して持ってきてください。印刷するつもりがない人は印刷しなくてもよいです(ノーパで表示できればそれで十分)。 実験テキストと資料 実験テキストのpdfファイルはここ(32ページ)。 (テキストには「情報学類」と書いてありますが、情報メディア創成学類も情報科学類も同じテキストでよいです) 上記テキストだけでも実験できるように書いてはありますが、関連授業の 資料も参考になるはずです。ホームページにはここから。 実験概要 自然言語処理とは日

    makimoto
    makimoto 2009/04/11
    形態素解析プログラムの作成。楽しそう。
  • 川柳の自動生成アルゴリズムの紹介(どうしたら 機械で川柳 詠めるかな)

    こんにちは。エイプリルフールに 1 日だけローンチした Google 川柳、お楽しみいただけましたか?エイプリルフールが終わってしまったのでサービスはもうありませんが、せっかくなのでその裏側をすこしご紹介します。 今回は、Google人工知能 CADIE を開発し、その CADIE が世界中で面白いサービスを提供するという設定で Google 川柳を提供しました。人工知能 CADIE は架空のものですが、コンピューターによる川柳の自動生成を行ったのは、ウソではありません。 ここでは、その川柳をコンピューターに生成させた手順を簡単にご紹介します。 川柳とは何かを学習する まず、物の川柳/俳句を Web 上から集めました。集めた作品を解析し、俳句/川柳にありがちな品詞の並びパターンを学習しました。「瞬間」を切り取る 川柳/俳句には、「話題」が必要になります。これは、Web ページからラン

    川柳の自動生成アルゴリズムの紹介(どうしたら 機械で川柳 詠めるかな)
  • Amazon.co.jp: Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit: Bird, Steven, Klein, Ewan, Loper, Edward: 本

    Amazon.co.jp: Natural Language Processing with Python: Analyzing Text with the Natural Language Toolkit: Bird, Steven, Klein, Ewan, Loper, Edward: 本