GyaimというIMEです。Rubyで数百行で書かれたものですが、実用的に使うことができます。https://github.com/masui/Gyaimこれ単体では既存のIMEに対する優位性はありません。「自分のIMEを簡単に作れること」がメリットです。
Sekka(石火): SKK like Japanese input method Sekka(石火)はkiyokaが開発中のSKKライクな日本語入力メソッドです。現在はEmacs専用です。 特徴 モードレス Sekkaには日本語入力モードという概念がありません。Emacsのカーソル位置のローマ字を(Ctrl+J)キーで直接、漢字変換できます。 SKKライク 入力するローマ字表記ルールはSKKに近いルールを採用していますので、SKKユーザーは簡単にSekkaで文章を入力することができるでしょう。 ミスタイプ許容 ローマ字表記の揺れ(siとshi、nとnnなどの混在)や少々のローマ字のミスタイプは曖昧辞書検索によって救済されます。 Kanji => "漢字" Kannj => "漢字" Funiki => "雰囲気" fuinki => "雰囲気" Shizegegosor => "自然言語
Google 日本語入力のソースコードが公開されたらしい。Mozc (もずく)という名前だそうで。オフィシャルブログだけではなく、Twitter でもものすごい勢いで伝播していたようだが、すごい食いつきである。そして、公開されるやいなや読んだ人もたくさんいるようで、そちらもすごいなと思う。日本語入力エンジンのソース読む人なんて、ほとんどいないと思っていたのだが、逆にこんなに日本語入力って注目されるんだ、と嬉しい気持ちである(でも日本語入力エンジン作る人が増えたりはしないのかもしれない)。 そんな感じでいち早くソースコード読まれた @tkngさんがMozc(Google日本語入力)のコードを読んだメモを公開してくださった。ありがたい。変換アルゴリズムは、挙動から考えてそうだろうな、と思っていたのと同じだった。変換履歴を用いたリランキングをするところがなかなか難しいのだが、@tkng さんも手
ブラウザから使える IME としては AjaxIME が有名ですが、AjaxIME よりは仮名漢字変換モデルをがんばっているので、多少精度がよいようです。 ATOK 2007 はたまたま失敗する事例ばかり集めているので悪く見えますが、 普段はもっとよいですね。言語モデルを Web コーパスから作り、仮名漢字 変換モデルを新聞記事から作っているので、上記4つの硬い文は ChaIME でも正しく変換できることは予測可能ですが、下記4つは難しいです。 このような文体で書かれたコーパス(ブログデータ?)から仮名漢字変換モデル を学習するとうまく行くかもしれません。 統計的仮名漢字変換 統計的仮名漢字変換について ページを分けました。 既知の問題点(優先度順) unigram によるバックオフ(辞書引き回数が減る) 仮名漢字モデルの Google 日本語 N グラムからの推定 現在2GBの辞書サイズ
MacUIM ダウンロード 安定版 (安定してないけど) SourceForge.jp: MacUIM からダウンロードしてください。 Mac OS X Tiger(PowerPC)のみに対応しています。 Intel Macでは動作しません。 開発版 ユニバーサルバイナリにしたけれどIntel Macでしか動作しないバージョンをここに置いておきます。 ダウンロード MacUIM-0.5.1-1.dmg size: 22.43MB md5sum: 38ff2867b99f279f1a190f84df78f83f かな入力ご使用の方は こちらのpatch を当てて使用してください。 PPCで動作確認できたのち、正式バージョンをリリースする予定です。 Intel/PPCで動作するバージョンがこちらで配布されています。 Anthy-dev 3422 Re: wikiのコーパス用例文収集 http:
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く