タグ

ocrに関するmochyのブックマーク (3)

  • Google DocsのOCR変換機能が日本語に対応

    PDFファイルやスキャナで読み込んだ文書の画像ファイルをGoogle Docsにアップロードすると、編集可能なテキストファイルに変換できる機能が横書きの日語に対応した。 米Googleは2月28日(現地時間)、昨年6月にGoogle Docsに追加したOCR(光学式文字認識)機能を、新たに日語を含む29カ国語に対応させたと発表した。日語のPDFやスキャナやデジカメで取り込んだ文字を含む画像をGoogle Docsにアップロードすると、ファイルがテキストデータに変換される。 使い方は、Google Docsの「アップロード」の画面で変換オプションを以下のように設定し、「アップロードを開始」をクリックする。変換が可能なファイル容量の上限は2Mバイトだ。 実際にやってみたところ、PDFではほぼ問題なくテキストに変換されたが、デジカメで撮影した画像からの変換の精度はまだ高いとはいえないようだ

    Google DocsのOCR変換機能が日本語に対応
  • ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています

    おっと。また大袈裟なタイトルつけちゃって。 釣り << なんて言われないように、気合い入れて書かなくっちゃ。 さて、先週のエントリー「裁断機 PK-513L でを 100冊裁断してみた - 経験した 9つの失敗とその回避方法」が大きな反響をいただいたので、今回は裁断の次のステップである「スキャン」を攻略。ScanSnap S1500 の設定についていろいろと調べてみました。 *目次というか、いきなり結論から 書いていったら結構長くなってしまったので、とりあえず目次。というかほとんど結論なんですが、結論だけ見られればいいやという方のためにも。 **(2010年7月9日 追記) 自炊した電子書籍PDF)を iPad でサクサク表示する方法(サンプル動画あり) << **(2010年8月13日 追記) OCR テキスト認識に限らず、ScanSnap S1500 の設定全般についてもまとめてみ

    ScanSnap S1500 の「OCR テキスト認識」に関する 15 の真実 - おいちゃんと呼ばれています
  • 窓の杜 - 【NEWS】独自エンジンを搭載したフリーの日本語OCRソフト「SmartOCR Lite Edition」

    独自エンジンで画像から文字を認識し、Word/ExcelファイルやRTF/HTML/CSV/PDF形式で保存できる日語OCRソフト「SmartOCR Lite Edition」v1.0.3が、17日に公開された。Windows XP/2000に対応するフリーソフトで、現在作者のホームページからダウンロードできる。 「SmartOCR Lite Edition」は、独自のエンジンを搭載したOCRソフト。スキャナー画像やBMP/TIFF/JPEG/PNG/GIF/WMF/EMF形式のファイルから読み取った文字情報をテキスト文字列に変換してTXTファイルとして保存できるほか、元画像のレイアウトや表組みを保持したWord/ExcelファイルやRTF/HTML/CSV/PDF形式でも保存できる。また元画像にテキスト情報を埋め込み、画像を選択してテキストコピーしたり文字列検索ができる“透明テキストつ

    mochy
    mochy 2005/11/29
  • 1