ebookに関するkawaserioのブックマーク (4)

  • OCRはどのように間違いを犯すのか? - 電子化

    さて、JPEG2000に関する小難しい話*1が続いていますので、ちょっと休憩です。 日のお題画像 日は、OCRについて、お話します。 (http://denshika.cc/faq/faq4.phpも参照してください。) OCRの技術を簡単に説明しますと、こんな紙面の画像があるとしますと、 http://chroniclingamerica.loc.gov/lccn/sn83030272/1879-07-01/ed-1/seq-1/ 赤丸の記事に該当する部分を抜き出して、 さらに、1行を抜き出して、 さらに、単語を抜き出して、 さらに、文字単位に切り分けます。 ここまで来たら、各文字が、それぞれ何か、ということを計算します。 普通に1文字づつ計算をしていくと、たとえば、  を  と勘違いしたり、  を  と勘違いしたりします。 なので、上の「PIECES」という単語を と勘違いする可能

    OCRはどのように間違いを犯すのか? - 電子化
  • 新聞電子化とJPEG 2000 その2 - 電子化

    日のお題画像 NDNP(全米電子新聞プロジェクト*1)におけるJPEG2000の詳細を見てみます。このシリーズの概要は、http://d.hatena.ne.jp/denshikA/20091007をご覧ください。 では、さっそく行きまぁす。日、最も重要なことは、項目5ですので、時間のない人は、こちらへすっ飛んでください。 1. The JPEG 2000 file will conform with JP2 file format as specified in ISO/IEC 15444-1:2000 (i.e., JPEG 2000, Part 1). JPEG 2000という規格は、いくつかの種類があります。それをパート○という形でまとめています、今回は「Part 1」に準拠してください、ということです。 2. The JPEG 2000 file will be prepar

    新聞電子化とJPEG 2000 その2 - 電子化
  • SSIMとは何か? その2 - 電子化

    日も、引き続き、画像の圧縮などの話をしましょう。(相変わらず、マニア度高めですが、気にせずに、読み進んでいただければ、おそらく大丈夫です。) 日の課題画像: http://www.cns.nyu.edu/pub/eero/wang03-reprint.pdf 11ページより抜粋 前回は、PSNRというのが「私たちの感覚とは異なる結果を生む」ことがある一方、SSIMというのは「私たちの感覚により近いと評判」だと書きました。 ところが、「私たちの感覚により近い」というのは、一体全体、どんな感じなのでしょうか?もう少しだけ詳しく見てみましょう。この部分を理解しますと、SSIMが身近になると思います*1。 SSIMと言えば、Zhou Wangさんです。さっそく、彼の論文を拝見しましょう。 Image Quality Assessment: From Error Visibility to St

    SSIMとは何か? その2 - 電子化
  • SSIMとは何か? その1 - 電子化

    日は、画像の圧縮などの話をしましょう。(マニア度高めですが、細かいところを気にせずに、読み進んでいただければ、大丈夫だと思います。) *1 上の画像が元の画像だとして、下のどちらが、元の画像に近いと感じますか?(解説は後ほど) (変換A) *2 (変換B)*3 詳しいお話に入る前に、状況を整理しましょう。 今年に入ってから、私のところに、「SSIMって何ですか」という質問が、頻繁に届くようになりました。理由は、いろんな公共機関が大規模な電子化プロジェクトの予算をつけて、 画像のフォーマットとして、JPEG 2000にすること、なおかつ、 SSIMの値を一定水準以上にすること という指定があったからです。 これまでも、JPEG 2000を採用しているプロジェクトはありました。しかし、これまでのプロジェクトは、「PSNRの値を一定水準以上にすること」という指定でした。それが今年あたりから、P

    SSIMとは何か? その1 - 電子化
  • 1