情景文字認識(Scene Text Detection)関連のメモ
スポンサーリンク
ただのメモ書きです。研究がしたいわけではないです。
適当に見つけたというか、観測範囲で遭遇したもの。全然網羅できていないです。
ERFilter以外にもいろいろありますねってことで。
お手軽に使えて決定打という感じのがあるといいのに。
情景文字認識とは
英語だとScene Text Detector。交通標識とか看板とか、日常生活で目にする風景にある文字の検出、認識。
号数忘れたけどWeb+DBのバックナンバーにも解説記事。
EAST: An Efficient and Accurate Scene Text Detector
- 論文:[1704.03155] EAST: An Efficient and Accurate Scene Text Detector
- 実装:argman/EAST: A tensorflow implementation of EAST text detector
以下、参考になりそうな利用例。
SWT
Microsoftの研究所の開発したアルゴリズム。Python用のライブラリもある。
特許とかそのへんは不明。
ERFilter
もともとは画像の回転検出用?
パラメーターの調整方法がよくわからないので試してない。
ドキュメント:Scene Text Detection — OpenCV 3.0.0-dev documentation
contlibのモジュールだったはず。
データセット
自由には使え無いと考えたほうが良さそう。
- The Street View House Numbers (SVHN) Dataset
- The Street View Text Dataset - TC11
- NEOCR: Natural Environment OCR Dataset - TC11
- Introduction - ICDAR 2017 RobustReading Competition
ICDARに関しては過去のイベントのページにもデータセットがある(2013、2011)*1。
検索するとOPU-JST-1というのがヒットするけど入手方法は不明*2。
そのほかリンク集
- Natural scene text detection using opencv & machine learning (SVM)
- Deep Learning based Text Recognition (OCR) using Tesseract and OpenCV | Learn OpenCV
そのほか
良さそうなページを見つけたら追加します。
詳解 OpenCV 3 ―コンピュータビジョンライブラリを使った画像処理・認識
- 作者: Gary Bradski,Adrian Kaehler,松田晃一,小沼千絵,永田雅人,花形理
- 出版社/メーカー: オライリージャパン
- 発売日: 2018/05/26
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
- 作者: 原田達也
- 出版社/メーカー: 講談社
- 発売日: 2017/05/25
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る