[解決済み] テッセラクトOCRの精度を向上させる画像処理
2022-04-21 21:09:39
質問
tesseractを使って文書をテキスト化しています。文書の品質にはばらつきがあり、どのような画像処理をすれば結果が良くなるのか、ヒントを探しています。例えば、FAXで作成されたような高ピクセルなテキストは、tesseractでは特に処理が難しいことに気づきました。
どのような画像処理技術を使えば精度が上がるのでしょうか?ガウスぼかしを使ってピクセルのような画像を滑らかにすることで、少しは改善されましたが、もっと具体的に良い結果が得られるようなテクニックがあればいいなと思います。例えば、白黒画像に特化したフィルターで不規則なエッジをなめらかにし、さらにコントラストを高めてキャラクターをより鮮明にするようなフィルターです。
画像処理の初心者のために、一般的なコツを教えてください。
解決方法は?
- DPIを修正する(必要な場合) 300DPIが最小です。
- テキストサイズを修正する(例:12ptでOK)
- テキストの行を修正してみる (テキストの傾き補正と歪み補正)
- 画像の明るさを調整する(例:画像に暗い部分がない)。
- 画像の2値化、ノイズ除去
すべてのケースに適合する万能のコマンドラインはありません(画像をぼかしたり、シャープにしたりする必要がある場合もあります)。しかし、以下のコマンドを試してみてください。 TEXTCLEANER (フレッドのImageMagickスクリプト) .
コマンドラインが苦手な方は、オープンソースの scantailor.sourceforge.net または商用 ブックレストア .
関連
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン