[解決済み] TesseractとOpenCVのどちらを選べばよいですか？[クローズド］

2023-01-29 07:43:18

質問

最近、私はテッセラクトと OpenCV . Tesseractは本格的なOCRエンジンで、OpenCVはOCRアプリケーション/サービスを作成するためのフレームワークとして利用できるようです。

私はいくつかの画像でTesseractを使ってみましたが、その精度はまずまずのようです。その後、私は非常にシンプルなチュートリアルを見つけ、感銘を受けました。数分で、私はシステムのトレーニングを終え、その精度は良好でした。しかし、もちろん、このアプローチを取ることは、大規模なトレーニングセットを使用してシステムを広範囲にわたってトレーニングする必要があることを意味します。

私の具体的な質問は次のとおりです。

カスタム OCR アプリケーションを構築するために、Tesseract と OpenCV のどちらを選ぶべきでしょうか？
Tesseractには、様々な言語のトレーニングデータセットがあります。OpenCVには同様のものがあり、OCRを実現するためにゼロから始める必要はないのでしょうか？
商用アプリケーションを考えているのですが、どちらが良いでしょうか？

何か提案はありますか？

どのように解決するのですか？

Tesseract は OCR エンジンです。画像からテキストを読み取り、基本的なドキュメントのセグメンテーションを行い、特定の画像入力 (単一の単語、行、段落、ページ、限られた辞書など) で操作するために使用、作業、そして Google によって特別な資金提供が行われています。
一方、OpenCV はコンピュータビジョンのライブラリで、いくつかの特徴抽出とデータ分類を実行できる機能を含んでいます。基本的な OCR を実行する簡単な文字セグメンターと分類器を作成できますが、あまり優れた OCR エンジンではありません (以前 Python で一から作成したことがあります。学習データから逸脱した入力に対しては本当に不正確です）。

OCRがどれだけ難しいか、基本的なことを理解したいのであれば、OpenCVを試してみてください。Tesseractは実 OCRです。

[解決済み] TesseractとOpenCVのどちらを選べばよいですか？[クローズド］

質問

どのように解決するのですか？

関連

[解決済み] 関数デコレータを作成し、それらを連鎖させるには？

[解決済み] プログラムの実行やシステムコマンドの呼び出しはどのように行うのですか？

[解決済み] リストのリストからフラットなリストを作るには？

[解決済み] staticmethodとclassmethodの違いについて

[解決済み] Pythonのリストメソッドであるappendとextendの違いは何ですか？

[解決済み】ネストされたディレクトリを安全に作成するには？

[解決済み】strとreprの違いは何ですか？

[解決済み】画像処理。コカ・コーラ缶」認識のためのアルゴリズム改良

[解決済み】2つの辞書を1つの式でマージする（辞書の和をとる）には？）

[解決済み] Djangoで2つの日付の間を選択する

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

[解決済み] OpenCV-Pythonによる簡単な数字認識OCR

[解決済み] DataFrameに日付間の日数カラムを追加する pandas

[解決済み] 値で列挙名を取得する [重複]。

[解決済み] Pythonで0xを使わずにhex()を使うには？

[解決済み] Django 1.7で初期マイグレーションからマイグレートバックする方法は？

[解決済み] CSVデータを処理する際、1行目のデータを無視する方法を教えてください。

[解決済み] PySparkでデータフレームのカラムをString型からDouble型に変更する方法は？

[解決済み] Pythonの文字列書式をリストで使う

[解決済み] Pythonの文字列の前にあるbという接頭辞は何を意味するのですか？

[解決済み] 新しいpip backtrackingの実行時問題の解決