私の仕事では、印刷されたソースコードを取得して、テキストエディタに手動でソースコードを入力する必要がある場合があります。理由を聞かないでください。
明らかに、入力には長い時間がかかり、入力エラーをデバッグするために常に余分な時間がかかります(おっと、そこで「$」記号を見逃しました)。
私は次のようないくつかのOCRソリューションを試すことにしました:
- MicrosoftDocumentImaging-OCRが組み込まれています
- 結果:先頭の空白をすべて見逃し、すべての下線を見逃し、句読文字の多くを誤って解釈しました。
- 結論:手動でコードを入力するよりも時間がかかります。
- さまざまなオンラインWebOCRアプリ
- 結果:MicrosoftDocumentImagingと同等またはそれより悪い
- 結論:手動でコードを入力するよりも時間がかかります。
フォントがサンセリフとモノスペースであることを考えると、ソースコードはOCRするのが非常に簡単だと思います。
ソースコードでうまく機能する優れたOCRソリューションを見つけた人はいますか?
たぶん私はより良いOCRソリューション(必ずしもソースコード固有ではない)が必要ですか?