delphi - フォーマット（フォント名とサイズ）に基づいて単語またはPDFからテキストを抽出する

Question

大きなテキスト (Word または PDF ドキュメントの約 1000 ページ) を解析し、このドキュメント内のテキストの一部をデータベースフィールドに配置する必要があります。

抽出したいテキストを区別できるのはフォーマットだけであることがわかりました。常に「Helvetica-Condensed」サイズ12です

それをしてもいいですか？文字列関数の使用方法は知っていますが、フォーマットをテストするには何を使用すればよいですか?

私が言ったように、テキストはワード文書またはPDFの中に保存されています

サードパーティのコンポーネントがある場合は、問題なく実行できます。それを参照してください。

ありがとう

score 1 · Accepted Answer

1

QuickPDFがあります。価格は 249,00 ドルです。

于 2009-11-25T13:46:09.773 に答える

score 0 · Accepted Answer

もう1つのオプションは、自分でコーディングすることです。ファイルの仕様はオンラインで入手できます。ドキュメントからテキストを取り除こうとしているだけの場合は、ほとんどの場合にこれがガイドになります。

注意しなければならないのは、完全に画像から作成されたドキュメントだけです。そのシナリオでは（ファイルの読み取りに何を使用するかに関係なく）、OCRタイプのアプリケーションも必要になります。これが当てはまるかどうかを確認するには、テキストを「抽出」するファイルの種類のサンプルを開き、コピーするテキストを選択して、メモ帳に貼り付けてみます。

delphi - フォーマット（フォント名とサイズ）に基づいて単語またはPDFからテキストを抽出する

2 に答える 2

Related

Reference