1

大きなテキスト (Word または PDF ドキュメントの約 1000 ページ) を解析し、このドキュメント内のテキストの一部をデータベース フィールドに配置する必要があります。

抽出したいテキストを区別できるのはフォーマットだけであることがわかりました。常に「Helvetica-Condensed」サイズ12です

それをしてもいいですか ?文字列関数の使用方法は知っていますが、フォーマットをテストするには何を使用すればよいですか?

私が言ったように、テキストはワード文書またはPDFの中に保存されています

サードパーティのコンポーネントがある場合は、問題なく実行できます。それを参照してください。

ありがとう

4

2 に答える 2

1

QuickPDFがあります。価格は 249,00 ドルです。

于 2009-11-25T13:46:09.773 に答える
0

もう1つのオプションは、自分でコーディングすることです。ファイルの仕様はオンラインで入手できます。ドキュメントからテキストを取り除こうとしているだけの場合は、ほとんどの場合にこれがガイドになります 。

注意しなければならないのは、完全に画像から作成されたドキュメントだけです。そのシナリオでは(ファイルの読み取りに何を使用するかに関係なく)、OCRタイプのアプリケーションも必要になります。これが当てはまるかどうかを確認するには、テキストを「抽出」するファイルの種類のサンプルを開き、コピーするテキストを選択して、メモ帳に貼り付けてみます。

于 2009-11-25T16:54:51.593 に答える