差し込み印刷の結果である MSWord ドキュメント (約 40,000) の大規模なコレクションがあります (メイン ドキュメントは同じですが、データ ソースは異なります)。
マージ フィールドの 1 つは、「はい」または「いいえ」というテキストを含むテキスト フィールドです。
どのドキュメントの差し込みフィールドが値「はい」に設定されているかを簡単にリストする方法はありますか? (約10,000件の「はい」の文書を見込んでいます。)
Word 自体、Office オートメーション、バイナリ ファイルの 16 進ダンプと特定の魔法の grep の使用、またはこの種のことを実行できる既製のツール (perl スクリプト、.NET アプリなど) を使用するかどうかに関係なく、あらゆるアプローチに興味があります。 .
ファイルは、Linux と Windows の両方のボックスからアクセスできるネットワーク共有上にあるため (必要に応じて、しばらくの間 Mac を盗むこともできます)、ツールがどのプラットフォームで実行されるかについてはあまり心配していません...