重複の可能性:
多数のPDFファイルを比較するためのツール?
私は、ビジネスが新年の新しいpdfフォームの束を提供し、改訂メモがまったくないという古典的なシナリオにあり、あなたは前年のものと何が違うのかを理解することになっています。
ここではたくさんのフォームについて話しているので、PDFを比較して違いの概要を説明する方法を見つけようとしています。そのため、人がすべてのフォームを手動で確認する必要はありません。
私の考えは、PDFからすべてのテキストを抽出し、それを.txtにダンプしてから、テキストファイルで違いを実行することでしたが、それは恐ろしいことのように聞こえます。
私の質問はプログラムで言っていますが、PDFを比較し、主に人々の経験からアイデアを得るための信頼できるツールがあれば満足しています。また、プログラムによるソリューションを喜んで受け入れます(C#が望ましいですが、plsはアイデアを出します)。