ABCPdf.NETツールを使用してPDFファイルからコンテンツテキストを抽出するにはどうすればよいですか?
GetTextメソッドを試しましたが、内容が抽出されません。
var doc = new Doc();
var url = @".../FileName.pdf";
doc.Read(url);
string xmlContents = doc.GetText("Text");
Response.Write(xmlContents);
doc.Clear();
doc.Dispose();
私のPDFにはほぼ1000語が含まれていますが、GetTextは4〜5語しか返しません。最初のページのテキストのみが返されることに気づきました。
したがって、質問は「PDFファイルのすべてのページからテキストを抽出する方法」である必要があります。-(タイトルを変更してわかりやすくしました)。
ありがとう、