PDFファイルの空白ページを検出できません。インターネットで検索しましたが、良い解決策が見つかりませんでした。
Itextsharp を使用して、ページ サイズ、Xobjects で試しました。しかし、正確な結果は得られません。
私は試した
if(xobjects==null || textcontent==null || size <20 bytes )
then "blank"
else
not blank
しかし、最大時間は間違った答えを返します。Itextsharpを使用しました
コードは以下のとおりです...私はItextsharp Librabryを使用しています
xobjects の場合
PdfDictionary xobjects = resourceDic.GetAsDict(PdfName.XOBJECT);
//here resourceDic is PdfDictionary type
//I know that if Xobjects is null then page is blank. But sometimes blank page gives xobjects which is not null.
コンテンツストリーム用
RandomAccessFileOrArray f = reader.SafeFile;
//here reader = new PdfReader(filename);
byte[] contentBytes = reader.GetPageContent(pageNum, f);
//I have measured the size of contentbytes but sometimes it gives more than 20 bytes for blank page
テキストコンテンツ用
String extractedText = PdfTextExtractor.GetTextFromPage(reader, pageNum, new LocationTextExtractionStrategy());
// sometimes blank page give a text more than 20 char length .