perl スクリプトで空白ページを検出する信頼できる方法はありますか? getPageText メソッドを使用して、次のスクリプトで実行しようとしました。こうすると、文字がなくグラフィックだけのページも白紙として認識されてしまいます。
#!/usr/bin/perl -w
use CAM::PDF;
my $filename=$ARGV[0];
my $doc = CAM::PDF->new($filename) || die "$CAM::PDF::errstr\n";
my $pages = $doc->numPages();
print $pages;
$content=$doc->getPageText(1);
print "length".length($content);
if(length($content)==0)
{
print "File is empty";
}
foreach my $p ( 1 .. $doc->numPages() ) {
my $str = $doc->getPageText($p);
$str =~ m/[[:alnum:]]+/ms ); # actually returned text
print "Result text:".qq($str);
}
空白のページを見つける別の方法はありますか?