PDF が (アクセシビリティのために) 「タグ付けされている」かどうかをプログラムで判断することは可能ですか? 私は PHP を使用しており、(可能であれば) PDF ファイルを読み込んで、タグ付けされている場合は true、そうでない場合は false を返したいと考えています。
1338 次
2 に答える
5
公式の ISO PDF-1.7 仕様 (Adobe Web サイトから無料で入手できるコピー) の 574 ページを読みました。
「タグ付き PDF ドキュメントには、Markedエントリの値がtrueのマーク情報ディクショナリ (表 321 を参照) も含まれる必要があります。」
私にとってそれは...
- ...PDF 構造を解析して、
- ...ドキュメント カタログを探す
- ... MarkInfoエントリがあるべき場所
- ...マーク情報辞書の指定
- ...これには、タグ付き PDFのブール値trueを持つMarkedという名前のキーが含まれている必要があります。
于 2012-05-27T16:42:51.800 に答える
3
おそらく、これをさらに進めることができます(すべてのPDF_get_xx関数を確認してください)。こちらも参考にさせていただきます。
これに基づいて:
Characteristics of a properly tagged PDF:
- The PDF file includes a logical reading order for its content
- Images are given correct alternate descriptions
- Tables are correctly tagged to represent the table structure
- Form-fields are authored to promote their utility to screen-readers
- Represents text as Unicode to clear up composition irregularities such as soft
and hard hyphens
さらに進むかもしれません。
于 2012-05-27T16:43:53.663 に答える