5

PDF が (アクセシビリティのために) 「タグ付けされている」かどうかをプログラムで判断することは可能ですか? 私は PHP を使用しており、(可能であれば) PDF ファイルを読み込んで、タグ付けされている場合は true、そうでない場合は false を返したいと考えています。

FPDFTCPDFを見てきましたが、どちらもこの情報を抽出できるかどうかはわかりません。

4

2 に答える 2

5

公式の ISO PDF-1.7 仕様 (Adobe Web サイトから無料で入手できるコピー) の 574 ページを読みました。

「タグ付き PDF ドキュメントには、Markedエントリの値がtrueのマーク情報ディクショナリ (表 321 を参照) も含まれる必要があります。」

私にとってそれは...

  1. ...PDF 構造を解析して、
  2. ...ドキュメント カタログを探す
  3. ... MarkInfoエントリがあるべき場所
  4. ...マーク情報辞書の指定
  5. ...これには、タグ付き PDFのブール値trueを持つMarkedという名前のキーが含まれている必要があります。
于 2012-05-27T16:42:51.800 に答える
3

おそらく、これをさらに進めることができます(すべてのPDF_get_xx関数を確認してください)。こちらも参考にさせていただきます。

これに基づいて:

Characteristics of a properly tagged PDF:

    - The PDF file includes a logical reading order for its content
    - Images are given correct alternate descriptions
    - Tables are correctly tagged to represent the table structure
    - Form-fields are authored to promote their utility to screen-readers
    - Represents text as Unicode to clear up composition irregularities such as soft
      and hard hyphens

さらに進むかもしれません。

于 2012-05-27T16:43:53.663 に答える