1

PDF レンダラーを使用して解析しようとしている PDF ファイルがあり、次の問題があります。

(1) 一部の名前ツリーには、下限または上限のいずれかが NULL で定義された制限があります。仕様では、それらの処理方法について実際には何も述べていません。

(Intermediate and leaf nodes only; required) An array of two strings, specifying
the (lexically) least and greatest keys included in the Names array of a leaf 
node or in the Names arrays of any leaf nodes that are descendants of an
intermediate node. 

したがって、基本的に、境界のいずれかが null の場合は範囲​​が開いていると想定しています。両方の制限が null の場合は、名前のキーを見つけようとします。この仮定は正しいですか?

(2) (1) からの仮定を行うときの同じ PDF ファイルでは、探しているキーが制限によって定義された範囲に収まる場合でも、キーは存在せず、次の子供たちを見る必要があります。これはまだ正しいと思いますか?

(3) 最後に、同じ PDF ファイル内

key1 value1 key2 value2 ... keyn valuen

仕様で定義されたシーケンスですが、値で始まります:

value0 key1 value1 ... keyn valuen

値で終了します。したがって、この場合、マッピングが間違っている可能性があるため、最初の値をスキップします。繰り返しますが、正しいですか?

私の推測は次のとおりです。

  • PDFの形式が正しくありません
  • ライブラリを完全に混乱させ、上記の症状を引き起こす1.6の機能を使用しているか

既存のコードを壊さずに、問題の PDF ファイルを処理するようにライブラリを変更したいと考えています。

更新: この問題を修正するために、最終的に上記のすべてに対処するのではなく、別の場所で問題に対処することにしました。この問題はもともと、アウトラインでアクションを読み取るときに発生しました。これで、おそらく「障害のある」アクションは単純に無視されます。対応パッチです。

4

0 に答える 0