説明と「キーワード」を含む TIFF ファイルが多数あります (OS X では、ファイル インスペクターで用語として使用されます)。ただし、画像からこのメタデータを収集するのは困難です。
tifffile.py、PILの exif コマンド、およびIPTCInfoを使用してみましたが、 tifffile.pyは説明を取得しますが、これらのライブラリのいずれかを使用してファイルから「キーワード」を解析できないようです。
キーワードは、JPEG とは異なる TIFF の「仕様」を使用して保存されますか? これらのキーワードを解析する最善の方法は何でしょうか?
編集
からのコメントabarnert
に加えて、TIFF ファイルの 1 つをテキスト エディターで開いたところ、「キーワード」を含む XML データがあることがわかりました。以下のスニペット:
...
<rdf:Description rdf:about=""
xmlns:dc="http://purl.org/dc/elements/1.1/">
<dc:description>
<rdf:Alt>
<rdf:li xml:lang="x-default">OLYMPUS DIGITAL CAMERA</rdf:li>
</rdf:Alt>
</dc:description>
<dc:format>image/tiff</dc:format>
<dc:subject>
<rdf:Bag>
<rdf:li>Foo</rdf:li>
<rdf:li>Bar</rdf:li>
<rdf:li>A long keyword</rdf:li>
</rdf:Bag>
</dc:subject>
</rdf:Description>
...
これはバイナリ表現として格納できるように見えます。tifffile.py には、本質的に整数のタプルである多数のタグがリストされています。ただし、これを変換する方法がわかりません。提案?