caffe - Caffe: ブロブに期待される lmdb データ構造を理解する

Question

Caffe でデータがどのように解釈されるかを理解しようとしています。そのために、Minst チュートリアルを参照しました。入力データの定義を見てみましょう。

layers {
  name: "mnist"
  type: DATA
  data_param {
    source: "mnist_train_lmdb"
    backend: LMDB
    batch_size: 64
    scale: 0.00390625
  }
  top: "data"
  top: "label"
}

mnist_train_lmdb を見て、エントリの 1 つを取得しました (16 進数で表示):

0801101C181C229006
00000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000
00000000000000000000000000000000000000000000000000000000
00000000000054B99F973C2400000000000000000000000000000000
000000000000DEFEFEFEFEF1C6C6C6C6C6C6C6C6AA34000000000000
00000000000043724872A3E3FEE1FEFEFEFAE5FEFE8C000000000000
000000000000000000000011420E4343433B15ECFE6A000000000000
00000000000000000000000000000000000053FDD112000000000000
000000000000000000000000000000000016E9FF5300000000000000
000000000000000000000000000000000081FEEE2C00000000000000
000000000000000000000000000000003BF9FE3E0000000000000000
0000000000000000000000000000000085FEBB050000000000000000
00000000000000000000000000000009CDF83A000000000000000000
0000000000000000000000000000007EFEB600000000000000000000
00000000000000000000000000004BFBF03900000000000000000000
0000000000000000000000000013DDFEA60000000000000000000000
00000000000000000000000003CBFEDB230000000000000000000000
00000000000000000000000026FEFE4D000000000000000000000000
00000000000000000000001FE0FE7301000000000000000000000000
000000000000000000000085FEFE3400000000000000000000000000
000000000000000000003DF2FEFE3400000000000000000000000000
0000000000000000000079FEFEDB2800000000000000000000000000
0000000000000000000079FECF120000000000000000000000000000
00000000000000000000000000000000000000000000000000000000
2807

(「7」の数字が見えるように、ここに改行を追加しました。)

今私の質問は、このフォーマットがどこに記述されているのですか? または別の言い方をすれば、最初の 36 バイトが何らかのヘッダーであり、最後の 8 バイトが何らかのラベル対応を持っていると定義されている場所はどこですか?

独自のデータを構築するにはどうすればよいですか? Blob TutorialもLayers Definitionも、必要なフォーマットについてあまり教えてくれません。私の意図は、画像データではなく、時系列を使用することです

ありがとう！

score 2 · Accepted Answer

2 番目の質問にお答えします。Caffe は lmdb、hdf5 などの選択された形式のデータのみを取得するため、データをこれらの形式に変換 (または合成データの場合は生成) することをお勧めします。次のリンクがこれに役立ちます。import hdf5Python で問題がある場合は、このページを参照してください。

Python で LMDB ファイルを作成する

Python での HDF5 ファイルの作成

HDF5 その他の例

caffe - Caffe: ブロブに期待される lmdb データ構造を理解する

2 に答える 2

Related

Reference