問題タブ [lmdb]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
classification - Caffe は負の損失値を生成します (lmdb を使用したマルチラベル分類)
lmdb データベースに基づいて複数のラベルを分類しようとしています。2 つの異なるデータベースを作成します。1 つは画像自体用で、もう 1 つはラベル用です。私の意図は、水平方向と垂直方向の角度に 2 つの異なるラベルを付けることです。つまり、label1 [0-360] label2 [0-360] です。
そうするために、私のコードは次のとおりです。
私は次のようにtrain.txt
見えます:とは整数です。/path/to/image label1 label2
label1
label2
私train_val.prototxt
はこのように見えます:
TEST フェーズの部分は同じです
私の損失レイヤーは次のようになります。
lmdb - lmdb: 残りの空き容量を確認する方法は?
lmdb 環境を作成するときに、マップ サイズを指定できます。どの時点でマップ サイズがどれだけ使用されているかを判断する方法はありますか?
つまり、容量不足の問題が発生する前に対処できるようにするには、空き容量がどれだけ残っているかを調べる必要があります。
私が考えることができる唯一のことは、すべてのデータベースを調べて、mdb_env_stat を使用してブランチ、リーフ、およびオーバーフロー ページの数を取得することです。すべてのデータベースを合計し (ページ サイズを掛ける)、現在のマップ サイズと比較します。これは、使用済みスペースを計算する正しい方法ですか?
python - CaffeなしでPythonでLMDBから画像をロードするには?
作成した LMDB データベースから画像とラベル データをロードしたいと考えています。対応するイメージとラベルのペアに一意のキーを割り当て、それらを LMDB に追加します (例: image-000000001、label-000000001)。画像を保存する際に、 を使用して画像の numpy-array を文字列に変換しますimage.tostring()
。LMDB をロードしているときに、生成したキーを渡すだけで非常に簡単にラベルを取得できることがわかりますが、画像データはエンコードされた方法で表示されます。をしてもうまくいきnumpy.fromstring(lmdb_cursor.get('image-000000001'))
ません。
ここに表示されます-具体的には@Ghilas BELHADJによる2番目の回答は、 Caffe-datumオブジェクトを使用して最初にデータをロードし、次にを使用して画像をフェッチする必要がありますdatum.data
。しかし、「データ」タグと「ラベル」タグを使用して画像とラベルを整理するような構造はありません。PythonでそのようなLMDBからnumpy画像の形式でデータを正しく読み取るにはどうすればよいですか?
Lua では、これは次のように実現できます。
Pythonでこれを行う方法がわかりません。
machine-learning - NVIDIA DIGITS - 複数の入力レイヤー
NVIDIA DIGITS フレームワークについて質問があります。だから私は DIGITS なしでカフェを使用しており、これまで HDF5 レイヤーを使用してきました。複数の「トップ」(data_0、data_1、data_2) 入力を使用できます (以下のコードを参照)。そのため、ネットに複数の入力画像を供給することができました。ただし、DIGITS では lmdb 入力レイヤーのみが機能します。
複数の入力画像を含む lmdb 入力レイヤーを作成することは可能ですか??
caffe - LMDB データベースの作成中にグレースケール画像を転置する必要はありますか?
一連の画像と一連のグラウンド トゥルース画像を LMDB データベースに変換しています。目的はピクセル単位の予測です。CxHxW
RGB 画像から LMDB を作成するためのほとんどのコードには、次のように順番に転置を示す行があります。
画像データ (トレーニング データと対応するグラウンド トゥルース画像の両方) はグレースケール (つまり、単一チャネル) です。私の質問は、この行の目的は何single channel
ですか?画像とグラウンドトゥルースに対してこの行列転置を行うべきですか、それとも必要ありませんか?
あなたの助けに感謝します。
python - Python を使用して LMDB にエンコードされたファイルとして画像を挿入する
次のスニペットを使用して、大量の画像を LMDB 形式に挿入しようとしています。
ただし、圧縮されていないバイトがディスクに書き込まれるため、結果のファイルは非常に巨大です!! したがって、PythonでencodingプロパティをJPGに設定するにはどうすればよいのでしょうか。私は、まさにそのオプションが C++ api で利用可能であることをすでに認識しています。
前もって感謝します