問題タブ [attention-model]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
937 参照

tensorflow - 変数スコープで LSTM 層と変数を再利用する方法 (注意メカニズム)

コードで重みを共有したいという問題がありますlstm_decoder(したがって、基本的に LSTM を 1 つだけ使用します)。それに関するオンラインのリソースがいくつかあることは知っていますが、以下が重みを共有しない理由をまだ理解できません。

ループの反復ごとに同じ LSTM セルと同じ W_target を使用したいと考えています。ただし、ループ内で window_size = 2 の場合print(initial_input, last_encoder_state)とforで次の出力が得られます。print(W_target)

更新:マキシムのコメントの後、次の構文を試しました

変数 W_target を適切に共有するようになりましたが、lstm セル/重みの共有にはまだ問題があります。

0 投票する
1 に答える
754 参照

tensorflow - カスタマイズされたデータセットでテンソルフロー Attention-ocr をトレーニングするためのパイプラインは何ですか?

Attention-ocr に関する stackoverflow に関するいくつかの質問を読みましたが、そのほとんどは特定のステップの実装の詳細に関するものです。私が知りたかったのは、独自のデータセットでこのモデルを微調整するためのパイプラインです。

私の知る限り、手順は次のとおりです。

0) 最初に FSNS データセットをダウンロードする必要がありますか?? この手順をバイパスして、1 つのイメージだけで推論を実行しようとしましたが、常にエラーが表示されます:「ImportError: 'fsns という名前のモジュールはありません」。したがって、独自のデータセットを設定すると、このエラーは解消されるのでしょうか。

1) データを FSNS と同じ形式で保存します。(このトピックに関するリンク: How to create dataset in the same format as the FSNS dataset?</a>, how to create cutomized dataset for google tensorflow Attention ocr? )

2) トレーニング済みのチェックポイントをダウンロードします ( http://download.tensorflow.org/models/attention_ocr_2017_08_09.tar.gz )

3) 「model.py」を自分の目的に合うように修正します。

4) なんらかの方法で「train.py」を変更して、tensorflow サービングを使用して独自のモジュールをトレーニングします。

私はまだこのプロジェクトの初期段階 (独自のデータセットの作成) にあり、その方法と次の段階について混乱しています。