TensorFlow でニューラル ネットワークを使って実験を行っています。最新バージョンのリリース ノートによると、DataSet は今後、入力データを提供するための推奨される API です。
一般に、外界から数値を取得する場合、値の範囲を正規化する必要があります。長さ、質量、速度、日付、時間などの生の数値を差し込むと、結果として生じる問題は悪条件になります。値のダイナミック レンジを確認し、範囲(0,1)
またはに正規化する必要があります(-1,1)
。
これはもちろん生の Python で行うことができます。ただし、DataSet は多数のデータ変換機能を提供し、その使用を奨励しています。これは、結果として得られるコードが保守しやすくなるだけでなく、実行速度も向上するという理論に基づいています。これは、正規化のための組み込み機能も必要であることを示唆しています。
https://www.tensorflow.org/programmers_guide/datasetsのドキュメントを見てみると、そのような言及は見当たりません。何か不足していますか?これを行うための推奨される方法は何ですか?