問題タブ [zero-padding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-3.x - numpy での一般的なパディング加算の最速のソリューション
可変サイズの2つのdim配列を互いに追加する必要があります。これを行うには多くの方法があります!
典型的なサイズは数千×数百です (これはスケーリングに影響を与える可能性があるためです!)。これらの追加を何十万回も実行する必要があります。私の場合、最初の次元は同じであることが保証されていますが、部分配列は可変長です。
より小さな例の作業:
これを行うより速い方法はありますか?私は上記のような他のPythonicソリューションに興味がありますが、複雑さに関係なく本当に最速のものにも興味があります(スピードが主に王様ですが、Cで書くほどではないプロジェクトです)。
neural-network - パディングされたシーケンスを変更された Dataset クラスで正しくパックする方法
そのため、3D numpy 配列と形状の長さを受け取る Dataset クラスを作成しましたpack_padded_sequence
。
独自の ToTensor クラスを作成しました。
しかし、何らかの理由print(list(MyDataset(dataset, data_shape)))
で、パディングが削除されずに通常の Tensor オブジェクトが返されます。
私の入力に関するもう少し詳しい情報はdataset
、次の順序で 3D numpy 配列ですbatch size, sequence length, features
。data_shape はbatch_size
、シーケンスの長さを表す数値とサイズが一致するリストです。
シーケンスの長さも、最大のシーケンスから最小のシーケンス サイズの順です。
私の入力の例:
対応する data_shape: