問題タブ [zero-padding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
24 参照

python-3.x - numpy での一般的なパディング加算の最速のソリューション

可変サイズの2つのdim配列を互いに追加する必要があります。これを行うには多くの方法があります!

典型的なサイズは数千×数百です (これはスケーリングに影響を与える可能性があるためです!)。これらの追加を何十万回も実行する必要があります。私の場合、最初の次元は同じであることが保証されていますが、部分配列は可変長です。

より小さな例の作業:

これを行うより速い方法はありますか?私は上記のような他のPythonicソリューションに興味がありますが、複雑さに関係なく本当に最速のものにも興味があります(スピードが主に王様ですが、Cで書くほどではないプロジェクトです)。

0 投票する
0 に答える
43 参照

neural-network - パディングされたシーケンスを変更された Dataset クラスで正しくパックする方法

そのため、3D numpy 配列と形状の長さを受け取る Dataset クラスを作成しましたpack_padded_sequence

独自の ToTensor クラスを作成しました。

しかし、何らかの理由print(list(MyDataset(dataset, data_shape)))で、パディングが削除されずに通常の Tensor オブジェクトが返されます。

私の入力に関するもう少し詳しい情報はdataset、次の順序で 3D numpy 配列ですbatch size, sequence length, features。data_shape はbatch_size、シーケンスの長さを表す数値とサイズが一致するリストです。

シーケンスの長さも、最大のシーケンスから最小のシーケンス サイズの順です。

私の入力の例:

対応する data_shape: