問題タブ [downsampling]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1537 参照

python - float と int のウィンドウ サイズを使用して平均化することにより、1D 配列の値をダウン サンプリングするにはどうすればよいですか?

平均法を使用して、固定[Mx1]ベクトルを任意の[Nx1]次元にダウンサンプリングしようとしています。必要な出力配列に応じて毎回変化する動的なウィンドウ サイズがあります。そのため、場合によっては、幸運にもウィンドウサイズに完全に適合する int のウィンドウサイズを取得し、ウィンドウサイズとして浮動小数点数を取得することもあります。しかし、浮動サイズのウィンドウを使用して、固定[Mx1]ベクトルから[Nx1]サイズのベクトルを作成するにはどうすればよいですか?

以下は私が試したコードです:

出力:

上記の例では、[Mx1] ([400x1])ベクトルをNx1 ([140x1])次元でダウンサンプリングする必要があります。したがって、動的にウィンドウ サイズ[2.857x1]を使用して[Mx1] vector をダウンサンプリングできます。しかし、この場合、 [140x1] ではなく[200x1]のベクトルを出力として取得しています。これは、-> [2x1]でダウンサンプリングされた小麦粉 (2.85)に発生するフローティング ウィンドウのためです。私のウィンドウサイズは新しい[Nx1]次元にぴったりなので、パディングはゼロです。では、 [Mx1]ベクトルをダウンサンプリングするために、そのようなタイプのウィンドウ サイズを使用する方法はありますか?

0 投票する
1 に答える
134 参照

python-3.x - スピーチデータのscipy配列をAdobe Auditionで読み取り可能なASCIIテキストにエクスポートする

scipy.signal の wav 読み取り機能を使用して、48khz、16 ビット精度の PCM 音声データを読み取りました。

次に、次の手順を順番に実行します: デシメーション -> 正規化

間引きと正規化は、次の手順を使用して行われます。

私のデシメートされた(またはダウンサンプリングされた)信号は16khzであると想定されています(したがって、上記のようにダウンサンプリング係数は3です)。ここで、正規化されたダウンサンプリングされた numpy 配列 normtimeSerDownSmpldSig を Adob​​e Audition で表示したいと考えています。

Python および/または Adob​​e オーディションで実行する必要がある手順は何ですか? scipy の savetxt 関数を使用して、上記の配列を Adob​​e Audition で表示するにはどうすればよいですか?

私の yiir シグナル値は次のようになります。

Adobe audition での使用に関する情報 ### このリンク (45 ページ) -

http://www.newhopechurch.ca/docs/tech/AUDITION.pdf

以下を与えます:

ASCII テキスト データ (.txt) オーディオ データは、標準のテキスト形式でファイルに読み書きできます。各サンプルはキャリッジ リターンで区切られ、チャンネルはタブ文字で区切られています。オプションのヘッダーをデータの前に配置できます。ヘッダー テキストがない場合、データは 16 ビットの符号付き 10 進整数であると見なされます。ヘッダーは KEYWORD: value としてフォーマットされ、キーワードは SAMPLES、BITSPERSAMPLE、CHANNELS、SAMPLERATE、および NORMALIZED です。>NORMALIZED の値は、TRUE または FALSE のいずれかです。たとえば、SAMPLES: 1582 BITSPERSAMPLE: 16 CHANNELS: 2 SAMPLERATE: 22050 NORMALIZED: FALSE 164 -1372 492 -876 など... オプション 次のいずれかを選択します。 •Include Format Header は、データの前にヘッダーを配置します。•Normalized Data は、データを -1.0 から 1.0 の間で正規化します。

0 投票する
0 に答える
237 参照

python - kivy/python で画像をダウンスケールして良い結果を得るにはどうすればよいですか?

ソースよりも小さいサイズで画像を表示しようとしていますが、これを達成しましたが、1080p 以外の解像度では品質がひどいものです。これまでの私のコードは次のとおりです。

そこで、Richard Jones の例を使用して、画像を使用しているユーザーの画面サイズに基づいて画像のサイズを設定しています。これは 1920 x 1080 で実行すると完璧に動作しますが、Window.size を 720p に切り替えると、縮小された画像に非常に多くのノイズが含まれており、見栄えが悪くなります。Ivied は mag_filter に linear とnearest を使用し、カードのサイズを dp(210.9) と dp(240) に設定しようとしましたが、結果は同じでした。さまざまな解像度またはこれを機能させる方法を説明するドキュメントを使用して、kivy でスケールダウンするより良い方法を知っている人はいますか? 元の画像サイズは 746 x 1037 です。

0 投票する
2 に答える
1832 参照

neural-network - 最大プーリング vs. ゼロ パディング: 空間情報の損失

畳み込みニューラル ネットワークに関しては、通常、さまざまな戦略を推奨する多くの論文があります。畳み込みの前に画像にパディングを追加することが絶対に必要であると人々が言うのを聞いたことがあります。そうしないと、多くの空間情報が失われます。一方、画像のサイズを縮小するために、プーリング (通常は最大プーリング) を喜んで使用します。ここでの考えは、最大プーリングは空間情報を減らしますが、相対的な位置に対する感度も低下させるので、トレードオフですか?

ゼロパディングはより多くの情報を保持するのではなく、空のデータを保持するだけだと他の人が言っているのを聞いたことがあります。これは、ゼロを追加すると、情報の一部が欠落している場合にカーネルからの反応が得られないためです。

エッジに「スクラップ値」を持つ大きなカーネルがあり、活性化のソースがカーネルの小さな領域に集中している場合、ゼロパディングが機能すると想像できますか?

パディングを使用せずにプーリング コントラを使用したダウンサンプリングの効果に関する論文をいくつか読んでみたいと思いますが、それについてはあまり見つけられません。良い推奨事項や考えはありますか? 畳み込みコントラ プーリングを使用した空間ダウンサンプリング

図: 畳み込みコントラ プーリングを使用した空間ダウンサンプリング (Researchgate)

0 投票する
1 に答える
3529 参照

c++ - libswresample: swr_convert() が十分なサンプルを生成していません

C++ アプリケーションでストリーミング オーディオをリサンプリングするために ffmpeg/libswresample を使用しようとしています。サンプル幅の変更はうまく機能し、結果は期待どおりに聞こえます。ただし、サンプル レートを変更すると、結果がやや不安定になります。libswresample ライブラリの使い方が間違っているのか、リサンプリング理論を誤解しているのかはわかりません。

デモンストレーションのために簡略化した、私のリサンプリング プロセスを次に示します。

リサンプリングされたオーディオが正しく聞こえない理由は、 swr_convert()112 が返されるためだと思われます。ここで、128 (リサンプリングされたオーディオのサンプル数) が返されると予想されます。 128 のサンプル、まだswr_convert()112 のサンプルを生成しています。オーディオの長さで表現すると、これも不可解です。44100 では 256 サンプル = 5.8 ミリ秒ですが、22050 では 112 サンプル = 5.07 ミリ秒です。ダウンサンプリング プロセスは、リサンプリングされたオーディオの長さを変更すべきではありませんか?

また、swr_convert() が予想よりも小さい数値を返す ffmpeg で提供されている例も確認しました。したがって、問題は libswresample のバグではなく、私の理解不足によるものだと思われます。

0 投票する
1 に答える
497 参照

matlab - 2 つのベクトルを同じ長さにする

次の問題があります。

2 つのデータ ベクトルv1 (長さN1= 13812 ) とv2 (長さN2=60002021 ) があります。補間 bzw を使用して、両方のベクトルを同じ長さN3にする必要があります。ダウンサンプリング、要件: 2xN1。

誰か助けてくれませんか?私の考えは、interpinterp1、およびdownsample を使用して問題を解決することでした。それは正しいアプローチですか?