問題タブ [audacity]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
fft - Octave (Matlab): スペクトル計算
FFT を使用した Octave でのスペクトル計算に関する別の質問:
Audacity を使用して、ホワイト ノイズを含む .wav ファイルを作成し、fcut = 1kHz、-20dB/decade のローパスでフィルター処理しました。Audacity によって分析されたスペクトルは予想どおりに見えます (残念ながら、十分な評判がないため、画像を投稿できません)。
次に、次のコードを使用して、Octave でスペクトルを分析しました。
Octave によって作成されたプロットは非常に「滑らか」ではなく、隣接する 2 つのポイント間の差が 10dB を超える可能性があるため、-20dB/decade を適切に認識できません。1kHz のカットオフ周波数は推測でしかありません。
Audacityで行われているように「滑らかな」スペクトルを取得する方法を知っている人はいますか(これは合理的な解決策であると思います)?
フィリップ
ios - 目標 c の音声ファイル形式の問題
AVAudioRecorder を使用してオーディオ WAV (自分の声を録音した) ファイルを作成しました。最終的なファイル形式は WAV ファイルです。ファイルが正常に保存され、自分の声が聞こえます。このファイルをバックエンド サーバー (Web サービス) に送信したいと考えています。しかし、私のサーバーは WAV のデータと FMT 情報のみを受け入れます。FLLR、データ、FMT を含む wav ファイル情報が原因で、wav ファイルを受け付けません。Riffpad ツールで WAV ファイルの情報を確認しました。FLLR、データ、FMTを表示しています。しかし、データと fmt だけが必要です。私のサーバー側はデータと FMT のみを受け入れるためです。プログラムでwavファイルのFLLRを削除する方法を教えてください。
レコードのソース コード:
audio - コマンドラインで audacity をインストールします。ルートアクセスなし
root アクセスなしでコマンドラインから audacity をインストールする簡単な方法はありますか?
apt-get も持っていません:
ありがとう!
編集:
基本的に、再生バーがあり、信号を確認してズームインおよびズームアウトできるオーディオプレーヤーを探しています。
python - 音声ファイルの各単語の長さを取得する
音声ファイルの各単語のおおよその長さを取得することは可能ですか? 最も近いのは (YouTube ビデオのオーディオ ファイルの場合)、キャプション ファイルをsrt
. にはsrt
、ビデオの各センテンスの長さが表示されます。
文中の各単語の長さを何らかの方法で取得できるかどうか疑問に思っていました。正確ではないかもしれませんが、そのあたりですか?
file - WAVファイルをTXTファイルに変換
プレーン TXT ファイルに変換したい 8 ビット WAV ファイルがあります。結果の TXT ファイルには、すべてのサンプルの値を表す 0 から 255 までの数値のみが含まれていることが重要です。
もちろん、必要に応じてすべてを変換/正規化することは大したことではないため、-128 から 128 のようなものでも問題ありません。
Audacity を使用してさまざまなヘッダーのない RAW 形式にエクスポートしようとしましたが、利用可能なエンコーディングは探しているものではありません。
この質問は少し奇妙かもしれませんが (ある種のアート プロジェクトでそのファイルが必要です)、助けていただければ幸いです。
bytearray - NAudio 4000Hz WAV?
以下のような NAudio lib を使用しようとしています。WAV ファイルを Mono、4KHz として保存すると、AudioBytesOriginal 配列がすべてゼロになります。Windows でダブルクリックするとファイルが再生されるため、データはそこにあります。Audacity でも再生されます。
限られたデバイスでの再生には非常に低いサンプル レートが必要ですが、.NET Framework 4.6.1 と NAudio を使用してバイト作業を処理しています。
ありがとう。
python - どうやってこの数字を手に入れたのですか?
私はこのコードを持っています:
これはこれを生成します:
どうやってそのプロットを手に入れたのかわかりません。大きなスコアが大きな確率を与えるべきであることは理解していますが、プロットを取得できません。numpy.ones_likeもあまり役に立ちませんでしたね。:)
編集:
私は何を求めているのか不明な投票を得たので、私はこれを尋ねています. に[0.8360188027814407, 0.11314284146556014, 0.050838355752999165]
適用されたソフトマックスの結果であるベクトルから、どのようにしscores
てそのプロットを得たのですか. つまり、その背後にあるロジックは何ですか?
スコア( の後vstack()
)は次のとおりです。
audio - Audacity の .wav ファイルの途中から無音部分を削除するにはどうすればよいですか?
Audacity を使用してオーディオ ファイルから無音部分を削除しようとしています。Trim Silenceと呼ばれる Nyquist プラグインがあり、ファイルの最初と最後から無音部分を削除しますが、途中は削除しません。これを反転させて、最初と最後以外の無音部分を削除したいと思います。
以下の関数がプラグインの関連部分だと思います。truncate-internal-silences 関数を取得するには、どのように変更すればよいですか? (私は Nyquist も Lisp も知りません。そのため、変更どころか、現在の機能を理解するのに苦労しています。)
まったく異なるアプローチも歓迎します。これは、多くのオーディオ ファイルを編集する方法について、現時点での最良の推測にすぎません。