問題タブ [audio-processing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - Help with implementing this beat-detection algorithm?
I recently tried to implement a beat detection code found here, namely the Derivation and Combfilter algorithm #1:: http://archive.gamedev.net/reference/programming/features/beatdetection/page2.asp
Im not too sure if I implemented it successfully as I am not getting good results. I was wondering if anyone have implemented this successfully or just towards the good people who want to help in general. Here is my implementation:
The results that I am getting are always very high, usually around 190 and 200BPM, which should NOT be the case, as my .wav files have tempos only between 60-120BPM.
Note that I am using a .WAV file (44.1Khz, 16-bit, Mono), so that some of the formulas are a bit modified (i.e. calculating the energy) to work with only one channel. I would like to confirm if there have been any discrepancies in my implementation? I am not worrying about the FFT part because I am using a library for that.
Thank you very much!
python - Python は時間の経過に伴うオーディオの周波数と振幅を見つけます
これが私がやりたいことです。その.wavファイルの1ミリ秒ごとに.wavファイルのオーディオ周波数と振幅を見つけて、ファイルに保存したいと思います。周波数と振幅をグラフ化し、時間の経過に伴う振幅をグラフにしましたが、時間の経過とともに周波数を把握できません。私の最終的な目標は、ファイルを読み取り、それらの振幅を使用して変数を調整し、どの変数が使用されているかをトリガーする頻度を使用できるようにすることです。これは簡単な部分のようです。私はnumpy、audiolab、matplotlibなどを使用してきました... FFTを使用していますが、これを理解することはできません。ありがとう!
iphone - プログラムで 2 つのオーディオ ファイルを比較するにはどうすればよいですか?
プログラムで 2 つのオーディオ ファイルを比較したいと考えています。例: iPhone アプリにサウンド ファイルがあり、別のファイルを録音します。既存の音が録音された音と一致するかどうかを確認したい ( - 音声認識に似ています)。
どうすればこれを達成できますか?
qt - QtMultimediaを使用してMP3ファイルから生のPCMサンプルを読み取りますか?
QtMultimediaを使用して、たとえばNokia N950電話に保存されているMP3ファイルのPCMrawオーディオサンプルにアクセスする方法はありますか?
それが不可能な場合、合理的な代替案は何でしょうか。既存のQtプロジェクトと合理的に簡単に統合できるもの。私はlibmpg123を知っていますが、電話用にクロスコンパイルする方法について少し混乱していて、もっと簡単なものを望んでいました。
c# - C#/。netオーディオノイズリダクション
私はクラスライブラリを開発しています。これにより、再調査の目的で、ストリーミングされたオーディオ(録音デバイスから取得されたバッファリングされたサンプルで動作しているため、基本的にバイト配列があります)を操作できます。
問題は、ノイズリダクションを追加する必要があることです-サンプル処理と分析を適用する前に、ノイズプロファイルをキャプチャし、各サンプルにノイズリダクションを適用する必要があり、適用できるアルゴリズム/サンプル/ライブラリを見つけることができませんでした。
どんな助けでもいただければ幸いです。前もって感謝します。
iphone - BPM iPhoneを探す
iPhoneライブラリに保存されている曲を再生せずにBPMを見つける方法を探しています。私はそれについて経験がありませんが、誰でもそれが可能であることを確認できますか?
algorithm - MatlabBpmアルゴリズム
音楽のテンポ(1分あたりの拍数またはその他の測定値)を取得するためのMATLABアルゴリズムをどこで見つけることができるか知っている人はいますか?私はこのサイトからのものを試しました:http ://www.clear.rice.edu/elec301/Projects01/beat_sync/beatalgo.html しかし、私に良い反応を与えていません。
algorithm - 風切り音の検出
音声ストリームに従って風を検出するアプリを開発したいと考えています。
ガイドラインやリンクを提供するために、ここで専門家の考えが必要です。これは簡単な作業ではないことはわかっていますが、ここで多くの努力を払うことを計画しています.
私の計画は、ストリーム内のいくつかの一般的なパターンを検出することです。値が風切り音のこの一般的なパターンに近い場合は、一致が見つかったことを通知します。値が既知のパターンに近い場合は、素晴らしいと確信できます。風が検出され、値がパターンと一致しない場合は、それほど風がないと思います....
それが最初の私の計画ですが、これがどのように行われるかを学ぶ必要があります. すでにこれを行っている開いているプロジェクトはありますか? または、このトピックについて研究を行っている人がいますか?
私がこのフォーラムに書き込む理由は、Google で検索する方法がわからないためです。私が見つけたものは、私が探していたものではありませんでした。この種のアルゴリズムの開発を開始する方法が本当にわかりません。
編集 1:
風を録音しようとしましたが、保存されたオーディオ ファイルを開くと、単なる数字の集まりでした :)。これをどの形式で保存すればよいかさえわかりません。wave で十分ですか? 何か他のものを使用する必要がありますか、または風切り音のオーディオ ファイルを mp3 に変換するとどうなりますか: これは解析に役立ちますか?
多くの質問をいただきましたが、それは、この種のトピックについてどこから読んだらよいか分からないからです。質問にガイドラインのタグを付けているので、誰かが私を助けてくれることを願っています.
検出可能な何かがあるに違いありません。なぜなら、風切り音は非常に一般的だからです。これを検出するには何らかの方法が必要です。ヒントを教えてくれる人、このトピックに精通している誰かが必要なだけです。
c# - オーディオを分析して Guitar Hero レベルを自動的に作成する
ギター ヒーローのようなゲーム (このようなもの) を作成しようとしています。ユーザーから提供されたオーディオ ファイルを分析してレベルを自動的に作成できるようにしたいのですが、その方法がわかりません。
BPM 検出アルゴリズムを使用して、ビートに矢印を配置し、繰り返しパターンにレールを配置する必要があるのではないかと考えましたが、それらを実装する方法がわかりません。
また、byte[] データをコピーする Read メソッドを持つ NAudio の BlockAlignReductionStream を使用していますが、2 チャンネルのオーディオ ファイルを読み取るとどうなりますか? 最初のチャネルから 1 バイト、2 番目のチャネルから 1 バイトを読み取りますか? (16ビットPCMと表示されているため)24ビットと32ビットの浮動小数点でも同じことが起こりますか?
signal-processing - オーディオストリームから音声を検出する方法
誰かがオーディオストリームでいつ話すかを判断する必要があります。ハミングウィンドウを適用し、FFTを計算しました。ここから人間の声を検出するにはどうすればよいですか?