問題タブ [audio-processing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
java - 16ビットPCMWaveデータをfloatに変換する正しい方法
16ビットPCM形式のWaveファイルがあります。生データbyte[]
とサンプルを抽出する方法があり、フロート形式、つまりfloat[]
フーリエ変換を行うためにそれらが必要です。これが私のコードです、これは正しく見えますか?私はAndroidで作業しているので、javax.sound.sampled
などは利用できません。
java - オーディオ処理用のサーバー プラットフォーム
着信 UDP 接続からのオーディオを処理するためのサーバーを構築しようとしています。入力ストリーム (おそらく .wav) の周波数、振幅、タイム シフトなどを変更して、出力をリアルタイムでフィードバックできるようにする必要があります。言語は、C/C++/ObjC または Java のいずれか、または両方の組み合わせになります (十分に高速な場合)。
私がこれまで見てきたのは、いくつかのフォーラムで Jack と PulseAudio について言及されていることです。ただし、これらのどれが私のニーズに最も適しているかはわかりません。オーディオ処理をしている友人から、これら 2 つのフレームワークにはかなり大きなコードベースがあると聞いたことがあります。私のニーズに最適なプラットフォームはどれですか? また、どのプラットフォームをお勧めしますか?
ご協力いただきありがとうございます!
android - 特定のトーンを拾うためのAndroidマイク
こんにちは、Android音源クラスを使用すると、あるデバイスでトーンを作成し、別のデバイスで同じトーンをリッスンできるかどうか疑問に思いました。これが可能であれば、他にもいくつか質問があります。
バックラウンドノイズを考慮して、この特定のトーンだけを聞くことは可能ですか?
このプロセスはリソースを大量に消費しますか?
人間の耳には聞こえない、または耳に近い音を使用できますか?
最後に、送信デバイスから数フィートでしか聞こえないトーンを使用できますか?
いつもありがとうございました:)
編集>オーディオ処理タグsabastianを追加していただきありがとうございます。はるかに良い説明。
c# - 音響オーディオ比較ライブラリ
オーディオ比較を処理するソフトウェアまたはライブラリが必要ですが、mp3 内のタグを使用せず、2 つのオーディオ ファイル間の類似性または信頼性を比較する必要があります。または、オーディオ ファイルからピースを切り取った場合、ソフトウェアはそれがどこにあるのかを示す必要があります。メインオーディオファイルからのファイルトークン(私が十分に明確であることを願っています).
では、このテクノロジーがAudio Acoustic Comparing と呼ばれ、指紋と呼ばれるいくつかのオーディオ サンプル ファイルに基づいていることをどのように聞いたのでしょうか。ファイルのどこかに、入力サンプルまたはフィンガープリントに相当するものが見つかった場合、ソフトウェアは私を指摘するはずです。
ベスト。
c++ - wavin lib. によって C++ でキャプチャされたオーディオ信号の振幅 (または rms 電圧) を取得しますか?
私は非常に基本的なロボット工学プロジェクトに取り組んでおり、音声認識を実装したいと考えています。複雑なことはわかっていますが、3つか4つのコマンド(または単語)だけでやりたいと思っています。
私はwavinを使ってオーディオを録音できることを知っています。しかし、オーディオ信号でリアルタイムの振幅分析を行いたいのですが、どうすればそれができるのでしょうか。波形は 8 ビット、モノとして入力されます。
信号を特定の時間のセットに分割し、さらに小さなサブセットに分割し、サブセットの平均 rms 値を取得してからそれらを合計し、実際に保存された信号とどれだけ異なるかを確認することを考えました。エラーがセットのすべて (またはほとんど) の許容値を下回っている場合は、その単語を出力します。
これはどのように実装できますか?他の提案も提供していただければ、それは素晴らしいことです。
前もって感謝します。
linux - 音声を参照録音と比較する方法 - 言語学習
誰かに語学学習の成績またはパーセンテージを与えるために、ユーザーが送信したオーディオ録音を参照録音と比較して比較する方法を探しています。
これは非常に非科学的な方法であり、何よりも仕掛けであることに気づきました.
私が最初に考えたのは、ある種のオーディオのフィンガープリンティング、または波形の比較です。
私が見るべきアイデアはありますか?
iphone - iPhone AudioQueue - 着信オーディオ データを読み取って BPM を決定する
音のエネルギーを使用してマイクから 1 分あたりの拍数 (BPM) を決定しようとしています。BPM を決定する部分はわかったと思いますが、RAW データを取得するのに少し問題があります。
この例は、Apples SpeakHere アプリに基づいています - 私が使用している AudioQueue コールバック関数:
しかし、私はいくつかの興味深い値を取得しています - 誰かが私が間違っている場所の正しい方向に私を向けて、私が返すべき範囲を教えてくれる可能性があります.
オーディオ形式のセットアップ:
乾杯、
c# - BinaryReaderを使用したWaveファイルの解析
.NETアセンブリmscorlibSystem.IO名前空間では、ReadInt16()メソッドを使用して、オーディオデータバイトをループし、符号付き整数値をテキストファイルにダンプしています。1つのサンプルレートに関連付けられた2つの値をどのように解釈しますか?つまり、1秒のモノラルデータがある場合は88200バイトになるため、ReadInt16()を使用すると88200個の離散整数が返されます。これは情報が多すぎるので、整数は44100個だけにする必要があります。したがって、別の方法を使用する必要がありますか、それとも反復ごとにループを1つ進める必要がありますか。
どうもありがとう..........ミッキー
.net - .NET ソリューションを使用して、ピッチを維持しながら再生速度を落とした MP3 を作成します。
私は、MP3 ファイル (ボーカル オーディオ) を取得し、ピッチを維持しながら再生速度を遅くして MP3 のバージョンを保存する .NET で部分的に機能するソリューションを持っています。オーディオの忠実度はそれほど良くありませんが、ピッチをある程度維持するソリューションを見つけました。私が行っていることを達成するために必要なコンポーネントが少なくて済む他のソリューションはありますか? また、より高いレベルのオーディオ忠実度を維持しながらピッチを維持するソリューションはありますか?
スケーラビリティを高めるために、可動部分を減らすことを検討しています。
現時点では、nAudio を使用して MP3 を Wav に変換し、SoundTouch を使用して Wav の再生速度を遅くし、LAME を使用して Wav を MP3 にエンコードしています。
ありがとうシャン