問題タブ [signal-processing]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
linux - Octave でサウンドを再生するにはどうすればよいですか?
Octave は、特定のサウンド再生ユーティリティがシステムで利用可能になると想定しているように見えますが、代替を指定する機能は提供していないようです。以下のエラーで、Octave は を探していますがofsndplay
、これはすべてのシステムで利用できるユーティリティではありません。
オクターブ:38> 音(beamformed_20)
sh: ofsndplay: コマンドが見つかりません
システムに適したユーティリティを指定するために使用できる Octave 構成設定またはコード フラグメントはありますか?
math - Matlabで信号の低周波数バージョンを生成するにはどうすればよいですか?
サイン入力を使用して、周波数を変更し、スペクトル内のいくつかの低い周波数をカットして、メイン周波数をゼロにシフトしようとしました。信号はfftshiftされていないので、fftベクトルの最初と最後でいくつかのサンプルを削除することでそれを試みました。
しかし、期待どおりに機能しませんでした。また、スペクトルの中央部分を削除しようとしましたが、より高い周波数の正弦波も使用しました。
それを正しくする方法は?
audio - スマートフォンでの音符のピッチ認識、pt。2
前の質問のフォローアップとして、スマートフォンアプリケーションで特定の音符を検出したい場合、着信音がその音符であるかどうかを知るだけで、ある程度のあいまいさがあり、 xセントオフキーであることに注意してください。
それを考えると、速度と精度の点で他の方法よりも優れた方法はありますか?つまり、探しているメモがたとえば#C3であることを知ることで、そのメモが存在するかどうかを判断するのに最適な方法はありますか?すべての波形を分離してから基本周波数の結果を確認するよりも、1つの音符を検索する方が簡単だと思います。
私の最初の質問への回答で、ある回答者は、メモが特定の範囲内にあることがわかっている場合、自己相関がうまく機能する可能性があると提案しました。特定の音符(+/- xセント)の有無を確認するだけでよい場合、自己相関がさらにうまく機能するのではないかと思います。
それらの方法は次のとおりです。
- キスFFT
- FFTW
- 離散ウェーブレット変換
- 自己相関
- ゼロクロッシング分析
- オクターブ間隔のフィルター
- DWT
どんな考えでもいただければ幸いです。
c++ - 音声処理 - トーン認識
オーディオ処理プログラムの学習プロジェクトとして、簡単なギター チューナーの開発を開始しました。
誰かがこれに適したライブラリを勧めてくれますか? 基本的に私が探しているものは次のとおりです。
- マイク入力。
- 信号のリアルタイム処理。マイクで再生されているものは何でも、音符認識を実行できる必要があります。
- クロス プラットフォーム/オープン ソースは大きなプラスになります。
javascript - Javascript を使用してオーディオ ファイルの無音部分を見つけることはできますか?
Javascript を使用して音声の録音を書き起こすツールに取り組んでいます。audio
基本的に、キー イベントをフックして、タグで読み込まれたファイルを再生、一時停止、およびループします。
このようなことを行うための高度な既存のデスクトップ アプリが多数あります ( Transcriberなど -スクリーンショットはこちら)。ほとんどの文字起こしツールには、音声ファイル内をジャンプするために使用できる波形が組み込まれています。これは、文字起こし者がフレーズを視覚的に見つけて繰り返しまたはループすることを学習できるため、非常に役立ちます。
Javascript を使用して、ブラウザでこの機能のサブセットをエミュレートできるかどうか疑問に思っています。私は信号処理についてあまり知りません。おそらくそれは実現可能でさえありません。
しかし、私が思い描いているのは、Javascript がファイルからサウンド ストリームを読み取り、振幅を定期的にサンプリングすることです。振幅が特定の時間のしきい値よりも長く非常に低い場合、それはフレーズ ブレークとしてラベル付けされます。
このようなラベリングは、転写に非常に役立つと思います。次に、キー コマンドを設定して、前の沈黙の期間にジャンプすることができました。仮説として(jQueryベースのAPIを想像して):
silences
silence
には時間のリストが含まれているため、ユーザーがさまざまなsをジャンプできるように何らかの方法で接続しcurrentTime
、 を選択した値に設定して再生することができます。
Javascriptでこの種のことを行うことさえ考えられますか?
c++ - 誰かがC++でまともなDSP/音声ライブラリをお勧めできますか?
SPUCが私の注意を引いたが、Googleはあまりにも多くの結果を返します。ビジョン用のOpenCVのような標準の推奨ライブラリはありますか?必要な機能は次のとおりです。
- 無料のオープンソース
- フィルター設計(バターワース、チェビシェフなど)
- FFT
- 可能であれば、MFCC計算などの一部の音声処理機能は、その部分にSPTK(sp-tk.sourceforge.net)を使用できるため、二次的なものです。
c# - サウンド カードでの信号解析用の Java または C# ライブラリ
PC のサウンド カードを使用した信号解析用の Java または C# ライブラリはありますか? 私は音楽のミキシングには興味がなく、むしろ汎用の信号分析に興味があります 。SIGVIEWを見てください。それができる Java または C# ライブラリに興味があります。もう1つの例は、サウンドカードによってキャプチャされた脳波信号を分析することによって、サウンドカード脳波計を構築しようとするscEEGプロジェクトです。
visualization - プログラムで「音を聞く」(信号処理?)
私はコンピュータビジョンに精通しており(よく知っています)、そのうちの1つのアプリケーションは光学式文字認識などの画像認識であると思います。しかし、私がもっと興味を持っているのは、私が今学んだ「コンピューターリスニング」であり、デジタル信号処理と見なされます。
信号処理について私が最も興味を持っているのは、音楽への応用の可能性です。少し前に、誰かがギターを弾いている録音を聞いて、実際に演奏されたノート/コードをタイムライン全体に自動的にグラフ化できるアプリケーションのプレビュー(名前を忘れてしまいました)を見たのを覚えています。 。プログラムを使用して、ユーザーはこれらを移動したり、編集したりすることができました。さて、明らかにこれははるかに複雑ですが、同じことを含みますか?信号処理?また、音楽ビジュアライザーやインテリジェント照明システムでの可能なアプリケーションにも興味があります。
私の理解では、MP3などの圧縮オーディオ形式でこの処理を実行しても、別々のトラックを含むMIDIと同じ結果は得られません(誤解されているかもしれません)。PCMなどの非圧縮形式はMP3よりも優れていますか?サウンド処理については何も知りません。これまで読んだことから推測していることです。
私はすでにこの質問を見てきました。この質問には、私の質問の多くをカバーするすばらしい回答とリンクがあります。しかし、私が見つけたリンクのほとんどは理論的なものであり、すべて興味深いものであり、この主題に興味があることを考えると間違いなく読む価値がありますが、これを容易にする既存のライブラリがあるかどうかを知りたいと思いました、または、コンピュータサイエンス/プログラミングを対象としたこの主題に関連する記事(おそらくサンプルコード付き)。オープンソースのサウンド/音楽ビジュアライザーやその他のオープンソースのサウンド処理コードでさえ素晴らしいでしょう。
意味がわからなかったらごめんなさい。私が言ったように、私は私が何について話しているのかわかりません。
c++ - C++サウンド処理
オーディオファイルの操作に使用できるライブラリを探しています。基本的に私がやりたいことは次のとおりです。
MP3/WAVファイルをロードする
ファイルの15秒のクリップを取得します
その上に別のMP3/WAVファイルをオーバーレイします
新しいMP3/WAVファイルとしてレンダリング