問題タブ [pitch-tracking]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
audio - PCMまたはWAVサンプルの基本周波数をどのように分析しますか?
DirectXのバッファーにサンプルを保持しています。これは、楽器から演奏およびキャプチャされたノートのサンプルです。サンプルの周波数を分析するにはどうすればよいですか(ギターチューナーのように)?FFTが関係していると思いますが、HOWTOへのポインタはありません。
linux - Linuxでのピッチの識別
録音された歌唱セッションのピッチを特定できる無料のソフトウェアツールまたは組み合わせはありますか?
アイデアは、標準ノート(C3、C#3、Dなど)のマーカーとともに、タイムラインに現在のピッチを含むある種のグラフを表示することです。ピッチ補正もリアルタイムで行う必要もありません。
かつてそれを行うRosegardenのプラグインがあったことは知っていますが、それはなくなっています。
signal-processing - 基本周波数の検出
インドのIIT-Bombayでこの技術フェスティバルが開催され、「Artbots」と呼ばれるイベントが開催され、芸術的な能力を持つアートボットをデザインすることになっています。歌を入力として受け取り、歌の中の音符を検出してピアノで再生する音楽ロボットについてのアイデアがありました。曲の音符のピッチを計算するのに役立つ方法が必要です。それをどうやって進めるかについてのアイデア/提案はありますか?
iphone - iPhoneでのリアルタイムピッチシフト
私が書いている子供向けの iPhone アプリケーションがあり、Core Audio を使用してサウンド サンプルのピッチをシフトできる必要があります。これが行われている場所を見ることができるサンプルコードはありますか? アプリ ストアには、これを行う音楽アプリやゲーム アプリがたくさんあるので、私が最初のアプリではないことはわかっています。ただし、それが行われた例は見つかりません。
wav - WAVファイルのピッチを表示
私はオーディオの世界に不慣れで、対処方法がわからないタスクを割り当てられました。WAV ファイルのピッチを表すグラフを表示する必要があります。WAV ファイルはポリフォニックにすることができます。その場合、支配的な (つまり、最も音量の大きい) 楽器 (または人間の声の歌唱) のピッチ グラフを表示する必要があります。私は .NET に精通しており、C、C++、Java についてはほとんど知りません。
私はウェブで調査を開始し、ポリフォニック WAV ファイルのピッチ検出は解決されていない問題であることを理解しましたが、正確なピッチは必要ありません。次のものよりも高いかどうか、そしてそのピッチは何であるかを知るためだけです長さ。
私の質問は次のとおりです。
このタスクの背後にある理論を学ぶには、どこから始めればよいですか? そのためにおすすめの本はありますか?
それを行うことができるAPI/ツールはありますか?
ありがとう、
ML
audio - リアルタイムピッチ検出
歌っているユーザーのピッチ検出をリアルタイムで実行しようとしていますが、多くの問題が発生しています。FFT( FFT問題(ランダムな結果を返す))や自己相関(自己相関ピッチ検出はマイク入力でランダムな結果を返す)など、さまざまな方法を試しましたが、良い結果を得る方法がないようです。誰かがリアルタイムのピッチ追跡の方法や、私がすでに持っている方法を改善する方法を提案できますか?リアルタイムのピッチ検出に適したC/C++メソッドが見つからないようです。
ありがとう、
ニール。
編集:注意するために、マイク入力データが正しいこと、および正弦波を使用した場合の結果が多かれ少なかれ正しいピッチであることを確認しました。
編集:申し訳ありませんが、これは遅れていますが、現時点では、結果の配列と各インデックスから値を取り出し、X軸にインデックスをプロットし、Y軸に値をプロットすることで自動照合を視覚化しています(両方をで割っています) 100000か何か、そしてOpenGLを使用しているim)、データをVSTホストにプラグインし、VSTプラグインを使用することは私には選択肢ではありません。現時点では、ランダムなドットのように見えます。私はそれを正しく行っていますか、それともそれを行うためのコードを教えてください、または生のオーディオデータと自己相関データを視覚化する方法を理解するのを手伝ってください。
audio - スマートフォンでの音符のピッチ認識
低速のCPU、コードサイズ、RAMなどの限られたリソースで、電子チューナーやソフトウェアチューナーと同様に、音符のピッチを検出するのに最適な方法はありますか?
使用する必要があります:
- キスFFT
- FFTW
- 離散ウェーブレット変換
- 自己相関
- ゼロクロッシング分析
- オクターブ間隔のフィルター
他の?
一言で言えば、私がやろうとしているのは、任意の(合理的な)楽器で演奏された、中央Cから2オクターブ下から2オクターブ上にある単一の音符を認識することです。半音の20%以内にしたいのですが、つまり、ユーザーがフラットすぎたりシャープすぎたりする場合は、それを区別する必要があります。ただし、チューニングに必要な精度は必要ありません。
c++ - FFTを使用したリアルタイムのピッチ検出
C++を使用してリアルタイムのピッチ検出を行おうとしています。他のすべてがうまくいかなかったので、performous(http://performous.org/ )からいくつかのコードをテストしています。私はこれがうまくいくことを確かに知っています、しかし私はそれをうまく動かすことができません。私はこれを数週間試しましたが、ピッチ検出コードを機能させることができませんでした。
visualization - プログラムで「音を聞く」(信号処理?)
私はコンピュータビジョンに精通しており(よく知っています)、そのうちの1つのアプリケーションは光学式文字認識などの画像認識であると思います。しかし、私がもっと興味を持っているのは、私が今学んだ「コンピューターリスニング」であり、デジタル信号処理と見なされます。
信号処理について私が最も興味を持っているのは、音楽への応用の可能性です。少し前に、誰かがギターを弾いている録音を聞いて、実際に演奏されたノート/コードをタイムライン全体に自動的にグラフ化できるアプリケーションのプレビュー(名前を忘れてしまいました)を見たのを覚えています。 。プログラムを使用して、ユーザーはこれらを移動したり、編集したりすることができました。さて、明らかにこれははるかに複雑ですが、同じことを含みますか?信号処理?また、音楽ビジュアライザーやインテリジェント照明システムでの可能なアプリケーションにも興味があります。
私の理解では、MP3などの圧縮オーディオ形式でこの処理を実行しても、別々のトラックを含むMIDIと同じ結果は得られません(誤解されているかもしれません)。PCMなどの非圧縮形式はMP3よりも優れていますか?サウンド処理については何も知りません。これまで読んだことから推測していることです。
私はすでにこの質問を見てきました。この質問には、私の質問の多くをカバーするすばらしい回答とリンクがあります。しかし、私が見つけたリンクのほとんどは理論的なものであり、すべて興味深いものであり、この主題に興味があることを考えると間違いなく読む価値がありますが、これを容易にする既存のライブラリがあるかどうかを知りたいと思いました、または、コンピュータサイエンス/プログラミングを対象としたこの主題に関連する記事(おそらくサンプルコード付き)。オープンソースのサウンド/音楽ビジュアライザーやその他のオープンソースのサウンド処理コードでさえ素晴らしいでしょう。
意味がわからなかったらごめんなさい。私が言ったように、私は私が何について話しているのかわかりません。