問題タブ [pcm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
delphi - Delphi コードを使用して MP3 を PCM に変換する方法は?
http://www.un4seen.com/bass.htmlのBass コンポーネントがあります。mp3 を読み込んで、フォーマットを PCM に変更しようとしていますが、何も起こりませんか?
または任意の提案をいただければ幸いです。
c - 追加+シフトを使用したpcm16からpcm14への変換
私は、署名されたショートパンツの配列が受信されるサウンド変換アルゴリズムを研究しています。
アルゴリズムの特定の時点で、サンプルを16ビットから14ビットに変換し、次のようにします。
最下位2ビットを削除したいので、シフトが必要であることは明らかですが、+2
そこはどうでしょうか。
audio - G711(PCM u-law)をデコード
オーディオコーデックの理解が限られているため、ご容赦ください。IPCAM からこのオーディオ ソースを取得しています (htto//... CGI インターフェイス経由)。Windows、MAC、および Android フォンでこのオーディオ ソースを再生するクライアント プログラムをいくつか作成しようとしています。オーディオは G711 (PCM ulaw) でエンコードされます。
PCM オーディオ データをオーディオ エンジンに渡して再生する前に、生のオーディオ データにデコードする必要がありますか? もしそうなら、それをデコードする方法に関するサンプルコードはありますか? PCM はすでに RAW であると信じているので、私は混乱しています。たとえば、Android のオーディオ エンジンに直接フィードすることはできますか?
よろしくお願いします
c - 16bit raw PCM ファイルの書き込みに関する問題
小さな実験的な音楽作品として、標準 C で曲をプログラムしようとしています。コードは、Audacity にインポートできる生の PCM ファイルを出力します。現時点ではすべてが期待どおりに動作しますが、現在使用している 8 ビットではなく、各サンプルを 16 ビットとして書き込もうとすると問題が発生します。
書き込まれる時点まで、現在のサンプルは float として計算され、その境界はほぼ符号付き 8 ビット整数の範囲内に保たれます。次に、次のサンプルのプロセスを繰り返す前に、8 ビット整数として書き込まれます。これは正常に機能し、適切に再生されます。この問題は、16 ビットの生の PCM ファイルとして書き込もうとしたときに発生します。fwrite を使用して結果の 16 ビット整数を書き込むと、fwrite を使用して float を 256 倍し、結果を整数にコピーします。これは、インポート時に期待される結果をもたらさず、期待していたものの非常に歪んだバージョンになります。
問題は書き込み段階でのみ発生するため、以下に有効なコードを追加しました。
ワーキング 8 ビット コード:
16 ビット コードが機能しない:
明らかな何かが欠けているだけかもしれませんが、何時間もかけて解決しようとしています。前もって感謝します!
delphi - デルファイの.wav標本を比較する方法は?
.wav
2つのファイルを比較して標本の研究を始めたいと思います。継続時間、アクセント、発音の結果をパーセンテージで返すようなものです。など、またはを比較/分析するコード.wav
。
python - (Python)Gstreamerを使用してオーディオを(PCMデータに)デコードします
Python Gstreamerバインディングを使用してオーディオを再生するアプリケーションを作成していますが、オーディオもデコードしようとしています。つまり、を使用してデータを読み取りdecodebin
、生のPCMバッファーを受信したいと考えています。具体的には、ファイル全体をメモリに読み込むのではなく、ファイルのチャンクを段階的に読み込みたいと考えています。
いくつかの具体的な質問:Gstreamerでこれをどのように達成できますか?特にpygstとは?ストリームからデータを読み取るために使用する必要がある特定の「シンク」要素はありますか?pygstBuffer
オブジェクトからデータを読み取るための好ましい方法はありますか?(単に「メインループ」に入るのではなく)データを消費する速度を制御するにはどうすればよいですか?
header - 整数バイトが逆方向に格納されるのはなぜですか?これはヘッダーにのみ適用されますか?
現在、WAVファイルを解読しようとしています。ヘッダーからPCMデータまで。
WAVファイルの構造を詳しく説明したPDF(http://www.tdt.com/T2Support/technical_notes/tn0132.pdf)を見つけました。これを使用して、適切なヘッダーデータを抽出して理解することができました。 Ghex2。しかし、私の質問は次のとおりです。
整数バイトが逆方向に格納されるのはなぜですか?つまり、12月 20は、0x00000014ではなく0x14000000として格納されます。
PCMデータの整数も逆方向に保存されていますか?
objective-c - Core Audio AudioFIleReadPackets... looking for raw audio
I'm trying to get raw audio data from a file (i'm used to seeing floating point values between -1 and 1).
I'm trying to pull this data out of the buffers in real time so that I can provide some type of metering for the app.
I'm basically reading the whole file into memory using AudioFileReadPackets. I've create a RemoteIO audio unit to do playback and inside of the playbackCallback, i'm supplying the mData to the AudioBuffer so that it can be sent to hardware.
The big problem I'm having is that the data being sent to the buffers from my array of data (from AudioFileReadPackets) is UInt32... I'm really confused. It looks like it's 32-bits and I've set the packets/frames to be 4bytes each. How the heck to I get my raw audio data (from -1 to 1) out of this?
This is my Format description
I am reading a wave file currently.
Thanks!
c# - .NET で AMR サウンド ストリームを PCM 非圧縮ストリームに変換する方法
電話に ( Stream オブジェクトとして) 記録された AMR ( Adaptive Multi-Rate ) オーディオ ファイルを PCM 非圧縮 wav オーディオ ストリームに変換して、後で音声認識のために処理できるようにする必要があります。音声認識は AMR 形式を好みません。これは、 Microsoft Speech Platformを使用したサーバー アプリケーションになります。で ffdshow または同様のライブラリを使用するかどうかはわかりません。
現在、NAudio と DirectShowNet を調査して、これを達成するのに役立つかどうかを確認していますが、誰かが正しい方向を示してくれることを望んでいました。
java - MIDIサウンドバンクとは?
私はMIDI初心者です。MIDI サウンドバンクには、MIDI シンセサイザーが PCM オーディオに変換するための「命令」[原文ママ] が含まれていますか?
サーバーで生成されたタイムラインに基づいて、(必要に応じて) シーケンスし、再生 (およびそれらをミックス) するための指示を提供したい可変デュレーション オーディオ (現在は PCM であり、したがって私の質問) が多数あります。論理的には MIDI が答えのように思えますが、正確にはサウンドバンクとは何か、そしてそれが本当に単なる PCM サウンドのバンクなのかについては少し曖昧です。
更新: 私は最初にこれを Java から見ています。