問題タブ [pcm]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - Silverlight 4 - マイクからの PCM データのエンコード
を使用してマイクからオーディオ データをキャプチャするための基本的な SL4 アプリケーションを作成しましたCaptureSource
。問題は、それが未加工の PCM 出力であることです。つまり、巨大で圧縮されていないことを意味します。
このアプリケーションを純粋に SL4 環境内で実行する必要がある場合、PCM オーディオ データを圧縮して、リモート サーバーにより簡単に配信できるようにするにはどうすればよいでしょうか?
基本的に、Windows Phone シリーズ 7 アプリケーションにデプロイ/インクルードできるソリューションと、ブラウザー環境で動作するソリューションが必要です。つまり、マネージ コード ソリューションのみだと思いますか?
会話の中で、人々はたとえば Speex や WMA を提案しましたが、SL4 プロジェクトでは機能しない DLL への参照を必要とせずに機能するライブラリやサンプルは見つかりませんでした。
c++ - PCMサンプルのボリュームの視覚化
C ++アプリケーションにPCMオーディオ(G.711)のチャンクがいくつかあります。これらのチャンクのそれぞれで異なる音量を視覚化したいと思います。
私の最初の試みは、各チャンクのサンプル値の平均を計算し、それをボリュームインジケーターとして使用することでしたが、これはうまく機能しません。無音のチャンクでは0を取得し、音声のあるチャンクでは値が異なりますが、値はわずかに異なるだけで、実際の音量とは似ていないようです。
体積を計算するためのより良いアルゴリズムは何でしょうか?
G.711オーディオは対数PCMだと聞きました。それをどのように考慮に入れるべきですか?
algorithm - PCMファイルを結合するためのアルゴリズムは何ですか?
PCMファイルを結合するためのアルゴリズムは何ですか?スピーカーが同時にspeacであるような方法でそれらを結合する必要があるいくつかのPCMファイルがあります。
では、PCMファイルを結合する方法は?
mp3 - pymad、pcm、vad などを使用して、話し言葉の音声ファイルの一時停止を検出する
まず、私がやろうとしていることを大まかに述べ、アドバイスを求めます。次に、現在のアプローチを説明し、現在の問題に対する回答を求めます。
問題
話している人の MP3 ファイルがあります。文またはフレーズにほぼ対応するセグメントに分割したいと思います。(手動で行いますが、何時間ものデータについて話しているのです。)
これをプログラム的に、または既存のユーティリティで行う方法についてアドバイスがあれば、ぜひ聞かせてください。(私は音声アクティビティ検出を認識しており、少し調べましたが、自由に利用できるユーティリティは見当たりませんでした。)
現在のアプローチ
最も簡単な方法は、一定の間隔で MP3 をスキャンし、平均音量があるしきい値を下回っている場所を特定することだと思いました。次に、既存のユーティリティを使用して、それらの場所で mp3 をカットします。
私は pymad をいじっていましたが、mp3 の各フレームの PCM (パルス符号変調) データを正常に抽出できたと思います。PCM データが相対ボリュームにどのように変換されるかについて頭を悩ませているように見えないため、今は行き詰まっています。複数のチャネル、ビッグエンディアンとリトルエンディアンなど、他の複雑な要因についても認識しています。
pcm サンプルのグループを相対ボリュームにマッピングする方法に関するアドバイスが重要です。
ありがとう!
java - 生の PCM 出力コードを Java から Android AudioTrack API に移植するのが難しい
チップチューン (NSF、SPC など) の音楽ファイルを再生するアプリケーションを Java SE から Android に移植しようとしています。Android API には、このアプリケーションが生の PCM オーディオを出力するために使用する javax マルチメディア クラスがないようです。API で見つけた最も近いアナログは AudioTrack であり、それと格闘してきました。
しかし、進行中のポートを介してサンプル音楽ファイルの 1 つを実行しようとすると、返されるのは静的なものだけです。私の疑いは、私がセットアップした AudioTrack に問題があるということです。さまざまなコンストラクターを試しましたが、最終的にはすべて static を出力するだけです。
元のコードでの DataLine のセットアップは次のようなものです。
私が現在使用しているコンストラクタは次のとおりです。
それらの定数と変数を置き換えて、できるだけ簡潔に意味をなすようにしましたが、私の基本的な質問は、ある形式から別の形式に移行するときに行った仮定に明らかな問題があるかどうかです.
android - Androidの再生が突然止まる
オーディオ コンテンツをストリーミングしているアプリがありますが、突然停止することがあります。
logcat ウィンドウに表示される --
AudioHardware の pcm 再生がスタンバイになります
以上です。
別のスレッド (しゃれを意図したもの) で、スレッドを使いすぎたからだと誰かが言っているのを見ました。それが本当にこれを引き起こしているのでしょうか?オーディオ スレッドの優先順位を高くしてもらえますか?
とにかく、オーディオ ハードウェアの pcm がスタンバイにならないようにするには?
bytearray - ByteArray から PCM データを適切にトリミングする
録音したクリップの先頭から少量のオーディオをトリミングする必要がある状況があります (通常は 110 ~ 150 ミリ秒の間で、一貫性のない量です)。
周波数44100、ビットレート16で録音しています。これは私が使用しているコードです:
これは時間的には機能しているように見えますが、録音されたすべてのオーディオは静的でグロスになります。丸めについて何か問題がありますか? 生の PCM データを変更する必要があったのはこれが初めてなので、詳細についてはわかりません。
ありがとう!
c++ - PCM ストリームのパケット損失を隠す
「パケット損失隠蔽」を使用して、オーディオ ストリーム内の失われた PCM フレームを隠蔽しようとしています。残念ながら、すべてのライセンス制限とコードの肥大化なしにアクセスできるライブラリを見つけることができません (...いくつかの提案があります)。
PLC を実装する Asterisk プロジェクトのために Steve Underwood によって書かれたいくつかの GPL コードを見つけました。いくつかの制限があります。ただし、Steve が彼のコードで示唆しているように、彼のアルゴリズムは、少し手を加えるだけでさまざまなストリームに適用できます。現在、コードは 8kHz 16 ビット符号付きモノラル ストリームで動作します。
コードのバリエーションは、 Google Code Searchの簡単な検索で見つけることができます。
私の希望は、コードを他のストリームで動作するように適応させることです。最初の目標は、アルゴリズムを 8+ kHz、16 ビット符号付き、マルチチャンネル オーディオ (すべて C++ 環境) に合わせることです。最終的には、GPL ライセンスの下でコードを利用できるようにすることを検討しており、それが他の人の利益になることを期待しています...
私の努力による以下のコードが添付されています。コードには、特定の確率で多数のフレームを「ドロップ」するメイン関数が含まれています。残念ながら、コードは期待どおりには機能しません。gdb で実行すると EXC_BAD_ACCESS を受け取りますが、「bt」コマンドを使用すると gdb からトレースが取得されません。明らかに、どこかでメモリを踏みにじっていますが、正確な場所はわかりません。amdf_pitch関数をコメントアウトすると、コードはクラッシュせずに実行されます...
PcmConcealer.hpp
Pcmコンシーラー.cpp
PS - デジタル オーディオは私の得意分野ではないことを告白しなければなりません...
c# - C#で純粋なPCM rawストリームを再生する方法は?
System.Media.SoundPlayerとNAudioを調べていましたが、AFAIKではWAVEストリームのみが再生されます。WAVEファイルは、純粋なPCMデータとフォーマットヘッダーで構成されています。
このヘッダーをWAVE形式で提供したくありません。プログラムでパラメータ(ビットレートなど)を渡したい
delphi - pcm形式の簡単なボイスレコーダーを作成するにはどうすればよいですか?
私はwav形式を使用して簡単な音声録音を作成しました。私の問題は、http://www.un4seen.comからTbassコンポーネントを使用してPCM形式で保存したかったことです。私のコンパイラはdelphiです。またはmp3/wavからpcmへの変換。