問題タブ [wave]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
delphi - pcm形式の簡単なボイスレコーダーを作成するにはどうすればよいですか?
私はwav形式を使用して簡単な音声録音を作成しました。私の問題は、http://www.un4seen.comからTbassコンポーネントを使用してPCM形式で保存したかったことです。私のコンパイラはdelphiです。またはmp3/wavからpcmへの変換。
python - PythonWaveモジュールはStringIOオブジェクトを受け入れることができますか
私はwaveモジュールを使用してPythonでwavファイルを読み取ろうとしています。
私のアプリケーションでは一般的ではありませんが、wavファイルを読み取るためにファイルやファイル名を使用していませんが、代わりにwavファイルをバッファーに入れています。
そして、これが私がしていることです
しかし、私はEOFError
それを実行すると取得しています...
私はそれらStringIO
がwavファイルの作成のために働くことを知っています、そして私は以下を試しました、そしてそれは働きます
windows-vista - WindowsVista音声認識エンジンのサンプリングレート
認識を行うコンピューターに記録されていない一連のWAVファイルからの音声を認識する必要があります。エンジンがトレーニングに使用した録音と同じサンプリングレートで録音されたWAVファイルからの音声を認識すれば、結果はより良くなることを私は知っています。
しかし、私の質問は、Vistaのエンジンがトレーニングされたサンプリングレートはどれくらいかということです。この情報はどこにも見つからないようです。
また...WAVファイルをあるサンプリングレートから別のサンプリングレートに、C#から変換する方法を知っていますか?
ありがとう!
image-processing - 2 つの波形データを比較するには?
画像からデータ測定値を取得しました。つまり、プロファイルスキャンデータです。(ある線に沿って取得された画像強度値)そして、私が欲しいのは、別の画像の線からデータを取得し、それらを比較することです。似ているか似ていないか知りたいです。たとえば、私は得ました:
そしてそれらを比較したい。類似していない場合は、そのデータの最も長い部分、つまり互いに類似している部分を知りたいです。たとえば、data1 と data2 を 0 から N - 1 までのインデックスで見ると似ていないことがあるかもしれませんが、インデックス 100 ... N - 56 ではほとんど同じです。類似性とは、data1 と data2 を波の形で表す場合、類似性とは、それらがほとんど同じように動作することを意味しますが、少し異なる場合があります。波の形がほとんど似ているということです。
c - オーディオサウンドを改善するにはどうすればよいですか?(C + FFMpegオーディオ生成の例)
だから私は私が単純化したこの素晴らしいCFFMpegの公式の例を見つけました:
どのように聞こえますか?何かがわからないかもしれませんが、それはひどい音に聞こえます=(オーディオ生成のサウンドをより良くする方法/より面白くする/慎重な方法でメロディックな方法(このコードを変更してサウンドをより良くする方法だけの特別な機能はありません)?
matlab - MATLAB のオーディオで必要なヘルプ
オーディオ トラックからエネルギー機能を抽出する .m ファイルを作成しようとしていますが、その実装に問題があるようです。
そのファイルを MATLAB で実行すると、次のエラーが発生します。
??? x(2) にアクセスしようとしました。numel(x)=1 であるため、インデックスが範囲外です。エラー ==> 12 の myrms energy(frame)=energy(frame)+x(i)^2;
どんな助けでも大歓迎です。
python - Pythonでステレオwavファイルを書く方法は?
次のコードは、周波数400Hzの単純な正弦波をモノラルWAVファイルに書き込みます。ステレオWAVファイルを作成するには、このコードをどのように変更する必要がありますか。2番目のチャネルは異なる周波数である必要があります。
iphone - iPhoneで録音されたサウンドをあるフォーマットから別のフォーマットに変換する、たとえばwavをmp3に変換する
オーディオを録音して、他のサウンド形式に変換しようとしています。AVAudioRecorder クラスを使用して録音しています。これらは、使用した録音設定です。
録音は美しく機能しています。次に、このサウンド ファイルを mp3 形式に変換します。AudioToolBox フレームワークでこれを行うことはできますか。私はこれを試しました
関数 AudioConverterNew() でエラー kAudioConverterErr_FormatNotSupported ('fmt') が発生しています。さまざまな mFormatID と mFormatFlag の組み合わせを試しました。しかし、オペラント (ソースまたは宛先) の 1 つが mp3 の場合は常に、このエラーが発生します。これらの質問について教えてください。
AudioToolbox フレームワークと関数を使用して、サウンドを圧縮形式と非圧縮形式の間で変換できますか (現在、.wav と .mp3 の間で変換したいと考えています)。AudioConverterNew のドキュメントでは、「リニア PCM と圧縮形式の間のエンコードとデコードがサポートされている」と述べています。しかし、彼らは具体的にどの圧縮形式を言っているわけではありません。
質問 1 に対する答えが「いいえ」の場合、上記のフォーマット間でサウンドを変換するには、どのフレームワークを使用する必要がありますか?
- 上記の 2 とは関係ありませんが、さまざまなサウンド形式 (wav、mp3、aac など) とそのデジタル表現 (cpm、lpcm など) に関する情報がある Web サイトへのリンクを教えてください。
c++ - ポゴスティックジャンプのC++正弦波動方程式
画面を弧を描いてジャンプするポゴスティックを作成する必要があります。これを行う最良の方法は、正弦波で動かすことだと私は考えていました。波の上部が1で、地面が0で、波の下部が-1の場合、波が0に達するたびに値をリセットして、正弦波を再開します。したがって、典型的な正弦波(0、1、0、-1、0など)に従う代わりに、0、1、0、1、0などになります。
残念ながら、私の数学はかなりひどいものであり、数式を開発するために何時間も努力してきました。現時点では、上半分がポゴスティックのジャンプをエミュレートする通常の正弦波を作成しようとしていますが、それほど遠くまでは到達できないようです。私が持っている最も近いものは:
波はかなり狭く、ハイポイントはかなり高くする必要があります。上記の式は、最初の反復では問題なく開始されますが、その後、波が広くなり、高点と低点が互いに接近します。誰かが数学の初心者を助けることができますか?
android - SoundPool を使用して 10 ~ 20000Hz の正弦波を生成する
最初に AudioTrack を使用して正弦波を生成しようとしました。結果は満足のいくものではありませんでした。その後、サウンドプールのクラスに移りました。Audacity を使用して 1 秒のオーディオファイルを作成し、再生速度 (.5 ~ 2.0) を変更して目的の周波数を取得しました。(配列、のこぎり波と三角波ファイルもあるため)
次に、選択した周波数に応じてオーディオを再生します。
私が見たところ、この方法は 5000 ~ 20000 Hz の範囲を除いて正常に機能します。私はこれについて頭を悩ませていますが、なぜそれが機能していないのか、問題のパターンが見つかりません。
この方法に根本的な問題はありますか?
よろしくお願いします
編集:「説明されていません」 5000〜20000 Hzの範囲で正弦波を再生すると、周波数が不正確であることは明らかです。これは、ピッチがかなりずれていることを意味します。たとえば、19000 Hz は低すぎて、耳で簡単に検出できます。私が言えることは、10000 Hz (5000 Hz も同様です - 私の間違い) であり、通常の再生レートは正しいということです。14kHz あたりで、信号のピッチが正しくなくなります。
考え/考えられる原因(?): (A)再生速度 (SoundPool) には何段階ありますか? ドキュメントには 0.5-2.0 とありますが、これは 15 の異なる再生速度があることを意味しますか? (B) Audacity を使用して .ogg ファイルを生成しました。10000Hz の正弦波を拡大すると、滑らかすぎず (サンプル レート 44100)、波形が正確に 0 で開始および終了していないことがわかります。