-1

だから、私は Vib リボンをリメイクしようとしています: http://www.youtube.com/watch?v=ehdymXc0epY 入力は .wav ファイルになります。さまざまな障害を生み出すボリュームとピッチのしきい値-フーリエ変換を指摘されましたが、これは理解できません。誰かがこの状況に適した波形解析クラスを教えてくれますか? AudioSurf や音楽ビジュアライザーなどのソース コードを入手できませんでした。

なぜ Java なのですか?私は入門 Java クラスを取っているので、他の言語は機能しません。

4

2 に答える 2

1

Praat スクリプト (Praat はここからダウンロードできます) を記述して、必要な情報を含む出力ファイルを生成し、その txt ファイルを Java プログラムで読み取ることができます。

@Garethが言ったように、おそらく外部ライブラリもあります。

于 2012-07-27T15:24:05.600 に答える
0

別の言語(Python)と別のクラスプロジェクトではありますが、これにはSound Viewer Toolを使用することになりました。以下が svt.py に追加された場合:

def processWav(filename, channel):
    """
    filename: path to a wav file
    Channel: 1 for left, 2 for right
    Returns centroids, frequencies, volumes
    """
    #open file
    audio_file = audiolab.sndfile(filename, 'read')
    #should be length of audiofile in seconds * 60. will fix this later
    import contextlib
    import wave
    with contextlib.closing(wave.open(filename, 'r')) as f:
        frames = f.getnframes()
        rate = f.getframerate()
        duration = frames / float(rate)
    duration *= 30 #30 data points for every second of audio yay
    duration = int(duration) #can only return an integer number of frames so yeah
    #print duration
    #Not really samples per pixel but I'll let that slide
    samples_per_pixel = audio_file.get_nframes() / float(duration)
    #some rule says this frequency has to be half of the sample rate
    nyquist_freq = (audio_file.get_samplerate() / 2) + 0.0
    #fft_size stays 4096
    processor = AudioProcessor(audio_file, 2048, channel, numpy.hanning)

    centroids = []
    frequencies = []
    volumes = []

    for x in range(duration):
        seek_point = int(x * samples_per_pixel)
        next_seek_point = int((x + 1) * samples_per_pixel)
        (spectral_centroid, db_spectrum) = processor.spectral_centroid(seek_point)
        peaks = processor.peaks(seek_point, next_seek_point)      
        centroids.append(spectral_centroid)
        frequencies.append(db_spectrum)
        volumes.append(peaks)

    #print "Centroids:" + str(centroids)
    #print "Frequencies:" + str(frequencies)
    #print "Volumes:" + str(volumes)

    #convert volumes[] from peaks to actual volumes
    for i in range(len(volumes)):
        volumes[i] = abs(volumes[i][0]) + abs(volumes[i][1])
    #round frequencies to save resources
    for i in range(len(frequencies)):
        for j in range(len(frequencies[i])):
            frequencies[i][j] = round(frequencies[i][j], 4)
    return centroids, frequencies, volumes

分析は、wav ファイルで簡単に行うことができます。重心は音楽の音色を表し、周波数の加重平均であり、任意の時点での全体的な明るさを示します。

ここでの最初の回答は、FFT/信号処理/デジタル サウンド表現を理解する上で非常に役立ちました。

于 2013-01-22T20:56:06.673 に答える