音声認識プログラムを作りたいです。私は自分でコードを持っています。それらはインターネット上にたくさんあります。とにかく投稿します。
import json, pyaudio
from vosk import Model, KaldiRecognizer
model = Model('small') #small
rec = KaldiRecognizer(model, 16000)
p = pyaudio.PyAudio()
stream = p.open(format=pyaudio.paInt16, channels=1, rate=16000, input=True, frames_per_buffer=8000)
stream.start_stream()
def listen():
while 1:
data = stream.read(4000, exception_on_overflow=False)
if rec.AcceptWaveform(data) and len(data) > 0:
answer = json.loads(rec.Result())
if answer['text']:
yield answer['text']
for text in listen():
print(text)
タスクは、私が不和でコミュニケーションをとる友人の音声認識と同時に音声認識を使用することです。マイクが別のプログラムで使用されている場合、speech_recognition ライブラリはエラーをスローするため、vosk ライブラリを使用しました。では、どうすればコンピューターでプログラムを実行し、オーディオ ストリームをディスコードからコンピューターに転送して、友人のスピーチが認識されるのでしょうか。これは可能ですか?