問題タブ [pocketsphinx]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - LanguageModel JS ファイルを取得するには?
Web サイトでの音声認識に PocketSphinx.js を使用しています。言語モデル ファイル (.dmp) をダウンロードしました。しかし、彼らのコードは言語モデルに JS ファイルを使用しています。JS ファイルの入手先がわかりません。手伝ってください。ありがとう。
python - Python は、ポケットフィンクスからのデコーダーを認識しません
pocketphinx と sphinxbase の最新バージョン (0.8) をインストールしました。私は、ポケットフィンクスを Python コード (Python のバージョン 3.4.2) にインポートし、次のように「デコーダー」を使用しようとしています。
ただし、次のエラーが表示されます。
誰かが何が悪いのか知っていますか?
python - Jasper - Rasbery PI 音声認識 フリーフォームディクテーション
Jasper API を使用して、Python でラズベリー pi 用の音声認識プログラムを作成する予定です。しかし、私は Jasper のドキュメントを見てきましたが、キーワードの検出と事前定義された文法の検索を回避しているようです。
これはかなり良い精度を持っているように見えますが、私のプロジェクトには適していません。
自由形式のディクテーション用に Jasper を構成する方法はありますか? これを達成する方法を教えてくれる、私が見逃したソースはありますか?
以前に Google Speech API を使用して、ディクテーションで非常に良い結果が得られました。これを使用するように Jasper を構成できることは知っていますが、ディクテーションはサポートされていますか?
この件に関する情報をお寄せいただきありがとうございます。
speech-recognition - pocketphinx.js - 間違った言葉を受け入れるのを防ぎます
Webapp で音声認識に pocketphinx.js を使用しようとしています。私の問題は、ソフトウェアが聞こえるすべての単語を正しい単語として認識しようとすることです。
そして、私が見つけたすべてのデモが同じように動作するので、私は疑問に思っています.
たとえば、このデモをご覧ください: https://touchless-timer.appspot.com/timer/en.html# 英語でアラームを設定するために作られています。
しかし、私がドイツ語で何かを言っているときは、「アラームを....に設定する」のように、何か正しいことを理解したことが常に出力されます。
では、別の言語を話している場合でも、常に正しい入力を認識する場合、どのように使用すればよいですか?
私の質問が理解できることを願っています。どうもありがとう。
android - Android スタジオが pocketphinx デモ プロジェクトで .md5 ファイルを生成しない
Eclipse でPocketphinx デモプロジェクトをビルドすると、IDE はいくつかの assest ファイルの md5 ファイルを生成します。ただし、Android Studio で同じことを行うと、md5 ファイルが生成されません。この場合、Android Studio でコンパイルしたアプリケーションは、以下に示すエラーを返します。
現在 Studio 1.0.2 バージョンを使用しています。SDK ツール:24.0.2 SDK platform-tools:21 SDK Build-tools:21.1.2
問題は何でしょうか?ありがとう
c++ - ポケットフィンクスの簡単な例は、基本的な c テストでは機能しますが、c++ プロジェクトに含まれている場合は機能しません
私はポケットフィンクスでプロジェクトを構築しようとしています。私は初期状態にあり、最初に、ファイルを読み取って単語を検出する単一の main.c のドキュメントから簡単な例を試しました。
今、マイクから RtAudio 経由でオーディオ データを読み取る C++ SDL プロジェクトにこれを含めようとしましたが、機能しません。
私は得る:
マイクは次のように初期化されます:
次に、私のC ++クラスには、次の保護変数があります。
コンストラクターで私は行います(読みやすくするためにエラーチェックを削除しました):
次に、ユーザーがスペースを押すと、startNextTime_ と spaceDown_ を true に設定し、スペースを解放すると、stopNextTime_ を true に設定します。
RtAudioコールバックは、次のことを行うクラスのメソッドを呼び出します(ユーザーがスペースを押してバッファに解放するまでのオーディオデータ全体をコピーします。これが必要かどうかはわかりませんが、害はないと思います):
上記の pocketphinx エラー メッセージの後に「no hyp」という出力が表示されます。私はそれを私の小さなテスト用の c ファイルと何度も比較しましたが、唯一の違いは、a) ファイルではなくマイクからデータを読み取っていることと、b) スレッドで実行されていることです。
何か案は?
編集:
これはポケットフィンクスのログです:
android - 音響モデルの適応におけるポケットフィンクス エラー
pocketphinx-android-demo-5prealpha を使用して音声認識アプリケーションを作成したいと考えています。スペイン語で作業するには、このアプリだけが必要です。
デフォルトの音響モデルと言語モデルを voxforge のスペイン語パケット (voxforge-es-0.2.tar.gz) に置き換えました。
英語では、デフォルトでアプリは私の電話で正しく動作します: Samsung Galaxy S4 (i9505) with Android KitKat 442.
言語と音響コーパスを置き換えてプロジェクトを再コンパイルすると、アプリがクラッシュし、logcat を介して次のエラーが発生します。アプリもテストするために、「KEYPHRASE」を「comenzar」(「開始」または「起動」を意味する)に変更しました。
エラーは次のとおりです。
問題はどこだ?メソッド、変数、またはコードの種類は変更しません。
python - PocketSphinx のクラッシュ
cmu pocketphinx を使用して簡単な音声認識エンジンをコーディングしようとしていますが、decode_raw()関数に遭遇すると常にクラッシュします。PyPocketSphinx(pipでインストール)を使用して、Windows 7 64ビットでPython 2.7 32ビットを使用しています
これが私のコードです:
この問題を 1 週間以上解決しようとしましたが、まだ答えが見つかりません。
編集: クラッシュ前に生成されたログ:
編集 2: これは、PyPocketsphinx をコンパイルしようとすると、ログ ファイルに生成されます。
setup.py ビルド:
setup.py インストール:
これらの行に問題があると思います: