問題タブ [watson]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
xpages - Notes 文書の MIME にバイナリ応答 (ストリーム) を直接書き込む
Watson API をいじっているので、Text2Speech サービスを使用して、サービスからオーディオ ストリーム (ファイル) を取得しています。私はすでにコードを含むファイルを取得していますが、私の MIME には後で何も含まれていません。以下でこのメソッドを呼び出した後、ドキュメントを保存します。バイト コンテンツを直接 MIME にストリーミングするためのベスト プラクティスを教えてください。
node.js - ノードを使用した IBM Watson Speech to Text API。DOMに出力するには?
私は npm モジュールを使用して IBM の Watson と連携し、音声をテキストに変換しています。ここでこのパッケージを使用しています: https://github.com/watson-developer-cloud/speech-javascript-sdk。
正常に認証できますが、それ以外は何も起こりません。応答からテキストを取得し、DOM に挿入したいと考えています。試してみるために次のことを試しましたが、何のフィードバックも得られません。
ドキュメントには、このメソッドについて次のように書かれています。
options.outputElement が設定されている場合、WritableElementStream に渡されるその他のオプション。
と
デフォルトでは FormatStream を介して結果をパイプします。 options.format=false > を無効に設定します。
WatsonSpeech.SpeechToText.recognizeMicrophone はコールバック関数を受け取るので、応答を処理して DOM に挿入できると思いますが、それがわかりません。また、私は本当に JS の人ではないので、promise が何をするのかわかりません。
ibm-watson - Watson knowledge studio: モデルにレシピ名を取得するように教える方法は?
私はここ数週間、Watson Knowledge Studio の使い方を理解しようとしてきました。私は、データをシンプルにし、注釈を付けやすくするために、料理のレシピに取り組んできました。私の目標は、レシピを構造化されていないテキストとして送信し、レシピ名、材料、調理器具、予算、食事などで構造化された応答を取得できるようにすることです.
レシピ名を除いて、これまでのところ実際には問題ありません。
だから私の質問は、この非常に特定の部分(レシピ名)を識別する方法をモデルに教える方法です。ほとんどの場合異なるからです。
どんなアドバイスも歓迎します:)
html - Watson Retrieve and Rank サービスの Web インターフェースを使用して、html を含む zip ファイルまたは json ファイルを含む zip ファイルをアップロードできますか?
Watson Retrieve and Rank サービスの Web インターフェースを使用して、html を含む zip ファイルまたは json ファイルを含む zip ファイルをアップロードできますか?
ibm-cloud - WebSocket を備えたブラウザーから watson Speech to Text を使用する (ライブ検出)
「ライブ検出」を使用してブラウザーから IBM Watson Speech to Text を使用したい。つまり、オーディオを録音してファイルを送信したくない。代わりに、Websockets オプションを使用して継続的な音声テキスト変換を行いたい。
この git リポジトリを見つけました https://github.com/watson-developer-cloud/speech-javascript-sdk
しかし、使用方法に関する実際の例は見つかりませんでした。誰かがそれを使用する方法(または他の代替手段)のコード例を教えてもらえますか。
おそらく私WatsonSpeech.SpeechToText.recognizeMicrophone({token})
が必要としているものであり、それを使用するためのいくつかの例で十分だと思います。
java - IBM Watson テキスト読み上げの StreamPlayer を停止する方法
IBM Watson テキスト読み上げを使用して、Android アプリケーションでテキストを音声出力に変換しようとしています。ここに私の依存関係があります
ここで文字列をオーディオに変換します
問題は、オーディオを再生するアクティビティを終了すると、オーディオを停止したいときにオーディオが再生され続けることです。
使用する場合android.speech.tts.TextToSpeech
は簡単に使用できますTextToSpeech.stop()
が、IBM Watson のテキスト読み上げでどのように行うのですか?
watson - ワトソンは他の単語を学習しますか?それとも私が常に教えなければなりませんか?
IBM のワトソン会話にいくつかの単語を教えた後、時間の経過とともに、彼は同じ主題に関連する他の人を学習しますか?それとも私は常に新しい単語を入力する必要がありますか?
speech-recognition - カスタム・モデルを使用した Watson Speech-to-text の精度が低い
Watson 会話サービスは私のアクセントを認識しませんでした。そのため、カスタム モデルを使用しました。カスタム モデルを使用する前と使用した後の結果を次に示します。
試験結果
モデルを統合する前に:- 彼らが持っているモットーがある場合。シーラ。その中でもジャバ。女性。。
モデルを統合した後:- Omatta David を提供します。スリランカ。その中でもジャバ。番号。政府
実際の音声- Audio 49,Wijayaba Mawatha,Kalubowila,Dehiwela,Sri Lanka.Government.Gov.
カスタムモデルをどのように含めたか- github からフォークされたデモで指定された同じファイルを使用しまし た socket.js に、図に示すようにカスタマイズ ID を含めました。カスタムモデルを含める他の方法(カスタムモデルを統合する方法) )しかし、私が行った方法が正しいかどうか知りたいですか?
カスタム モデルの作成に使用した Python コードを次に示します。コードリンク
これは、JSON 形式で Python コードを実行した後のコーパス結果です。コーパスファイル
これは、スリランカのすべての道路を含めたカスタム モデル(コードに含まれていたカスタム モデル テキスト ファイル)です。
ファイルをフォークし、socket.js を次のように編集しました。