問題タブ [retrieve-and-rank]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
retrieve-and-rank - 質問をアップロードするためのフォーマットの簡単な情報はどこにありますか?
状況:
検索およびランク付けサービスをトレーニングして簡単に構成したいと考えています。いくつかの PDF をアップロードしましたが、いくつか質問をアップロードしたいと思います。ドキュメントには、csv ファイルをどのように構造化する必要があるか、どのフィールドが必須フィールドで、どれが必須ファイルではないかについての簡単な情報が見つかりません。
「[あなたの質問 (必須)]」、[ドキュメント ID (必須)]、[ランキング (オプション)]のようなもの:
セクションxyzのxyzにあるドキュメント ID 。
ヘルプの中には、そのような種類のヘルプが見つかりません。
https://www.ibm.com/watson/developercloud/doc/retrieve-rank/training_data.shtml#script
影響:
チュートリアル以外では、構成の「実際の」ドキュメントを取得する機会はありません。
考えられる解決策:
追加のドキュメントを提供します。
多分私はそれを見つけることができなかったので、誰かが私を正しい場所に案内してくれますか?
ibm-cloud - Bluemix Retrieve&Rank では、継続的に学習するためのシステムをどのように実装しますか?
以下のWebページを参考に、IBM BluemixのRetrieve & Rankサービスを利用して、問い合わせに対応できるボットを作成しています。
質問: 問い合わせに対するユーザーの回答に基づいて、ランカーを一度学習した後、継続的に学習して回答精度を向上させる仕組みをどのように構築できますか?
前提:R&R サービスには、ユーザーの問い合わせ回答結果から継続的に学習する API がなかったため、GroundTruth ファイルをチューニングしたり、ランカーを再度トレーニングしたりするなどのプロセスを定期的に実行する必要があると考えられます。
想定GTファイルのチューニング内容:
- 新しい質問がある場合は、質問と回答のセットを追加します
- 既存の質問でうまく答えられなかったものがある場合は、応答の関連性スコアを増減します (ボットが間違って答えた場合はスコアを下げ、有用な答えがあればスコアを上げます)
ibm-watson - Watson R&R サービスは、特定のユーザーが制限された回答にアクセスできるかどうかを指定できますか?
私が知っているように、Watson は、ユーザーが質問をすると、ランクの信頼性を備えた比較的正しい答えを提供できます。しかし、実際には、一部の制限された情報をすべてのユーザーに公開してはなりません。Watson は、どの回答を公開してはならないか、または制限された回答に誰がアクセスできるかを知ることができますか? 可能であれば、ワトソンを学習させるにはどうすればよいですか?
retrieve-and-rank - Watson Retrieve & Rank サービスのクラスターの作成
APIを取得してランク付けするのは初めてです。最初のチュートリアルに取り掛かりました。50 MB のストレージで新しいクラスター (無料) を作成しようとすると、次のエラーが発生します。
新しいクラスターを作成できません: If-Match ヘッダーが正しくありません
再現手順: 1) Bluemix の取得およびランク付けサービスの [ツールの起動] をクリックします。2) 新しいウィンドウが開きます。接続された「ドキュメント変換」API を選択します。3) [新しいクラスターの作成] をクリックします。4) クラスター名を追加し、[クラスター サイズ] ドロップボックスで 0.05 GB を選択します。5) 「作成」ボタンをクリックします。
結果 エラー メッセージ: 新しいクラスターを作成できません: If-Match ヘッダーが正しくありません
ibm-watson - 取得およびランク Web インターフェイスでタイトルと ID を設定する
IBM Watson Retrieve and Rank Web Interface を使用して、html 記事のコレクションを作成しました。Web インターフェイスを介して、HTML 記事をアップロードできました。問題は、ID とタイトルのデータが使用できないコレクションを照会するときです。ブラウザで作成したクエリは次のとおりです。
https://MY-USER-NAME:MY-PASSWORD@gateway.watsonplatform.net/retrieve-and-rank/api/v1/solr_clusters/MY-CLUSTER/solr/MY-COLLECTION/select?q=基本とは遷音速補助翼バズのメカニズム&wt=json&fl=id,title
私が得る応答は次のとおりです。
{"responseHeader":{"status":0,"QTime":106,"params":{"q":"遷音速エルロン バズの基本的なメカニズムは何ですか","fl":"id,title", "wt":"json"}},"response":{"numFound":12,"start":0,"docs":[{ "id":"6a06f47c-cb3f-4791-9914-c84772eb9415",""タイトル":"無題" }.....
太字部分が問題です。Web インターフェイスを使用する場合、ドキュメントをアップロードするときにタイトルと ID を設定する方法はありますか? または、コレクションにクエリを実行して、アップロードしたドキュメントのファイル名やドキュメントのテキストを取得する別の方法はありますか?
html - Watson Retrieve and Rank サービスの Web インターフェースを使用して、html を含む zip ファイルまたは json ファイルを含む zip ファイルをアップロードできますか?
Watson Retrieve and Rank サービスの Web インターフェースを使用して、html を含む zip ファイルまたは json ファイルを含む zip ファイルをアップロードできますか?
retrieve-and-rank - watson retrieve-and-rank - 手動ランキング
デモンストレーション用のランカーを構築しようとしています。「自動トレーニング」を行ったところ、OK の結果が得られました (改善される可能性があります)。手動トレーニングを開始しようとしていますが、Bluemix のオンライン ドキュメント ( https://www.ibm.com ) のパラメーターの意味について混乱しています。 /watson/developercloud/doc/retrieve-rank/training_data.shtml#manual
次の Bluemix サンプル データについて説明してもらえますか?
query__id とは何ですか? (それは何を表しているのですか?) feature1、feature2 とは何ですか? (それは何を表していますか?) question_id_1 とは何ですか? (それは何を表しているのですか?)そしてそれらのスコアはどのように計算されますか(0.0、3.4、-900)?
私は、ground_truth の値が 0 から 4 まででなければならないことを理解しました (0 はまったく関連がないことを意味し、4 は完全一致を意味します)、それは正しいですか?
よろしくザビエル
solr - Solr ltr(learning to rank) モジュールの使用時にユーザークリックを使用してモデルをトレーニングする方法
https://issues.apache.org/jira/browse/SOLR-8542では、Solr はランク付けの学習機能を統合しています。
私はそれを私たちの製品に統合しようとしました。しかし、部分的なペアワイズ フィードバックをそのドキュメントの重要性または関連性に変換する方法を理解するのは困難です。 https://github.com/apache/lucene-solr/blob/f62874e47a0c790b9e396f58ef6f14ea04e2280b/solr/contrib/ltr/README.md トレーニング データの組み立て部分: 3 列目は、そのドキュメントの相対的な重要性または関連性を示します。
https://static.aminer.org/pdf/PDF/000/472/865/optimizing_search_engines_using_clickthrough_data.pdfを読みました
http://www.cs.cornell.edu/people/tj/publications/joachims_etal_05a.pdf
http://alexbenedetti.blogspot.com/2016/07/solr-is-learning-to-rank-better-part-1.html しかし、まだ手掛かりがありません。
部分的なペアワイズ フィードバックを 5 つのスコアに変換し、それを使用してモデルのトレーニングと更新を行う方法について、詳細な説明とサンプル コードを教えてください。
どうもありがとう。
ibm-cloud - R&RインデックスドキュメントAPIのHTTP 403(requested via method [POST] has been blocked)エラーの解決方法
R&R で 200 万件のドキュメントをインデックスに登録しようとしましたが、約 83 万件のドキュメントの後、HTTP403 エラーが発生しました。一度に 1 万件のドキュメントを含む「API の更新」リクエストを送信し、カスタマイズしたツールで操作を繰り返しました。約83万回まで成功したので、基本認証のクレデンシャルを間違えたとは思いません。
クラスター リソースにリソースの問題はないようです。ディスクとメモリに空き容量があります。
この HTTP403 エラーの原因と解決方法を教えていただけないでしょうか。