シナリオ:
BLOB ストレージ: PDF、Word、画像ファイル (約 70 ファイル) が含まれています
既定のフィールドと定義済みのスキルを使用して、Azure ポータルから Azure 検索インスタンスを作成しました。
しかし、これらのファイル内のテキストを照会した結果はあまり良くありません。コンテンツとキー フレーズを検索および取得できるようにしました。Lucene アナライザーを使用しようとしましたが、あまり役に立ちませんでした。
主な懸念は、検索エクスプローラーで「u」などの文字を入力すると、ファイルが返されることです。私の理解によると、私のファイルにはそのような単語はありません。それで、それは何をしているのですか?
検索を絞り込むには?また、結果を操作する方法は?
私は文書処理の専門家ではありません。そのため、JSON 形式のドキュメントではなく、ブロブ内の非構造化ドキュメントを使用します。
別のこと、インデックス内のフィールドを定義する方法、たとえば、PDF の章/タイトル名に関連する章名またはタイトル名としましょう?
いくつかのアイデアやリンクの例を教えてください。これを開発するために.netコアを使用しています。