問題タブ [fast-esp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
377 参照

fast-esp - FAST-ESP で HTML メタデータから日付を抽出する

ドキュメント処理中に、html メタ データからすべての日付を抽出し、日付フィールド (dtgeneric1) に入力するために使用される最新の日付を特定したいと考えています。

Spy ステージを使用した検査では、パイプラインで既に meta_* 属性が追加されていますが、メタ データ名は異なるソースからのドキュメント間で異なることが示されています。

理想的には、すべての meta_* 属性を Python ステージに渡し、それを使用してどれが日付でどれが最大かを判断したいと考えていますが、「すべてのメタ属性」を入力として指定する方法はないようです。

誰かが似たようなことをしたことがありますか?これを行うための最良の方法についてアドバイスを提供できます.

ありがとう

ニール

0 投票する
2 に答える
814 参照

python - Fast Esp カスタム ステージ開発

私は Enterprise Search に取り組んでおり、Fast ESP を使用しています。今のところ 4 つのプロジェクトがありますが、ステージと Python に関する情報はありません。しかし、私はカスタムステージ開発を学んだことに気づきました。書類の処理に苦労することが多いからです。カスタム ステージを開発する方法を知りたいです。特に、Attributefilter ステージのソース コードを見つける方法を知りたいです。私はあなたの答えを待っています

0 投票する
2 に答える
1865 参照

sharepoint-2010 - FullTextSearchQuery は、SharePoint 2010 および FAST Search Server とどのように連携しますか?

SharePoint 2010 と FAST Search Server を既定の検索サービス アプリケーションとしてテスト環境をインストールしました。いくつかのテスト コンテンツから開始し、std を使用していくつかの検索を実行しました。SharePoint GUI - これまでのところすべて問題ありません。

ここで、Microsoft.Office.Server.Search.Query.FullTextSqlQuery クラスを使用して、より複雑なクエリを実行したいと考えています。検索で返された ResultTableCollection オブジェクトにアクセスしようとすると、例外が発生します。

これは、実行しようとしている PowerShell スクリプトです。

そして、これは例外です (上記のコードの最後の行によってスローされます):
指定されたキーが辞書に存在しませんでした。
System.Collections.Generic.KeyNotFoundException で System.ThrowHelper.ThrowKeyNotFoundException() で
System.Collections.Generic.Dictionary`2.get_Item(TKey キー) で
Microsoft.Office.Server.Search.Query.ResultTableCollection.get_Item(ResultType requestedType)で

std を使用して検索を実行すると、まったく同じスクリプトが完全に機能します。SharePoint 検索サービス アプリケーション。ここで、クエリ結果のセキュリティ トリミングが問題の原因である可能性があると述べた関連記事を 1 つ見つけました。ただし、私の FAST サービス アプリケーションのサービス アカウントには AD に対する十分なアクセス許可があるため、これが私の環境にどのように関連するかわかりません。

助言がありますか?

0 投票する
1 に答える
244 参照

fast-esp - FAST ESP クエリから一度に複数の結果を取得する方法

私は現在、Java fast esp インターフェイス (v5.0.15.1) を使用して高速にクエリを実行し、結果を取得しています。ただし、IQueryResult からドキュメント イテレータしか取得できないようで、.next() への各呼び出しは http リクエストのようです。一括結果を処理するより良い方法はありますか?

0 投票する
1 に答える
533 参照

performance - インターネットサイト用のFASTSearchServer2010の情報が必要

これは、SharePoint製品の高速検索ではありません。SharePointなしでインストールできるFAST製品に関する情報を探しています。

Googleで検索しましたが、次のブログ以外の情報が見つかりません-http ://consultingblogs.emc.com/manjunathasubbarya/archive/2010/12/05/fsis-fast-search-for-internet- sites.aspx

インストールと構成をサポートしているSMEがいるかどうか知りたいです。MicrosoftのWebサイトに情報がありますか?FASTがSharePointの外部でサポートされているかどうかを誰かが知っている場合。

0 投票する
0 に答える
1496 参照

sharepoint-2010 - FAST Search Server と SharePoint 2010 を使用した複数値管理プロパティ

私のシナリオは、FAST Search Server がインストールされた SharePoint 2010 環境です。FQL (Fast Query Language) で SharePoint KeywordQuery クラスを使用して、FAST インデックスに対してクエリを実行しています。

私の問題:どうやら高速検索サーバーは「返されたクエリ結果でデータ型の認識をサポートしていません」(ここで述べたように)。これは、複数のクロールされたプロパティ (「作成者」など) にマップされている管理プロパティの場合、エンジンはすべての値を含む単一の文字列のみを返すことを意味します。(その場合、SharePoint 検索は文字列の配列を返します。)

さまざまな値を区別できるようにする必要があるため、その問題の可能な解決策を見つけようとしました。これが私がこれまでに見つけたものです:

  1. カスタム プロパティ エクストラクタを実装し、さまざまな値のセパレータを導入します。
  2. たとえば、FAST 構成ファイル (たとえば、C:\FASTSearch\index-profiles\deployment-ready-index-profile.xml) を変更し、異なる値の区切り記号を導入します。
  3. KeywordQuery クラス (ResultType.RefinementResults) の絞り込み機能を使用して、絞り込み結果と検索結果の間のマッピングを試みます。

私の意見では、1 と 2 はどちらもお勧めできません。システム全体 (FAST Search Center サイトなど) に影響を与える「標準」管理プロパティの動作を変更するからです。さらに、構成ファイルが FAST 更新によって置き換えられるため、2 は MS によって禁止されているようです。3は非常に高価な操作のようです。

私が見逃した他の解決策はありますか?どんなアドバイスも大歓迎です...

0 投票する
2 に答える
2111 参照

sharepoint - ローカル ファイル システムで FAST Search クロールがエラー 0x80040d07 で失敗する

私のマシンには、Sharepoint 2010 と FAST Search for SharePoint 2010 が正常にインストールされました。SharePoint サイトのクロールでは問題なく動作しているように見えますが、ローカル ファイル システムのクロールは以下のエラーで失敗し続けます。

これは、イベント ビュー アプリケーション ログから取得しました。サービスを実行しているユーザーへの読み取り、一覧表示、および実行アクセスを許可するようにアクセス許可が設定されていることを確認しました。また、クロール ルールなどを更新して、非常に自由度の高いものにしてみました。

コンテンツ ソースで試した URL は次のとおりです。 //win-fs/C:/Users/ravish/FAST_TEST_SET file://win-fs/C:/Users/ravish/FAST_TEST_SET file:\win-fs\C:\ユーザー\ravish\FAST_TEST_SET

これまでのところ何も機能していないようです。答えを見つけようとしてウェブを苦労してきましたが、同様の問題を抱えている多くのユーザーを見つけましたが、それに対する明確な回答はありません. 私は何時間も費やしたので、どんな助けも感謝します。

私のシステムの詳細: Windows Server 2008 R2 Sharepoint Enterprise 2010 FAST Search 2010

(すべて単一のラップトップにインストールされています)

0 投票する
1 に答える
887 参照

sharepoint-2010 - FAST For SharePointWebCrawlerメタタグ抽出

FAST For SharePointを使用して、SharepPoint以外のWebサイトをクロールしています。ウェブサイトはエラーなしでクロールしました、私はどんなキーワードの結果も得ることができます。

結果ページにhtmlページのメタタグでリファイナーを作成したい。2つのレベルのリファイナーが必要です。カテゴリとサブカテゴリ。ユーザーがカテゴリをクリックした場合、リファイナパネルには関連するすべてのサブカテゴリが表示される必要があります。

このようなメタタグ:

FAST For SharePoint Webcrawlerを使用してHTMLページをクロールしたメタタグを抽出するにはどうすればよいですか?

メタタグ名を[FASTSearchAdministration] > [Managed Properties ]に追加し、それらのメタタグのリファイナーパネルを構成しようとしましたが、結果を取得できませんでした。それは動作しません。

ありがとうございました!

0 投票する
4 に答える
1582 参照

c# - .NET を使用してギガバイト単位のデータを FAST ESP に効率的に供給する方法

これは難しい質問ですが、とにかくやってみます。私たちの仕事は、Microsoft FAST ESP にギガバイトのデータを供給することです。インデックス化されたデータの最終的な量は、50 ~ 60 GB 程度です。

FAST には .NET API がありますが、コア コンポーネントは Python で記述されています (パイプラインを処理してドキュメントにインデックスを付けます)。課題は、インデックス作成のためにギガバイトのデータをシステムに供給しながら、システムと確実に通信することです。

ここで FAST で発生する問題は次のとおりです。

  1. 一度に大量のデータが供給されると、システムが何時間もアクセスできないままデータのインデックスを再作成する必要があるため、システムは風変わりです。受け入れられない。

  2. これには時間がかかりすぎる (数日) ため、すべてのデータをキューに入れ、一度に 1 つのアイテムを連続してフィードするオプションはありません。

  3. FAST でアイテムをインデックス化できない場合、クライアントはアイテムを再フィードする必要があります。これが機能するためには、システムがコールバック メソッドを呼び出して、クライアントに失敗を通知する必要があります。ただし、システムがタイムアウトするたびに、そのコールバックが呼び出されないため、フィード クライアントはタイムアウトに対応できません。したがって、クライアントは飢えています。データはキューにありますが、システムに渡すことができません。キューが崩壊します。データが失われます。あなたはアイデアを得る。

ノート:

  1. 小さなアイテムの場合は数秒、大きなアイテムの場合は最大 5 ~ 8 時間かかります。
  2. インデックスが作成されるアイテムは、バイナリ ベースとテキスト ベースの両方です。
  3. 目標は、完全なインデックス作成に「わずか」48 ~ 72 時間かかることです。つまり、週末に実行する必要があります。
  4. ここでの FAST ドキュメント処理パイプライン (Python コード) には、それぞれ約 30 のステージがあります。この記事の執筆時点では、合計 27 のパイプラインがあります。

要約すれば:

主な課題は、大小の項目を適切な速度でシステムに供給することです (システムが崩壊したり、メモリの問題が発生したりする可能性があるため、速すぎたり、時間がかかりすぎるため遅すぎたりすることはありません)、同時に、並行して実行します。スレッドを非同期に実行するような方法。私の意見では、どのアイテムをいつ、何個同時に給餌するかを決定するアルゴリズムが必要です。並列プログラミングが思い浮かびます。

各キュー (プロセス) が特定のサイズのアイテム専用である複数の「キュー」が存在する場合もあります。これらのアイテムはキューにロードされ、1 つずつ (ワーカー スレッドで) 供給されます。

誰かがこのようなことをしたことがあるかどうか、またはこのような問題にどのように対処するかについて興味があります.

編集: 繰り返しますが、私は FAST ESP を「修正」したり、内部の仕組みを改善したりするつもりはありません。有効活用にチャレンジ!

0 投票する
1 に答える
628 参照

fast-esp - http経由でアクセス可能なリモートFASTESP5.3サーバーにクエリを実行するクライアントツール

http経由でアクセス可能なリモートFASTESP5.3サーバーでFASTクエリを実行するために使用できるクライアントツールはありますか?