5

I'm currently looking at indexing an ASP website from Sharepoint and I need to replicate the old "advanced search" schema that the users are familiar with. In order to do this I need to index a few meta tags from the web pages. This is easily done and for the text fields I can use them in the search as well. However for date meta tags, like "expired" or "published" I'm having some problems. The problem is basically that the meta tags are crawled as "text", but I need Sharepoint to parse them as datetime. I've seen a few posts on TechNet asking for the same, but with no answer.

1: https://forums.microsoft.com/TechNet/ShowPost.aspx?PostID=2614064&SiteID=17 TechNet

4

2 に答える 2

3

あなたは何も悪いことをしていません、これは製品がどのように機能するかです。前に言ったことに加えて、カスタマイズするのは簡単ではありません。

これに取り組む適切な方法は、HTML用のカスタムプロトコルハンドラーを作成することです。これは、いくつかのインターフェイスを実装するカスタムCOMオブジェクトです。MOSS 2007 SDKには、プロトコルハンドラリファレンスがあります。

これを行うときに、initファイルを作成して、METAフィールドをクロールするタイプを(String、Int、DateTime)として定義できるようにしました。次に、カスタムプロパティを追加すると、すべてが適切に解析されました。その後、通常どおりにカスタムプロパティを使用できます。

于 2008-11-03T15:35:37.870 に答える
1

検索に組み込まれている Web クローラーは初歩的なものであり、メタ タグを含めるように簡単に拡張することはできません。独自のプロトコル ハンドラを記述して、独自のコンテンツ ソース内の ASP ページをクロールできると言われています。それが機能すると言われています。ただし、実際に独自のプロトコル ハンドラを作成する人はいないと思います。

SharePoint クローラーが提供するものにがっかりすることになるでしょう。そのため、公式フォーラムにも回答がありません。本当の回答は、「それは簡単にはできません。ごめんなさい」だからです。

ASP ページのメタ タグ自体をクロールするカスタム Web サービス (ASMX または WCF ベース) を作成することで、何かをハックできる場合があります。そこから、Web サービスの結果を検索可能な BDC にプルし、検索結果/BDC データに元のページへのリンクを含めることができます。それは Rube Goldberg デバイスのようなものですが、プロトコル ハンドラーの書き方を理解するよりも簡単であると言っても、信じてください。

于 2008-10-03T19:35:02.077 に答える