2

Nutch を使用してサイトのインデックスを作成しましたが、現在は Zend Lucene ライブラリを使用してインデックスを検索しています。

私は実際に Zend ライブラリを Codeigniter に取り込みましたが、すべて Zend が作業を行っています。

タイトル、スコア、URL は問題なく表示できますが、ページのコンテンツを表示するためのフィールドの名前が見つかりません。

これまでのところ、次のコードがあります

$index = new Zend_Search_Lucene('C:\nutch\nutch-0.9\my-search\index');

$query = $this->input->post('searchQuery');

$hits = $index->find($query);

echo "<p>Index contains " . $index->count() . " documents.</p>";

echo "<p>Search for '" . $query . "' returned " . count($hits) . " hits</p>";

foreach ($hits as $hit) 
{

  echo "<h4>" . $hit->title . "</h4>";

  echo "<p><b>Score:</b> " . sprintf('%.2f', $hit->score) . "</p>";

  echo "<p><b>Url:</b> " ."<a href='" . $hit->url . "'>" . $hit->url. "</a></p>";

}

コンテンツまたはコンテンツの要約を表示するフィールドの名前を手伝ってくれる人はいますか?

ありがとう

4

1 に答える 1

2

Nutch インデックスの形式はわかりませんが、lucene インデックスを確認する必要があるときはいつでも、Luke - Lucene Index Toolboxを使用します。

インデックス ディレクトリを開き、フィールドを参照し、クエリを実行できます。なじみのないインデックスを使用している場合に非常に役立ちます。

于 2010-11-22T15:55:56.350 に答える