Google Mini 検索アプライアンスによってインデックス付けされたページを含む Drupal サイトがあります。
週の初めに、多数のリンクがインデックス済みとしてマークされていることに気付きましたが、同じページに戻る「このページを印刷する」リンクがあり、rel="nofollow" が設定されていたため、除外されていました。nofollow を削除し、2 日前に GSA にサイトの再インデックスを依頼しました。
現在、問題のページは GSA 内でインデックス登録済みとしてマークされていますが、サイトの検索結果には表示されていません。
/search/google_appliance/TERM で検索しても表示されません。他の用語を検索すると、それらが表示されます。つまり、GSA が機能していることがわかります。
/search/node/TERM [Drupal デフォルト検索] で検索すると、異なる Drupal の結果が得られます [用語を含むページが表示されます]。これにより、GSA に到達していることを確信できます。
新しくインデックスに登録されたページが GSA 検索に表示されない理由について何か考えはありますか?
編集/解決済み: いくつかの問題がありました。以前は、検索で xslt を使用して、ページの表示方法と、送信を押したときにクエリが送信されたページの場所 (サイトの送信ボタンではなく、アプライアンス上) を処理していました。クエリ文字列は古い形式でサイトに渡され、サイトは 404 を返しました (bookstore.site.com と origin.site.com を検索した場合と同じです)。検索に関係するものよりも、「ここからそこにたどり着けない」ような問題です。xslt を削除したので、デフォルトの Google ルック アンド フィールが使用され、アプライアンスのデータベースに対して適切で一般的な検索を実行できるようになりました。
ただし、Drupal モジュールが解析できず、ログが simplexml_load_string() [function.simplexml-load-string]: ^ in \sites\all\modules\google_appliance\GoogleMini でヒットするという奇妙な検索結果が返されました。 318行目の.php。
いくつかのクエリ文字列変数を試し、出力エンコーディングを設定する行をコメントアウトすると、すべてが機能するようです。問題の行は google_appliance.module の 322 行目です。
$gm->setOutputEncoding('utf8');