特定のファイル タイプのみをインデックス化するように LucidWorks Web データ ソースを構成しようとしています。ただし、インクルード パスを.*\.html
.html ファイルのみをクロールするように設定すると (簡単な例として)、トップ レベルのフォルダーのみがインデックス化されます。 クロールの深さが に設定されて-1
おり、インクルード パスを空白のままにすると、期待どおりにサブツリー全体がクロールされます。
Web データ ソースの作成と正規表現の使用に関するドキュメントを参照しましたが、どの文字にも一致する必要があるため、.*\.html
機能しない理由が見つかりません。.*