問題タブ [content-indexing]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
449 参照

windows - Windowsフォルダでコンテンツのインデックス作成が有効になっているかどうかを確認するにはどうすればよいですか?

Delphi2010から呼び出すことができるWindowsAPIを探しています。これにより、アプリケーションは、特定のフォルダーでコンテンツのインデックス作成が有効になっているかどうかを判断できます。つまり、フォルダを右クリックしたときに[プロパティ]ダイアログの[詳細属性]ページにある[ファイルのプロパティに加えて、このフォルダ内のファイルにコンテンツのインデックスを作成することを許可する]というチェックボックスがオンになっているかどうか。これについてはMSDNであまり見つけることができませんが、適切な場所を探していない可能性があります。

0 投票する
2 に答える
1321 参照

lucene - Lucene.NET ファセット検索

Solr を使用せずに、Lucene.NET でファセット検索を構築しています。現在のクエリ内のナビゲーション アイテムのリストを取得したいと考えています。正しい方向を向いていることを確認したいだけです。うまくいくアイデアを念頭に置いていますが、これが正しい方法かどうかはわかりません。

現時点での私の計画は、使用可能なすべてのフィルターの階層を作成し、ここで説明する手法を使用してリストを調べて、結果がゼロのフィルターを除外して、それぞれのカウントを取得することです。それは大丈夫ですか、それとも何か不足していますか?

0 投票する
2 に答える
317 参照

video - ビデオコンテンツを分析し、インデックスを作成します (検索エンジンを使用しますか?)

何千ものビデオ ファイルのインデックスを作成するにはどうすればよいですか? ビデオ ファイルのオーディオ トラックを分析し、これをタグのようにどこかに書き込みます。

ありがとう!

0 投票する
1 に答える
532 参照

solr - solrのインデックス作成と再インデックス作成

10個のフィールドを持つスキーマがあります。フィールドの1つはtext(ファイルのコンテンツ)であり、残りのすべてのフィールドはカスタムメタデータです。ドキュメントは変更されませんが、メタデータは頻繁に変更されます。インデックスの再作成中にドキュメント(テキスト)をスキップする方法はありますか?カスタムメタデータのみをインデックスに登録できますか?インデックスの再作成でDocument(text)をスキップした場合、インデックスドキュメントからテキストフィールドを削除してインデックスファイルを更新しますか?

0 投票する
1 に答える
288 参照

java - ルセン検索

親愛なる StackOverFlow 開発者の皆様 助けてください。私は Java スイング アプリケーションで使用する Apache lucene で立ち往生しています。問題は非常に複雑で、私でさえ混乱しています。私の実際の要件が何であるかを理解してください。クライアントがswingアプリケーションでhtmlファイルにアクセスできるように、htmlファイルを提供する必要があるのは簡単です。検索機能には、apache luceneインデックスを使用することにしました。これは検索機能を提供していますが、検索条件に一致した html ファイル データを表示したいと考えています。Java APIではswingを使用しており、JEditorPaneはhtmlファイルの内容を表示する必要があるコントロールです。html ファイルのインデックスを作成する方法と、html ファイルのコンテンツを lucene インデックスから取得する方法を教えてください。HTMLファイルにはテキストだけでなく、リンクも含まれています。

よろしくお願いします。

0 投票する
1 に答える
351 参照

.htaccess - htaccess は、特定のサブドメインの特定の URL のみを許可し、残りはすべて許可しない

当社のウェブサイトには 2 つのサブドメインがあります。

  • subdomain1.xxxxx.com
  • subdomain2.xxxxx.com

(数日前に 2 番目のものを作成しました)

私が .htaccess で達成しようとしていること:

すべてのsubdomain2.xxxxx.com/???URL が検索エンジンに表示されないようにする必要があります。実際、Google が両方のサブドメインを含むすべての URL のインデックスを作成し始めていることがわかりましたが、それは望ましくありません。

2 番目のサブドメインを特定の URL だけに使用したいと考えています。たとえば、次のようになります。

subdomain2.xxxxx.com/live/

他のすべての URL は、2 番目のサブドメインで機能してはなりません。したがって、Google はこの URL だけを 2 番目のサブドメインでインデックスに登録する必要があります。

subdomain2.xxxxx.com/live/

他に何もありません...他のすべてのURL(たとえば、subdomain1.xxxxx.com/video/またはsubdomain1.xxxxx.com/photo/その他すべて)は、サブドメイン1内で引き続き表示され、インデックス化されている必要があります。サブドメイン2でのみ機能するため、もちろんsubdomain1.xxxxx.com/live/機能してはなりません。

どうすれば.htaccessでそれを行うことができますか?

0 投票する
1 に答える
456 参照

solr - PDFBox を 1.8 から 2.0.2 に更新した後、PDF ファイルのインデックスを作成できません

PDFファイルのコンテンツインデックス作成にPDFBoxとtikaを使用しています。すべてがPDFFBox 1.8で正常に動作していますが、PDFBoxを2.0.2に更新すると、以下のエラーが表示されます:

この問題を解決するのを手伝ってもらえますか?

このため、PDFBox を 2.0.2 に更新しました

私のgradleの依存関係は次のとおりです。

ここでは tika 1.5 を使用しており、このバージョンは pdfbox 2.0.3 をサポートしています。ここで見ることができます